大数据挖掘分析技术培训

预约试听
编辑:佚名 发布时间:2022-08-11

本课程从大数据挖掘分析技术实战的角度,结合理论和实践,全方位地介绍Mahout和MLlib等大数据挖掘工具的开发技巧。

教学过程中还提供了案例分析来帮助学员了解如何用Mahout和MLlib挖掘工具来解决具体的问题,并介绍了从大数据中挖掘出有价值的信息的关键。

大数据挖掘分析技术培训课程介绍

课程时间

本课程为企业内训,课程时长为1-2天,可根据企业需要调整相应的培训时间。

咨询了解

课程对象

系统架构师、系统分析师、高级程序员、资深开发人员。

咨询了解

课程特色

方法工具讲授与案例分析相结合,紧密联系企业的实际,具有实战性、可操作性。

咨询了解

培训方式

主题讲授+案例分析+互动问答+视频欣赏+情景模拟+小队讨论+模拟训练

咨询了解

大数据挖掘分析技术培训课程内容

第一讲大数据挖掘及其背景

1)数据挖掘定义

2)Hadoop相关技术

3)大数据挖掘知识点


第二讲 MapReduce/DAG计算模式

1)分布式文件系统DFS

2)MapReduce计算模型介绍

3)使用MR进行算法设计

4)DAG及其算法设计


第三讲 云挖掘工具Mahout/MLib

1)Hadoop中的Mahoutb介绍

2)Spark中的Mahout/MLib介绍

3)推荐系统及其Mahout实现方法

4)信息聚类及其MLlib实现方法

5)分类技术在Mahout/MLib中的实现方法


第四讲 推荐系统及其应用开发

1)一个推荐系统的模型

2)基于内容的推荐

3)协同过滤

4)基于Mahout的电影推荐案例


第五讲 分类技术及其应用

1)分类的定义

2)分类主要算法

3)Mahout分类过程

4)评估指标以及评测

5)贝叶斯算法新闻分类实例


第六讲 聚类技术及其应用

1)聚类的定义

2)聚类的主要算法

3)K-Means、Canopy及其应用示例

4)Fuzzy K-Means、Dirichlet及其应用示例

5)基于MLlib的新闻聚类实例


第七讲 关联规则和相似项发现

1)购物篮模型

2)Apriori算法

3)抄袭文档发现

4)近邻搜索的应用


第八讲 流数据挖掘相关技术

1)流数据挖掘及分析

2)Storm和流数据处理模型

3)流处理中的数据抽样

4)流过滤和Bloom filter


第九讲 云环境下大数据挖掘应用

1)与Hadoop/Yarn集群应用的协作

2)与Docker等其它云工具配合

3)大数据挖掘行业应用展望

更多课程详情请点击咨询专属客服

抢限时体验课

相关推荐

猜你喜欢

同类学校

Copyright © 2006-2018 kaoshi.china.com

""