你的位置: 首页 > 公开课首页 > 生产管理 > 课程详情

details

大数据分析挖掘:基于HadoopMahoutMLlib的大数据挖掘培训

暂无评价   
  • 开课时间:2016年05月23日 09:00 周一 已结束
  • 结束时间:2016年05月25日 17:00 周三
  • 开课地点:上海市
  • 授课讲师: 杨老师
  • 课程编号:303706
  • 课程分类:生产管理
  •  
  • 收藏 人气:311
你实际购买的价格
付款时最多可用0淘币抵扣0元现金
购买成功后,系统会给用户帐号返回的现金券
淘课价格
5500
你还可以: 收藏

培训受众:


_x000D_
1,系统架构师、系统分析师、高级程序员、资深开发人员。
_x000D_
2,牵涉到大数据处理的数据中心运行、规划、设计负责人。
_x000D_
3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。
_x000D_
4,高校、科研院所牵涉到大数据与分布式数据处理的项目负责人。
_x000D_

课程大纲:


第一讲大数据挖掘及其背景
1)数据挖掘定义
2)Hadoop相关技术
3)大数据挖掘知识点
第二讲 MapReduceDAG计算模式
1)分布式文件系统DFS
2)MapReduce计算模型介绍
3)使用MR进行算法设计
4)DAG及其算法设计
第三讲 云挖掘工具MahoutMLib
1)Hadoop中的Mahoutb介绍
2)Spark中的MahoutMLib介绍
3)推荐系统及其Mahout实现方法
4)信息聚类及其MLlib实现方法
5)分类技术在MahoutMLib中的实现方法
第四讲 推荐系统及其应用开发
1)一个推荐系统的模型
2)基于内容的推荐
3)协同过滤
4)基于Mahout的电影推荐案例
第五讲 分类技术及其应用
1)分类的定义
2)分类主要算法
3)Mahout分类过程
4)评估指标以及评测
5)贝叶斯算法新闻分类实例
第六讲 聚类技术及其应用
1)聚类的定义
2)聚类的主要算法
3)K-Means、Canopy及其应用示例
4)Fuzzy K-Means、Dirichlet及其应用示例

5)基于MLlib的新闻聚类实例
第七讲 关联规则和相似项发现
1)购物篮模型
2)Apriori算法
3)抄袭文档发现
4)近邻搜索的应用
第八讲 流数据挖掘相关技术
1)流数据挖掘及分析
2)Storm和流数据处理模型
3)流处理中的数据抽样
4)流过滤和Bloom filter
第九讲 云环境下大数据挖掘应用
1)与HadoopYarn集群应用的协作
2)与Docker等其它云工具配合
3)大数据挖掘行业应用展望

培训师介绍:

 
杨老师,资深讲师。主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。

本课程名称: 大数据分析挖掘:基于HadoopMahoutMLlib的大数据挖掘培训

查看更多:生产管理公开课

数据分析 设计 其它 相关的最新课程
讲师动态评分 与同行相比

授课内容与课纲相符00%

讲师授课水平00%

服务态度00%