你的位置: 首页 > 公开课首页 > 市场营销 > 课程详情

details

大数据分析挖掘-基于HadoopMahoutMllib的大数据挖掘

暂无评价   
  • 开课时间:2017/03/16 09:00 已结束
  • 结束时间:2017/03/18 17:00
  • 开课地点:北京市
  • 授课讲师: 李老师
  • 课程编号:328697
  • 课程分类:市场营销
  •  
  • 收藏 人气:380
你实际购买的价格
付款时最多可用0淘币抵扣0元现金
购买成功后,系统会给用户帐号返回的现金券
淘课价格
5500
你还可以: 收藏

培训受众:

1,系统架构师、系统分析师、高级程序员、资深开发人员。2,牵涉到大数据处理的数据中心运行、规划、设计负责人。3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。4,高校、科研院所牵涉到大数据与分布式数据处理的项目负责人。

课程大纲:

第一讲大数据挖掘及其背景
1)数据挖掘定义
2)Hadoop相关技术
3)大数据挖掘知识点

第二讲 MapReduceDAG计算模式
1)分布式文件系统DFS
2)MapReduce计算模型介绍
3)使用MR进行算法设计

4)DAG及其算法设计
第三讲 云挖掘工具MahoutMLib
1)Hadoop中的Mahoutb介绍
2)Spark中的MahoutMLib介绍
3)推荐系统及其Mahout实现方法
4)信息聚类及其MLlib实现方法
5)分类技术在MahoutMLib中的实现方法

第四讲 推荐系统及其应用开发
1)一个推荐系统的模型
2)基于内容的推荐
3)协同过滤
4)基于Mahout的电影推荐案例

第五讲 分类技术及其应用
1)分类的定义
2)分类主要算法
3)Mahout分类过程
4)评估指标以及评测
5)贝叶斯算法新闻分类实例

第六讲 聚类技术及其应用
1)聚类的定义
2)聚类的主要算法
3)K-Means、Canopy及其应用示例
4)Fuzzy K-Means、Dirichlet及其应用示例
5)基于MLlib的新闻聚类实例
第七讲 关联规则和相似项发现
1)购物篮模型
2)Apriori算法
3)抄袭文档发现
4)近邻搜索的应用

第八讲 流数据挖掘相关技术
1)流数据挖掘及分析
2)Storm和流数据处理模型
3)流处理中的数据抽样
4)流过滤和Bloom filter

第九讲 云环境下大数据挖掘应用
1)与HadoopYarn集群应用的协作
2)与Docker等其它云工具配合
3)大数据挖掘行业应用展望

培训师介绍:

 
李老师,( )资深讲师。
软件测试专家,擅长搭建完善的测试体系、自动化测试、性能测试、安全测试及精通常见开源与商业测试软件工具。
10多年丰富的软件开发、测试、持续集成与交付经验。
熟练使用QTP与LoadRunner、Selenium、Jemeter自动化测试工具,熟练掌握Vbs、shell、脚本语言,熟悉主流测试技术;
熟悉QC、TD等测试管理工具;
拥有丰富的测试项目管理经验;
熟练搭建部署Linux、win2008主流服务器;
熟悉oracle数据库部署与维护,熟练使用PL/SQL语言;
熟练部署MOSS门户网站,熟悉规划设计MOSS门户网站工作流。
熟悉敏捷测试过程和持续集成的实践,擅长测试组织与测试过程能力的建设,超过10个千万级大项目的测试管理与持续集成的实践经验。

本课程名称: 大数据分析挖掘-基于HadoopMahoutMllib的大数据挖掘

查看更多:市场营销公开课

数据分析 设计 其它 相关的最新课程
讲师动态评分 与同行相比

授课内容与课纲相符00%

讲师授课水平00%

服务态度00%