您的位置: 首页 > 公开课首页 > 生产管理 > 课程详情

details

R数据挖掘技术:基于R语言的数据挖掘和统计分析技术

暂无评价   
  • 开课时间:2016年05月18日 09:00 周三 查找最新
  • 结束时间:2016年05月20日 17:00 周五
  • 课程时长:18小时
  • 招生进展: 确定开班
  • 开课地点:北京市
  • 授课讲师: 杨老师
  • 课程编号:304399
  • 课程分类:生产管理
  •  
  • 收藏 人气:104
您实际购买的价格
付款时最多可用0淘币抵扣0元现金
购买成功后,系统会给用户帐号返回的现金券
淘课价
5500
可用淘币
0
返现金券
待定

你还可以: 收藏

培训受众:


_x000D_
1,系统架构师、系统分析师、高级程序员、资深开发人员。
_x000D_
2,牵涉到数据挖掘和统计分析的数据中心运行、规划、设计负责人。
_x000D_
3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。
_x000D_
4,高校、科研院所牵涉到数据挖掘与统计分析处理的项目负责人。
_x000D_
R是一个数据分析和图形显示的程序设计环境,用于统计分析、绘图的语言和操作。是目前广大企业较通用的数据挖掘与统计分析工具。为解决广大系统设计人员深入进行数据挖掘与统计分析需要,培训中心特举办R数据挖掘技术-基于R语言的数据挖掘和统计分析技术培训班,
_x000D_

课程大纲:


第一讲数据挖掘和R简介
1.1 数据挖掘
1.2 R语言
1.3 Iris数据集
1.4Bodyfat数据集
第二讲数据的导入与导出
2.1 R数据的保存与加载
2.2 CSV文件的导入与导出
2.3 通过ODBC从数据库中读取数据
2.4 从Excel中导入与导出数据
第三讲数据可视化展现
3.1 查看数据
3.2 单个变量展现
3.3 多个变量展现
3.4 更多探索
3.5 将图表保存到文件中
第四讲决策树与随机森林
4.1 使用party包构建决策树
4.2 使用rpart包构建决策树
4.3 随机森林
第五讲回归分析
5.1 线性回归
5.2 逻辑回归
5.3 广义线性回归
5.4 非线性回归
第六讲聚类分析
6.1 k-means聚类
6.2 k-medoids聚类
6.3 层次聚类
6.4 基于密度的聚类
第七讲离群点检测
7.1 单变量的离群点检测
7.2 局部离群点因子检测
7.3 用聚类方法进行离群点检测
7.4 时间序列数据的离群点检测
第八讲时间序列分析
8.1 R中的时间序列数据
8.2 时间序列分解
8.3 时间序列预测
8.4 时间序列聚类
8.5 时间序列分类
第九讲关联规则
9.1 关联规则的基本概念
9.2 Titanic数据集
9.3 关联规则挖掘
9.4 消除冗余
9.5 解释规则
9.6 关联规则的可视化
第十讲社交网络分析
10.1 词项网络
10.2 推文网络
10.3 双模式网络
第十一讲 R与Hadoop/Spark等大数据技术的融合
1)R/Hadoop数据处理技术介绍
2)SparkR数据处理技术介绍
3)基于Hadoop/Yarn集群的应用展望

培训师介绍:

 
杨老师,资深讲师。主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。

本课程名称: R数据挖掘技术:基于R语言的数据挖掘和统计分析技术

查看更多:生产管理公开课

统计分析 数据库 excel it 相关的最新课程
讲师动态评分 与同行相比

授课内容与课纲相符00%

讲师授课水平00%

服务态度00%