你的位置: 首页 > 内训课首页 > 互联网/语言 > 课程详情

details

Storm大数据流式处理技术

暂无评价   
淘课价格
待定
你还可以: 收藏

培训受众:

1,系统架构师、系统分析师、高级程序员、资深开发人员。

2,牵涉到大数据处理的数据中心运行、规划、设计负责人。

3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。

4,高校、科研院所牵涉到大数据与分布式数据处理的项目负责人。

课程收益:

1, 全面了解大数据流式处理技术的相关知识。

2,学习Storm的核心技术方法以及应用特征。

3,深入使用Storm在大数据流式处理中的使用。

4,掌握BDAS相关工具及其主要功能。

培训颁发证书:

培训结束,颁发“Storm大数据流式处理技术”结业证书。

课程大纲:

随着互联网、移动互联网和物联网的发展,我们已经切实迎来了大数据时代。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,对大数据的流式处理和分析已经成为一个非常重要且紧迫的需求。目前对大数据的流式处理和分析工具,业界公认最佳为Storm。Twitter将Storm正式开源了,这是一个分布式、容错的实时计算系统,Storm可以方便地在一个计算机集群中编写与扩展复杂的实时计算。Storm保证每个消息都会得到处理,在一个小集群中,每秒可以处理数以百万计的消息,可以使用任意编程语言来做开发,事实上已成为当前互联网企业主流的大数据流式处理工具。为解决广大系统设计人员深入研究与开发大数据流式处理的需要,培训中心特举办“Storm大数据流式处理技术”培训班, 具体事宜通知如下:

 

一、培训对象

1,系统架构师、系统分析师、高级程序员、资深开发人员。

2,牵涉到大数据处理的数据中心运行、规划、设计负责人。

3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。

4,高校、科研院所牵涉到大数据与分布式数据处理的项目负责人。

 

二、学员基础

1,对IT系统设计有一定的理论与实践经验。

2,有一定的数据仓库与大数据流式处理基础知识。

三、师资

由业界知名计算专家亲自授课:

杨老师   主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。

 

四、培训要点

互联网点击数据、传感数据、日志文件、具有丰富地理空间信息的移动数据和涉及网络的各类评论,成为了海量信息的多种形式。当数据以成百上千TB不断增长的时候,我们在内部交易系统的历史信息之外,需要一种基于大数据流式处理和分析的决策模型和技术支持。

大数据通常具有:数据体量(Volume)巨大,数据类型(Variety)繁多,价值(Value)密度低,处理速度(Velocity)快等四大特征。如何有效管理和高效处理这些大数据已成为当前亟待解决的问题。大数据流式处理意味着更严峻的挑战,更好地管理和处理这些数据也将会获得意想不到的收获。

Storm为分布式实时计算提供了一组通用原语,可被用于“流处理”之中,实时处理消息并更新数据库。这是管理队列及工作者集群的另一种方式。 Storm也可被用于“连续计算”(continuous computation),对数据流做连续查询,在计算时就将结果以流的形式输出给用户。它还可被用于“分布式RPC”,以并行的方式运行昂贵的运算。

本课程从大数据流式处理技术以及Storm实战的角度,理论和实践相结合,全方位地介绍Storm大数据流式处理工具的原理和内核。以案例分析的方式来帮助学员了解如何用BDAS系列工具来解决具体的问题,并介绍了从大数据中挖掘出有价值的信息的关键。

本课程不是一个泛泛的理论性、概念性的介绍课程,而是针对问题讨论解决方案的深入课程。教师对于上述领域有深入的理论研究与实践经验,在课程中将会针对这些问题与学员一起进行研究,在关键点上演示、实践,以加深对于这些解决方案的理解。通过本课程学习,希望推动大数据相关的项目开发上升到一个新水平。

 

五、培训内容

第一讲 Storm大数据处理介绍

  1)  什么是Storm

  2) Storm的诞生

  3) Storm的成长

  4) Storm的优势

  5) Storm的应用现状和发展趋势

第二讲 Storm配置和容错机制

  1)Storm基本概念

  2)Storm的配置

  3) 序列化(Serialization)

  4) 容错机制

第三讲 Storm可靠性及消息传输

1) 可靠性机制

2) 保证消息处理

  3)  消息传输机制

  4)  Storm生产与开发环境

第四讲 Storm拓扑及流分组

  1)  什么是拓扑

  2) TopologyBuilder

  3)  流分组

  4)  不同模式下运行拓扑

  5)  拓扑的常见模式

第五讲 Spout和Bolt详解

  1) 可靠的与不可靠的消息

  2) Spout获取数据的方式

  3) Bolt数据处理概述

  4) 可靠的与不可靠的Bolt

  5) 复合流与复合Anchoring

第六讲 分布式DPRC

  1)   DRPC TopologyBuilder

  2)  本地模式的DRPC

  3)  远程模式的DRPC

  4)  一个复杂的DRPC例子

  5)  非线性DRPC

第七讲 Storm事务拓扑

  1)  什么是事务拓扑

  2)  事务拓扑的设计细节

  3)  事务拓扑的实现细节

  4)  事务拓扑API

第八讲 Storm中的Trident

 1)  Trident概述

  2) Trident API

  3) Trident的操作

第九讲 Trident的状态

1)Trident的状态

2)  实现Trident Spout

3)  Spout与State的联系

第十讲 Storm企业应用

  1)  Storm应用在互联网企业

  2) Storm在Twitter的应用

  3) Storm其它企业的应用

  4)  小结

 

六、培训目标

1, 全面了解大数据流式处理技术的相关知识。

2,学习Storm的核心技术方法以及应用特征。

3,深入使用Storm在大数据流式处理中的使用。

4,掌握BDAS相关工具及其主要功能。

 

七、培训时间、地点


八、证书

培训结束,颁发“Storm大数据流式处理技术”结业证书。

 

九、费用

培训费:5800元/人(含教材、证书、午餐、学习用具等)。住宿协助安排,费用自理。

本课程名称: Storm大数据流式处理技术

查看更多:互联网/语言内训课

storm 大数据流式处理 相关的最新课程
讲师动态评分 与同行相比

授课内容与课纲相符00%

讲师授课水平00%

服务态度00%