建议学员:程序员和软件工程师
课时:3天(这门3天的课程针对那些希望在应用的速度,易用性和高级分析方面进行优化的程序员和软件工程师。)
Cloudera Apache Spark 课程帮助学员创建完整的、统一的大数据应用,集成批处理,流和交互式分析。通过Spark, 程序员可以编写复杂的并行应用来执行更快更好的决策实时操作,并应用到广泛的用例,架构和行业里。
Cloudera Apache Spark 是MapReduce的新一代继承者。Spark是Haoop上对性能,易用性和复杂
分析优化的强大的开源数据处理引擎。Spark框架支持流式数据处理,复杂迭代算法,比传统Hadoop MapReduce 程序快100倍。
Cloudera Spark学习内容:
通过讲师引导的讨论以及交互式的练习,学员将获得Hadoop生态系统全方位的体验,主要的主题包括:
> 用 Spark shell 执行互动式 数据分析
> Spark的 弹性分布式数据集(Resilient Distributed Datasets)的特性
> Spark 怎样运行在一个集群上
> Spark的并行编程
> 编写Spark应用
> 用Spark处理流数据
听课学员 & 先决条件:
该课程适合具有一定编程经验的程序开发人员 。 课程样例和练习涉及到Python 和Scala语言, 因此需要对其中之一的语言的知识。 需要 Linux 的基本知识. 事先无需Hadoop经验。
Cloudera授权指定培训机构:北京精准数源信息技术有限公司
(原厂的讲师、原厂的课程、同步国际最新的课程体系、全球最具权威的大数据国际认证)
授课形式:面对面案例教学+上机实操
|