搜索
查看: 1075|: 0

北京上海广州Cloudera Hadoop大数据培训:CCAH(管理员)、CCA(Spark and Hadoop)

[复制链接]

2

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2016-8-4 11:20:54 | 显示全部楼层 |阅读模式
北京上海广州Cloudera Hadoop大数据培训:CCAH(管理员)CCA(Spark and Hadoop)
北京8月16-19日Cloudera Developer training for Spark and Hadoop(CCA-175)
上海8月27-30Cloudera Developer training for Spark and Hadoop(CCA-175)
广州9月5-8日Cloudera Developer training for Spark and Hadoop(CCA-175)
北京9月20-23日Cloudera Aaminisrrator Training for Apache Hadoop(CCAH)
上海9月27-30日Cloudera Aaminisrrator Training for Apache Hadoop(CCAH)
【其他课程安排】400-679-6113
Cloudera大数据 478790619
课程内容:
Cloudera Apache Hadoop管理员课程】
    课时:4
    学习系统管理的概念和Apache Hadoop的最佳实践,
    从安装和配置到负载均衡和调优。
    这个4天的的课程通过动手时间来赋予你部署的经验,
    以及更多的安全方面的经验和故障排除。
    课程结束后,学员被鼓励去参加ClouderaApache Hadoop管理员(CCAH)考试。
    【课程内容】
    1Hadoop分布式文件系统(HDFS
    2YARN/MapReduce的工作原理
    3、如何优化Hadoop机群所需要的硬件配置
    4、搭建Hadoop机群所需要考虑的网络因素
    5Hadoop机群维护和控制
    6、如何利用Hadoop配置选项进行系统性能调优
    7、如何利用FairScheduler为多用户提供服务级别保障
    8Hadoop机群维护和监控
    9、如何使用Flume从动态生成的文件加载到Hadoop
    10、如何使用Sqoop从关系型数据加载数据
    11Hadoop生态系统工具(如HiveImpalaPigBase
    【学员基础】
    具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。
    【授课形式】
案例教学+上机实践
Cloudera Apache Hadoop开发者课程】
  课时:4
  【课程内容】
    什么是Spark
    回顾:从Hadoop MapReduceSpark
    回顾:HDFS
    回顾:YARN
    spark概述
    spark Shell的使用
    RDDS(弹性分布式数据集)
    Spark中的函数式编程
    创建RDDs
    其它通用RDD操作
    键值对RDDPair RDDs
    Map-Reduce
    其它键值对RDD(Pair RDDS)操作
    Spark应用程序vs. Spark Shell
    创建SparkContext
    建立Spark应用程序(Scalajava)
    运行Spark应用程序
    Spark应用程序网页用户界面(Web UI)
    配置Spark属性
    日志记录
    回顾:集群上的Spark
    RDD分区
    基于文件RDDs的分区
    HDFS和数据本地性
    执行并行操作
    阶段和任务
    RDD沿袭
    RDD持久化概述
    分布式持久化
    Spark Streaming概述
    实例:流请求计数
    DStreams
    开发Spark Streaming应用程序
    多批处理操作
    状态操作
    滑动窗口操作
    高级数据源
    通用的Spark使用案例
    Spark中的迭代算法
    图处理与分析
    机器学习
    实例:K-means
    共享变量:广播变量(Broadcast Variables
    共享变量:累加器(Accumulators
    常见性能问题
    诊断性能问题
    SparkSQLSQL Context
    创建DataFrames
    DataFrames转化和查询
    保存DataFrames
    DataFramesRDDS
SparkSQL,ImpalaHive-on-Spark的比较
   【学员基础】
    具备项目经验;熟悉PythonScala;熟悉MySQL会有帮助
    【授课形式】
案例教学+上机实践

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-11-15 18:02 , Processed in 0.058576 second(s), 24 queries .

快速回复 返回顶部 返回列表