1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据
2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程
3、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据
4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组
5、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据
6、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能
7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例
8、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询
9、impala和hive、pig、关系数据库的不同、使用impala shell
10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析
11、对比map reduce、pig、hive、impala和关系数据库
那个培训机构比较靠谱呢,这又是学员们的一个问题,
精准数源—Cloudera官方指定认证培训机构
一直秉承着“科学、高效、权威、品质”的教学宗旨,以“追求卓越服务,与企业共同发展“的努力目标,为企事业单位培养更多更优秀的数据技术人才,加速企业以应对大数据挑战。
【机构优势】
●Cloudera原厂讲师
●Cloudera原厂课程
●全球最具权威的大数据资质认证
●国际最新的课程体系
●国内通过Cloudera管理员和数据分子式培训并顺利拿到讲师资格证书最多的企业
【课时】
4天 7课时/天
【学员基础】
该课程适合有SQL经验和基本Unix和Linux命令的数据分析师、业务分析师和管理员。
无需Java和Apache Hadoop经验
【授课形式】
面对面案例教学+上机实操
【课程时间】
10月24日—27日(09:00—18:00)
【课程地点】
上海市祖冲之路1559号张江创意大厦1楼会议室
【咨询电话】
15757151220 陈老师
18621994731 周老师