搜索
查看: 7943|: 0

如何快速学会大数据分析

[复制链接]

24

主题

0

回帖

159

积分

注册会员

积分
159
发表于 2016-12-28 14:49:51 | 显示全部楼层 |阅读模式
  以数据分析师为目标,从数据分析基础、JAVA语言入门和linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce和Hbase等理论知识和hadoop的生态环境,详细演示hadoop三种模式的安装配置,以案例的形式,重点讲解基于mahout项目的大数据分析之聚类、分类以及主题推荐。区别于普通的JAVA程序员,本课程的重点是培养基于Hadoop架构的大数据分析思想及架构设计,通过演示实际的大数据分析案例。


  使爱好者能在较短的时间内理解大数据分析的真实价值,并且掌握如何使用Spark应用于大数据分析过程,使爱好者能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。从入门知识学起的课程体系设计和面向大数据分析师的培训理念,引导大数据爱好者一步步深入学习,适合零基础学员从零学起。本次培训共分为七个阶段:

  第一阶段:大数据前沿知识及hadoop入门

  1.大数据前沿知识介绍

  2.课程介绍

  3.Linux及unbuntu系统基础

  4.hadoop的单机和伪分布模式的安装配置

  第二阶段:Hadoop部署进阶

         

  1.Hadoop集群模式搭建

  2.Hadoop分布式文件系统HDFS深入剖析

  3.使用hdfs提供的api进行hdfs文件操作

  4.Mapreduce概念及思想

  第三阶段:大数据导入与存储

         

  1.mysql数据库基础知识

  2.hive的基本语法

  3.hive的架构及设计原理

  4.hive安装部署与案例

  5.sqoop安装及使用

  6.sqoop组件导入到hive

  第四阶段:Hbase理论及实战

  1.hbase简介

  2.安装及配置

  3.hbase的数据存储

  4.项目实战

  第五阶段:Spark配置及使用场景

  1.scala基本语法

  2.spark介绍及发展历史

  3..sparkstandalone模式部署

  4.sparkRDD详解

  第六阶段:spark大数据分析原理

  1.Spark内核:基本定义、Spark任务调度

  2.SparkStreaming实时流计算

  3.SparkMLlib机器学习

  4.SparkSQL查询

  第七阶段:hadoop+Spark大数据分析

  1.实战案例深入解析

  2.hadoop+Spark的大数据分析之分类

  3.Logistic回归与主题推荐

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-12-22 20:32 , Processed in 0.063425 second(s), 25 queries .

快速回复 返回顶部 返回列表