搜索
查看: 8119|: 1

大数据入门书籍(一)

[复制链接]

24

主题

0

回帖

159

积分

注册会员

积分
159
发表于 2016-12-6 15:30:03 | 显示全部楼层 |阅读模式
  当年互联网疯狂发展的时候,很多人在观望和犹豫中错过了这班顺风车(没有尽早开个淘宝店,肠子都悔青了好几遍呢)。如今,同样的桥段上演,大数据时代,坚决不能再无动于衷!

  于是,你着急,你迷茫,你很方……除了平时要加班加点的搬砖,牙缝里挤出来的的闲碎时间都贡献给度娘了,“小白如何学习大数据”,“大数据入门书籍有哪些”……

  的确,网上是潜伏了不少大神,动不动“出没”一下,分享一些干货,大家集体呈膜拜姿势。但是,大学教授会站在小学生的角度讲课吗?(简单粗暴地讲道理,小编没有任何偏见哟)

  所以,真心想学习大数据技术的宝宝们,一口吃不成胖子,地基还是要打稳咯~

  1:<大数据时代>

  这是学习大数据必读的一本书,也是最系统的关于大数据概念的一本书,由维克托·迈尔-舍恩伯格和肯尼斯·库克耶编写,主要介绍了大数据理念和生活工作及思维变革的关系。

  它被包括宽带资本董事长田朔宁、知名IT评论人谢文等专业读者鉴定为“大数据领域最好的著作没有之一,一本顶一万本”。有这么好吗?看完自己评价吧。这本书对这个大规模产生、分享和应用数据的新的大时代进行了阐述和厘清,作者围绕“要全体不要抽样、要效率不要绝对精确、要相关不要因果”三大理念,通过数十个商业和学术案例,剖析了万事万物数据化和数据复用挖掘的巨大价值。

  2:<爆发>

  由巴拉巴西编写,主要讲了在一个历史故事的连续讲述中,了解大数据的概念实质。从大数据的历史开始,能更深入的了解大数据的发展历程。

  巴拉巴西整本书讲述的大数据根本目的,是预测。他甚至有零有整地判断,人类行为93%是可以预测的。打个比方,千百年前人类无法如今天般准确预测天气,以致某些大致预测的行为都被认为是“通神”,其实核心在于对天气数据的海量占有和分析能力。但假如全人类的所有基础及行为数据全部被占有全部能分析呢?比如通过智能终端LBS功能采集全部运动轨迹、通过金融系统采集所有支付记录、通过SNS采集所有社会关系和通过邮件、文档、社会视频监控和自我视频监测采集所有言行记录,24小时,每分每秒,一生,全地球70亿人,那会如何?

  3:<大数据>

  由徐子沛编写,看美国政府在大数据开放上的进程与反复,算是个案。如果能够基本了解这三本的观点,出门有底气,见人腰杆直,不再被忽悠。

  全书讲述的,是大数据在美国政府管理中的应用,以及美国政府运行方式大数据变革的历史与斗争,其实也是故事性的。从奥巴马上台就颁布《信息公开法案》,到设立第一个美国政府首席信息官开始,讲述美国政府与民间在社会数据公开的斗争史,以及美国社会管理向大数据思维转变的过程。首先,这算是一个最详实的案例;其次,这代表的不是某种管理方式变革,深处是对民主运行机制的变革与进步。说好了,这本书用心良苦,远远超越科普技术领域;说坏了,其心可诛。有一段,民间斗争,逼迫奥巴马公布所有每日白宫全部日程,包括接见了谁、谈话的全部内容,这不就是个人大数据全公开在公众人物上的应用吗?这可比现在所谓官员公开财产的要求高了几十倍——这要求政府全部行为、全部数据、全部公开,全体公众随时可查——技术和成本上其实已经可以做到或至少努力接近——如果不这么做,不止是落后问题而是真正的其心可诛了。

  4:<大数据基础与应用>

  由陈明编写。看名字就知道,入门级别拯救小白的书。这本书共17章,第1章是对大数据的简单概述,第2章介绍大数据研究的方法论,第3、8、9、14章介绍大数据的生态环境,第17章介绍数据科学的内容,剩下的章节是本书重点,介绍大数据技术及应用方法。

  身处大数据大环境下,身边的人经常讨论数据库、数据可视化、大数据预处理等等。这些词听得多了会让人产生错觉——自己已经知道里面的门道了。但事实上还是个“门外汉”。

  举个例子,没有人肯在上千人规模的讲座上专门花半个小时教你怎样进行数据清洗。本书专门列了一章,详细介绍大数据预处理技术,包括数据清洗的实现方式,从步骤到检验,都做了用心的阐述。诸如此类,数据挖掘、大数据流式计算、Hadoop、NoSQL等等都从最基础的点做了详细介绍。耐心看完这些,再往深处进阶就不会那么吃力了。

  5:<一本书读懂大数据>

  进入大数据时代,让数据开口说话将成为司空见惯的事情,本书将从大数据时代的前因后果讲起,全面分析大数据时代的特征、企业实践的案例、大数据的发展方向、未来的机遇和挑战等内容,展现一个客观立体、自由开放的大数据时代。

  5:<集体智慧编程>

  入门,浅显易懂,里面每一章都是一个案例,但是很方便,有具体的代码,用来入门最好。

  6:<社交网络的数据挖掘>

  专门做社交网络的数据挖掘,案例很丰富,有代码。

  7:<数据可视化之美>

  致力于介绍各种可视化方案。

  8:<鲜活的数据>

  比较简单的可视化,不过内容丰富,有代码。

  9:<数据挖掘导论完整版>

  看完上述的书,对大数据产生很大的兴趣,已经初步入门了,现在开始理论方面的学习,数据挖掘入门教程,个人觉得写的很好,目前正在研究这本书,努力。。。

  10:<统计学习方法>

  这本书比较深,刚开始看的就是这一本,不过太深,看到一半,准备在导论看完之后,在看这本书提升一下自己。

  11:<鸟哥私房菜—基础篇>

  作为一个计算机专业Linux那是必学的,而且Hadoop是建立在Linux基础上的,不求多么的精通,但是基础的操作要学会。

  如果是没有任何编程语言基础的想入行大数据的话,是必须要学习java基础的,虽然大数据支持很多开发语言,但是企业用的最多的还是java,接下来学习数据结构,关系型数据库,linux系统操作,有了基础之后,在进入大数据学习,可以给小白学习的体系。

  第一阶段

  COREJAVA(加**的需重点熟练掌握,其他掌握)

  Java基础**

  数据类型

  运算符、循环

  算法

  顺序结构程序设计

  程序结构

  数组及多维数组

  面向对象**

  构造方法、控制符、封装

  继承**

  多态**

  抽象类、接口**

  常用类

  集合Collection、list**

  HashSet、TreeSet、Collection

  集合类Map**

  异常

  File

  文件/流**

  数据流和对象流**

  线程(理解即可)

  网络通信(理解即可)

  第二阶段

  数据结构

  关系型数据库

  Linux系统操作

  Linux操作系统概述

  安装Linux操作系统

  图形界面操作基础

  Linux字符界面基础

  字符界面操作进阶

  用户、组群和权限管理

  文件系统管理

  软件包管理与系统备份

  Linux网络配置

  (主要掌握Linux操作系统的理论基础和服务器配置实践知识,同时通过大量实验,着重培养学生的动手能力。使学生了解Linux操作系统在行业中的重要地位和广泛的使用范围。在学习Linux的基础上,加深对服务器操作系统的认识和实践配置能力。加深对计算机网络基础知识的理解,并在实践中加以应用。掌握Linux操作系统的安装、命令行操作、用户管理、磁盘管理、文件系统管理、软件包管理、进程管理、系统监测和系统故障排除。掌握Linux操作系统的网络配置、DNS、DHCP、HTTP、FTP、SMTP和POP3服务的配置与管理。为更深一步学习其它网络操作系统和软件系统开发奠定坚实的基础。与此同时,如果大家有时间把javaweb及框架学习一番,会让你的大数据学习更自由一些)

  重点掌握:

  常见算法

  数据库表设计

  SQL语句

  Linux常见命令

  第三阶段

  Hadoop阶段

  离线分析阶段

  实时计算阶段

  重点掌握:

  Hadoop基础

  HDFS

  MapReduce

  分布式集群

  Hive

  Hbase

  Sqoop

  Pig

  Storm实时数据处理平台

  Spark平台

  若之前没有项目经验或JAVA基础,掌握了第一阶段进入企业,不足以立即上手做项目,企业需再花时间与成本培养;

  第二阶段掌握扎实以后,进入企业就可以跟着做项目了,跟着一大帮人做项目倒也不用太担心自己能不能应付的来,当然薪资不能有太高的要求;

  前两个阶段都服务于第三阶段的学习,除了熟练掌握这些知识以外,重点需要找些相应的项目去做,不管项目大小做过与没有相差很多的哦!掌握扎实后可直接面对企业就业,薪资待遇较高!

0

主题

5

回帖

12

积分

新手上路

积分
12
发表于 2016-12-6 22:33:48 | 显示全部楼层
可以啊,分析的有借鉴意义
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2025-1-28 00:48 , Processed in 0.140546 second(s), 25 queries .

快速回复 返回顶部 返回列表