首先查阅了资料,什么是hadoop,至于这方面,你可以参考这个帖子hadoop新手学习指导。对这个有了整体的认识之后开始下面内容。(新手请务必参考hadoop新手学习指导,否则后面可能看不懂) 我们知道hadoop,有单机安装,伪分布安装和分布安装。
同时hadoop的环境是Linux,所以我们还需要安装Linux系统。因为我们的习惯是使用windows,所以对于Linux上来就安装软件之类的,困难度很大。并且我们要搭建集群,需要多台硬件的,不可能为了搭建集群,去买三台电脑。 从成本和使用我们需要懂虚拟化方面的知识。这里的虚拟化其实就是我们需要懂得虚拟机的使用。因为hadoop安装在Linux中,才能真正发挥作用。所以我们也不会使用windows。 (这里补充硬件的选择:最关键的是内存,2G内存是有点卡的,4G有点勉强的,8G用起来顺畅)
基于以上内容。所以我们需要懂得
1.虚拟化
2.Linux
3.java基础 下面来详细介绍 1.虚拟化
刚开始学习,上来就安装了虚拟机wmware station,然后创建虚拟机,安装Linux。但是问题来了。虚拟机的网络难住,因为缺乏这方面的知识,所以不得不停下来,学习虚拟机的网络,该怎么搞。虚拟机网络分为三种:
1.briage
2.host-only
3.nat
这不是很简单的吗?网上资料也不少。可是事情并没有想象的那么简单,因为nat虽然能上网,但是虚拟系统无法和本局域网中的其他真实主机进行通讯。桥接模式全都需要手工配置,而且这里还需要明白自己是本机拨号上网,还是路由拨号上网。host-only创建一个与网内其他机器相隔离的虚拟系统,这个更不行。这些都不适合我们的hadoop集群。hadoop要求主机与虚拟机与外部网络(能上网),这三者都是通的,在安装的过程中,才不会遇到麻烦。
所以这就是虚拟化方面的困难。
下面总结了在虚拟化方面需要做的:
虚拟化零基础入门
此文章让你明白为什么虚拟化,虚拟化的价值 虚拟机入门二,虚拟机的三种网络模式 详细介绍了虚拟化三种网络模式 搭建集群必备虚拟化网络知识 上面了解三种网络模式,这三种网络模式该如何才能上网。 对于上面你可能了解的还不够,下面咱们论坛会员具体实践指导,可以与他们相互交流: 集群搭建:主机宽带拨号上网,虚拟机使用桥接模式,该如何ping通外网 集群搭建必备:虚拟机之一实现Host-only方式上网 集群搭建必备:nat模式设置静态ip,达到上网与主机相互通信 上面是三种不同网络模式下,如何达到,虚拟机,主机,网络三者互通。 上面的知识具备了我们开始动手:
第一步:下载软件 VMware Workstation 10.0.0简体中文正式版官方下载地址
ubuntu-desktop 版:是图形界面
ubuntu-12.04-desktop-amd64
链接: http://pan.baidu.com/s/1eQxHLFO 密码: nnkv 新手指导windows使用虚拟机安装Linux(ubuntu):包括下载及安装指导
上面的帖子很齐全,包括wmware下载Linux桌面版下载。还有安装指导,包括下面需要讲解的Linux安装指导 第二步:
下载我们就需要安装和使用 VMware workstation安装linux(ubuntu)配置详解 在这里我们安装完毕虚拟机,安装完毕Linux,我们需要返回第一步,进行网络设置。但是在网络设置中,我们会遇到各种各样的困难,因为缺乏Linux知识。 同时这里补充一些虚拟化的基础知识:
虚拟网卡概述 VMware虚拟机网络设置方法 虚拟机(Linux操作系统)三种网络模式切换遇到的问题 2.Linux
2.1、Linux基础知识 对于Linux的学习也是一个过程,因为可能你连最简单的开机和关机命令都不会,更不要谈配置网络。这里面给大家提供刚开始学习所查阅的资料和经验总结。
首先我们需要使用一些命令,进行网络配置,但是在网络配置中,这里面又必须懂得虚拟机的一些知识,所以前面的虚拟机知识需要掌握扎实一些。
对于网络配置: 集群搭建:主机宽带拨号上网,虚拟机使用桥接模式,该如何ping通外网 集群搭建必备:虚拟机之一实现Host-only方式上网 集群搭建必备:nat模式设置静态ip,达到上网与主机相互通信 其实还是上面三个,但是我们会遇到各种不会的命令,即使能查到命令,我们也不能使用。为什么会这样,因为各种有的命令,是需要使用安装包的。我们在配置网络过程中,同样会遇到各种各样的奇怪的配置。在我们的Linux的系统,不能找到文件。这里只举ubuntu。网络配置文件/etc/network/interfaces。我们配置完毕之后,有各种网络重启方式: - <div id="code_LEi"><ol style="list-style: none;"><li style="margin-left: 0px; float: left; list-style: none;">/etc/init.d/networking restart</li></ol></div><p style="padding-top: 10px; padding-bottom: 10px; clear: both; width: auto; font-size: 16px; line-height: 33px; text-indent: 35px; color: rgb(85, 85, 85);"></p>
[color=rgb(51, 102, 153) !important]复制代码
这是一种网络重启方式,但是有时候并不管用。 那么这时候我们遇到困难了,刚接触命令不起作用,该怎么办? - <div id="code_vYk"><ol style="list-style: none;"><li style="margin-left: 0px; float: left; list-style: none;">ifconfig eth0 down</li></ol></div><p style="padding-top: 10px; padding-bottom: 10px; clear: both; width: auto; font-size: 16px; line-height: 33px; text-indent: 35px; color: rgb(85, 85, 85);"></p>
[color=rgb(51, 102, 153) !important]复制代码
- <div id="code_v0Z"><ol style="list-style: none;"><li style="margin-left: 0px; float: left; list-style: none;">ifconfig eth0 up</li></ol></div><p style="padding-top: 10px; padding-bottom: 10px; clear: both; width: auto; font-size: 16px; line-height: 33px; text-indent: 35px; color: rgb(85, 85, 85);"></p>
[color=rgb(51, 102, 153) !important]复制代码
(这里同样需要明白,我这里使用的是eth0上网的,如果你使用的是eth1,就需要替换成eth1) 上面的两个命令能达到同样的效果。 在举一例:
我们需要配置网络文件,在很多网络配置是使用下面的命令的 - The program vim can be found in the following package:vimvim -gnomevim-tinyvim-gtk
- vim
- -noxTry:sudo apt-get install <select package>
[color=rgb(51, 102, 153) !important]复制代码
这和我们看到的配置完全不一样。这是因为我们安装Linux之后,并没有安装vim包。所以我们又遇到了困难。如果你熟悉Linux的话,这个根本不是问题
[color=rgb(51, 102, 153) !important]复制代码
上面命令迎刃而解。一个vim,一个vi。在我们刚接触这些肯定云里雾里,所以你需要首先有成就感,然后在慢慢接触。下面都是经过实践的内容,也算是经验,大家可以参考。 文章出处:http://www.edu360.cn/open?pid=1
|