搜索
收藏本版 |订阅

Hadoop 今日: 0|主题: 220|排名: 12 

作者 回复/查看 最后发表
Cloudera升级企业软件,首次亮相Apache Hadoop快捷部署软件
Cloudera是一家专业从事基于Apache Hadoop的数据管理软件销售和服务的公司,它即将发布一个新版本的服务软件——Cloudera 3.5版。该公司同时还将发布Cloudera SCM Express,该软件让任何人都能 ...
idata 2014-9-26 01809 idata 2014-9-26 14:08
Hadoop遭遇瓶颈的七大危险信号
大多数企业大数据应用案例尚处于实验和试点阶段,对于少数首次在生产环境部署Hadoop系统的用户来说,最常遇到的就是扩展问题,此类问题往往导致企业因噎废食,终止大数据应用项目。  部署 ...
Yafei 2014-9-26 01968 Yafei 2014-9-26 14:07
为Hadoop提供防护!Imperva联手Cloudera
Imperva公司(NYSE:IMPV)是企业安全领域第三大支柱――数据中心安全的领导者,其全新的保护层专为物理及虚拟数据中心而设计。近日,Imperva公司宣布其数据安全平台SecureSphere正式支持Cloude ...
菜鸟之家 2014-9-26 02095 菜鸟之家 2014-9-26 14:06
星环:如何构建企业级Hadoop/Spark分析平台
  一说大数据,人们往往想到Hadoop。这固然不错,但随着大数据技术的深入应用,多种类数据应用要求的不断提出,一些Hadoop不甚专注的领域开始被人们注意,相关技术也迅速获得专业技术领域的 ...
小雨涵 2014-9-26 01778 小雨涵 2014-9-26 14:05
本土Hadoop产品TDH入列中央政府采购网
  随着大数据应用的深入,其核心技术Hadoop也开始进入政府信息化部门的视野。近日,中央政府采购网新开辟了“大数据一体化管理平台”的栏目,星环信息科技(上海)有限公司(星环科技)自主研 ...
IT市场 2014-9-26 01601 IT市场 2014-9-26 14:04
Hadoop教程 第二章:Hadoop分布式文件系统[3]
在MapReduce中使用HDFS对于MapReduce HDFS是一个功能强大的工具,通过设置fs.default.name来配置名字结点的信息,Hadoop MapReduce会自动在HDFS找它的输入文件,使用FileInputFormat子类,Hadoo ...
MEI 2014-9-26 01783 MEI 2014-9-26 14:01
Hadoop教程 第二章:Hadoop分布式文件系统[2]
与HDFS交互这节将向你介绍与HDFS交互的命令,这些命令可以载入数据,取得数据,操作文件。所有与集群交互的命令是通过一个脚本bin/hadoop来进行的,它可以用Java虚拟机载入Hadoop系统,来执行用 ...
MEI 2014-9-26 01676 MEI 2014-9-26 14:00
Sqoop中文手册
Sqoop中文手册Sqoop在我们的实际工作中有一些应用,为了对Sqoop的使用有个更全面的了解,于是我花了一些时间将Sqoop的使用整理成了一份中文手册,我 自认还是非常全面的,覆盖到了Sqoop所有的方 ...
bigdata 2014-9-25 01878 bigdata 2014-9-25 16:45
sqoop从关系型数据库导数据到hdfs和hbase上
本人最近弄了些sqoop导数据方法和命令,关于批量导入和一般导入,在本机器上linux环境运行正常;(一)Oracle导入到hdfs上 sqoop import --connect jdbcracle:thinip:端口号:databas ...
bigdata 2014-9-25 03665 bigdata 2014-9-25 16:40
Hadoop教程 第二章:Hadoop分布式文件系统[1]
第二章:Hadoop分布式文件系统< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-comfficeffice" /> 介绍HDFS,Hadoop Distributed File System,是一个设计用来保存大数据量的数据的分布 ...
MEI 2014-9-25 01808 MEI 2014-9-25 14:19
Hadoop教程 第一章:教程介绍
第一章:教程介绍< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-comfficeffice" />介绍欢迎来到Yahoo! Hadoop教程!这个系列教程将向你介绍Apache Hadoop系统的许多方向,还将向你展 ...
MEI 2014-9-25 01744 MEI 2014-9-25 14:18
Hadoop并非大数据处理的一切
云计算的伟大之处就在于在进行大数据处理时不必再向以往一样购买大量的服务器集群,租用服务器处理大数据更加利用控制成本。Hadoop作为一个重量级的分布式处理开源框架已经在大数据处理领域有所 ...
MEI 2014-9-11 02696 MEI 2014-9-11 09:00
分享个大数据技术博客
今天给大家分享个纯粹的大数据技术博客,里面有大量文章,很全面。 http://xn--jlq582ax31c.xn--fiqs8s/ www.ibigdatas.com
bigdata 2014-8-19 02448 bigdata 2014-8-19 21:53
hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用和用法
order byorder by 会对输入做全局排序,因此只有一个reducer(多个reducer无法保证全局有序) 只有一个reducer,会导致当输入规模较大时,需要较长的计算时间。set hive.mapred.mode=nonstrict; ...
bigdata 2014-8-14 02414 bigdata 2014-8-14 10:25
Hadoop大数据零基础高端实战教程 新人帖
http://ke.qq.com/cgi-bin/courseDetail?course_id=8546免费报名学习 1、全面掌握Hadoop2.0的架构原理和使用场景,并通过贯穿课程的项目进行实战 2、掌握YARN以及运行在YARN上的计算框架的原 ...
小美美 2014-8-12 02118 小美美 2014-8-12 17:14
hbase应用snappy的部署
因为业务需要所以对hbase的数据做整体的压缩处理。 首先需要在hadoop集群里安装snappy成功。以下介绍如何在hadoop中部署snappy第一步骤:下载snappy网页地址:http://code.google.com/p/snappy/ ...
bigdata 2014-7-15 03367 bigdata 2014-7-15 17:31
内存时代 开源Spark赋予Hadoop实时分析能力
自5月30日阿帕奇软件基金会宣布发布开源平台Spark 1.0以来,Spark就屡登头条,备受数据专家关注。但是,Spark的企业应用时代真的来了吗? 从近期举办的美国Spark峰会上来看,大家对Spark技术还 ...
MEI 2014-7-14 02138 MEI 2014-7-14 10:56
HBase性能调优
因官方Book Performance Tuning部分章节没有按配置项进行索引,不能达到快速查阅的效果。所以我以配置项驱动,重新整理了原文,并补充一些自己的理解,如有错误,欢迎指正。配置优化zookeeper.s ...
bigdata 2014-7-3 02117 bigdata 2014-7-3 17:11
hadoop Shell命令详解
一、用户命令 1、archive命令(1).什么是Hadoop archives? Hadoop archives是特殊的档案格式。一个Hadoop archive对应一个文件系统目录。 Hadoop archive的扩展名是*.har。Hadoop archive包含元 ...
bigdata 2014-6-27 03534 bigdata 2014-6-27 15:29
Hadoop DistributedCache详解
DistributedCache是Hadoop提供的文件缓存工具,它能够自动将指定的文件分发到各个节点上,缓存到本地,供用户程序读取使用。它具有以下几个特点:缓存的文件是只读的,修改这些文件内容没有意义 ...
bigdata 2014-6-23 12799 张小川 2014-6-23 20:16
下一页 »

快速发帖

还可输入 200 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-12-22 10:06 , Processed in 0.076275 second(s), 12 queries .

返回顶部 返回版块