搜索资源列表
hdfs
- 基于Java的Hadoop分布式文件系统-Hadoop dfs
kfs-0.3.tar
- 来自startup的垂直搜索引擎http://www.kosmix.com/的开源项目,又一个开源的类似google mapreduce 的分布式文件系统,可以应用在诸如图片存储、搜索引擎、网格计算、数据挖掘这样需要处理大数据量的网络应用中。与hadoop集成得也比较好,这样可以充分利用了hadoop一些现成的功能,基于C++。-Applications that process large volumes of data (such as, search engines, grid compu
Hadoop_Install_And_Configration
- 一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。-A distributed system infrastructure development by the Apache Foundation. Users can not understand the underlying details
hadoop-setup-in-CentOS
- Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。-Hadoop i
gfarm-2.5.1.tar
- Gfarm 是一个分布式的文件系统,主要用于大规模的集群计算。-It s implemented in userland, and can be mounted by FUSE. It utilizes locality of a file to access a data node, and supports Globus GSI for Wide Area Network. Users can control file replica location on Gfarm. Gfarm can
Hhadoop-010taa
- Hadoop是一个用于运行应用程序在大型集群的廉价硬件设备上的框架。Hadoop为应用程序透明的提供了一组稳定/可靠的接口和数据运动。在 Hadoop中实现了Google的MapReduce算法,它能能够把应用程序分割成许多很小的工作单元,每个单元可以在任何集群节点上执行或重复执行。此外,Hadoop还提供一个分布式文件系统用来在各个计算节点上存储数据,并提供了对数据读写的高吞吐率。由于应用了map -Hadoop is a framework for running application
hdfs-replication-management-
- hdfs副本管理,详细介绍了hdfs分布式文件系统的副本维护原理-HDFS replica management, introduces in detail a copy of the hadoop distributed file system maintenance principle
FileSystemCat
- Hadoop HDFS文件系统操作例程。功能包括:获取HDFS指定目录下所有文件列表,打印输出 递归遍历目录 上传本地文件到HDFS 在HDFS上Hadoop HDFS文件系统例程。功能包括:创建文件夹 创建HDFS文件 读取HDFS文件内容 重命名HDFS文件 删除HDFS文件及目录 查看HDFS文件是否存在 获取HDFS中指定目录中的文件列表. -Hadoop HDFS file system operations routine. Features include: HDFS to get
NetDisk
- Hadoop分布式文件系统HDFS访问例程,为Java界面程序,通过IOUtils.copyBytes可将 本地上传文件到HDFS;或从HDFS下载文件到本地硬盘。开发环境为Eclipse。-Hadoop Distributed File System HDFS access routines for Java interface program, through IOUtils.copyBytes can upload files to the local HDFS or downloa
WordCount.tar
- wordcount程序,一般用于检测hadoop是否安装成功并能正常运行;计算您上传到HDFS文件系统中的文件的字数-Wordcount program, commonly used to test whether the hadoop installation is successful and can run normally Calculate you uploaded to the HDFS files the number of words in a file system
Hive-programming-guide(2)
- 本书是一本ApacheHive的编程指南,旨在介绍如何使用Hive的SQL方法—HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。全书通过大量的实例,首先介绍如何在用户环境下装和配置Hive,并对Hadoop和MapReduce进行详尽閘述,最终演示Hive如何在Hadoop生态系统进行工作。 本书适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。 -This book is a Apache Hive programming gu
Hbase
- HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。