搜索资源列表
kfs-0.3.tar
- 来自startup的垂直搜索引擎http://www.kosmix.com/的开源项目,又一个开源的类似google mapreduce 的分布式文件系统,可以应用在诸如图片存储、搜索引擎、网格计算、数据挖掘这样需要处理大数据量的网络应用中。与hadoop集成得也比较好,这样可以充分利用了hadoop一些现成的功能,基于C++。-Applications that process large volumes of data (such as, search engines, grid compu
hdfs-replication-management-
- hdfs副本管理,详细介绍了hdfs分布式文件系统的副本维护原理-HDFS replica management, introduces in detail a copy of the hadoop distributed file system maintenance principle
NetDisk
- Hadoop分布式文件系统HDFS访问例程,为Java界面程序,通过IOUtils.copyBytes可将 本地上传文件到HDFS;或从HDFS下载文件到本地硬盘。开发环境为Eclipse。-Hadoop Distributed File System HDFS access routines for Java interface program, through IOUtils.copyBytes can upload files to the local HDFS or downloa
KafkaDemo
- Kafka是一个高吞吐量分布式消息系统。linkedin开源的kafka。 Kafka就跟这个名字一样,设计非常独特。首先,kafka的开发者们认为不需要在内存里缓存什么数据,操作系统的文件缓存已经足够完善和强大,只要你不搞随机写,顺序读写的性能是非常高效的。kafka的数据只会顺序append,数据的删除策略是累积到一定程度或者超过一定时间再删除。Kafka另一个独特的地方是将消费者信息保存在客户端而不是MQ服务器,这样服务器就不用记录消息的投递过程,每个客户端都自己知道自己下一次应该从什么地
mpi_userguide
- 压缩包内包含了MPIVH2安装包,以及Linux系统下的安装说明,集群内NFS共享的安装说明,以及一个分布式计算的示例程序(100个文件,分布式处理后,结果写入另外100个文件)。在虚拟机REDHAT上经过测试,-Within the archive contains a MPIVH2 installation package and installation instructions under Linux, NFS shares within a cluster installation i
day3.tar
- 大数据统计单词代码源码,还有分布式文件系统上传文件代码,rpc远程调用代码-Big data statistics the word code, source code, and the file on the file system of distributed code, RPC remote procedure call code