搜索资源列表
hadoop-0.7.1.tar
- hadoop:Nutch集群平台,分布式编程模式,让Nutch可以自动在普通机器组成的集群中以并行方式分布执行-hadoop : Cluster Nutch software platform, distributed programming model, Let Nutch software can be automatically composed of general machinery cluster parallel to the implementation of distribut
hadoop-0.20.1.tar
- hadoop平台的源代码,这这上面可以架设hadoop-hadoop
Hadoop-eclipse
- 云计算hadoop的eclipse平台开发配置介绍,十分有用哦-Hadoop' s eclipse cloud computing platform configuration descr iption, very useful oh
src
- 基于将数据挖掘与并行技术结合,学习数据挖掘中关联规则算法,用java编写出最高效的apriori改进算法,用ubuntu上的eclipse作为开发平台,通过在eclipse上安装hadoop插件的方法建立并行平台。-Based on the data mining combined with parallel technology, learning algorithms in data mining association rules, using Java to write out the
wordcount
- 可在hadoop平台上运行的java程序,用于文本的字数统计-word count
mahout-distribution-0.8
- mahout最新稳定版本源码包,基于hadoop平台,可以看发推荐系统。-mahout latest stable version of source code package, based on hadoop platform, you can see the hair recommendation system.
hadoop-eclipse
- hadoop平台下安装eclipse的插件和教程。非常简单-install eclipse plugins and tutorials under hadoop platform. Very simple
WordCount
- hadoop-2.2.0实现的在windows7平台的mr代码,-hadoop-2.2.0 code in windows7
esaymr_v1.0
- 整个框架是基于.NET Framework2.0开发,绿色不需要任何安装和复杂配置,相对与Hadoop简直可以用轻松来形容,可以让任何一个程序员或者IT短时间内快速搭建起属于自己的并行计算框架。功能介绍 1、一个并行计算软件框架 基于此框架的软件可以运行在多台计算机组成的计算集群上,并且每个计算机的计算任务也是多线程方式并行进行的,对于处理复杂的业务和巨量数据时非常用于。 2、有着MapReduce血统的任务调度监控中心 EasyMR的作业会由Mgr平台根据Key集切分成若干个数
src
- 实现在Hadoop平台上分布式环境上的K-means聚类,随机选取中心点后进行分类-Implementing K-means clustering on a distributed environment on the Hadoop platform, sorting randomly after selecting the center point
wordcount
- 在hadoop平台进行大数据的wordcount.(Wordcount for big data at hadoop platform.)