搜索资源列表
kmeans
- k均值聚类方法。 在给定一个有n个对象的数据集,划分聚类技术将构造数据进行k个划分,每一个划分代表一个簇,k小于等于n。-k-means clustering method. Given a set of n objects data, dividing the data clustering techniques to construct k partitions, each partition represents a cluster, k less than or equal n.
recommender-
- Collaborative Filtering,基于Collaborative Filtering,建立主动为用户推荐商品的推荐系统。实现参考协同过滤算法或它的优化,实现并改进算法,计算出每个客户对未购买的商品的兴趣度,并向客户主动推荐他最感兴趣的N个商品。实验数据可以从MovieLens.com下载。要求使用至少10,000不同用户的数据,至少1000个不同的movie。-Collaborative Filtering,Based Collaborative Filtering, the in
DeepLearning-master
- 深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。[1] 深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。[1] 深度学习是机器
libsvm-guide
- 为libsvm或者svm初学者编写的文档,特别介绍数据挖掘的步骤-for beginner of libsvm or svm
naivebayes
- 朴素贝叶斯算法 求导致某一结果或现象发生的最可能的条件-Naive Bayes algorithm for the most likely cause of the condition or a result of the phenomenon
K_Means-algorithm
- very useful matlab code for K_Means Algorithm it can be use after change the given input data or use the original one that i provided with the code you can start by run K_Means_Clustering.m
ProcessData
- 以数据分割为中心进行探讨对数据进行分割,可缩小待访问数据对象的范围或磁盘空间,提高检索性能,把分割后的数据放到不同的磁盘上,提高数据库并行访问的能力-To split the data into the data center to explore split, the data object to be accessed can be reduced scope or disk space to improve the retri performance, the data is divid
bayes
- 首先对数据进行拆分,分为测试集与训练集,通过训练集进行贝叶斯网络的建模,最后利用建立的模型进行预测或分类任务的R语言代码-First, the data is split into a training set and test set, Bayesian network modeling through the training set, and finally the use of the model to predict or classify tasks R language code
LDA-topic-model
- 首先声明,这是别人写的LDA主题模型代码,本人测试过,可以运行,但是输出跟输出有点不尽人意,输入的是词的序号和该词在文档中出现的次数,要是可以直接读取文档就完美了。输出是主题以及词在该主题出现的概率,其中得到的主题我就看不懂了,不知道是算法问题,还是因为我的水平有限。在研究LDA主题模型的朋友,可以下载试一下-First statement, which is written by someone else LDA topic model code, I tested, you can run,
cengcijvlei
- 层次聚类分析也称系统聚类法或分级聚类法,是实际工作中采用最多的方法之一-Hierarchical cluster analysis, also known as system clustering or hierarchical clustering method, is one of the most used methods in practical work.
kde2d
- 二维高斯核函数重构 重构方法不依赖于参数化模型-2D Gaussian Kernel Reconstruction fast and accurate state-of-the-art bivariate kernel density estimator with diagonal bandwidth matrix. The kernel is assumed to be Gaussian. The two bandwidth parameter
svd
- 奇异值分解在某些方面与对称矩阵或厄米矩阵基于特征向量的对角化类似。然而这两种矩阵分解尽管有其相关性,但还是有明显的不同。-Singular value decomposition in some respects symmetric matrix or Hermitian matrix based on a similar feature vectors diagonalization. However, the two matrix decomposition in spite of its
FCMCluster
- 模糊c-均值聚类算法 fuzzy c-means algorithm (FCMA)或称( FCM)。在众多模糊聚类算法中,模糊C-均值( FCM) 算法应用最广泛且较成功,它通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。- 模糊c-均值聚类算法 fuzzy c-means algorithm (FCMA)或称( FCM)。在众多模糊聚类算法中,模糊C-均值( FCM) 算法应用最广泛且较成功,它通过优化目标函数得到每个样本点
E-Algorithm
- 用于数据挖掘分类的算法,E-Alothm,并附有10个左右的KEEL专用数据集,算法实现+实际例程。-For the data mining classification algorithm, E-Alothm, and with 10 or so KEEL dedicated data set, the algorithm to achieve+ practical routines.
pso
- pso粒子群算法 他是一个实现Common,Clerc 1“的PSO工具箱 Trelea类型以及跟踪更改的alpha版本环境。 它可以搜索最小,最大或“距离” 用户开发成本函数。 很容易使用和黑客 相当好的文档(类型帮助任何功能和 它应该告诉你你需要什么),并将利用 矢量化成本函数。 它使用与Matlab类似的语法 优化工具箱。 包括静态和动态的套件测试功能。 它还包括一个专用的基于PSO的神经元网络教练与Mathwork的神经网络工具箱一起使用。-his is a
nmf
- 非负矩阵分解,处理合成孔径雷达图像,数据处理(The multichannel or wide-angle imaging performance of synthetic aperture radar (SAR) can be improved by applying the compressed sensing (CS) theory to each channel or sub-aperture image formation independently.)
DoubanMovie250DataMining
- 用于抓取豆瓣电影前250位信息,可增加或修改需要抓取的信息(To crawl the information of Top250 movies in www.douban.com, if you need ,you can edit file to add or change the information you need.)
重抽样与自助法
- 当数据抽样于非正态分布时,如未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,这时基于随机化和重抽样的统计方法可派上用场。(When the sampling data in non normal distribution, such as the unknown or mixed distribution, the sample size is too small, there are outliers, based on the theor
机器学习实战
- 机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存、谋发展的决定性手段,这使得这一过去为分析师和数学家所专属的研究领域越来越为人们所瞩目。(Machine learning is an extremely important research direction in the field of artificial intelligence. Under the background of the large da
weka-3-8-1
- weka3-8-1最新包,可直接放到eclipse 或者打开可视化做数据挖掘(The latest package of weka3-8-1 can be directly put into eclipse or open to do data mining.)
