搜索资源列表
epc2d-update
- 一个投影聚类算法及其数据集生成源码。 参考文献: Eric K.K. Ng, A. Fu : Efficient algorithm for Projected Clustering,-a clustering algorithm and its projection data sets generated source. References : Eric K. K. Ng, A. Fu : Projected Efficient algorithm for clustering,
realDBSCAN
- 二维的DBSCAN聚类算法,输入(x,y)数组,搜索半径Eps,密度搜索参数Minpts。输出: Clusters,每一行代表一个簇,形式为簇的对象对应的原数据集的ID-two-dimensional clustering algorithm, the input (x, y) array, search radius Eps. Minpts density search parameters. Output : Clusters, each firm on behalf of a cluste
singlelink
- 聚类算法:最短距离算法。对给定的数据集进行自底向上的层次的分解,直到某种条件满足而已。缺陷在于一旦一个步骤完成,它就不能被撤消这个严格的规定是有用的,由于不用担心组合数目的不同选择,计算代价会较小。
isodata_iris
- 聚类分析isodata算法的C程序,实现对iris数据集分类的功能
dbscan
- DBSCAN是一种性能优越的基于密度的空间聚类算法.利用基于密度的聚类概念,用户只需输入一个参数,DBSCAN算法就能够发现任意形状的类,并可以有效地处理噪声.这里是用C# 编写的,以兰花数据集作为测试数据的代码。
zhong
- 系统聚类算法K-means 属于聚类分析中一种基本的划分方法,常采用误差平方和准则函数作为聚类准则,该算法在处理大数据集时是相对可伸缩且高效率的,同时具有潜在的数据并行性。但是这种算法依赖于初始值的选择以及数据的输入顺序;此外,当运用误差平方和准则函数测度聚类效果时,如果各簇的形状和大小差别很大,为使误差平方和 Jc 值达到最小有可能出现将大的聚类簇分割的现象。-system clustering algorithm K-means cluster analysis is a basic met
遗传聚类
- 使用遗传算法优化Kmeans聚类过程,测试数据集都来源于UCI,很好理解,适合初学者。
Clustering.zip
- 数据挖掘算法的实现,基于模糊聚类的最大树算法,数据集是darpa99,也就是KDD-CUP99中采用的数据集,The realization of data mining algorithms, based on fuzzy clustering of the largest tree algorithm, a data set is darpa99, which is used in KDD-CUP99 data set
selfAffinity
- AP是在数据点的相似度矩阵的基础上进行聚类.对于规模很大的数据集,AP算法是一种快速、有效的聚类方法,这是其他传统的聚类算法所不能及的,-A semi-supervised clustering method based on affinity propagation (AP) algorithm is proposed in this paper. AP takes as input measures of similarity between pairs of data points. AP
K-meansNB
- :将K—means算法引入到朴素贝叶斯分类研究中,提出一种基于K—means的朴素贝叶斯分类算法。首先用K— me.arks算法对原始数据集中的完整数据子集进行聚类,计算缺失数据子集中的每条记录与 个簇重心之间的相似度,把记 录赋给距离最近的一个簇,并用该簇相应的属性均值来填充记录的缺失值,然后用朴素贝叶斯分类算法对处理后的数据 集进行分类。实验结果表明,与朴素贝叶斯相比,基于K—means思想的朴素贝叶斯算法具有较高的分类准确率。-: K-means algorithm will
wyp1
- 网通数据资源,用以进行聚类时的数据集,对实验仿真有帮助-Netcom' s data resources to carry out clustering of data sets, the experimental simulation help
TRACLUS_Algorithm
- 轨道聚类算法,用于大样本数据集的轨道聚类,实验效果良好-Track clustering algorithm for large sample data sets track clustering, experimental results well
fcm-mine
- 模糊C均值聚类算法。可以对数据集进行聚类。-fcm
emalgorithmusedtocluster
- 采用em算法对某个具体的二维数据集进行聚类-Em algorithm using two-dimensional data set to a specific cluster
datamining
- 以microsoft.com网站的一组处理后的web日志为数据(ftp://ftp.ics.uci.edu/pub/machine-learning-databases/anonymous/),利用并根据实际情况改进了聚类分析基于划分的方法类中最基本的Kmeans和Kmedoids方法,对下载数据集的一个采样(5000samples,294 attributes per sample)进行了简单的聚类分析,以期望找出有用的用户访问模式。 -web datamining with datase
KMEANS
- k-means C++ 源代码, 修正原来的错误, 增加的新功能 1、用vector实现其存储 2、直接在程序中读取数据集 3、结果可以保存到文件中 4、用户可以输入聚类个数 5、初始聚类中心随机选择(代码自动随机)-k-means C++ source code, fixes the original error, the increase in new features 1, 2, with the vector to achieve its store dire
clusterequal
- 将一个数据集通过聚类划分成若干大小相等的子集-decompositioning a large set into many subsets of equal set-size
C-means-clustering-algorithm
- 利用C++实现C均值聚类算法。模糊c均值聚类算法因算法简单收敛速度快且能处理大数据集,解决问题范围广,易于应用计算机实现等特点受到了越来越多人的关注,并应用于各个领域。-C means clustering algorithm in C++
xcluster-master
- SIGKDD2017上的文章,该算法适合数据集类簇数和数据条目都比较大的情况,聚类效率高(It is suitable for large number of data categories and data items, and the efficiency of clustering is high)
Clustering-master
- 一个基础的聚类算法,带数据集,适合初步研究聚类算法的人学习。(A basic clustering algorithm, with data sets, is suitable for the preliminary study of clustering algorithm for human learning.)