搜索资源列表
K-meansNB
- :将K—means算法引入到朴素贝叶斯分类研究中,提出一种基于K—means的朴素贝叶斯分类算法。首先用K— me.arks算法对原始数据集中的完整数据子集进行聚类,计算缺失数据子集中的每条记录与 个簇重心之间的相似度,把记 录赋给距离最近的一个簇,并用该簇相应的属性均值来填充记录的缺失值,然后用朴素贝叶斯分类算法对处理后的数据 集进行分类。实验结果表明,与朴素贝叶斯相比,基于K—means思想的朴素贝叶斯算法具有较高的分类准确率。-: K-means algorithm will
AprioriMain
- 此算法实现了基本的Apriori算法,效率很低. 过程是:先通过对数据集进行扫描,得到候选1-项集C1,根据用户输入的最小支持度筛选出频繁1-项集L1,将筛选中 不满足条件的结果放入一个先验项集,然后对L1进行组合,并根据Apriori算法的先验原理,用每个组合的结果和先 验项集中的所有元素进行比较,如果组合结果的子集中包含先验集中的任何一个元组就将其排除,将没有被排除 的组合结果放入C2.如此循环反复,直到Cn或Ln为空. 2008.11.1-2008.11.3
clusterequal
- 将一个数据集通过聚类划分成若干大小相等的子集-decompositioning a large set into many subsets of equal set-size
MNIST-handwritten-digits
- 手写数字识别数据集,MNIST,包括原始数据集的所有样本,以及抽取的2000个样本的子集,.mat格式。美国著名数据集NIST的子集,模式识别常用实验数据集-handwritten digits recognition ,dataset, MNIST from NIST, .mat file,
jiqixuexi
- 编写代码计算信息增益,splitDataSet函数是用来选择各个特征的子集的,比如选择年龄(第0个特征)的青年(用0代表)的自己,我们可以调用splitDataSet(dataSet,0,0)这样返回的子集就是年龄为青年的5个数据集。chooseBestFeatureToSplit是选择选择最优特征的函数。(Write code to calculate the information gain.SplitDataSet function is used to select the featur