搜索资源列表
DataMining3rd
- 评测数据在去掉停用词的 分类过程开放测试中,引入Good-Turing算法的分类性能比Laplace原则提高了3·05 ,比Lidstone方法提高 1·00 .而在交叉熵选择特征词的算法中,增加Good-Turing的贝叶斯分类方法可比最大熵分类性能高95 .通过这种数据平滑的算法,有助于克服因数据稀疏而引发的特征词缺失问题 -Evaluation data in the open test of the classification process to remove stop
classificiation-algorithm-overview
- 机器学习领域经典分类算法综述,包括Decision Tree(ID3、C4.5(C5.0)、CART、PUBLIC、SLIQ和SPRINT算法),三种典型贝叶斯分类器(朴素贝叶斯算法、TAN算法、贝叶斯网络分类器),k-近邻 、 基于数据库技术的分类算法( MIND算法、GAC-RDB算法),基于关联规则(CBA:Classification Based on Association Rule)的分类(Apriori算法),支持向量机分类,基于软计算的分类方法(粗糙集(rough set)、遗传