搜索资源列表
reuters21578
- 这是一个英文的语料库,可以用于进行文本的分类与聚类。是文本分类领域共用的一个语料库。-This is a corpus of English, can be used for text classification and clustering. The field of text classification is a common corpus.
111
- 有关层次聚类的源码,对于文本聚类有一定作用。-Hierarchical clustering,Text Clustering
myfirst1
- 实现吉布斯采样,可用来处理文本,对文本聚类,分析文本主题,请用vs2010打开-Achieve Gibbs sampling, can be used to handle text, text clustering, analysis of text themes
optics_cos
- 基于余弦聚类的OPTICS聚类算法,能够用于文本聚类-This is the OPTICS clustering algorithm based on cosine distance which can be used in text clustering.
Cjulei
- 将文本文件中数据按照C均值聚类算法进行聚类-The text file data according to C-means clustering algorithm for clustering
PLSA
- PLSA能夠將文字利用主題語意分群 是一個很有用的工具-PLSA able to use the theme semantic clustering text is a useful tool
CosineSimilarAlgorithmzf
- 这里会用到TF/IDF权重,用余弦夹角计算文本相似度,用方差计算两个数据间欧式距离,用k-means进行数据聚类等数学和统计知识。-Here will use the TF/IDF weight, with cosine angle calculation of text similarity, with the variance of the two data between the data of the European distance, with K-means data cluste
TextSummarizer-master
- Document summarizer approach for the text document to do clustering and then do summarization
DBSCAN Clustering
- 基于matlab的dbscancluster的实现可用于文本聚类(The implementation of dbscancluster based on Matlab can be used for text clustering)
情感分析用词语集·知网hownet词典
- 该软件可以实现微博分析、聊天分析、全网分析、网站分析、浏览分析、分词、词频统计、英文词频统计、流量分析、聚类分析等一系列文本分析(The software can realize micro-blog analysis, chat analysis, whole network analysis, website analysis, browse analysis, word segmentation, word frequency statistics, English word freque
协同过滤算法
- 文本聚类(Text clustering)文档聚类主要是依据著名的聚类假设:同类的文档相似度较大,而不同类的文档相似度较小。作为一种无监督的机器学习方法,聚类由于不需要训练过程,以及不需要预先对文档手工标注类别,因此具有一定的灵活性和较高的自动化处理能力,已经成为对文本信息进行有效地组织、摘要和导航的重要手段,为越来越多的研究人员所关注。(Text clustering document clustering is based on the well-known clustering assum