搜索资源列表
jiyuwenlideerzhihuafangfa
- 的基于纹理的牌照图象二值化方法即 首先对牌照图象作纹理分析, 然后采用模式识别技术中的最 大最小准则获取二值比阈值进行二值化的方法效果优于灰度直方图方法。若对纹理基元的选择附加一些条件则有可能提 供更好的二值化结果。该方法也可适用于票据或文本图象的 二值化。
Sliq
- 实现数据挖掘的一个重要算法sliq。能够从文本中读出数据,并进行数据挖掘的关联规则分析。
inference.rar
- 文本倾向性分析程序,由中国科学院计算所开发,基于LDA模型,不可外泄的内部程序,冒着被开除的风险与大家分享,欲下从速。,Tendentious text analysis program, developed by the Chinese Academy of Sciences calculated, based on the LDA model, the internal procedures can not be compromised, despite the risk of being
N-gram
- 在分析了传统的分类模型后 ,文中提出了用N元语言模型作为中文文本分类模型。根据该方法 ,设计并实现一个基于词的2元语言模型分类器。-After the review of traditional text classi fication models , a method using N2gram language models to classi fy Chinese text was presented. With the bi2gram model, a text classi fie
CRFPP0[1].53
- 条件随机域,主要用于标记序列,可以进行分词,词性标注,句法分析,以及文本抽取等。-condition random field
Query
- 根据潜在语义分析进行查询。将文本中的特征集合做LSI变换。-Latent Semantic Analysis in accordance with inquiries. The text of the characteristics of a collection so LSI transformation.
topicmodal
- 文本降维的新技术。含隐语义分析,在文本分类、聚类等领域都有广泛前景。-A new text dimension reduction techniques. With implicit semantic analysis, text classification, clustering and other fields have a wide prospect.
IntServer
- 复杂网络聚类算法进行文本分析,能够进行关键字的提取和分类功能。-Complex network clustering algorithm for text analysis, to carry out keyword extraction and classification capabilities.
Analysis-of-Documents
- 机器学习中的文本分析资料 Rapid Exploitation and Analysis of Documents-Rapid Exploitation and Analysis of Documents
onTextCategorization
- 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增 益IG、互信息MI、V2分布CHI 四种不同的特征选取方法。采用支持向量机(SVM) 和KNN两种不同的分类 器以考察不同抽取方法的有效性。实验结果表明, 在英文文本分类中表现良好的特征抽取方法( IG、MI 和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因, 并分析了可能的 矫正方法包括采用超大规模训练语料和采用组合的特征抽取方法。最后通过实验验证组合特征
naivebeys
- 朴素贝叶斯实现文本的正负趋向性分析,使用python编的,可以通过编绎,很方便。-Naive Bayes text of the positive and negative trend analysis, using python compiled by unravel, very convenient.
text-est
- 这是一篇综述文章,介绍文本分析的参数估计问题,主要是贝叶斯模型包括PLSA,LDA等-This technical note is intended to review the foundations of Bayesian parameter estimation in the discrete domain, which is necessary to understand the inner workings of topic-based text analysis approache
LSA
- LSA文本分析 LSA文本分析 LSA文本分析 -LSA wenbenfenxi
CNN
- 卷积神经网络的源代码,用于微博博文文本情感分析的三分类。(Convolutional neural network source code for micro-blog Bowen text sentiment analysis of the three categories.)
机器学习与数据挖掘方法和应用
- 本书分为5个部分,共18章,较为全面地介绍了机器学习的基本概念,并讨论了数据挖掘和知识发现中的有关问题及多策略学习方法,具体地阐述了机器学习与数据挖掘在工程设计,文本、图像和音乐,网页分析、计算机病毒和计算机控制,医疗诊断、生物医疗信号分析和水质分析中的生物信号处理等方面的应用情况。本书收集众多不同领域中数据挖掘的实际案例,以此来说明数据挖掘的具体解决方法,以期为广大读者提供一个更为广阔的数据挖掘(The book is divided into 5 parts, 18 chapters, a
sentiwordnet
- python3.6下英文文本预处理和情感分析(English text preprocessing and emotional analysis under python3.6)
计算语言学讲义中科院+刘群
- 自然语言处理语义分析演讲内容,入门者推荐学习(Text categorized corpus)
文本分类
- 于潜在语义分析的网页文本分类研究,基于拉推策略的基本思想,该文提出了文本分类的增量学习模型ICCDP。
Sentiment Analysis1
- 读取csv或xlsx文件后对文本信息进行NLP情感分析并计算出情感的得分,越接近1越积极,越接近-1越消极(After reading the CSV or xlsx file, NLP sentiment analysis is performed on the text information and the score of sentiment is calculated. The closer to 1, the more positive, the more close to - 1,
Python机器学习基础教程(完整电子版)
- 本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。(This book is an introduction to machine learning, introduced in Python langua