搜索资源列表
LJClusterDemo
- 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模
Matching-Algorithm
- 要:图像匹配是计算机视觉中许多领域的基础,特征提取则是图像匹配的基础,其中不变量特征是一 个重要的理论。SIFt是最有效的尺度、旋转、亮度不变量局部特征之一,但算法复杂、计算时间长。分析 了SIFt的计算时间分配,通过计算关键点的邻域梯度直方图时动态修改采样步长,大大提高了SWr的 计算速度。分析了基于SIFt特征的图像匹配算法,提出了双向匹配算法,提高了图像匹配的准确率。实 验结果表明所提出的方法是有效的-Scale invariant feature transform(SI
PMl-IR
- Blog信息源和信息量的广泛增长给中文文本分类带来了新的挑战。本文提出了—种基于PMI—IR算法的四种情感分类方法来对Blog文本进行情感分类。该方法以情感词语为中心,通过搜索引擎返回的结果来计算文本 中的情感要素和背景情感词之问的点互信息值,从而对文本进行情感分类。该方法在国家语言资源监测与研究中心网络媒体语言分中-心2008年度的Blog语料和COAE2008的语料上分别进行了测试。与传统方法相比准确率和召回率都有了较大的提高。-Development ofBIog texts info