CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 其它 中文信息处理 搜索资源 - 数据集

搜索资源列表

  1. experimentoftextclassification

    0下载:
  2. 整个实验是在Windows环境下使用delphi完成的。选取了600篇文档,数据集共分教育,商业与经济,计算机与因特网,娱乐与休闲,自然科学5个类别, 教育类包括31篇文档, 商业与经济类有93篇文档, 计算机与因特网102篇文档, 娱乐与休闲166篇文档, 自然科学有208篇文档。 目录“DataSet”:RawText中的文本分词后保存在DataSet目录。 数据表“WordsTable”:保存DataSet中所有文本的倒排文档。 其中“目录
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:2863443
    • 提供者:同承
  1. wordmark

    0下载:
  2. 通过一个已经标号词性的训练集来得到训练数据,再根据训练数据对需要进行分词的数据进行分词,采用概率最高的分词情况为最后结果。-By a label the parts of speech training set training data to get the need segmentation data based on the training data segmentation with the highest probability of segmentation for the fin
  3. 所属分类:MultiLanguage

    • 发布日期:2017-11-15
    • 文件大小:5274570
    • 提供者:小鑫猪
  1. ReutersClassification

    0下载:
  2. 调用weka.jar中的前处理及分类方法,实现对Reuters-21578数据集的文本分类-Do the classification for Reuters-21578 dataset based on methods in weka.jar
  3. 所属分类:MultiLanguage

    • 发布日期:2017-05-20
    • 文件大小:5655753
    • 提供者:F Y
  1. bp

    0下载:
  2. 针对样本决策库数据量大的问题选用基于粗糙集对提取的样本数据进行离散化-Sample library data for decision-making problem of large sample selection based on rough sets were discrete data extraction
  3. 所属分类:MultiLanguage

    • 发布日期:2017-04-11
    • 文件大小:1080
    • 提供者:马吴永
  1. aclImdb_v1.tar

    1下载:
  2. 英文影评语料库,用于英文情感分析。包含训练集和测试集,均为标注数据。(English movie reviews corpus)
  3. 所属分类:多国语言处理

    • 发布日期:2020-03-25
    • 文件大小:84125696
    • 提供者:wwwWang
搜珍网 www.dssz.com