搜索资源 - 数据集 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

中文信息处理

搜索资源 - 数据集

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

汇编语言

SCSI/ASPI

编译器/词法分析

磁盘编程

语音合成与识别

编辑器/阅读器

杀毒

中文信息处理

并行运算

书籍源码

Dephi控件源码

操作系统开发

中间件编程

MacOS编程

LabView编程

易语言编程

搜索资源列表

experimentoftextclassification

0下载：
整个实验是在Windows环境下使用delphi完成的。选取了600篇文档，数据集共分教育，商业与经济，计算机与因特网，娱乐与休闲，自然科学5个类别，教育类包括31篇文档，商业与经济类有93篇文档，计算机与因特网102篇文档，娱乐与休闲166篇文档，自然科学有208篇文档。目录“DataSet”：RawText中的文本分词后保存在DataSet目录。数据表“WordsTable”：保存DataSet中所有文本的倒排文档。其中“目录
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：2863443
- 提供者：同承

wordmark

0下载：
通过一个已经标号词性的训练集来得到训练数据，再根据训练数据对需要进行分词的数据进行分词，采用概率最高的分词情况为最后结果。-By a label the parts of speech training set training data to get the need segmentation data based on the training data segmentation with the highest probability of segmentation for the fin
所属分类：MultiLanguage
- 发布日期：2017-11-15
- 文件大小：5274570
- 提供者：小鑫猪

ReutersClassification

0下载：
调用weka.jar中的前处理及分类方法，实现对Reuters-21578数据集的文本分类-Do the classification for Reuters-21578 dataset based on methods in weka.jar
所属分类：MultiLanguage
- 发布日期：2017-05-20
- 文件大小：5655753
- 提供者：F Y

bp

0下载：
针对样本决策库数据量大的问题选用基于粗糙集对提取的样本数据进行离散化-Sample library data for decision-making problem of large sample selection based on rough sets were discrete data extraction
所属分类：MultiLanguage
- 发布日期：2017-04-11
- 文件大小：1080
- 提供者：马吴永

aclImdb_v1.tar

1下载：
英文影评语料库，用于英文情感分析。包含训练集和测试集，均为标注数据。(English movie reviews corpus)
所属分类：多国语言处理
- 发布日期：2020-03-25
- 文件大小：84125696
- 提供者：wwwWang

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.