搜索资源列表
gmeans
- gmeans-- Clustering with first variation and splitting 文本聚类算法Gmeans ,使用了3种相似度函数,cosine,euclidean ,KL.文本数据使用的是稀疏矩阵形式. -gmeans clustering with first variation and splitting Gmeans,a text clustering algorithm, uses 3 functions,cosine,euclidean and
文本与二值图像的游程压缩[xtulbd,050418]
- 【文本与二值图像的游程】1. 文本游程压缩的原理 对重复字段采用3符号标识法:(1) 重复提示符,比如@,#等;(2) 游程长度参数或重复次数,若用一个字节表示,最大长度可为255个重复字;(3) 重复字符。以上三部分合称为重复因子。可见要获得压缩效益,重复字符应在3个以上。2. 图像游程压缩的原理 对于二值图像,原始数据为零一矩阵,压缩时逐行处理该矩阵:(1) 连续n个1,表示为+n;(2) 连续n个0,表示为-n。-text and binary image -- an outbound t
lz77压宿酸法
- lz77压宿算法,用c语言实现,可以在tc下编译通过,根据不同的计算机要修改下相关的参数值,对文本数据的压缩效果很好-lz77 places pressure algorithm, using the c language, in tc under compile, based on different computers to be amended under the relevant parameters, the text data compression with good result
20newgroup数据集
- 这是一个著名的文本分类训练集.通常用于测试分类算法的性能.写论文的同志必不可少的东西~~
数据结构的C++描述
- 目 录 译者序 前言 第一部分 预备知识 第1章 C++程序设计 1 1.1 引言 1 1.2 函数与参数 2 1.2.1 传值参数 2 1.2.2 模板函数 3 1.2.3 引用参数 3 1.2.4 常量引用参数 4 1.2.5 返回值 4 1.2.6 递归函数 5 1.3 动态存储分配
B+树实现旅游图站点搜索
- 一、 需求分析: (1) 已知某市每条公路路线及沿途所经过的站名,要实现的功能是:在任一车站终端查询知道 1、 是否有公共汽车到达指定的目的地(任一站点) 2、 若有,打印出乘车的路线(不一定唯一)。如需中途换车,应指示在哪里换哪条线路的车。 (2) 实现的数据结构:因为将公共交通图看成是一个有向图,所以选择十字链表为其数据结构。 其中有信息点为:站点的连接关系(十字链表的弧头和弧尾链域很好的实现了这个功能) 反应途径的线路号(这个当作弧的信息域,含有两个往返的方向,并且每个方向又对
Haffman
- 利用Haffman树实现文本数据的压缩和解压缩。VC++MFC环境-Using Haffman code method,complete text file compress and uncompress. please use it under VC++ mfc environment.
demo
- 实现数据挖掘的几个算法,包括模糊聚类,K均值,以及K近邻等聚类算法-Some of the implementation of data mining algorithms, including fuzzy clustering, K-means, as well as neighbors, such as clustering algorithm K
readtext
- 读入一个文本数据,转换成矩阵。 -Reading into a text data, conversion into a matrix.
textscantool
- 交互式可视化文本扫描工具,用于读取带有分隔数据的大型文本文件。-Textscantool is an interactive GUI to read large text files with delimited data. The tool lets you specify which columns to read and what data types to use.
The-text-data-about-data-mining-algorithms
- 文本数据的数据挖掘算法:对大量存在的文本数据,用已有的结构化数据挖掘技术,提出了非结构化数据知识发现方法。-The text data about data mining algorithms
stop_word
- 停用词库,四川大学机器智能实验室。用于文本数据挖掘的预处理。-Disable thesaurus, Sichuan University, Machine Intelligence Laboratory. Pre-processing for text data mining.
text_data_mining
- java编写的数据挖掘方面的代码,里面包含有文本分类,作者身份识别方面的java源码,本人亲自参与编写-java code about data mining;include:text cluster ,authorship identification,
supermarket
- 大四上学期做的一个人工智能里有关数据挖掘的课程设计,里面包括数据挖掘算法和数据库文件。。。对于想学好人工智能的非常有用-Last semester to do a senior artificial intelligence in the design of data mining programs, which include data mining algorithms and database files. . . The artificial intelligence is very u
Huffman
- 通过Huffman编码,实现对文件(如文本文件)的压缩和解压。压缩后生成二进制文件。压缩效率高。C++版数据结构与算法的典型应用。-By Huffman coding, to achieve the file (such as a text file) of the compression and decompression. Compressed binary file generated. Compression efficiency.
appl3_4
- 读入文本数据,绘制地震波时间域曲线及频谱分析图-Read text data, seismic mapping and spectral analysis of time domain curve diagram
基于MATLAB去噪后输出脉搏数据文本程序
- 本程序是利用matlab进行去噪后,对脉搏数据进行文本输出程序。(This procedure is the use of MATLAB denoising, pulse data for the text output process.)
wenbenduxiejisuan
- 读取文本数据并进行计算,将计算的结果写入新的文本,写入列数据并自动换行(Read the text data and calculate, write the results of the calculation to the new text, write the column data and change the line automatically.)
python数据分析 韩波
- 一本python数据分析的优秀资料 《python数据分析》(python data analysis),作者【印尼】Ivan Idris,翻译:韩波。 本人制作的PDF图书,带目录和书签。 作为一种高级程序设计语言,Python凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。同时,Python语言的数据分析功能也逐渐为大众所认可。, 本书是一本介绍如何用Python进行数据分析的学习指南。全书共12章,从Python程序库入门、NumPy数组、matplotlib和pa
Python机器学习基础教程(完整电子版)
- 本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。(This book is an introduction to machine learning, introduced in Python langua