搜索资源列表
KMeanIntroduction
- 聚类分析是将集合中的数据按其相似性大小分成不同类别的一种方法,它是模式 识别中多变量无监督学习的一个分支,己成功地用于医学,地质,财务,工程,图像 处理和文档等的数据分类中;含有实现此算法的源码 -cluster analysis is to pool the data according to similar size into a different category, It is pattern recognition multivariable Unsupervised Le
dfdgg
- 图象处理源代码集 图像分割是图像处理、模式识别、计算机视觉等领域中极为重要的内容之一,是实现自动图像分析时首先需要完成的操作。它是根据图像的某些特征或特征集合的相似性准则,对图像像素进行分组聚类,把图像平面划分为一系列有意义的区域,使其后的图像分析及识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息。由于分割中出现的误差会传播至高层次处理阶段,因此分割的精确程度是至关重要的。-image processing source code is a set image s
LJClusterDemo
- 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模
AIS
- 本文简要介绍了数据挖掘中的聚类、关联分析、时间序列分析等理论和技术,在分析目前交通领域的数据挖掘,特别是AIS信息的数据挖掘研究现状的基础上,针对网络化的AIS数据库的AIS信息特点,提出了用于AIS信息的挖掘方法-This paper briefly describes the data mining clustering, association analysis, time series analysis theory and technology, in analyzing the da
Chameleon
- Chameleon算法是一种通过在合并两类时用更高 的标准来提高聚类质量的聚类算法,它既考虑了互连 性,又考虑了近似度,特别是簇内部的特征,因而能够 自动地适应被合并簇的内部特征,因此具有较强的发 现任意形状和任意大小簇的能力。Chameleon算法首 先由数据集构造成一个K-最近邻图Gk,再通过一个 图的划分算法将图Gk划分成大量的子图,每个子图 代表一个初始子簇,最后用一个凝聚的层次聚类算法 反复地合并子簇来找到真正的结果簇。 -Chameleon
ARM
- 数据挖掘,分类的方法介绍和聚类的相关应用等-data mining
Clustering.Algorithms.Research
- 软件学报 2008年论文《聚类算法研究》,作者孙吉贵, 刘杰, 赵连宇。pdf格式,14页。对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括 另一方面选择一些典型的聚类算法和一些知名的数据集,主要从正确率和运行效率两个方面进行模拟实验,并分别就同一种聚类算法、不同的数据集以及同一个数据集、不同的聚类算法的聚类情况进行对比分析.最后通过综合上述两方面信息给出聚类分析的研究热点、难点、不足和有待解决的一些问题.上
PCA
- 提出一种基于主分量分析和相融性度量的快速聚类方法。通过构造主分量空间将高维数据投影到两个主成分上 进行特征提取,每一个主分量都是原始变量的线性组合-Is proposed based on Principal Component Analysis and Measure of blending fast clustering method. Principal component space by constructing a high-dimensional data onto two p
File3
- 数据挖掘,聚类,遗传算法,k-means算法,基于遗传算法的k-means聚类方法。-Data mining, clustering, genetic algorithm, k-means algorithm, based on genetic algorithm k-means clustering method.
File10
- Web文档聚类系统的设计与实现:数据挖掘;聚类分柝:文本挖掘;预处理;聚类组合;可 视化;欧氏距离-Web Document Clustering Design and Implementation: Data mining Clustering Hierarchical: text mining pretreatment cluster combinations visualization Euclidean distance
lunwen
- 可拓性数据挖掘 客户服务系统 系统聚类在客户关系管理中的应用-System gathers application in resembling in Customer Relationship Management
kmeans
- 用VC或Java实现K-means聚类算法,分别以迭代次数及分配不再发生变化为算法终止条件,用图片(自己选择)作为数据集,比较运行时间(画出时间与像素点的关系曲线图,因此须用多幅像素个数不同的图片进行实验),提交实验报告与源代码。-K-means clustering algorithm for algorithm termination conditions, with a picture (their choice) as a data set to compare the running
8
- 基于模型的时间序列数据挖掘---聚类和预测相关问题研究 ---- Clustering and forecasting issues related to model-based time-series data mining
datamining
- 主要介绍在大型数据库中发现知识(Knowledge Discovery in Large Databases, KDD)的各种技术,是专门针对决策支持中的各类问题进行讨论的高端课程。面向对象为软件工程专业硕士研究生。 本课程讲授的主要内容包括:数据预处理、数据仓库及OLAP、概念描述型数据挖掘、关联规则挖掘、分类挖掘和预测以及聚类挖掘,涉及的领域包括数理统计、概率论、机器学习、信息论、集合论等等。-Introduces knowledge discovery in large dat
juleisuanfa
- 聚类算法,适用于数据的模糊聚类,便于数据的集中处理-Clustering fuzzy clustering algorithm, applied to the data to facilitate centralized data processing
high-demensional
- 这是一些有关高位数据聚类的论文,还挺有帮助的-This is some of the papers about the high data clustering, quite helpful
Fuzzy-Clustering
- K_means算法研究综述k均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所有聚类算法中最广泛使用的。给定一个数据点集合和需要的聚类数目k,k由用户指定,k均值算法根据某个距离函数反复把数据分入k个聚类中。-rewelding K_means algorithm research review
Matlab_analyse_traffic_jam_status
- 根据深圳市出租车GPS数据所提供的信息,针对交通出行数据的空间分布特征,选取了4月18号这天的全天数据出租车载客后的行驶数据, 利用mtalab对数据的处理,筛选出出租车的起始点及拥堵的时段的行驶数据并通过kmeans聚类分析设定拥堵的标准,得到对于出租车在路段上的车速在小于2.15公里/小时的时候可以认为非常拥堵,拥堵的时段 5:00-7:00,12:00-14:00,19:00-21:00,非常拥堵的时间段为5:00-7:00,19:00-21:00。-analyse traffic jam
sonno
- TGSOM一种用于数据聚类的动态自组织映射神经网络,一篇不错的论文-Dynamic TGSOM for data clustering self-organizing map neural network, a good thesis
Clementine两步聚类
- 数据挖掘工具Clementine进行两步聚类的全流程指导