搜索资源列表
SVM
- 使用支持向量机算法对二分类问题进行预测,实现大数据分析的目标。(Support vector machine algorithm is used to predict the two classification problem, and achieve the goal of large data analysis.)
MyWebApp
- 用javaweb实现的淘宝双11大数据分析,通过对数数百万条数据处理上传到hdfs,然后转到mysql中,其中还有基于SVM的回头客预测。(Using JavaWeb to achieve Taobao double 11 data analysis, through millions of data processing, upload to HDFS, and then go to MySQL, including SVM based repeat customer forecasts.)
Spark快速大数据分析
- 利用Python和Spark进行海量数据的实时分析,解决商业方案(Using Python and Spark to do real-time analysis of mass data, and to solve business solutions)
大数据下的机器学习算法综述
- 研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题. 文中主要分析和总结当前用于处理大数据的机器学习算法的研究现状.(Developing machine learning algorithms for big data is a research focus. In this paper, the state of the art machine learning techniques for big data are introduced and analyzed.)
大数据爬虫
- 实现网页信息爬取,爬取您需要的信息,实现数据获取分析功能(Implementation of web crawling)
[muchong.com]数据分析与解方程
- 在实现数据分析技术时,有可能还需要进行数据的规范化和数据处理. 该文档将会发挥较大的作用。(When implementing data analysis technology, you might also want to consider normalization and data handling. This document will play an important part in this.)
大数据时代
- 从硅谷到北京,大数据的话题正在被传播。随着智能手机以及 “ 可佩带 ” 计算设备的出现,我们的行为、位置,甚至身体生理数据等每一点变化都成为了可被记录和分析的数据。(From Silicon Valley to Beijing, the topic of big data is being spread. With the advent of smartphones and wearable computing devices, every change in our behavior, loc
hive高级分析函数与优化
- 大数据分析工具 hive 高级分析函数的使用与优化,笔记整理!(hive analyze function& optimize)
第9章 聚类分析
- 大数据挖掘,主要包括:数据的分类与聚类分析、智能算法、(Classification and cluster analysis of data)
深入浅出数据分析.pdf
- 《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文以后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现《深入浅出数据分析》目标知识以外,为读者搭建了走向下一步深入研究的桥梁。 《深入浅出数据分析》构思跌宕起伏,行文妙趣横生,无论读者是职场老手,还是业界新人;无论是字
纽约时报数据集
- 纽约时报数据集可以用于大数据分析,来进行预测新闻的点击率。(The New York Times data set can be used for large data analysis to predict the click rate of the news.)
Spark快速大数据分析
- 每个spark应用都由一个驱动器程序来发起集群上的各种分布式并行操作。驱动器程序包含应用的main函数,并且定义了集群上的分布式数据集,还对这些分布式数据集应用了相关操作。 在上面的例子中,实际的驱动器程序就是spark shell本身,只要输入想运行的程序就可以了。 驱动器程序通过一个SparkContext对象来访问spark.这个对象代表对计算集群的一个连接。shell启动时已经自己创建了一个SparkContext对象,是一个叫做sc的变量。 一旦有了SparkContext,就可
疾病制图
- 利用R语言进行空间大数据分析的例子,主要是研究疾病制图(use R language for analyzing the space data, the code is used for plotting the disease mapping.)
Tempo大数据分析平台产品白皮书V1.2
- 数据库--->数据仓库--->大数据平台(Tempo wellcome download)
2017-健康险大数据分析应用前景
- AI人工智能-2017-健康险大数据分析应用前景(AI artificial intelligence -2017- health insurance big data analysis application prospects)
极客内参-大数据开发实战-淘宝数据8
- 大数据环境搭建,主要是关于大数据分析的数据集。(Building big data environment)
Tableau数据可视化从入门到精通
- 用于大数据分析及图像可视化应用,是最好的工具(Application of Large Data Analysis and Image Visualization)
BigDataAnalysis-master
- 大数据分析的python相关实现,具体看代码(for big data analysis)
2019年猪肉价格与猪饲料价格Python大数据分析
- 2019年猪肉价格与猪饲料价格Python大数据分析;(To judge whether the price of pork will fall in the next few months. I can afford pork for the new year)
大数据分析实践-基于Python
- python 高级课件教程,大数据分析实践-基于Python(Big data analysis practice based on Python)