搜索资源列表
Hadoop
- hadoop实战手册,用于为大数据分析建立平台。手册比较详细,容易上手-hadoop combat manuals, used to establish a platform for big data analysis. Manual relatively detailed, easy to use
Hadoop技术内幕:深入解析YARN架构设计与实现原理
- Hadoop是一个开源框架,它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。它的目的是从单一的服务器到上千台机器的扩展,(Hadoop is an open source framework that allows you to store and process large data in a distributed environment using a simple programming model computer throughout the cluster.It
解决Spark数据倾斜的八种实用方法
- 什么是数据倾斜?对 Spark/Hadoop 这样的分布式大数据系统来讲,数据量大并不可怕,可怕的是数据倾斜。对于分布式系统而言,理想情况下,随着系统规模(节点数量)的增加,应用整
如何快速搭建Hadoop运行环境
- Hadoop 是一个分布式系统基础架构,在大数据领域被广泛的使用,它将大数据处理引擎尽可能的靠近存储,Hadoop 最核心的设计就是 HDFS