MapReduce设计模式
图书信息
| 作者 | [美]Donald Miner,Adam Shook |
| 出版社 | 信息技术第一出版分社 |
| ISBN | 9787115360946 |
| 出版时间 | 2014-09-01 |
| 字数 | 21.8万 |
| 分类 | 信息技术第一出版分社,科技,计算机,网络,程序设计 |
读书简介
MapReduce作为一种分布式海量数据处理的编程框架,已经得到业界的广泛关注。随着Hadoop的普及,MapReduce目前已经成为海量数据处理的基础但也是重要的方法之一。 《MapReduce设计模式》是一本关于设计模式的书,为读者提供解决问题的模板或通用指南。书中主要介绍编程模式,即如何利用MapReduce框架解决一类问题,重在提供解决问题的方法和思路。
目录
内容提要
作者简介
第1章 设计模式与MapReduce
1.1 设计模式
1.2 MapReduce简史
1.3 MapReduce和Hadoop简介
1.4 Hadoop示例:单词计数
1.5 Pig和Hive
第2章 概要模式
2.1 数值概要
2.2 倒排索引概要
2.3 计数器计数
第3章 过滤模式
3.1 过滤
3.2 布隆过滤
3.3 Top 10
3.4 去重
第4章 数据组织模式
4.1 分层结构
4.2 分区
4.3 分箱
4.4 全排序
4.5 混排
第5章 连接模式
5.1 连接简介
5.2 reduce端连接
5.3 复制连接
5.4 组合连接
5.5 笛卡儿积
第6章 元模式
6.1 作业链
6.2 链折叠
6.3 作业归并
第7章 输入和输出模式
7.1 在Hadoop中自定义输入和输出
7.2 生成数据
7.3 外部源输出
7.4 外部源输入
7.5 分区裁剪
第8章 最后的思考与设计模式的未来
8.1 数据的本质趋势
8.2 YARN的影响
8.3 作为库或者组件的模式
8.4 读者可以帮到什么
附录A 布隆过滤器
A.1 综述
A.2 用例
A.3 缺点
A.4 调整你的布隆过滤器
- 一年级爱科学:异想天开的玉米粒(代晓琴)
- 姚明(1)(读书堂)
- GBT 51338-2018 分布式电源并网工程调试与验收标准(电力企业联合会)
- 犹忆武林人未远——民国武林忆旧及安慰武学遗录(安慰)
- 未解之谜(下)(百读)
- 《新东方英语》中学生2014年12月号(《新东方英语》编辑部)
- 第7集 制度的起点是小人思维(俞凌雄)
- Gone With the Windsors(Laurie Graham)
