当前位置:网站首页>图书 > 正文 >>

基于Hadoop的大数据分析和处理

图书信息

作者魏祖宽,刘兆宏
出版社电子工业出版社
ISBN9787121317392
出版时间2017-06-01
字数23.5万
分类电子工业出版社,科技,计算机,网络,计算机理论与教程

读书简介

本书基于云计算和大数据,介绍大数据处理和分析的技术,分为两部分。*部分介绍Hadoop基础知识,内容包括:Hadoop的介绍和集群构建、Hadoop的分部式系统架构、MapReduce及其应用、Hadoop的版本特征及化。第二部分以云计算为主题,详细论述利用Hadoop的大数据分析和处理工具,以及NoSQL技术,内容包括:云计算和Hadoop、Amazon服务中的MapReduce应用、Hadoop应用下的大数据分析、NoSQL、HBase。

目录

内容简介

前言

第1章 Hadoop的介绍和集群构建

1.1 Hadoop介绍

1.2 Hadoop构建案例

1.3 构建Hadoop集群

1.4 Hadoop分布式文件系统指令

1.5 小 结

第2章 Hadoop分布式处理文件系统

2.1 Hadoop分布式文件系统的设计

2.2 概观Hadoop分布式文件系统的整体构造

2.3 Namenode的角色

2.4 Datanode的角色

2.5 小 结

第3章 大数据和MapReduce

3.1 大数据的概要

3.2 MapReduce

3.3 MapReduce的结构

3.4 MapReduce的容错性(Fault Tolerance)

3.5 MapReduce的编程

3.6 构建Hadoop:通过MapReduce的案例介绍

3.7 小 结

第4章 Hadoop版本特征及进化

4.1 Hadoop 0.1x版本的API

4.2 Hadoop附加功能(append)

4.3 Hadoop安全相关功能

4.4 Hadoop 2.0.0 alpha

4.5 小 结

第5章 云计算和Hadoop

5.1 大规模Hadoop集群的构建和案例

5.2 云基础设施服务的登场

5.3 在Amazon EC2中构建Hadoop集群

5.4 小 结

第6章 Amazon Elastic MapReduce的倍增利用

6.1 Amazon EMR的活用

6.2 小 结

第7章 Hadoop应用下的大数据分析

7.1 Hadoop应用下的机器学习(Mahout)

7.2 基于Hadoop的统计分析Rhive(R and Hive)

7.3 利用Hadoop的图形数据处理Giraph

7.4 小 结

第8章 数据中的DBMS,NoSQL

8.1 NoSQL出现背景:大数据和Web 2.0

8.2 NoSQL的定义和类别特征

8.3 NoSQL数据模型概要和分类

8.4 NoSQL数据模型化

8.5 主要NoSQL的比较和选择

8.6 小 结

第9章 HBase:Hadoop中的NoSQL

9.1 Hadoop生态界中的HBase

9.2 HBase介绍

9.3 HBase数据模型

9.4 HBase的数据库模式

9.5 HBase构造

9.6 HBase的构建及运行

9.7 HBase的扩展——DuoBase中的HBase

9.8 HBase的用户定义索引

9.9 小 结

推荐图书