当前位置：网站首页>图书 > 正文 >>

Hadoop大数据实战权威指南

图书信息

作者	黄东军
出版社	电子工业出版社
ISBN	9787121318214
出版时间	2017-07-01
字数	21.0万
分类	科技,计算机,网络,计算机理论与教程

读书简介

大数据贵在落实！本书是一本讲解大数据实战的图书，按照“深分析组件原理、充分展示搭建过程、详细指导应用发”编写。全书分为三篇，*篇为大数据的基本概念和技术，主要介绍大数据的背景、发展及关键技术；第二篇为Hadoop大数据平台搭建与基本应用，内容涉及Linux、HDFS、MapReduce、YARN、Hive、HBase、Sqoop、Kafk、Spark等；第三篇为大数据处理与项目发，包括交互式数据处理、协同过滤推荐系统、销售数据分析系统，并就*的部分销售数据应用大数据行处理分析。

目录

内容简介

前言

第一篇大数据的基本概念和技术

第1章绪论

1.1 时代背景

1.2 大数据的概念

1.3 技术支撑体系

1.4 大数据人才及其能力要求

1.5 本章小结

第二篇 Hadoop大数据平台搭建与基本应用

第2章 Hadoop大数据关键技术

2.1 Hadoop生态系统

2.2 数据采集

2.3 大数据存储技术

2.4 分布式计算框架

2.5 数据分析平台与工具

2.6 本章小结

第三篇数据处理与项目开发

第3章 Linux操作系统与集群搭建

3.1 Linux操作系统

3.2 Linux安装与集群搭建

3.3 集群的配置

3.4 Linux基本命令

3.5 本章小结

第4章 HDFS安装与基本应用

4.1 HDFS概述

4.2 HDFS架构分析

4.3 文件操作过程分析

4.4 Hadoop HDFS安装与配置

4.5 Hadoop集群的启动

4.6 Hadoop集群的基本应用

4.7 本章小结

第5章 MapReduce与Yarn

5.1 MapReduce程序的概念

5.2 深入理解Yarn

5.3 在Linux平台安装Eclipse

5.4 开发MapReduce程序的基本方法

5.5 本章小结

第6章 Hive和HBase的安装与应用

6.1 在CentOS7下安装MySQL

6.2 Hive安装与应用

6.3 ZooKeeper集群安装

6.4 HBase的安装与应用

6.5 本章小结

第7章 Sqoop和Kafka的安装与应用

7.1 安装部署Sqoop

7.2 安装部署Kafka集群

7.3 本章小结

第8章 Spark集群安装与开发环境配置

8.1 深入理解Spark

8.2 安装与配置Scala

8.3 Spark集群的安装与配置

8.4 开发环境安装与配置

8.5 本章小结

第9章 Spark应用基础

9.1 Spark程序的运行模式

9.2 Spark应用设计

9.3 本章小结

第10章交互式数据处理

10.1 数据预处理

10.2 创建数据仓库

10.3 数据分析

10.4 本章小结

第11章协同过滤推荐系统

11.1 推荐算法概述

11.2 协同过滤推荐算法分析

11.3 Spark MLlib推荐算法应用

11.4 本章小结

第12章销售数据分析系统

12.1 数据采集

12.2 在HBase集群上准备数据

12.3 安装Phoenix中间件

12.4 基于Web的前端开发

12.5 本章小结

书籍类型：电子工业出版社,科技,计算机,网络,计算机理论与教程,

推荐图书

饿兔子跳（孙家宇）
Desperate Sons（Standiford, Les）
姚明（1）（读书堂）
数字时代的营销战略（曹虎等）
图说天下学生版超级兵器传奇世界王牌武器陆海空大阅兵（套装共3册）(试读本)（薛金冉　编著）
谦逊的问讯:以询问开启良好关系的艺术(原书第2版)（(美)埃德加·沙因,(美)彼得·沙因）
唐代文学的文化视野(全二册)精中华书局出品（杜晓勤著）