当前位置:网站首页>图书 > 正文 >>

特征工程入门与实践

图书信息

作者(土)锡南·厄兹代米尔(Sinan Ozdemir),迪夫娅·苏萨拉(Divya Susarla)
出版社人民邮电出版社有限公司
ISBN9787115511645
出版时间2019-06-01
字数18.0万
分类人民邮电出版社有限公司,科技,计算机,网络,程序设计

读书简介

本书将带你了解特征工程的完整过程,使机器学习更加系统、高效。你会从理解数据始学习,机器学习模型的成功正是取决于如何利用不同类型的特征,例如连续特征、分类特征等。你将了解何时纳一项特征、何时忽略一项特征,以及其中的原因。你还会学习如何将问题陈述转换为有用的新特征,如何提供由商业需求和数学见解驱动的特征,以及如何在自己的机器上行机器学习,从而自动学习数据中的特征。

目录

版权声明

前言

第 1 章 特征工程简介

1.1 激动人心的例子:AI驱动的聊天

1.2 特征工程的重要性

1.3 特征工程是什么

1.4 机器学习算法和特征工程的评估

1.5 特征理解:我的数据集里有什么

1.6 特征增强:清洗数据

1.7 特征选择:对坏属性说不

1.8 特征构建:能生成新特征吗

1.9 特征转换:数学显神通

1.10 特征学习:以AI促AI

1.11 小结

第 2 章 特征理解:我的数据集里有什么

2.1 数据结构的有无

2.2 定量数据和定性数据

2.3 数据的4个等级

2.4 数据等级总结

2.5 小结

第 3 章 特征增强:清洗数据

3.1 识别数据中的缺失值

3.2 处理数据集中的缺失值

3.3 标准化和归一化

3.4 小结

第 4 章 特征构建:我能生成新特征吗

4.1 检查数据集

4.2 填充分类特征

4.3 编码分类变量

4.4 扩展数值特征

4.5 针对文本的特征构建

4.6 小结

第 5 章 特征选择:对坏属性说不

5.1 在特征工程中实现更好的性能

5.2 创建基准机器学习流水线

5.3 特征选择的类型

5.4 选用正确的特征选择方法

5.5 小结

第 6 章 特征转换:数学显神通

6.1 维度缩减:特征转换、特征选择与特征构建

6.2 主成分分析

6.3 线性判别分析

6.4 LDA与PCA:使用鸢尾花数据集

6.5 小结

第 7 章 特征学习:以AI促AI

7.1 数据的参数假设

7.2 受限玻尔兹曼机

7.3 伯努利受限玻尔兹曼机

7.4 在机器学习流水线中应用RBM

7.5 学习文本特征:词向量

7.6 小结

第 8 章 案例分析

8.1 案例1:面部识别

8.2 案例2:预测酒店评论数据的主题

8.3 小结

看完了