当前位置:网站首页>图书 > 正文 >>

深度学习时代的计算机视觉算法

图书信息

作者徐从安 李健伟 董云龙 孙超 等 著
出版社人民邮电出版社有限公司
ISBN9787115581327
出版时间2022-01-01
字数14.2万
分类科技,计算机,网络,软件系统

读书简介

本书着重阐述了深度学习时代的计*机视觉*法的工作原理,*先对深度学习与计*机视觉基础行了介绍,之后对卷积神经网络结构的演化过程,以及基于深度学习的目标检测*法、图像分割*法、人体姿态估计*法、行人重识别与目标跟踪*法、人脸识别*法以及图像超分辨率重建方法行了介绍。本书系统讲解了在日常生活和工作中常见的几项计*机视觉任务,并着重介绍了在当今深度学习时代,这些计*机视觉任务是如何工作的,可使读者快速了解这些*法原理,以及其相互之间的关系。

目录

内容提要

前言

第1章 深度学习与计算机视觉基础

|1.1 人工智能简介|

|1.2 深度学习的崛起以及存在的问题|

|1.3 神经网络的基本概念|

1.3.1 前馈神经网络

1.3.2 反向传播算法

1.3.3 权重系数更新

|1.4 卷积神经网络原理|

1.4.1 CNN的起源与发展

1.4.2 CNN结构简介

1.4.3 CNN的其他组件

|1.5 计算机视觉简介|

|参考文献|

第2章 基于深度学习的图像分类算法

|2.1 图像分类——从特征设计到卷积神经网络结构设计|

|2.2 卷积神经网络结构演化|

2.2.1 从LeNet到VGG

2.2.2 Inception系列

2.2.3 ResNet系列

2.2.4 DenseNet系列

2.2.5 SqueezeNet系列

2.2.6 ShuffleNet系列

2.2.7 MobileNet系列

|2.3 神经架构搜索|

|2.4 CNN的计算量与参数计算方法|

|2.5 小结|

|参考文献|

第3章 基于深度学习的目标检测算法

|3.1 目标检测——从特征设计到深度学习|

3.1.1 任务简介

3.1.2 传统的目标检测算法

3.1.3 基于深度学习的目标检测方法

|3.2 目标检测的重要概念|

3.2.1 交并比和非极大值抑制

3.2.2 难负样本挖掘

3.2.3 边框回归

3.2.4 检测任务中的数据增广

3.2.5 先验框/默认边框/锚框

3.2.6 锚框与真实边框的匹配策略

3.2.7 感受野

3.2.8 RoI特征图映射

|3.3 双阶段检测算法|

3.3.1 从R-CNN到Fast R-CNN

3.3.2 Faster R-CNN算法原理

|3.4 单阶段检测算法|

3.4.1 YOLO检测算法

3.4.2 SSD检测算法

|3.5 融合单阶段和双阶段的算法|

3.5.1 单阶段检测算法及双阶段检测算法的特点

3.5.2 RefineDet:结合单阶段及双阶段优点

|3.6 从头训练的检测算法|

3.6.1 从头训练的检测算法简介

3.6.2 精心设计CNN实现从头训练

3.6.3 从头训练的本质

|3.7 检测任务中的级联设计|

3.7.1 传统的级联检测算法

3.7.2 深度学习下的级联检测

|3.8 多尺度目标检测|

3.8.1 问题描述以及常用方法

3.8.2 多尺度训练/测试

3.8.3 特征金字塔融合多层特征

3.8.4 小尺寸目标检测

|3.9 检测任务中的不平衡处理策略|

3.9.1 双阶段中的不平衡策略

3.9.2 单阶段中的不平衡策略

|3.10 锚框的轮回|

3.10.1 锚框的起源

3.10.2 现有检测算法中锚框的设计方法

3.10.3 锚框存在的问题

3.10.4 不需要锚框的算法

|3.11 目标检测的骨干网络设计|

|3.12 检测算法加速|

3.12.1 检测流程的加速

3.12.2 检测算法的轻量级网络

|3.13 自然场景文字检测|

|3.14 遥感图像目标检测|

|3.15 常用数据集和评价指标|

|参考文献|

第4章 基于深度学习的图像语义分割算法

|4.1 图像语义分割简介|

|4.2 语义分割研究难点|

|4.3 语义分割算法模型|

4.3.1 全卷积网络基础算法:FCN算法

4.3.2 编码-解码结构算法:U-Net算法

4.3.3 空洞卷积的应用:DeepLab系列

|4.4 图像实时语义分割|

4.4.1 实时语义分割简介

4.4.2 ENet算法

|4.5 图像分割数据集以及评价指标|

4.5.1 图像分割数据集

4.5.2 语义分割评估指标

|参考文献|

第5章 基于深度学习的人体姿态估计算法

|5.1 人体姿态估计任务简介|

5.1.1 任务简介

5.1.2 面临的挑战

5.1.3 方法概述

|5.2 单人姿态估计|

|5.3 自顶向下的多人姿态估计|

|5.4 自底向上的多人姿态估计|

|5.5 常用数据集以及评价指标|

|参考文献|

第6章 基于深度学习的行人重识别与目标跟踪

|6.1 行人重识别任务简介|

6.1.1 任务简介

6.1.2 工作流程

6.1.3 面临的挑战

6.1.4 与行人跟踪和人脸验证的关系

6.1.5 行人重识别数据集及评价指标

|6.2 特征提取和相似度度量|

|6.3 行人重识别:从全局特征到局部特征|

|6.4 行人重识别:从表征学习到度量学习|

|6.5 目标跟踪任务简介|

|6.6 基于相关滤波的目标跟踪算法|

|6.7 基于孪生网络的跟踪算法|

|参考文献|

第7章 基于深度学习的人脸识别

|7.1 任务简介|

7.1.1 人脸验证和人脸识别的区别

7.1.2 图像分类和人脸识别的异同

7.1.3 技术难点

7.1.4 人脸识别算法原理

|7.2 Softmax原理及存在的问题|

7.2.1 Softmax函数和Softmax损失

7.2.2 Softmax存在的问题

|7.3 度量损失|

7.3.1 对比损失

7.3.2 三元组损失

|7.4 大间隔损失|

7.4.1 L-Softmax

7.4.2 SphereFace

7.4.3 CosFace

7.4.4 ArcFace

7.4.5 大间隔损失总结

|7.5 特征规范化和权重规范化|

|参考文献|

第8章 基于深度学习的图像超分辨率重建方法

|8.1 任务简介|

|8.2 传统方法|

8.2.1 基于插值的方法

8.2.2 基于重建的方法

8.2.3 基于学习的方法

|8.3 基于卷积神经网络的图像超分辨率重建方法|

8.3.1 网络模型

8.3.2 损失函数

8.3.3 训练样本

8.3.4 训练策略

|8.4 常用数据集与评价指标|

|参考文献|