书籍:TensorFlow 2.0 Computer Vision Cookbook: Implement machine learning solutions to overcome various computer vision challenges
作者:Jesús Martínez
出版:Packt Publishing
地址:https://mp.weixin.qq.com/s/sh3u3myU_GM5eMPKsEa88g
01 书籍介绍
计算机视觉是一门科学领域,使得机器能够识别和处理数字图像和视频。本书专注于使用TensorFlow执行各种计算机视觉任务的独立示例。
本书首先介绍深度学习在计算机视觉中的基础知识,并介绍TensorFlow 2.x的关键特性,例如Keras和tf.data.Dataset API。然后,您将了解常见计算机视觉任务的内部和外部工作原理,例如图像分类、迁移学习、图像增强和样式化以及对象检测。本书还涵盖了自编码器在反向图像搜索索引和图像去噪等领域的应用,并提供了有关配方中使用的各种架构的见解,例如卷积神经网络(CNNs)、基于区域的CNNs(R-CNNs)、VGGNet和YOLO。
接下来,您将发现在构建各种计算机视觉应用程序时遇到的问题的解决技巧。最后,您将深入探讨更高级的主题,如生成对抗网络(GANs)、视频处理和AutoML,并以提高网络性能的技术为重点。
通过阅读本书,您将能够自信地使用TensorFlow 2.x解决各种计算机视觉问题。
学到什么:
· 了解如何使用YOLOv3等主流的模型来检测对象
· 使用AutoML从图像中预测性别和年龄
· 使用不同方法(例如FCNs和生成模型)对图像进行分割
· 学习如何通过排名N准确性、标签平滑和测试时增强来提高网络性能
· 使机器能够识别视频和实时流中的人的情绪
· 访问和重用先进的TensorFlow Hub模型,以进行图像分类和对象检测
· 使用CNN和RNN为图像生成标题
本书适合谁:
本书适合计算机视觉开发者和工程师,以及寻找计算机视觉中常见问题解决方案的深度学习实践者。您将了解如何运用现代机器学习(ML)技术和深度学习架构来执行各种计算机视觉任务。需要具备Python编程和计算机视觉的基础知识。
02 作者简介
Jesús Martínez是计算机视觉在线学习网站DataSmarts的创始人。他是一位计算机视觉专家,在该领域进行了各种项目的工作,例如使用OpenCV和TensorFlow开发的基于RGB摄像头和深度传感器图像的人数统计软件。他还使用TensorFlow创建了一个卷积神经网络,在模拟环境中实现了一辆仅使用视觉输入的自动驾驶汽车。此外,他还实现了一个Pipeline,使用多种先进的计算机视觉技术来跟踪道路上的车道线,并提供额外的信息,如曲率度量。