计算机视觉是人工智能领域中使机器具备“看”的能力的学科,主要任务和技术包括图像分类、对象检测、目标跟踪、语义分割和实例分割等。
计算机视觉定义
- 定义:计算机视觉是一门研究如何使机器“看”的科学,用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等,进一步做图形处理。46
计算机视觉主要任务
- 图像分类:给定一组标记图像,对新测试图像的类别进行预测。3
- 对象检测:识别图像中的对象,并输出边界框和标签。3
- 目标跟踪:在特定场景跟踪一个或多个特定感兴趣对象的过程。3
- 语义分割:将整个图像分成像素组,对每个像素进行标记和分类,理解图像中每个像素的角色。23
- 实例分割:除了语义分割,还将不同类型的实例进行分类,如不同颜色的车辆。3
计算机视觉技术
- 卷积神经网络:在计算机视觉任务中广泛应用,用于特征提取和图像分析。2
- 深度学习:通过训练大量数据,使模型能够识别和理解图像内容。7
- 三维视觉重建:从二维图像中恢复三维结构,用于场景理解等。7
- 视频内容分析:分析视频中的动态内容,进行行为识别等。7