首先直观感受:
- 我们当前所处的世界是三维的空间
- 图像是三维世界的场景在相机成像平面的投影
然后定量建立如下坐标系:
- 世界坐标系(三维):
; 单位是毫米
- 相机坐标系(三维):
, 原点与相机光学中心重合, z 轴与光轴重合; 单位是毫米
- 图像坐标系(二维):
, 原点为相机光轴与成像平面的交点,是图像的中心点; 单位是毫米
- 像素坐标系(二维):
, 原点在左上角, 单位为像素
世界坐标系到相机坐标系的转换
世界坐标系 通过 Rigid Transform (刚体变换: 旋转和平移) 得到 相机坐标系
其中 为三维旋转矩阵,
为 三维平移向量
Camera Calibration 中所说的外参,也即此处的 和
此转换所描述的即为相机在三维空间的运动
相机坐标系到图像坐标系的转换
相机坐标系通过 Perspective Transform (成像模型中的相似三角形原理) 得到图像坐标系
为相机焦距
值得注意的是,当前成像系统往往是透镜成像而非小孔成像,透镜的形状很难完全规则,因而成像效果可能存在不同程度的畸变
图像坐标系到像素坐标系的转换
图像坐标系通过Affine Transform (缩放和平移) 得到像素坐标系
其中 表示 图像中心像素坐标,
表示水平和垂直方向每个像素分别对应多少毫米
总结:世界坐标系到像素坐标系
当 世界坐标 和 像素坐标 都已确定,可以求解 M 矩阵