图像基础与人类感知
图像组成
从物理上讲,图像是三维(3D)场景的二维(2D)投影,是物体或场景的视觉表现、生动或图形描述。
亮度和明度
从物体某一点接收/反射的光是
\[I(\lambda)=\rho(\lambda)L(\lambda)\]
其中\(\rho(\lambda)\)是物体的反射率,\(L(\lambda)\)是光源的光谱能量分布,\(\lambda\)是可见光谱中的波长,350nm至780nm。
具有光分布\(I(x,y,\lambda)\)的空间分布物体的亮度或强度定义为
\[f(x,y)=\int_0^\infty I(x,y,\lambda)V(\lambda)\text{d}\lambda\]
其中\(V(\lambda)\)是视觉系统的相对光谱敏感度函数,是一条钟形曲线

\(V(\lambda)\)类似一种频率响应(Frequency response,简称频响。是当向电子仪器系统输入一个振幅不变,频率变化的信号时,测量系统相对输出端的响应。)
人类感知
人眼有许多形似锥体的细胞来感知光线。有三种不同类型的视锥细胞,具有不同的光谱敏感度函数\(V(\lambda)\),有助于感知颜色(红、绿、蓝)。
颜色是波长(频率)的函数,基色:红 (R)、绿 (G)、蓝 (B),因此彩色图像每个样本(像素)需要三个值。
- 加色法原色:红 (Red)、绿 (Green)、蓝 (Blue)
- 减色法原色:青(Cyan)、品红(Magenta)、黄(Yellow)
可以根据所需的三种原色的量来指定颜色:\(c=axp_1+bxp_2+cxp_3\),其中\((p_1,p_2,p_3)\)是一组特定的原色。(就是线性变换罢)
颜色空间是一个3D空间,以某种标准方式定义来描述颜色。

常见颜色空间:
- RGB - 面向硬件,用于显示器、摄像机
- rgb - 标准化RGB
- CMY - 用于彩色打印机
- YIQ(luminance,in-phase,quadrature)- 彩色电视广播
- HSI(HSV)(色调、饱和度、强度/值)- 用于颜色处理
- CIE-Luv、CIE-Lab(亮度、红绿、黄蓝)- 用于区分颜色。
- sRGB – 用于与设备无关的数字图像显示
图像的表示
从数学上讲,图像是二维(2D)函数\(f(x,y)\),它是两个空间坐标的函数。
数字图像是通过光学方式生成的二维光强度函数的采样和量化版本。该函数通常以等间距的矩形网格模式进行采样,其幅度以等间距量化。
数字图像的\(f(x,y)\)中\(x\)、\(y\)和\(f\)都是有限和离散量。
图像的数字化:空间采样或离散化,以及强度或灰度量化
- 将图像(二维光强度函数)表示为\(f(x,y)\)
- 空间坐标\((x,y)\)处\(f\)的值或幅度表示该点图像的强度(亮度,灰度等级)
- 为了便于计算机处理,\(f(x,y)\)必须在空间和幅度上都进行数字化
- 空间坐标\(f(x,y)\)的数字化称为空间采样或离散化
- 强度幅度\(f(x,y)\)的数字化称为强度或灰度量化
数字图像的(空间)分辨率是指对图像进行采样的\(m\times n\)阵列的大小,例如:\(f(x,y)=\sin\left[2\pi\left(ux\sin\phi+vy\sin\phi\right)\right]\),则图像为
\[\left[\begin{array}{cccc}f(1,1) & f(1,2) & \cdots & f(1,n) \\\\ f(2,1) & f(2,2) & \cdots & f(2,n) \\\\ \vdots & \vdots & \ddots & \vdots \\\\ f(m,1) & f(m,2) & \cdots & f(m,n) \end{array}\right]\]
数字图像的灰度分辨率是指灰度级(强度)的数量\(g=2^b\),其中\(b\)是每个样本的位数。(如\(b=8\)时\(g=256\))

图像直方图
灰度级范围为\([0, L]\)的数字图像\(f(x, y)\)的直方图是离散函数
\[p_f(f)=\frac{n_f}n\]
其中\(f\)是灰度级(\(f = 0, 1, 2, \ldots, L\))。\(n_f\)是具有该灰度级的像素数。\(n\)是正在处理的图像区域中的像素总数。
显然,数字图像的直方图\(p_f(f)\)是图像中灰度\(f\)出现的频率,显示灰度\(f\)的频率分布。显然,\(p_f(f)\geq0\)且\(\sum_{f=0}^L p_f(f)=1\)。
如果图像的像素灰度级为随机变量,则直方图\(p_f(f)\)是对图像中灰度级\(f\)出现概率的估计。
图像直方图的形状为图像的特征提供了许多线索。例如,分布较窄的直方图表示图像对比度较低等。
图像处理
数字图像处理是一系列机器或计算机操作,可产生一些预期的结果。这些操作可以、应该、并且希望用数学来描述。数字图像处理从一幅或一组图像开始,生成图像的修改版本或从图像中提取更多“有意义”的信息(特征),或理解(识别)图像内容的含义。
为何需要图像处理?
- 可视化:对比度增强、噪声消除、视觉质量改善、伪上色
- 图像理解:提取图像特性,如颜色、形状、纹理、边缘、线条、曲线、角等
- 自动驾驶汽车:识别道路、车辆、行人、交通标志
- 视觉服务:自动化机器人控制
- 安全:入侵检测、生物识别
- 信息检索:基于图像内容的搜索