冗余
- 压缩比: $C=\frac{b}{b’}$
- 相对冗余: $R=1-\frac{1}{C}$
编码冗余
- $r_k$: $M\times N$ 大小图像的灰度数值
- $p(r_k)=\frac{n_k}{MN}$
- 平均比特数:$L_{\text{avg}}=\sum_{k=0}^{L-1}l(r_k)p_r(r_k)$
- 固定比特数:$l(r_k)=m,L_{\text{avg}}=m$
空间和时间冗余
- 行程对(run-length pairs)
- 灰度值:某灰度连续出现的次数
- 相邻像素的灰度差
- 映射
- 可逆映射
- 不可逆映射
不相关的信息
- 有损压缩
- 被视觉系统忽略的信息
- 与图像用途无关的信息
- 量化
度量
- 信息:$I(E)=\log\frac{1}{P(E)}=-\log P(E)$
- $m$ 为底:$m$元单位
- $2$:比特
- 熵:$H=-\sum_{j=1}^JP(a_j)\log P(a_j)$
- 信源符号:$a_j$
- 零记忆信源:独立
- 灰度信源的熵:$H=-\sum_{k=0}^{L-1}p_r(r_k)\log_2p_r(r_k)$ (bits/pixel)
- 香农第一定理:$\lim_{n\rightarrow\infty}\frac{L_{avg,n}}{n}=H$
- 图像像素有相关性:马尔科夫信源,有限记忆信源
- 保真度
- $e(x,y)=\hat f(x,y)-f(x,y)$
- 总误差:$\sum\sum |e(x,y)|$
- 均方根误差:$e=(\frac{1}{MN}\sum\sum e(x,y)^2)^{\frac{1}{2}}$
- $\text{SNR}_{\text{ms}}=\frac{\sum\sum \hat f(x,y)^2}{\sum\sum e(x,y)^2}$
- 主观误差
图像压缩
- (Mapper -> Quantizer -> Symbol coder)[encoder] -> (Symbol decoder -> Inverse mapper)[decoder]
- Mapper: 转换为便于去掉空间和时间冗余,可逆
- Quantizer: 根据保真度准则降低精度,不可逆
- Symbol decoder: 生成定长/变长编码
- 霍夫曼编码:对符号概率排序,合并低概率符号
- 行程编码(run-length pairs)
- 符号编码:将图像表示为符号的集合
- 符号:图像中频繁出现的子图像
- 三元组集合:${(x_1,y_1,t_1),\cdots}$
二值图像压缩方法
二值图像压缩方法 | 组织 | 描述 |
---|---|---|
CCITT 3 | ITU-T | 行程,霍夫曼编码 |
CCITT 4 | ITU-T | 二维行程 |
JBIG(JBIGI) | ISO/IEC/ITU-T | 算术编码 |
JBIG2 | ISO/IEC/ITU-T | |
TIFF |
图像压缩方法
连续色调图像 | 组织 | 描述 |
---|---|---|
JPEG | ISO/IEC/ITU-T | DCT,霍夫曼编码,行程编码 |
JPEG-LS | ISO/IEC/ITU-T | |
JPEG-2000 | ISO/IEC/ITU-T | DWT |
BMP | Microsoft | 未压缩 |
GIF | CompuServe | LZW编码 |
Adobe Systems | ||
PNG | W3C | |
TIFF | Aldus |
视频压缩方法
视频 | 组织 | 描述 |
---|---|---|
DV | IEC | DCT |
H.261 | ITU-T | DCT,预测差分 |
H.262 | ITU-T | MPEG-2 |
H.263 | ITU-T | |
H.264 | ITU-T | |
MPEG-1 | ISO/IEC | |
MPEG-2 | ISO/IEC | |
MPEG-4 | ISO/IET | |
AVS | MII | Golomb编码,中国标准 |
HDV | 公司联盟 | |
M-JPEG | 多家公司 | |
Quick-Time | Apple | 媒体容器 |
VC-1 | SMPTE | |
WMV9 | Microsoft |
水印
- 特点
- 增加信息
- 可见水印
- 不可见水印
- 不能分离
- 增加信息
- 用途
- 版权,用户识别
- 证明真实性
- 自动监控
- 复制保护
- 简单的可见水印:$f_w=(1-\alpha)f+\alpha w$
- 简单的不可见水印:$f_w=4(\frac{f}{4})+\frac{w}{64}$
- 基于 DCT(离散余弦变换) 的不可见水印