数字音频
- 声音文件
- CD: 业界标准
- WAV: 储存
- MID, RMI: 合成音乐
- MP3: 着重压缩
- ra, rm, rmvb, WMA: 网络传输
- 电脑音乐创作
- 编曲 -> 合成 -> 后期制作
- CakeWalk, Vegas Audio, CoolEdit, Auto Score
- 语音合成引擎 VOCALOID 2
- 打谱软件 Overture
- 媒体关联
- 文本-语音转换
- 声音可视化
- 声音信号
- 听觉 20~20000 Hz
- 发出 80~3400 Hz
- 话音信号 300~3000 Hz
- 听阈:声音弱到刚好能听到(频率相关)
- 痛阈(频率相关)
基音域 | 泛音域 | 伴随噪声域 | |
---|---|---|---|
钢琴 | 27.5Hz | 4188Hz | 7040Hz |
管风琴 | 18.4Hz | 7902Hz | 14080Hz |
低音大管 | 25Hz | 220Hz | 7902Hz |
竖琴 | 61.7Hz | 1975Hz - 7902Hz | 12544Hz |
大号 | 55Hz | 440Hz - 3951Hz | 7040Hz |
长号 | 55Hz | 523Hz | 5274Hz |
小号 | 147Hz | 1175Hz | 10548Hz |
低音提琴 | 29Hz | 440Hz - 4500Hz | 11175Hz |
大提琴 | 61.7Hz | 1588Hz - 8372Hz | 16774Hz |
中提琴 | 140Hz | 2350Hz - 9500Hz | 18799Hz |
小提琴 | 180Hz | 4100Hz - 9500Hz | 18800Hz |
男低音 | 82.5Hz | 392Hz | 8350Hz |
男中音 | 120Hz | 460Hz | 8370Hz |
男高音 | 173Hz | 650Hz | 8370Hz |
女低音 | 190Hz | 1318Hz | 8200Hz |
次女高音 | 240Hz | 1396Hz | 8200Hz |
女高音 | 260Hz | 1590Hz | 8820Hz |
大管 | 66Hz | 698Hz | 8200Hz |
单簧管 | 134Hz | 1420Hz - 8920Hz | 12544Hz |
双簧管 | 240Hz | 1540Hz | 12544Hz |
竹笛 | 150Hz | 2100Hz | 19700Hz |
短笛 | 510Hz | 4250Hz | 12544Hz |
大鼓 | 60Hz | 166Hz - 1800Hz | 6100Hz |
木琴 | 166Hz | 2100Hz | 13000Hz |
三角铁 | 2000Hz | 2300Hz | 16000Hz |
- 声音类别
- 任意无规则:1/f0 波动
- 严密变化规律:1/f2 波动
- 不规则但给有特别性质的:1/f1 波动
- 固有频率
- 眼球:60Hz
- 露骨:200Hz
- 整体水平:3-6Hz
- 整体竖置:48Hz
- 频带
- 全频带:下限 30~60Hz,上限 15KHz~20KHz
- 杜比数码环绕声系统(Dolby Stereo digital, AC-3):互相独立 6 声道(5.1 声道),全频带的左,右,中,左环绕,右环绕和 120HZ 以下的低音声道
- A3D Surround 技术:创造环绕听者的 5 组音频流声场,使用两个音箱播放
- SRS:使用两个音箱仿 3D 环绕声
- 数字音频文件大小:Byte = 采样频率 * 采样位数 / 8 * 声道数 * 时间
- 奈奎斯特采样
- speech sampling 8kHz
- CD sampling 44.1kHz
- HDCD sampling 48/96kHz
- MIDI 电子乐器数字接口:音乐合成器、乐器、计算机交互音乐信息的标准协议
- 命令集合
- 串行接口 31.23k 波特
- 单个物理通道可以分成 16 个逻辑通道,每个逻辑通道可以指定一种乐器
- 合成器:利用数字信号处理器或者其他芯片产生音乐或声音的装置
- 产生方法
- FM 合成法:频率调制合成
- wavetable:乐音样本合成法
数字图像
-
视觉知识
-
可见光:380nm - 780nm
-
彩色空间
-
YUV:RGB 加权,考虑到人的视觉系统和 CRT 非线性特性(NTSC 彩色电视制式)
-
Y:明亮度,只有 $Y$ 则是黑白
$Y=0.299R+0.587G+0.114B$
-
UV:色度
$U=0.492(B-Y)$
$V=0.887(R-Y)$
-
-
YIQ:(PAL 和 SECAM 彩色电视制式)
- IQ: UV 进行旋转镜像变换
-
YCrCb:(计算机显示器)
-
-
六基色彩电
-
伽马矫正:非线性 $y=x^\gamma$
- 摄像机传感器($\gamma\approx 0.45$)
- 编码图像文件
- 解码图像文件
- 图像帧缓存查找表
- CRT
-
人眼
- 300ppi
- 临界闪烁频率 46 Hz
-
-
显示器
- CRT 带宽 = 最大分辨率 * 刷新率 * 1.3(1.5)
- LED, CRT, PDP, LCD
- 手机彩屏:STN, TFT, OLED
- Retina Display: 将一个像素点拆为四个
-
打印机
- DPI
- PPM
-
扫描仪
- 光学分辨率,最大分辨率
- 色彩深度和灰度
- CCD(电荷耦合元件)
- CIS(接触式图像传感器)
-
图像文件
- BMP:windows,无压缩
- TIFF:扫描仪
- GIF, JPEG, PNG:网络传播
数字视频
- 雷霄骅的博客是很好的学习资料
- 视频播放过程:解协议 -> (封装格式数据) -> 解封装 -> (压缩数据) -> 解码 ->(原始数据) -> 视音频同步
- 流媒体协议
推出机构 | 传输层协议 | 客户端 | 使用领域 | |
---|---|---|---|---|
RTSP+RTP | IETF | TCP+UDP | VLC, WMP | IPTV |
RTMP | Adobe Inc. | TCP | Flash | 直播 |
RTMFP | Adobe Inc. | UDP | Flash | 直播 |
MMS | Microsoft Inc. | TCP/UDP | WMP | 直播/点播 |
HTTP | WWW+IETF | TCP | Flash | 点播 |
- 直播服务普遍采用了 RTMP 作为流媒体协议,FLV 作为封装格式,H.264 作为视频编码格式,AAC 作为音频编码格式
- 点播服务普遍采用了 HTTP 作为流媒体协议,H.264 作为视频编码格式,AAC 作为音频编码格式
- 封装格式
推出机构 | 流媒体 | 视频编码 | 音频编码 | 使用领域 | |
---|---|---|---|---|---|
AVI | Microsoft Inc. | 不支持 | 几乎所有格式 | 几乎所有格式 | BT 下载 |
MP4 | MPEG | 支持 | MPEG-2,MPEG-4,H.264,H.263 | AAC, MPEG-1 Layers 1/2/3, AC-3 | 互联网视频网站 |
TS | MPEG | 支持 | MPEG-1, MPEG-2, MPEG-4, H.264 | MPEG-1 Layers 1/2/3, ACC | IPTV, 数字电视 |
FLV | Adobe Inc | 支持 | Sorenson, VP6, H.264 | MP3, ADPCM, Linear PCM, AAC | 互联网视频网站 |
MKV | CoreCodec Inc. | 支持 | 几乎所有格式 | 几乎所有格式 | 互联网视频网站 |
RMVB | Real Networks Inc. | 支持 | RealVideo 8,9,10 | AAC, Cook Codec, RealAudio Lossless | BT 下载 |
MOV | Apple |
- 常见格式的分辨率
- 线数:水平分解能力(水平像素一半)
- p: 逐行扫描
- i: 各行扫描
格式 | 水平(像素) | 垂直 | 建议码率 |
---|---|---|---|
sub-QCIF | 128 | 98 | |
QCIF | 176 | 144 | |
CIF | 352 | 288 | |
4CIF | 704 | 576 | |
16CIF | 1408 | 1152 | |
1080 | 1920 | 16:9 | 8500kbps |
720 | 1280 | 16:9 | 3500kbps |
480 | 704 | 16:9/4:3 | 1800kbps |
320 | 640 | 4:3 | |
HDTV | 1000 线 | ||
SDTV | 500-600 线 | ||
DTV | 200-300 线 |
- 文件大小 = 时间 x 码率 /8
- 数字视频
- 视频:实时摄影
- 封装格式:avi,mov,qt,mpeg,mpg,dat,rm,rmvb
- 动画:人工或计算机生成
- gif
- flic 文件:.fli/.flc
- flash 文件
- 视频:实时摄影
- 视频接口
- 模拟
- 复合视频
- 色差输入
- S-Video
- D-sub
- 数字
- DVI
- HDMI
- DP
- 模拟
- 数据视频获取
- DV(Digital Video Format)
- 码率 3.6MB/s, 720x576,音频 48KHz
- 变焦:光学变焦,数码变焦
- 色温:单位开尔文
- 蜡烛 <1900K
- 白昼 5000K
- 普通日光灯 4500K~6000K
- 阴天 >6000K
- 蓝天 >10000K
- CCD(Charged Coupled Device)
- 视频采集卡:通过接受视频输入端的模拟视频信号,采样量化后压缩编码
- 视频压缩卡:带有硬件压缩功能
- 非线性编辑卡:实时编辑
- DV(Digital Video Format)
- 电视制式:带宽 270Mbits/s
- PAL
- 扫描线:625 行/帧
- 刷新率:25 帧/秒
- YUV
- NSTC
- 扫描线:525 行/帧
- 刷新率:30 帧/秒
- YIQ
- SECAM
- PAL