音视频基础
yuhuo2021-06-28开发知识
音频
采样
某一时刻的声音可以由物理信息转化为数字信息表示,即为一个量化值。
采样指从时间-量化值组成的连续信号中取某一个时间点的量化值。
采样大小
采样大小表示一个量化值的存储范围。
采样率
采样率表示每秒采样的个数,单位:Hz(赫兹)。
声道数
单声道,双声道(左声道 + 右声道)。
编码格式
音频原始数据尺寸非常大,不利于传输和存储,因此需要编码压缩成音频码流。
尺寸计算
音频原始数据尺寸 = 采样大小 * 采样率 * 声道数 * 时长
常见无损格式:
- WAV 主流
- APE
- FLAC
常见有损格式:
- MP3 主流
- AAC 主流
- WMA
- Opus
视频
分辨率
图片是由像素组成,分辨率表示像素的数量,一般由 “ 宽像素数 * 高像素数 ” 表示。
常见分辨率比例是 16:9。名称中 P 代表行数,即高像素数。K 代表纵数,即宽像素数。
名称 | 分辨率 |
---|---|
8k | 7680 * 4320 |
4K | 3840 * 2160 |
2K(超高清) | 2560 * 1440 |
1080P(高清) | 1920 * 1080 |
720P(准高清) | 1280 * 720 |
540P(标清) | 960 * 540 |
360P(流畅) | 640 * 360 |
实际手机宽分辨率示例:
手机 | 逻辑分辨率 | 物理分辨率 | 缩放因子 |
---|---|---|---|
iphone 8 | 375 | 750 | @2x |
iphone 11 | 414 | 828 | @2x |
iphone X | 375 | 1125 | @3x |
iphone 8 Plus | 414 | 1242 | @3x |
魅族16s pro | 360 | 1080 | @3x |
华为 P10 Plus | 360 | 1440 | @4x |
帧率
视频是由连续播放的图片组成,一张图片又称一帧。
帧率表示每秒播放的帧数,单位:fps(frame per second)。
当帧率为 24 fps 以上时,大脑会认为这是流畅播放的视频。一般电影的帧率约为每秒 24 帧,游戏则需要更高。
码率
码率又称比特率,表示每秒的比特数,单位:bps(bit per second),1 kbps = 1024 bps。
存储单位
- 1 bit = 1位二进制(比特)
- 1 Byte = 8 bit(字节)
- 1 KB = 1024 Byte
- 1 MB = 1024 KB
- 1 GB = 1024 MB
- 1 TB = 1024 GB
编码格式
视频原始数据尺寸非常大,不利于传输和存储,因此需要编码压缩成视频码流。
尺寸计算
假设时长1分钟的视频,帧率 24 fps,分辨率 1920*1080,每个像素由RGB构成,共24位:
视频原始数据尺寸 = 60秒 * 24帧 * 1920 *1080 * 24 = 71663616000 bit = 8.34 G
常见格式:
- H.264 主流
- H.265
- MPEG-2
- MPEG-4 主流
- VP8
- VP9
- VC-1
- AV1
- AVS
封装格式
把视频码流、音频码流打包到一起,然后再添加一些基本信息,例如分辨率、时长、标题等,构成一个文件,这个文件称为封装格式。
常见格式:
名称 | 推出机构 | 流媒体(边下边播) | 支持的视频编码 | 支持的音频编码 | 目前使用领域 |
---|---|---|---|---|---|
MP4 主流 | MPEG | 支持 | MPEG-2,MPEG-44,H.264等 | AAC,MPEG-1等 | 互联网视频网站 |
TS | MPEG | 支持 | MPEG-4,H.264等 | MPEG-1 Layers I, II, III, AAC, | IPTV,数字电视 |
FLV | Adobe | 支持 | Sorenson,VP6,H.264 | MP3,ADPCM,Linear PCM,AAC等 | 互联网视频网站 |
MKV 主流 | CoreCodec | 支持 | 几乎所有格式 | 几乎所有格式 | 互联网视频网站 |
AVI 主流 | Microsoft | 不支持 | 几乎所有格式 | 几乎所有格式 | BT下载影视 |
MOV | Apple | ||||
RMVB | Real Networks | 支持 | RealVideo 8, 9, 10 |