音视频基础

yuhuo2021-06-28开发知识
参考链接

音频

采样

某一时刻的声音可以由物理信息转化为数字信息表示,即为一个量化值。

采样指从时间-量化值组成的连续信号中取某一个时间点的量化值。

视频播放流程

采样大小

采样大小表示一个量化值的存储范围。

采样率

采样率表示每秒采样的个数,单位:Hz(赫兹)。

声道数

单声道,双声道(左声道 + 右声道)。

编码格式

音频原始数据尺寸非常大,不利于传输和存储,因此需要编码压缩成音频码流。

尺寸计算

音频原始数据尺寸 = 采样大小 * 采样率 * 声道数 * 时长

常见无损格式:

  • WAV 主流
  • APE
  • FLAC

常见有损格式:

  • MP3 主流
  • AAC 主流
  • WMA
  • Opus

视频

分辨率

图片是由像素组成,分辨率表示像素的数量,一般由 “ 宽像素数 * 高像素数 ” 表示。

常见分辨率比例是 16:9。名称中 P 代表行数,即高像素数。K 代表纵数,即宽像素数。

名称分辨率
8k7680 * 4320
4K3840 * 2160
2K(超高清)2560 * 1440
1080P(高清)1920 * 1080
720P(准高清)1280 * 720
540P(标清)960 * 540
360P(流畅)640 * 360

实际手机宽分辨率示例:

手机逻辑分辨率物理分辨率缩放因子
iphone 8375750@2x
iphone 11414828@2x
iphone X3751125@3x
iphone 8 Plus4141242@3x
魅族16s pro3601080@3x
华为 P10 Plus3601440@4x

帧率

视频是由连续播放的图片组成,一张图片又称一帧。

帧率表示每秒播放的帧数,单位:fps(frame per second)。

当帧率为 24 fps 以上时,大脑会认为这是流畅播放的视频。一般电影的帧率约为每秒 24 帧,游戏则需要更高。

码率

码率又称比特率,表示每秒的比特数,单位:bps(bit per second),1 kbps = 1024 bps。

存储单位

  • 1 bit = 1位二进制(比特)
  • 1 Byte = 8 bit(字节)
  • 1 KB = 1024 Byte
  • 1 MB = 1024 KB
  • 1 GB = 1024 MB
  • 1 TB = 1024 GB

编码格式

视频原始数据尺寸非常大,不利于传输和存储,因此需要编码压缩成视频码流。

尺寸计算

假设时长1分钟的视频,帧率 24 fps,分辨率 1920*1080,每个像素由RGB构成,共24位:

视频原始数据尺寸 = 60秒 * 24帧 * 1920 *1080 * 24 = 71663616000 bit = 8.34 G

常见格式:

  • H.264 主流
  • H.265
  • MPEG-2
  • MPEG-4 主流
  • VP8
  • VP9
  • VC-1
  • AV1
  • AVS

封装格式

把视频码流、音频码流打包到一起,然后再添加一些基本信息,例如分辨率、时长、标题等,构成一个文件,这个文件称为封装格式。

常见格式:

名称推出机构流媒体(边下边播)支持的视频编码支持的音频编码目前使用领域
MP4 主流MPEG支持MPEG-2,MPEG-44,H.264等AAC,MPEG-1等互联网视频网站
TSMPEG支持MPEG-4,H.264等MPEG-1 Layers I, II, III, AAC,IPTV,数字电视
FLVAdobe支持Sorenson,VP6,H.264MP3,ADPCM,Linear PCM,AAC等互联网视频网站
MKV 主流CoreCodec支持几乎所有格式几乎所有格式互联网视频网站
AVI 主流Microsoft不支持几乎所有格式几乎所有格式BT下载影视
MOVApple
RMVBReal Networks支持RealVideo 8, 9, 10

视频播放流程

视频播放流程

Last Updated 2024/4/16 01:56:38