玉米笋是什么| 谈情说爱是什么意思| 安逸是什么意思| 刻板是什么意思| utc是什么| 妃是什么意思| 七夕之夜是什么生肖| 居心叵测是什么意思| 脑血栓前兆是什么症状表现| 吃山竹有什么好处| 雪对什么| 宫颈管短有什么症状| 肺结节影是什么意思啊| 嗜睡什么意思| 各什么己| 中医学学什么| 五行火生什么克什么| 北京大栅栏有什么好玩的| 为什么会得前列腺炎| 韬略是什么意思| 红参适合什么人吃| 什么是自锁| 外交部部长是什么级别| 重庆为什么叫雾都| 考试什么的都去死吧歌曲| 儿童说话晚去医院挂什么科| 浪琴表属于什么档次| 肝脏在什么位置图片| 心肌酶是检查什么的| 年柱比肩是什么意思| 都有什么血型| 朱砂是什么做的| 手汗症挂什么科| 女性大腿酸痛什么原因| 痰多吃什么好| 减肥可以吃什么| leonardo是什么牌子| 一月来两次月经是什么原因| ket是什么| 梦见刺猬是什么意思| 西红柿什么时候成熟| 尿泡沫多是什么原因| 脚底起水泡是什么原因| 什么是横纹肌溶解症| 2025是什么生肖年| 71年什么时候退休| adr是什么| 左肾积水是什么意思| 胆脂瘤是什么病| ozark是什么牌子| hvb是什么意思| 脾胃虚弱吃什么药| 鬼见愁是什么意思| 喝酒后腰疼是什么原因| 热感冒吃什么药好得快| 早泄吃什么药见效| 1995年属猪的是什么命| 上寒下热体质吃什么中成药| 炖鸭汤放什么食材最好| 二甲医院是什么意思| 青色是什么颜色的图片| 什么中药减肥| aojo眼镜什么档次| 肠易激综合症吃什么药| 黔驴技穷什么意思| 交界性心律是什么意思| 玻璃酸钠是什么| 家家酒是什么意思| 总胆红素偏高是什么意思| 脚冰凉是什么原因| 女生大姨妈推迟是什么原因| 呕吐是什么原因引起的| 随性什么意思| 左侧上颌窦炎症是什么意思| 为什么会胎停多数原因是什么| 出山是什么意思| 狗狗流鼻涕吃什么药| 内蒙古代叫什么| 玄武是什么动物| 洪字五行属什么| 蛀牙挂什么科| 头晕是什么症状引起的| 鸾凤和鸣什么意思| 狻猊是什么| 什么矿泉水最贵| 脚后跟疼是什么原因引起的| 爱的最高境界是什么| 不止是什么意思| 迁坟需要准备什么东西| 想吃辣是身体缺乏什么| 甲醛有什么危害| 失眠可以吃什么药| 四肢无力是什么原因| 心电图j点抬高什么意思| 七月三号是什么日子| 蜂蜜对人体有什么好处和功效| 211和985什么意思| 乳房挂什么科| 水果之王是什么| 铁蛋白是什么| 拉痢疾是什么症状| 二月一日是什么星座| 尿肌酐低说明什么原因| 甘油是什么油| 鱼腥草破壁饮片有什么功效| lv什么品牌| 相濡以沫是什么意思| 幸福是什么的经典语录| 玉镯子断了有什么预兆| 趁什么不什么| 长颈鹿吃什么树叶| 什么自若| 什么林什么染| 晚上睡觉腿酸难受是什么原因| fap什么意思| 拉绿色大便是什么原因| 光影什么| 押韵是什么意思| 考试穿什么颜色最吉利| 七月上旬是什么时候| 序五行属什么| 蚊子吸血是为了什么| 戴隐形眼镜用什么眼药水| 买单是什么意思| 锁骨窝疼可能是什么病| opc是什么意思| 签注什么意思| 日语亚麻跌是什么意思| bv是什么牌子| 三叉戟是什么意思| 今是什么结构| 茯苓长什么样| 青梅竹马什么意思| 荪是什么意思| 海龙是什么| 当伴郎有什么讲究| 文科和理科有什么区别| 经常流鼻血是什么病的前兆| 甲低有什么危害| 试管进周期是什么意思| emma什么意思| 胃不好吃什么药| 黑豚肉是什么肉| 天冬与麦冬有什么区别| 牙齿痛吃什么消炎药| 毛戈平属于什么档次| 缺少雌激素的女性会有什么症状| 痔疮是什么原因引起| 小拇指和无名指发麻是什么原因| 干是什么意思| 子宫瘢痕是什么意思| 类风湿关节炎吃什么药| 炭疽病用什么药最好| 线索细胞阳性什么意思| 杺字五行属什么| 嘴唇干裂是什么原因| 下岗是什么意思| 欲望什么意思| 什么叫体位性低血压| 土中金是什么生肖| 胎位不正是什么原因导致的| 学前班是什么意思| 7月29号是什么日子| 梦见捡到钱是什么意思| 吃什么补雌激素| 猪脆肠是什么器官| 维生素什么牌子好| 难以启齿是什么意思| 白马王子是什么意思| 胆经不通吃什么中成药| 油压是什么意思| 爱出油的人身体缺什么| 去痛片又叫什么名| 年轮稀疏的一面是什么方向| 什么头蛇尾| 菠萝蜜不能和什么一起吃| 狮子住在什么地方| 为什么明明很困就是睡不着| 多巴胺是什么东西| hl是胎儿的什么| 想吐吃什么药可以缓解| 三七粉什么人不适合吃| 舌头上有白苔是什么原因| 急性上呼吸道感染是什么引起的| 门诊号是什么意思| 相刑什么意思| 过敏性皮炎吃什么药| 勾践姓什么| 吃红糖有什么好处和坏处| 一日清闲一日仙是什么生肖| 大牙什么时候换| 支气管炎吃什么药最有效| 没有料酒可以用什么代替| 什么叫占位病变| kh什么意思| 1度房室传导阻滞是什么意思| 胃疼拉肚子吃什么药| 95年属于什么生肖| 肝功能看什么科室| 白头翁是什么生肖| 子年是什么年| 嗟是什么意思| 巡抚相当于现在的什么官| 结膜炎是什么原因引起的| 嗓子干痒吃什么药| 眩晕去医院挂什么科室| 桃胶有什么功效与作用| salute什么意思| 男生第一次什么感觉| 3的倒数是什么| 囊肿里面是什么东西| 新发展理念是什么| 脚气是什么菌引起的| 男生回复嗯嗯代表什么| 他汀是什么药| 随波逐流什么意思| 保妇康栓治疗什么妇科病| 项羽为什么叫西楚霸王| 身体游走性疼痛什么病| af是什么| tommyhilfiger什么牌子| 不什么思什么| 狐臭什么味| 突然想吃辣是什么原因| 宋江属什么生肖| 免签国家是什么意思| 加盟店是什么意思| 胃疼喝什么可以缓解| 恐龙灭绝的原因是什么| 总做梦是什么原因| 脑科属于什么科| 转氨酶高吃什么药最好| 鸭吃什么食物| 肝脓肿是什么原因引起的| 人为什么会有狐臭| 干爹是什么意思| 澳大利亚属于什么国家| 盆腔积液吃什么药好| 引狼入室是什么意思| 理数是什么| 什么饮料能解酒| wbc是什么意思| 肝囊肿是什么原因引起的| 芒果什么人不能吃| 男女双修什么意思| 南京市徽为什么是貔貅| 鬼畜是什么意思| pha是什么意思| 腿毛多是什么原因| 故事情节是什么意思| 什么食物含硒多| 什么叫低级别上皮内瘤变| 网球肘用什么药最有效| 脚癣是什么原因引起的| 青少年膝盖痛什么原因| 66岁属什么生肖| 什么是低血糖| 鱼字五行属什么| 女人什么时候停经| 肺结节是什么意思| 腿肿脚肿是什么病的前兆| 鼻梁高的男人说明什么| 散光是什么原因导致的| 一生辛苦不得财是什么生肖| 百度

默认
打赏 发表评论 4
想开发IM:买成品怕坑?租第3方怕贵?找开源自已撸?尽量别走弯路了... 找站长给点建议
实时音视频面视必备:快速掌握11个视频技术相关的基础概念
阅读(122653) | 评论(4 收藏6 淘帖1 1
微信扫一扫关注!

本文作者Ahab,原题“视频相关的理论知识与基础概念”,即时通讯网收录时有修订和改动。


1、引言


随着移动互联网的普及,实时音视频技术已经在越来越多的场景下发挥重要作用,已经不再局限于IM中的实时视频聊天、实时视频会议这种功能,在远程医疗、远程教育、智能家居等等场景也司空见惯。

虽然实时音视频技术的应用越来越普及,但对于程序员来说,这方面的技术门槛仍然存在(准备地说是仍然很高),想要在短时间内全面掌握实时音视频相关的技术难度非常大。

以IM中的实时音视频聊天为例,一个简化了的视频聊天技术,本质就是:音视频技术+网络技术的组合体,如下图所示:网络模块之上的部分,就是音视频技术所涉及的范畴

实时音视频面视必备:快速掌握11个视频技术相关的基础概念_x2.png
▲ 图片引用自《微信小程序音视频技术背后的故事

所以,想学习实时音视频开发,一般都是先学习音视频相关的技术知识,至于网络技术,完全可以分开学习。

不过,作为想从事这方面工作的小白面视者,是无法在短时间内全面掌握音视频技术,但可以通过快速了解相关的知识概念,在自已在脑中快速组织起相应的知识图谱,有助于日后针对相关知识点逐个深入学习和研究,也算是一种高效的技术学习方法。

本文将通过通俗的文字,言简意赅地为你讲解实时音视频技术中跟视频技术在关的11个非常重要的基础知识概念,希望能为你日后从事这方面的工作起到抛砖引玉的作用。

本文已同步发布于“即时通讯技术圈”公众号,欢迎关注。公众号上的链接是:点此进入

2、关于作者



3、参考资料


[1] 零基础,史上最通俗视频编码技术入门
[2] 零基础入门:实时音视频技术基础知识全面盘点
[3] 理解实时音视频聊天中的延时问题一篇就够

4、什么是视频?


根据人眼视觉暂留原理,每秒超过 24 帧的图像变化看上去是平滑连续的,这样的连续画面的播放叫视频。

通俗来说说,视频相当于连续展示多张图片,原理就像下面这样:

▲ 图片引用自《零基础,史上最通俗视频编码技术入门

5、什么是分辨率?


5.1基础


分辨率是以横向和纵向的像素数量来衡量的,表示平面图像的精细程度。视频精细程度并不只取决于视频分辨率,还取决于屏幕分辨率。

1080P 的 P 指 Progressive scan(逐行扫描),即垂直方向像素点,也就是 "高",所以 1920 * 1080 叫 1080P, 不叫 1920P。

5.2上采样


当 720P 的视频在 1080P 屏幕上播放时,需要将图像放大,放大操作也叫上采样。

“上采样”几乎都是采用内插值方法,即在原有图像的像素点之间采用合适的插值算法插入新的元素,所以图像放大也称为图像插值。

简单的记录一下插值算法:
实时音视频面视必备:快速掌握11个视频技术相关的基础概念_1.jpg

常见插值算法技术原理:

  • 1)邻插值算法:将四个像素(放大一倍)用原图一个像素的颜色填充,较简单易实现,早期的时候应用比较普遍,但会产生明显的锯齿边缘和马赛克现象;
  • 2)双线性插值法:是对邻插值法的一种改进,先对两水平方向进行一阶线性插值,再在垂直方向上进行一阶线性插值。能有效地弥补邻插值算法的不足,但还存在锯齿现象并会导致一些不期望的细节柔化;
  • 3)双三次插值法:是对双线性插值法的改进,它不仅考虑到周围四个直接相邻像素点灰度值的影响,还考虑到它们灰度值变化率的影响,使插值生成的像素灰度值延续原图像灰度变化的连续性,从而使放大图像浓淡变化自然平滑。

除此之外还有很多更复杂效果更优的算法,比如小波插值、分形等等。

5.3下采样


当 1080P 的视频在 720P 屏幕上播放时,需要将图像缩小,缩小操作也叫下采样。

“下采样”的定义为:对于一个样值序列,间隔几个样值取样一次,得到新序列。

对于一幅分辨率为 MxN 的图像,对其进行 s 倍下采样,即得到 (M/s)x(N/s) 分辨率的图像(s 应为 M、N 的公约数),就是把原始图像 sxs 窗口内的图像变成一个像素,这个像素点的值就是窗口内所有像素的均值。

最佳体验为屏幕与视频分辨率相同且全屏播放,视频分辨率过高的话屏幕没有能力去呈现,视频分辨率过低的话无法发挥屏幕的能力。

6、什么是比特率?


6.1基础


比特率即码率,在不同领域有不同的含义,在多媒体领域,指单位时间播放音频或视频的比特数,可以理解成吞吐量或带宽。

单位为 bps , 即 bits per second,每秒传输的数据量,常用单位有:kbps、mbps 等。

计算公式:码率(kbps)= 文件大小(kb)/ 时长(s)

通俗一点理解就是取样率,取样率越大,精度就越高,图像质量越好,但数据量也越大,所以要找到一个平衡点:用最低的比特率达到最少的失真。

在一个视频中,不同时段画面的复杂程度是不同的,比如高速变化的场景和几乎静止的场景,所需的数据量也是不同的,若都使用同一种比特率是不太合理的,所以引入了动态比特率。

6.2动态比特率


简称为 VBR,即 Variable Bit Rate,比特率可以随着图像复杂程度的不同而随之变化。

图像内容简单的片段采用较小的码率,图像内容复杂的片段采用较大的码率,这样既保证了播放质量,又兼顾了数据量的限制。

比如 RMVB 视频文件,其中的 VB 就是指 VBR,表示采用动态比特率编码方式,达到播放质量与体积兼得的效果。

6.3静态比特率


简称为 CBR,即 Constant Bit Rate,比特率恒定。

图像内容复杂的片段质量不稳定,图像内容简单的片段质量较好。上面列出的计算公式显然是针对 CBR ,除 VBR 和 CBR 外,还有 CVBR(Constrained VariableBit Rate) 、ABR (Average Bit Rate) 等等。

7、什么是采样率?


定义:每秒从连续信号中提取并组成离散信号的采样个数,单位为赫兹(Hz)。对于取样率、采样率和抽样率,没必要纠结它们的区别,都是同义词。

视频一般不标识采样率属性,比如:
实时音视频面视必备:快速掌握11个视频技术相关的基础概念_2.jpg

采样率本身就是一个可泛化的概念,对于视频来说,若非要用采样率来描述的话,那就要分为两个层面:帧频和场频。

  • 1)从帧频层面来说:采样率就是指帧率,指 1 秒钟显示多少帧图像;
  • 2)从场频层面来说:采样率就是指像素频率,指 1 秒钟显示多少个像素。

像素频率是显示器的一个指标,可以理解成显示器的最大带宽,可以起到限制分辨率和刷新率的作用。

根据含义可得出一个公式:

像素频率 = 帧率 X 帧像素数量


对于:
实时音视频面视必备:快速掌握11个视频技术相关的基础概念_3.jpg

帧率 = 138.5 x 1024 x 1024 / 1920 / 1080  ≈  70.04 , 得出的 70Hz 为正常的帧率范围,也可以反向确定对像素频率的理解是正确的。

8、什么是帧率?


定义:用于测量显示帧数的量度。单位为 FPS(Frames per Second,每秒显示帧数)或赫兹(Hz)。

帧率越高,画面越流畅、逼真,对显卡的处理能力要求越高,数据量越大。

文章开头,我们提到每秒超过 24 帧的图像变化看上去是平滑连续的,这是针对电影等视频而言,对游戏来说 24 帧不一定就是流畅的。

为什么 24fps 的电影感觉流畅,而 24fps 的游戏就感觉很卡呢?

第一个原因:两者图像生成原理不同

电影的一帧在一段时间曝光,每一帧都包含一段时间的信息,而游戏的画面则是由显卡计算生成的,一帧只包含那一瞬间的信息。

比如一个圆从左上角移动到右下角:
实时音视频面视必备:快速掌握11个视频技术相关的基础概念_4.jpg

前者为电影的一帧,后者为游戏的一帧,可以看到在电影中动作会出现拖影,给人以动感的效果,连贯而不卡。

第二个原因:电影的FPS是稳定的,而游戏则是不稳定的

电影若为 24fps,那就表示每隔 1/24 秒刷新一次画面,帧间隔是固定的。

游戏若为 60fps,表示大约每隔 1/60 秒刷新一次画面,帧间隔是不稳定的,即使 1 秒能显示 60 帧,那也可能是前半秒显示了 59 帧,后半秒显示了 1 帧。

9、什么是视频编码?


9.1基础


定义:通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式。视频数据在时域和空域层面都有极强的相关性,这也表示有大量的「时域冗余信息」和「空域冗余信息」,压缩技术就是去掉数据中的冗余信息。

9.2无损压缩


无损压缩也称为可逆编码,重构后的数据与原数据完全相同,适用于磁盘文件的压缩等。无损压缩主要采用熵编码方式,包括香农编码、哈夫曼编码和算术编码等。

9.2.1)香农编码:

香农编码采用信源符号的累计概率分布函数来分配码字,效率不高,实用性不大,但对其他编码方法有很好的理论指导意义。

9.2.2)哈夫曼编码:
哈夫曼编码完全依据出现概率来构造异字头的平均长度最短的码字。

基本方法为:先对图像数据扫描一遍,计算出各种像素出现的概率,按概率的大小指定不同长度的唯一码字,由此得到一张该图像的霍夫曼码表。

编码后的图像数据记录的是每个像素的码字,而码字与实际像素值的对应关系记录在码表中。

9.2.3)算术编码:
算术编码是用符号的概率和编码间隔两个基本参数来描述的,在给定符号集和符号概率的情况下,算术编码可以给出接近最优的编码结果。

使用算术编码的压缩算法通常先要对输入符号的概率进行估计,然后再编码,估计越准,编码结果就越接近最优的结果。

9.3有损压缩


有损压缩也称为不可逆编码,重构后的数据与原数据有差异,适用于任何允许有失真的场景,例如视频会议、可视电话、视频广播、视频监控等。

编码方式包括预测编码、变换编码、量化编码、混合编码等。

10、什么是编码标准?


10.1基础


定义:为保证编码的正确性,编码要规范化、标准化,所以就有了编码标准。

研制视频编码标准的有两大正式组织:

  • 1)ISO/IEC(国际标准化组织);
  • 2)ITU-T(国际电信联盟通信标准部)。

ISO/IEC 制定的编码标准有:MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21 和 MPEG-H 等。

ITU-T 制定的编码标准有:H.261、H.262、H.263、H.264 和 H.265 等。

MPEG-x 和 H.26x 标准的视频编码都是采用有损压缩的混合编码方式,主要区别在于处理图像的分辨率、预测精度、搜索范围、量化步长等参数的不同,所以其应用场合也不同

10.2MPEG-x 系列


10.2.1)MPEG-1:

MPEG-1 共 5 部分。

2 部分视频编码方案,规定了逐行扫描视频的编码方案。

3 部分音频编码方案,将音频流的压缩分为 3 层并依次增大压缩比,广为流传的 MP3(MPEG-1 Layer 3)就是按照此部分编码方案压缩之后的文件格式。

10.2.2)MPEG-2:

MPEG-2 共 11 个部分,在 MPEG-1 的基础上提高了码率和质量。

2 部分视频编码方案,规定了隔行扫描视频的编码方案,是和 ITU-T 共同开发的,ITU-T 称其为 H.262。

3 部分音频编码方案,延续了 MPEG-1 的 3 层压缩方案,压缩后文件格式仍为 MP3,但在压缩算法上有所改进。

7 部分首次提出 AAC(MPEG Advanced Audio Coding)编码,目的以更小的容量和更好的音质取代 MP3 格式。

10.2.3)MPEG-4:

MPEG-4 共 27 个部分,更加注重多媒体系统的交互性和灵活性。

3 部分音频编码方案,优化了 AAC 编码算法,并在推出后逐渐取代 MP3,比如和视频封装在一起的音频优先考虑 AAC 格式,但就民用而言大部分还是使用 MP3 格式。

10 部分提出 AVC(Advanced Video Coding)编码,是和 ITU-T 共同开发的,ITU-T 称其为 H.264。

14 部分提出了 MP4 格式封装,官方文件后缀名是 ".mp4",还有其他的以 mp4 为基础进行的扩展或缩水版本的格式,包括:M4V,  3GP, F4V 等。

10.2.4)MPEG-7:

MPEG-7 不同于 MPEG-1、MPEG-2、MPEG-4,它不是音视频压缩标准。

MPEG-7 被称为 "多媒体内容描述接口",目的就是产生一种描述多媒体信息的标准,并将该描述与所描述的内容相联系,以实现快速有效的检索。

10.2.5)MPEG-12:

MPEG-12 其实就是一些关键技术的集成,通过这种集成环境对全球数字媒体资源进行管理,实现内容描述、创建、发布、使用、识别、收费管理、版权保护等功能。

10.2.6)MPEG-H:

MPEG-H 包含了 1 个数字容器标准、1 个视频压缩标准、1 个音频压缩标准和 2 个一致性测试标准。

其中视频压缩标准为高效率视频编码(HEVC),和 ITU-T 联合开发,相比 H.264/MPEG-4 AVC 数据压缩率增加了 1 倍。

10.3H.26x 系列


10.3.1)H.261:

H.261 是第一个实用的数字视频编码标准,使用了混合编码框架,包括了基于运动补偿的帧间预测,基于离散余弦变换的空域变换编码,量化,zig-zag 扫描和熵编码。

H.261 的设计相当成功,之后的视频编码国际标准基本上都是基于 H.261 的设计框架,包括 MPEG-1,MPEG-2/H.262,H.263,甚至 H.264。

10.3.2)H.262:

H.262 由 MPEG-1 扩充而来,支持隔行扫描,在技术内容上和 MPEG-2 视频标准一致,DVD 就是采用了该技术。

10.3.3)H.263:

H.263 是一种用于视频会议的低码率视频编码标准,在 H.261 基础上发展而来。

与 H.261 相比采用了半象素的运动补偿,并增加了 4 种有效的压缩编码模式,在低码率下能够提供比 H.261 更好的图像效果。

H.263 于 1995 年推出第一版,后续在 1998 年和 2000 年还推出了第二版 H.263+、第三版 H.263++ 。

10.3.4)H.264:

H.264 又称为 MPEG-4 第 10 部分,即 MPEG-4 AVC,它是一种面向块,基于运动补偿的视频编码标准。

于 2003 年正式发布,现在已经成为高精度视频录制、压缩和发布的最常用格式之一。

H.264 可以在低码率情况下提供高质量的视频图像,相比 H.263 可节省 50% 的码率。

相比 H.263,H.264 不需设置较多的编码选项,降低了编码的复杂度。

H.264 可以根据不同的环境使用不同的传输和播放速率,并且提供了丰富的错误处理工具,可以很好的控制或消除丢包和误码。

H.264 性能的改进是以增加复杂性为代价而获得的,H.264 编码的计算复杂度大约相当于 H.263 的 3 倍,解码复杂度大约相当于 H.263 的 2 倍。

H.264 协议中定义了三种帧,分别为 I 帧、P 帧以及 B 帧:

  • 1)I 帧:I帧即帧内编码帧、关键帧,可以理解为一帧画面的完整保留,解码时只需要本帧数据就可以完成,不需要参考其他画面,数据量比较大;
  • 2)P 帧:P帧即前向预测编码帧,记录当前帧跟上一关键帧(或P帧)的差别,解码时依赖之前缓存的画面,叠加上本帧定义的差别,才能生成最终画面,数据量较 I 帧小很多;
  • 3)B 帧:B帧即双向预测编码帧,记录当前帧跟前后帧的差别,解码时依赖前面的I帧(或P帧)和后面的P帧,数据量比I帧和P帧小很多。

数据压缩比大约为:I帧:P帧:B帧  =  7:20:50,可见 P 帧和 B 帧极大的节省了数据量,节省出来的空间可以用来多保存一些 I 帧,以实现在相同码率下,提供更好的画质。

10.3.5)H.265:

H.265 即高效视频编码(High Efficiency Video Coding ,简称 HEVC),于 2013 年正式推出。

H.265 编码架构和 H.264 相似,主要也包含,帧内预测、帧间预测、转换、量化、去区块滤波器、熵编码等模块。

H.265 编码架构整体被分为编码单位、预测单位和转换单位。

H.265 在 H.264 的基础之上,使用先进的技术用以改善码流、编码质量、延时和算法复杂度之间的关系,达到最优化设置。

在码率减少 51-74% 的情况下,H.265 编码视频的质量还能与 H.264 编码视频近似甚至更好。

H.265 可以在有限带宽下传输更高质量的网络视频,智能手机、平板机等移动设备将能直接在线播放 1080p 的全高清视频,让网络视频跟上了显示屏 “高分辨率化” 的脚步。

来张图感受一下吧:
实时音视频面视必备:快速掌握11个视频技术相关的基础概念_5.jpg

除 MPEG-x 和 H.26x 系列标准外,还有其他的编码标准,如谷歌的 VP 系列,对视频编码标准归纳一下,如图:
实时音视频面视必备:快速掌握11个视频技术相关的基础概念_6.jpg

11、什么是视频封装格式?


视频封装格式如 mp4、mkv,用来存储或传输编码数据,可以理解成一个容器。

封装就是按照一定规则把音视频、字幕等数据组织起来,包含编码类型等公共信息,播放器可以按照这些信息来匹配解码器、同步音视频。

不同的封装格式支持的视音频编码格式是不一样的,比如 MKV 格式支持比较多,RMVB 则主要支持 Real 公司的视音频编码格式。

WiKi百科上列出了常见的视频封装格式,可以查看各封装格式支持的音视频编码格式等信息。

12、什么是视频解码?


定义:将视频压缩编码过的数据,解压缩成为视频原始数据,即视频编码的反过程。

对于一个播放器来说,很重要的一个指标就是能支持多少种视频解码。

13、视频播放原理是什么?


播放一个本地视频文件,需要经过解封装、解码音视频、音视频同步等步骤。

解封装:就是将输入的封装格式的数据,分离成为音频压缩编码数据和视频压缩编码数据。例如,FLV 格式的数据,经过解封装操作后,输出 H.264 编码的视频码流和 AAC 编码的音频码流。

解码:将视频/音频压缩编码数据,解码成为非压缩的视频/音频原始数据。

音频的压缩编码标准包含 AAC,MP3,AC-3 等等,视频的压缩编码标准则包含 H.264,MPEG2,VC-1 等等。

解码是整个系统中最重要也是最复杂的一个环节。

通过解码,压缩编码的视频数据输出成为非压缩的颜色数据,例如 YUV420P,RGB 等等;压缩编码的音频数据输出成为非压缩的音频抽样数据,例如 PCM 数据。

音视频同步:根据解封装模块处理过程中获取到的参数信息,同步解码出来的视频和音频数据,并将视频音频数据送至系统的显卡和声卡播放出来。

14、实时音视频中音视频与网络的关系是什么?


以下是一个典型的实时音视频数据的详细流转原理图:
实时音视频面视必备:快速掌握11个视频技术相关的基础概念_x2.png
▲ 图片引用自《微信小程序音视频技术背后的故事

如上图所示,相较于普通的音视频本地播放,实时音视频技术多了一个网络传输的步骤,换句话说:实时音视频技术 = 音视频技术 + 网络技术

因为篇幅受限,本篇就不对具体的技术细节展开讨论,感兴趣的读者,可以继续深入阅读即时通讯网收录的《实时音视频开发技术专辑》。

15、深入学习


如果你是初学者,还想以通俗易懂的方式了解实时音视频技术,可以继续阅读以下文章:


如果你想系统专业的学习实时音视频技术,那么务必阅读以下文章:

即时通讯网 - 即时通讯开发者社区! 来源: - 即时通讯开发者社区!

本帖已收录至以下技术专辑

推荐方案
评论 4
不错
签名: read the fucking source code
mark
打赏楼主 ×
使用微信打赏! 使用支付宝打赏!

返回顶部
哔哩哔哩是什么 抗美援朝什么时候结束 脚浮肿是什么原因 西瓜都有什么品种 漂流需要准备什么东西
梦见买鸡蛋是什么意思周公解梦 发现新大陆是什么意思 什么逼人 尿蛋白尿潜血同时出现说明什么 指甲变薄是什么原因
舌苔厚腻是什么原因 嬲是什么意思 肠易激综合征吃什么药好 鲱鱼为什么那么臭 不自觉是什么意思
抹胸是什么 河豚吃什么食物 筷子在古代叫什么 总是放响屁是什么原因 大腿内侧发黑是什么原因
白凉粉是什么做的hcv9jop5ns3r.cn 健康证是什么样的hcv8jop3ns9r.cn 直采是什么意思hcv9jop0ns3r.cn 92年属猴是什么命hcv7jop6ns9r.cn 木耳有什么功效与作用hcv8jop3ns5r.cn
肝硬化什么症状hcv9jop3ns1r.cn 宫腔灌注是治疗什么的hkuteam.com 猪狗不如是什么意思hcv9jop4ns6r.cn 专科学什么专业好就业hcv7jop5ns4r.cn 肺部结节是什么意思啊hcv8jop5ns2r.cn
鼻炎是什么原因引起的hcv8jop3ns2r.cn 身旺是什么意思yanzhenzixun.com 刺激性干咳是什么症状cj623037.com 五年生存率是什么意思hcv9jop2ns4r.cn 什么减肥药最安全hcv8jop4ns4r.cn
冠心病是什么病huizhijixie.com 养胃吃什么食物最好hcv8jop0ns3r.cn 坐飞机需要什么证件kuyehao.com 脂肪肝是什么原因造成的hcv9jop4ns5r.cn 蜂蜜水什么时候喝比较好hcv8jop6ns3r.cn
百度