RTC架构发展史,长达25年
随着移动互联网的普及和疫情的叠加,实时通信技术(RTC)一度成为热门技术方向。RTC从1996年开始发展成为一个非常复杂的技术领域,包括网络传输、全球调度、媒体处理算法、媒体编解码、信令协议、输入输出设备、Web、操作系统等相关技术。到目前为止已经发展了25年。在此期间,随着互联网的发展,经历了许多技术迭代。从网络通信架构的演变过程来看,可以分为五个阶段(这里称为五代)。RTC在每个阶段都有从终端技术到通信架构的巨大技术变化。
RTC架构发展史,长达25年
1:MCU级(1996-2004)
第二代:P2P阶段(2001-2007)
阶段3:单一SFU阶段(2003-2012年)
第四代:云级SFU(2010-2017年)
第五代:全球实时云通信阶段(2016至今)
每一代都是风起云涌的时代,每一代都是“卷轴王”的时代。在此,我不会将RTC某一领域的技术细节和应用进行“卷”,而是通过分析5个阶段的大环境背景和用户侧场景诉求对RTC技术演进的影响,为了让大家更好的了解RTC这个技术领域,也是自自己从事音视频从业以来的一个总结。
MCU级。
20世纪90年代中期,WWW网络兴起,大量终端用户通过电话线拨号接入互联网,当时网络速度仅为56kbps(俗称56K猫),看网页、下载图片有时需要几十秒钟。网络速度慢,流量昂贵,但是企业和个人都有通过PC联网的强烈需求。
公司场景:通过PC互连实现内部在线会议取代传统的电话会议,实现企业信息融合通讯。
个性化情景:通过PC互连实现点对点语音的实时通信。
H.323
国际电信联盟以传统的PSTN体系结构为基础,以H.323/RTP为基础,引入了H.323/RTP的IP网络多媒体标准,同时IETF组织于1996年发布了RTP规范(RTC1989)(RTC1989),并在H.323协议中引入了MCU和网关的概念。RTP/RTCP体系(RFC3550/3551)在随后的规范中被ITU合并到H.323标准中,对其进行了进一步的改进。
323标准不仅规定了传输协议的RTP,而且还制定了媒体编码规范(G.7xx/H.261/H.263),媒体协商协议(H.245),信令协议(RAS/H.225),网络安全协议(H.235)等等。在这种情况下,媒体编码影响很大,几乎现在的实时音、视频编码算法都是从这里发展起来的。323标准定义了点对点通信和多人会议通信,点对点通信和多人会议通信的区别在于,点对点通信的介质是终端直接通信,多人会议媒体需要通过MCU通过MCU,在MCU按需重新编码合流之后,进行媒体数发布。在此必须提一句,H.323的ASN.1协议编码技术的确很棒,但是也没能逃脱被淘汰的命运。