超清课堂直播面临的关键问题是:“看得清,听得明,传 得快”。
看得清:当前“专递课堂”和“名师课堂”主要以教育大屏为显 示终端,屏幕分辨率都高达 4K,甚至 8K。这样高质量的视频画面, 需要占用较高的网络带宽。为了帮助用户节省带宽资源,可使用更高 压缩率的编码标准。同等质量的视频,新一代的编码相比 AVC 编码 可节省至少一半带宽资源。同时只有满足一定的编码码率,视频质量 才可能得到保证。根据国家广电总局 4K 超高清电视视频质量标准,对于 4K30 帧的电视节目码率需要达到 25Mbps。这个视频编码的要求 是针对 AVS2 编码提出的,因此如果选用压缩效率比 AVS2 更高的视频 标准,同时也能达到 25Mbps 的码率,可以说是达到了国家广电超高 清的视频质量要求的。将这个 4K 超高清的电视视频标准应用到实时 音视频领域,也是一个极大的挑战。当前实时音视频通用软件提供商, 基本没有能满足这个要求的厂商。即便是在专属的会议主机设备上, 编码码率都小于 10Mbps。因此,如何达到广电级的视频质量,这是超 高清直播课堂一个挑战。
听得明:在教育场景下,远程双方需要实时语音互动,会遇到双 讲问题。双讲主要指在远程语音交互场景中,互动双方或多方同时讲 话,其中一方的声音会受到抑制,从而出现断断续续的情况。这是由 于其中一人的声音,被对方的回声所掩蔽。这就要求在回声消除算法 上寻找平衡点,既不能产生回声,又不能抑制人声。在教育场景下,另外一个重要的问题是完全自由的对话体验。不管是学生或老师在一 个标准的教室里,在任何位置、任何方向都能与远端的师生对话。声 音的采集还受到建筑物的装饰材质、空间大小、播放设备布局等的影 响。因此,如何在如此大面积并且不统一的物理环境、任意的位置都 能进行清晰的语音互动,是超高清直播课堂另外一个技术挑战。
传得快:根据国际通信联合会 ITU-T G.114 标准,为保证通话双 方的有效性和体验,音频传输的单向延迟必须小于 400ms。然而 TCP/IP 协议栈在网络层是提供尽力而为的服务,在链路质量差、设备 带宽满、不同运营商之间传输数据时,数据丢包是常有的事情。由于 TCP 有丢包退避机制来减轻网络拥塞,当发生连续多次丢包后,就会 产生非常大(>800ms)的延迟。因此,如何降低音视频端到端的延迟 是超高清直播课堂的第三个技术挑战。
