英雄联盟 S11 直播延迟 30 秒,这次网友反应有点不太一样
导读: 英雄联盟 S11 直播延迟 30 秒,这次网友反应有点不太一样 直播延迟几十秒,网友竟然还说 "真香"?!!你没听错,这发生在英雄联盟 S11这种全球赛事上,
网友提问:
英雄联盟 S11 直播延迟 30 秒,这次网友反应有点不太一样
优质回答:
直播延迟几十秒,网友竟然还说 "真香"?!!
你没听错,这发生在英雄联盟 S11这种全球赛事上,而且,延迟高达 30 秒。
要知道 S11 观众量可是千万级别,去年决赛最高同时观看人数就多达4595 万人;
像这种顶尖赛事,保证音、画质的低延迟本就应该是各大平台的" 基本操作 ",哪怕一点额外的延迟都是绝对不能忍的。
拿前几天 Dota2 直播举例,延迟 15 分钟,网友们那可是群情激愤……
而这回,S11 直播,一个官方频道延迟高达几十秒——
这似乎是大型直播事故了吧?
但万万没想到的是,弹幕画风竟然一片 " 舒适 "、" 真香 "。
△已经有听障人士用上了
其实,像这种直播字幕背后的 AI 实时语音识别技术,已经有不少应用了。包括油管的直播字幕、谷歌移动设备的视频字幕和微软 PPT 演讲字幕等,都属于这类技术。
不过,像这样专门为直播留出一个无障碍直播间的平台,目前还不多。
要真正做好一个无障碍直播间,技术上究竟比普通实时字幕特殊在哪里?
我们深入了解了一下,发现它比想象中更"难 "。
无障碍语音识别,特殊在哪里?
在理解无障碍的特殊性之前,需要先知道直播中的实时字幕是怎么来的。
从流程上来看,实时字幕处在直播视频编码和解码中间的位置。
实时字幕是在视频编解码过程中,对音频进行快速语音识别,再与视频一起输出的效果,整体大概是这么一个过程:
△简略版流程
可以看到,视频本身还需要经过编解码等传输流程,实时字幕制作则处在编码和解码中间的位置。
从技术本身来看,实时字幕用的是语音识别,具体分为人工识别和自动语音识别(ASR)两种。
此前,由于 ASR 准确率上不去(尤其是中文识别),人工识别又需要好几分钟延迟,大型比赛直播中采用实时 AI 字幕的不多。
这些年 AI 技术上来了,视频中应用自动语音识别 ASR 制作字幕的也多了起来,具体又分为流式 ASR和非流式 ASR。
非流式,指整段输入语音、再输出文字的结果;流式,指像 " 流水线一样 " 实时输出转文字结果。
目前的流式 ASR 可以做到速度极快(毫秒级,肉眼看起来是实时)的输出,经过训练也能达到不错的准确率;但与此同时,它也还有不少优化空间。
对于不同直播来说,选择语音识别方法时,主要会从准确率和识别速度进行考量,像新闻直播更重视准确率,娱乐赛事直播更侧重识别速度。
这次的无障碍我真的吹爆!虽然残障人士是少数人,但少数人也有享受一切的资格。
科技本身应该是无障碍的
放眼整个游戏行业的发展历程,B 站这种对残障人士的关怀思考,其道不孤。
最知名的莫过于是 2018 年 9 月,微软推出的 Xbox 自适应手柄——Xbox Adaptive Controller。
30 厘米长的手柄上有两个大的可编程按钮和 19 个插孔,可连接到一系列的操纵杆、按钮和开关。
即便有些玩家对价格表示不满,因为这款手柄要 99 美元(人民币 700 元左右),比普通手柄高出 40 美元,但当时在业内却引起了不少的轰动以及好评。
△色盲人士看马里奥是这样的(右)
去年,游戏届奥斯卡奖 The Game Awards(TGA)还专门设立一项最佳无障碍创新奖,来鼓励游戏厂商们为残障玩家服务。
不止是产品中辅助功能的更新,现在,更多的科技公司开始关注到无障碍相关的技术研发。
比如,眼球追踪技术。
如 Tobii 公司的眼动仪,就允许玩家通过眼球移动来控制数字界面,也已经有更多产品支持这项技术;又如 Tribe Game 的推出的《超点》动作游戏,玩家就能通过眼球追踪技术,完成对整个游戏的操控:
可以明显看到,更多科技公司与平台在关注残障人群 " 无障碍 " 体验文娱服务这件事。
而且这个群体,确实不应被忽略。
以往我们多数人只是在电视新闻中看到有企业机构关注他们的现实生计、刚需,但细想一下,这些听障朋友的精神需求,同样是生活中重要一环。
所幸,这样的需求正在越来越被广泛关注。
除了最直接的影响——对残障人士有益之外,科技走向 " 无障碍 "本身还有更多额外价值。
对于他们来说,技术人员正在成为智能时代的" 扫盲僧 "。
如今,数字化智能化服务为大多数人带来便利,但始终存在这样一批被拦截在技术之外的" 失语者 "和" 局外人 "。
他们或是不同程度的残障人士,或是行动不便的老年人、又或是那些因为特殊原因不能享受科技福祉的少数群体。
但谁来扛起这个 " 扫盲僧 " 的责任——将科技惠泽到更多群体呢?
如前所述,就是那些原本改变这一切的人,所谓的"无障碍 "场景,正是技术人员的练兵场。
如何练兵?该往哪个方向练兵?
这就离不开扫盲僧的核心秘籍——企业的 " 以人为本 " 价值观。
甚至从某种意义上说,这种价值观是最终实现的关键一环。
即使输出的产品功能再小、技术也不那么前沿,但只要能物尽其用,它所带来的价值就会更加长远。
这次 B 站是聚焦听障群体,下次也许就是视障群体,再下次可能就是老年用户……细想一下,一个平台最终不正是这么多小众用户共同组成的么?
毕竟,科技本身就应该是无障碍的。
如果哪天,地球上不再存在什么 " 失语者 "、" 局外人 ",技术无障碍的终极意义,也就真正实现了吧。
版权声明:本文部分来自互联网,由小编精心所写,本文地址:http://www.zhubian88.cn/smbk/20704.html,如需转载,请注明出处!