2018年10月28日,以“听见王者世界”为主题的腾讯王者荣耀周年庆音乐盛典在成都火热开演,以王者荣耀游戏人物吕布为原型的全球首款王者荣耀智能机器人,震撼上市!搭载了声智科技为腾讯独家定制的全球首创的穿透式远场语音交互解决方案,这款机器人,不仅是一款全球限量版的王者荣耀游戏手办,更是一款具备“听”、“说”感知能力的AI游戏达人!
腾讯王者荣耀智能机器人
王者荣耀智能机器人
声智科技,一直致力于中文远场语音交互技术的创新与突破。作为中国远场语音交互市场的开拓者,声智科技凭借领先的远场语音交互技术,助力腾讯、百度、阿里、华为、小米等知名企业客户,先后打造了小米AI音箱、小米小爱音箱mini、阿里巴巴天猫精灵、腾讯智能音箱,百度小度智能音箱、联想智能音箱、华为智能音箱等产品,出货量与市场占有率稳居国内智能音箱及智能盒子市场第一。
而全球首款王者荣耀智能机器人的问世,标志着声智科技率先在游戏市场完成远场语音交互技术的应用与落地,不断开拓创新引领行业发展。
当“人工智能”遇到“王者荣耀”
在人工智能快速发展的今天,各个领域的应用都在与AI跨界融合,当人工智能技术与游戏相结合,会迸发怎样的火花?
王者荣耀智能机器人是国内首款人工智能与游戏结合的智能机器人,集“机智伙伴”,“超级暖男”,“高冷学霸”三种人设于一体,可在真实游戏环境中与用户对话实时交流、为用户提供智能语音内容与服务,游戏小百科,视频自动剪辑,陪玩陪练,分秒中带玩家上王者!
全球首创的穿透式远场语音交互解决方案
王者荣耀智能机器人采用的是全球首款人偶型音腔结构设计,由独立的人偶和底座两部分构成,底座装有旋转装置,人偶可以追随玩家用户的声源,并且旋转定位。为了给游戏玩家身临其境的战斗体验,声智科技为腾讯王者荣耀荣耀机器人量身打造了全球首创的穿透式远场语音交互解决方案,通过独家的6麦环形倒置麦克风阵列(Inverse Array)设计,内置穿透式波达方向估计(Penetrated DOA),动态声场的回声消除(Vibrated AEC)等独家定制的AI声学算法,搭配声智科技领先的语音唤醒与识别技术,带给玩家用户不一样的语音交互体验。
(1)6麦环形倒置麦克风阵列(Inverse Array)
王者荣耀智能机器人采用的是全球首款人偶型音腔结构设计,由独立的人偶和底座两部分构成。为了战斗时,给游戏玩家身临其境的听觉享受,王者荣耀机器人将扬声器设置于人偶的头部。区别于常规智能语音设备(比如音箱、机顶盒)麦克风阵列置于顶端、扬声器位于底部的“上听下说”且“听说一体”的圆柱或立方体的中空音腔结构,王者荣耀智能机器人的麦克风阵列设计位置只能置于底座,从而形成独特的“下听上说”且“听说分离”的不规则非中空音腔结构。这样的结构设计,也给麦克风阵列的结构设计与声学AI算法适配带来了巨大的难度。
同时,为了使得战神吕布可以随时定位玩家位置,底盘设置了旋转电机装置,电机极为靠近麦克风阵列,当人偶被唤醒后进行大角度旋转时,会产生电机噪音,影响麦克风阵列的准确拾音。
6麦环形倒置麦克风阵列(Inverse Array)
为此,声智科技为腾讯的王者荣耀机器人量身研制了“倒置麦克风阵列(Inverse Array)”技术。基于声智科技定制研发的6麦环形的倒置麦克风阵列,进一步加强麦克风阵列的声音信号处理能力,对抗人偶机器人对于麦克风阵列的遮挡,以及其产生的声反射和声衍射的干扰,有效抑制自噪声和其他外部噪音。在真实的环境中,王者荣耀智能机器人战神吕布可拾取3-5米远场距离声音,并实现的360度全方位的语音唤醒与识别。
(2)穿透式波达方向估计(Penetrated DOA)
王者荣耀智能机器人独特的设计,使得人偶身体处在麦克风阵列正上方,形成直接障碍物,形成了大量因不规则外形的人偶身体产生的声反射和声衍射,导致了多径传播情况的普遍发生,极大的影响王者荣耀智能机器人准确定位功能。
穿透式波达方向估计(Penetrated DOA)
为了应对这些结构性挑战,进一步加强麦克风阵列的声音信号处理,有效抑制自噪声和其他外部噪音,提高声源测向的准确度,声智科技最新研发了穿透式波达方向估计(Penetrated DOA)技术。即使在噪音干扰大,强混响,强反射面的条件下,王者荣耀智能机器人可实现360度全方位的测向,定位误差在10度以内,随时响应“主公”的呼唤。
(3)动态声场的回声消除(Vibrated AEC)
传统智能音箱等产品的设计扬声器在底部,而王者荣耀智能机器人的扬声器位于头部两侧,一侧指向性的扬声器为全频段发声器件,承担主动发声功能,另一侧为低频共振被动膜片被动发声,形成整体音效。而这样的特殊设计,导致位于扬声器垂直下方的环形麦克风阵列单元拾取到的扬声器系统自噪声直达声信号不一致,这无疑增大了语音唤醒与识别的难度。
而且,主动扬声器的声音会干扰麦克风阵列进行声源侧向,进一步影响人偶旋转角度的准确性。同时,旋转装置的电机,极为靠近麦克风阵列,当人偶被唤醒后进行大角度旋转时,产生的电机噪音影响麦克风阵列的拾音。
动态声场的回声消除(Vibrated AEC)
为此,声智科技研发了最新的动态声场的回声消除(Vibrated AEC)技术,可有效提升音乐状态或语音合成(TTS)状态下的唤醒率,以及在5米内的噪音环境下的远场语音唤醒和识别率。搭配声智科技自主知识产权的混响消除、宽场景高灵敏语音唤醒等专属声学AI算法,可在保护主方向语音不失真的前提下,去除环境中的语音等非稳态噪声以及空调等其他平稳噪声的干扰,自适应计算混响的能量,予以抑制,去除由于房间混响造成的语音拖尾,增强语音清晰度,同时解决弱参考信号或者无参考信号等复杂场景中的回声抵消(自噪声抑制)问题,在双方面语音交互(Double Talk)的情况下仍然鲁棒。
所以,王者荣耀智能机器人在保证高唤醒率的同时有力降低误唤醒率,实现轻松唤醒,随时打断、随时唤醒,无惧环境,想说就说,声随心动,为用户打造完美的远场语音交互的体验。
语音天生具有人类沟通交流和知识传播的媒介属性,是下一代人工智能感知的核心入口,语音交互正在更多真实场景中逐渐落地。只有把麦克风阵列和算法相结合的从硬件到软件自下而上的解决方案,才能真正解决用户与智能设备交互距离以及相应的语音识别技术精度问题,从而真正迈向智能语音交互时代。
声智科技
声智科技是全球领先的声学语音技术和语言智能服务科技创新公司,专注于声学前沿技术和人工智能交互,秉持“听你所言,知你所想”的技术理念,致力于通过不断引领真实环境下的人机交互体验,实现“声音连接智能未来”的使命,“更自由的人机互联”愿景。
声智科技主要提供融合远场语音交互和远场实时通话技术的SoundAI Voice Kit(SVK)语音交互系统,从端到云的智能语音交互技术和服务方案,以及芯片、模组、开发板到完整产品的智能语音应用方案。目前与百度、阿里、腾讯、ARM、NVIDIA、Xilinx、Cypress、Bosch、Cadence等著名企业深度合作,深耕智能家居、智能汽车、智能安防、智能金融、智能教育、智能医疗和机器人等行业,服务小米、百度、阿里、华为、腾讯、联想、创维、金蝶、浪潮、中国移动、奇虎360、中央人民广播电台等客户,是国内服务用户最多、应用场景最全和覆盖地域最广的远场语音交互技术供应商。