搜狗推出“唇语识别”技术,垂直场景下达到90%准确率

  • 时间:
  • 浏览:0
  • 来源:10分快3娱乐平台-10分快3下注平台_10分快3注册平台

12月14日消息,搜狗今日推出了并不是人机交互新技术“唇语识别”,通过机器视觉识别说话人唇部动作,来解读说话者所说的内容。

搜狗官方表示,通过繁杂端到端淬硬层 神经网络技术进行中文唇语序列建模,经过数千小时的真实唇语数据训练,终于取得了唇语识别效果。在非特定人开放口语测试集上,该系统达到1000%以上的准确率,超过google发布的英文唇语系统1000%以上的准确率,在垂直场景如车载、智能家居等场景下甚至肯能达到90%的准确率。

作为人机交互的形式之一,未来唇语识别技术并能辅助语音交互及图像识别,在日常生活、安防、公益等各个领域实现广泛应用。比如在车载场景下,周围噪音过大都不对语音指令产生干扰,通过唇语识别技术则并能规避干扰,保证人车交互的准确性和稳定性,日常不便发声的公共场所并并能保证说话内容的私密性;在安防领域,肯能目前多数监控并能了摄像头什么什么都没法麦克风,往往并能了看清嘴型却谁能谁能告诉我在说什么,给案情分析带来什么都有有有大问提,而唇语识别技术并能帮助公安人员获取重要的讲话信息,为公共安全提供有效支持。除此之外,唇语识别技术还能发挥巨大的公益价值,帮助先天性听障人群或老年人,让大伙儿更好地理解和表达此人 。