首页 > 业界资讯 > 正文

搜狗“唇语识别”技术演示视频:歌词、绕口令都能识别

昨天,搜狗推出新一代人机交互——“唇语识别”,能识别人的唇部动作,动动嘴皮,不发出声音,就能识别你说的什么。

今天我们见到了演示视频从视频中可以看出将面部放入椭圆形区域内,不发声的说出一段话,几乎说完的瞬间,识别的文字就出现在屏幕上,无论是口语、诗词、歌词还是绕口令,都能很好的识别。

同时,在屏幕右下角,我们能看到唇语识别类似面部识别,通过检测嘴唇多个部位点的动作,进行语意的识别。 搜狗表示,通过复杂端到端深度神经网络技术进行中文唇语序列建模,经过数千小时的真实唇语数据训练,终于取得了唇语识别效果。

根据官方数据,搜狗唇语识别在非特定人开放口语测试集上,该系统达到60%以上的准确率,超过google发布的英文唇语系统50%以上的准确率。在垂直场景如车载、智能家居等场景下甚至已经达到90%的准确率。

未来唇语识别技术可以辅助语音交互及图像识别,日常周围噪音过大或不便发声的场所更加适用,既能保证识别准确性和稳定性,也可以保证说话内容的私密性。

此外,唇语识别技术可以帮助公安人员获取无声视频中重要的讲话信息,还能帮助先天性听障人群。

网友评论

三日内热门评论文章
热门IT产品
  1. ¥7599
    苹果iPhoneX 64GB
    ·
  2. ¥5799
    三星S9
    ·
  3. ¥4498
    vivo NEX旗舰版
    ·
  4. ¥4999
    OPPO Find X
    ·
  5. ¥1799
    努比亚Z18mini
    ·
  6. ¥1499
    OPPO A5
    ·
  7. ¥1999
    荣耀Play(4GB RAM)
    ·
  8. ¥1598
    vivo Y85
    ·
  9. ¥3499
    坚果R1(6GB RAM)
    ·
  10. ¥3599
    一加6(8GB RAM)
    ·
为您推荐
  • 相关阅读
  • 业界资讯
  • 手机通讯
  • 电脑办公
  • 新奇数码
  • 软件游戏
  • 科学探索