Northwestern Polytechnical
University
Audio Speech & Language Processing Group
Digital Signal Processing
  • English
Home
您是第counter free hit unique web位访客

首页»新闻»正文

Wireless Communications Speech Processing Medical Applications

小米语音技术总监王育军博士来访

     2018年5月4日,小米AI实验室语音技术总监王育军博士一行二人访问实验室。当日上午10:30,王育军博士在计算机学院105报告厅给广大师生带来了题为“小米的智能语音技术”的报告,之后小米AI实验室语音组的王欣为大家带来了“小米说话人(声纹)识别技术现状与应用”的报告。

      报告中,王育军博士首先介绍了语音技术对小米的重要性以及小米语音团队的发展情况。小米作为一家全球最大的IOT公司,语音的入口作用极为重要。从2017年1月组建语音团队至今,小米语音技术得到了快速的发展。语音识别、唤醒、声纹识别等技术已经应用到小米电视、小米手机、小米AI音箱、小寻儿童手表等众多产品中。“小爱同学”语音助手已经变得无处不在,搭载“小爱同学”的智能设备已经超过千万,成为小米最重要的的人工智能品牌。王育军博士展示了小米在语音识别、语音唤醒和声纹识别的技术突破,同时指出工业级的大数据在技术落地中的重要作用。他同时指出,小米语音团队在落地各项技术的同时,非常重视前沿技术的跟踪。在这方面,与西工大音频语音与语言处理研究组密切合作,已经有多项研究成果。其中,在今年的语音识别顶级会议ICASSP2018上,展示了基于小米电视搜索的“端到端”语音识别成果。他表示,今后将继续加强与实验室的校企合作。随后,王欣博士介绍了小米说话人识别技术现状与应用,从声纹识别原理、主流方法和在小米各种产品中的应用进行了全景式扫描。报告会后,两位来宾和现场听众进行了深入的交流和探讨。

     据悉,报告人王育军博士,2000年毕业于清华大学自动化系,随后赴英国伯明翰大学电子系学习人机交互技术。2002至2004年就职于NEC电子,从事嵌入式语音识别和语音合成技术。随后加入中软国际从事声学模型技术。2007年到2012年在比利时鲁汶大学电子系从事抗噪语音识别。回国后加入百度语音技术部。2015年就职于乐视,负责语音识别于自然语言理解技术。2017年加入小米,担任语音技术总监,负责语音识别与语音合成技术。

 

 

 

 

  • 校园风光