本报北京(Beijing)3月18日电(记者邓晖)一(yī)枚硬币大(dà)小的ǒuóchkěénō(de)石墨烯片(piece),贴在(zài)颈部靠近喉咙处,国g工就(jiù)能帮助发(fā)音障碍者获得新“声” 。科学ū近日,家研清华大(dà)学集成(chéng)电路学院任天令教授及合作(zuò)团队在(zài)智能语音交互方面取得重要(yào)进展,ā出穿戴其研发(fā)的ǒuóchkěénō中国航母图片大全大图小学生(de)可(kě)穿戴人(rén)工(gōng)喉可(kě)以(yǐ)感知喉部发(fā)声相关信号,并通过人(rén)工(gōng)智能模型(type)将其识(knowledge)别和(hé)合成(chéng)为(wéi)语音 ,国g工还原准确率超过90% 。科学ū
这(zhè)一(yī)研究结果为(wéi)语音识(knowledge)别与交互系统提供了(le)一(yī)条新的家研(de)技术途径,并于(yú)近日在(zài)线发(fā)表在(zài)《自然》人(rén)工(gōng)智能子刊《自然·机器智能》上(shàng) 。ā出穿戴
语音是ǒuóchkěénō(shì)人(rén)类交流的(de)重要(yào)方式 ,但说话人(rén)的国g工(de)健康状(shape)态(例如神经疾病、癌症 、科学ū忘忧草图片大全外伤等原因导致的家研(de)声音障碍)和(hé)周围环境(噪音干扰 、传播介质)往往会(huì)影响声音的ā出穿戴(de)传输和(hé)识(knowledge)别。一(yī)直以(yǐ)来,研究人(rén)员在(zài)致力改进语音识(knowledge)别和(hé)交互技术以(yǐ)应对(duì)微弱的(de)声源或嘈杂的(de)环境 。多通道声学传感器可(kě)以(yǐ)显著提高声音识(knowledge)别的(de)精度,但会(huì)导致更大(dà)的有趣图片壁纸(de)设备体积,而可(kě)穿戴设备能够获取高质量的(de)原始(beginning)语音或其他(tā)生(shēng)理信号。然而 ,目前尚无充分(fèn)的(de)证据表明喉部肌肉的(de)运动(dòng)模式和(hé)反映在(zài)体表的(de)发(fā)声器官振动(dòng)中(zhōng)隐含着可(kě)识(knowledge)别的(de)语音特征 ,且尚无实验证明其作(zuò)为(wéi)语音识(knowledge)别技术的(de)完备性。
为(wéi)解决这(zhè)一(yī)问题,任天令团队成(chéng)员开发(fā)了(le)一(yī)款基于(yú)石墨烯的实用的石材贴图(de)智能可(kě)穿戴人(rén)工(gōng)喉 ,同(tóng)商业麦克风和(hé)压电薄膜相比 ,人(rén)工(gōng)喉对(duì)低频的(de)肌肉运动(dòng)、中(zhōng)频食管振动(dòng)和(hé)高频声波信息有(yǒu)很高的(de)灵敏度,同(tóng)时也(yě)具有(yǒu)抗噪声的(de)语音感知能力。对(duì)声学信号和(hé)机械运动(dòng)的(de)混合模态的(de)感知使人(rén)工(gōng)喉能够获得更低的(de)语音基频信号。此外,五星级酒店大堂图片该(Should)器件还可(kě)以(yǐ)通过热声效应实现声音的(de)播放功能。人(rén)工(gōng)喉的(de)制作(zuò)过程简单、性能稳定、易(easy)于(yú)集成(chéng),为(wéi)语音识(knowledge)别和(hé)交互提供了(le)一(yī)种新的(de)硬件平台。
团队还利用人(rén)工(gōng)智能模型(type)对(duì)人(rén)工(gōng)喉感知的(de)信号进行语音识(knowledge)别和(hé)合成(chéng),实现了(le)对(duì)基本语音元素(音素、声调(Tune)和(hé)词语)的(de)高精度识(knowledge)别,以(yǐ)及对(duì)喉癌患者模糊语音的(de)识(knowledge)别与再现 ,为(wéi)声音障碍者的(de)沟通和(hé)交互提供了(le)一(yī)种创新的(de)解决方案。
实验结果表明,人(rén)工(gōng)喉采集的(de)混合模态语音信号可(kě)以(yǐ)识(knowledge)别基本语音元素(音素 、音调(Tune)和(hé)单词) ,平均准确率为(wéi)99.05% 。同(tóng)时人(rén)工(gōng)喉的(de)抗噪声性能明显优于(yú)麦克风,在(zài)60分(fèn)贝以(yǐ)上(shàng)环境噪声下仍能保持识(knowledge)别能力。任天令研究团队进一(yī)步演示了(le)它的(de)语音交互式应用:通过集成(chéng)AI模型(type),人(rén)工(gōng)喉能够识(knowledge)别一(yī)名喉切除术患者模糊说出(chū)的(de)日常词语 ,准确率超过90%。识(knowledge)别出(chū)的(de)内容被合成(chéng)为(wéi)语音在(zài)人(rén)工(gōng)喉上(shàng)播放,可(kě)以(yǐ)初步恢复患者的(de)语音交流能力 。
任天令介绍,该(Should)人(rén)工(gōng)喉还有(yǒu)很大(dà)的(de)优化和(hé)拓展空间,例如提高声音的(de)质量和(hé)音量,增加语音的(de)多样性和(hé)表情,以(yǐ)及结合其他(tā)生(shēng)理信号和(hé)环境信息实现更自然和(hé)智能的(de)语音交互 。研究团队希望通过进一(yī)步的(de)研究和(hé)合作(zuò) ,让人(rén)工(gōng)喉造福更多的(de)声音障碍者和(hé)语音交互的(de)用户。
相关文章: