今天,人体声学系统在人工智能的创新助力下,助力提高了人们的生活质量。而打破语言障碍,使患者从无声到“有声有色”的表达,则是石墨烯人工喉迈出的创新脚步。
石墨烯是从石墨材料中剥离出来、由碳原子组成的只有一层原子厚度的二维晶体,具有极高的电子迁移率、优秀的机械强度、优秀的导热性,对低频的肌肉运动、中频食管振动和高频声波信息有很高的灵敏度,同时也具有抗噪声的语音感知能力。
2017年,任天令团队创新性地提出了一种基于石墨烯的收发同体的集成声学器件:利用压阻效应来接收信号,并基于热声效应发射声音,从而巧妙地实现了单器件的声音收发同体。
在器件制备工艺上,采用独特的激光直写技术,能够直接将成本低廉的大面积聚酰亚胺薄膜快速转化为图形化的多孔石墨烯材料。
石墨烯智能人工喉一方面具有高热导率和低热容率,可以通过热声效应发出100Hz-40kHz的宽频谱声音;另一方面能够分辨低吟、尖叫、咳嗽、吞咽、点头等动作,并将这种“无含义声音”转换为频率、强度可控的声音,这无疑带来了声学器件的“全新革命”。
如果说刚开始,“石墨烯人工喉”只能实现简单的采集和发声功能,经过2次迭代后的石墨烯智能人工喉(WAGT)在器件柔性可贴附、声音收发系统集成、动作监测系统、轻型可穿戴等方面均有了重大突破,实现了声音输入到输出的闭环,并能够最终靠示波器实时观测喉部运动情况。
团队在第3次迭代时,研发出体积更小及功能更多的集成“人工喉”。这种膜片通过导线平方厘米大小的微控制器相连,后者可以放在口袋里,配有一个纽扣大小的电池,简单又便捷。
当佩戴者低吟时,石墨烯人工喉会感知喉咙的振动状态,提取关键声学特征,通过人工智能模型进行音频信号处理,来合成流畅、自然的语音,实现了动作发声系统。
据了解,新一代石墨烯人工喉可以基本恢复患者的语言交流能力,识别一名喉切除术患者模糊说出的日常词汇,准确率超过90%。甚至不同频率的耳语,尖叫和咳嗽都可以被该设备记录,编码,并进行分类,“解码”出不一样的种类的聋哑人“语言”,经过训练后,有望实现“吟诗作唱”的梦想。
“这是一款能够读懂人,代替人表达的一个智能芯片系统,” 任天令介绍,“也代表着一种新的交互方式。”
在中国,每年有超过30万人由于意外或者癌症等疾病手术而失去声音这种人类最简单最快速的通信交流方式。虽然目前有传统人工喉能够正常的使用,但除了成本大、消耗高,对于患者来说,也存在使用麻烦、体验感差、发音模糊等问题。尤其是传统人工喉的声音是电子机器的声音,在日常交流时不免显得突兀冰冷。
因此,如果能实现高精度无创便携式语音交互,无疑给众多失声患者点亮了一盏明灯。
过去的8年里,任天令都在开展研究工作。在国外学术交流中,看到一些发达国家对人类健康问题的重视,他引导小组成员关注基础研究,要“以人为本”,强调转化与实用提升科研实力。
自石墨烯被发现的将近20年里,任天令不仅参与到该器件的基础研究和实用化应用的探索中,更是致力于用突破传统器件限制的新型微纳电子器件,为国家医疗卫生事业赋能。“研究中,重点考虑怎么把它的潜质发挥出来,优先解决人类当下面临的紧迫性问题。”
“在医院调研时,让我感触最深的是,失声患者宁愿选择痛苦化疗,也要保留声带功能。”集成电路学院的韦雨宏表示,众多患者的心声给了她很多触动和启发,并在研究二维材料时更多关注人的体验感、便携度。通过团队研究的集成AI模型实现高精度识别,尽可能还原患者的情感诉求。
任天令认为,再高精尖的理论或是技术,只有“以人为本”,才能真正地发挥作用。石墨烯人工喉用智能模型来学习人、懂得人、适应人、服务人,就是对这一点最好的诠释。
石墨烯人工喉科研团队前后直接参与者有20余人。他们秉承清华人的使命,怀着“努力为社会多作贡献”的初心与情怀,一步一个脚印,实现了石墨烯人工喉从“0到1”的突破,辐射更多声音障碍者和语音交互的用户。
“我们每天都在攻坚克难,没有捷径。”无数个通宵实验,奔赴多个智能医疗领域调研走访,采集样本.......韦雨宏说,“人工喉系统是一个很复杂的工程建设项目,最关键的就是信号采集的问题。因为喉部震动比较微弱,最初采集的数据质量实际上并不理想。我们实验人员在自己身上也尝试过很多次,主要还是得多下功夫!”
八年如一日,任天令带领团队进行协同攻关,不断理论迭代与模型演化,终于设计出一款适用于普通患者的人工喉。
“声音信息处理是一个涉及多个学科和领域的复杂问题,需要更加多的专业相关知识和经验。”负责石墨烯AI领域的杨其晟在任天令的支持指导下,学习声音信息理论、优化器件和硬件系统、多方寻求合作交流......“这些让我更加体会到科研工作者的敬业精神、创新意识和团队协作精神。”
此项原创性研究性成果是我国在智能器件领域的重要创新。面向世界科学技术前沿、面向国家社会需求、面向人民生命健康,率先研发石墨烯人工喉声学器件,率先实现可穿戴人工喉技术跨越发展。
谈及未来应用,任天令表示,多年的研究工作积累让“人工喉”的产品化、量产化很有机会实现,并根据不一样的需求情况,多领域、多学科深度合作,形成更高层面的智能系统。目前,该器件正在与声纹识别、机器学习等技术结合,之后将在语音识别、家庭医疗等领域具有广阔前景。“这在技术上已没有难以逾越的障碍。”任天令微笑表示。