“中国的人机语音对话,是汉语的事,是我们民族的事情,为什么要让别人来做?我们应该自己去闯出这条路来。”这出自人机语音通信专家王仁华之口。
王仁华,曾任中国科学技术大学电子工程与信息科学系教授。他在中国科技大学建立起我国最早的人机语音通讯实验室,带领学生团队创立科大讯飞,填补了我国在语音合成、语音识别及语音评测方面的空白,多次荣获国家科技进步奖和国家信息产业重大发明奖等奖项。
吃闭门羹
王仁华家的客厅墙上挂着一幅画,画上是声音律动的波形,右上角醒目地写着10个大字:让世界聆听我们的声音。
王仁华1943年8月出生,到美国做访问学者时他37岁,主攻数字信号处理。偶然间看到《语音信号的数字处理》这本书,他如获至宝。王仁华揣着书和满心的激动,坐着长途车去拜访书的作者,没想到,对方毫不留情地让他吃了闭门羹。等候时的忐忑,垄断者的傲娇,80岁的王仁华一直没忘。
“我当时就下决心,总有一天我会在中国也建个贝尔实验室,在人机语音通信、人机对话协作上超过你们。”他说。
彼时,大洋彼岸的美国贝尔实验室闻名遐迩,许多沿用至今的发明,如晶体管、太阳能电池和通信卫星均诞生于此。两年学习期满,导师极力挽留王仁华继续读博士,他告诉导师,跟博士学位相比,他更想早一点回到祖国实现自己的梦想。
他说:“我理清楚了这条路应该怎么走,怎么从最开始的语音编码到语音合成、语音识别、语音评测、人机语音通信,再到人工智能。多一个博士学位没什么,但这件事情要能够做成功的话,对我们国家会更重要。”
“让机器像人一样能听会说”
1985年,王仁华决心成立语音实验室,目标就是“让机器像人一样能听会说”。没有尖端人才,他就培养学校里的优秀学生;没有经费,就去申请国家课题。
王仁华回忆,那时候科大刚迁到安徽合肥,条件很差,根本没有做这种稍微高级的实验的条件,就挤在几个房间,计算机都不一定有。“你是实验室的负责人,你要负责任,去挣项目,去赚钱,去建实验室,所有的事情,你必须去做。那时候我成天在北京跑,跑科学院,跑研究所。”
一年后,王仁华的语音实验室完成的“微机市话查号系统——114查号台”项目通过安徽省科委技术成果鉴定。经改进后,在天津、西安、长春、哈尔滨等30多个大城市使用,电子合成的号码播报声响遍大江南北。
1994年1月,汉语识别语音数据库在合肥建成。同时,王仁华团队基于机器语音识别技术研制成功了我国第一个普通话水平测试自动评测系统,被认定为我国“普通话推广历史上一次重大技术革命”。
“第一个吃螃蟹的人”
40岁之后的王仁华,身上多了一个鲜明的标签:“第一个吃螃蟹的人”。这个在学生眼里总是笑眯眯的王老师,总是会做出一些在旁人看来有些“叛逆”的事。1998年,即将硕士毕业的学生刘庆峰跟王仁华提出创业的想法,王仁华毫不犹豫表示支持:“你只管大胆去搞。”
智能语音公司科大讯飞成立之初,王仁华顶着压力,坚持把学校奖励的股权分配给学生。1999年,中国科学技术大学6名学生获准得到总计600多万元的技术股权奖励,这在全国高校中尚属首例。他的理由很简单,要想干成一番事业,没有好的待遇,怎么能留住人才?
他竭尽全力地帮助公司找项目、拓资源,但依然拦不住市场对创业公司的重重考验。连续5年,公司一直处于亏损状态。实验室里的佼佼者真的只是温室里的花朵而已吗?看到学生们开始怀疑自己,王仁华淡定地给他们打气:这条路,没有走错,坚持就好。
2004年,科大讯飞开始盈利。2008年5月12日,深交所的钟声响起,中国第一个由在校大学生创业的智能语音公司上市。
王仁华带领初出茅庐的学生,跨越语音评测、语音识别、机器翻译等一个个技术高峰,让中文语音交互技术融入了千行百业。学生刘庆峰说,很多同学至今感恩,王仁华老师打心眼里盼望学生都能青出于蓝胜于蓝,他心甘情愿把技术、舞台都传承给学生。
老师应该如何对学生,王仁华说,这是中国科技大学的老师们教给他的。当年,中科大各系的主任都是赫赫有名的学界泰斗,钱学森先生经常穿着土布中山装、戴着布帽、穿着布鞋来上课;化学物理系首任系主任郭永怀的包里,除了教案,经常会有一颗洗得干干净净的红苹果。王仁华更没有想到,他和同学在学校水房碰到语言学家李佩,三言两语,李佩就答应教他们英语。
2008年,王仁华获得安徽省重大科技成就奖。答辩时评委问:你说的人机语音通信这么好,你认为计算机“能听会说”什么时候能够实现?他想了想回答:15年。2023年,人工智能的认知大模型横空出世,距离2008年,正好15年。
摘自《中国之声》