第十四章 突破!新输入法神器(1 / 4)

外星代理人 燕飞 3469 字 2021-06-11

?

杜克进入一种入魔一样的研究状态,他现的时间非常宝贵,完全没有多少可以浪费的空间,所以吃完后就迅速回到自己那个小小的家里。坐24小时不间断下载的电脑面前,他疯狂下载各种语音片段资料,交给克里进行语音语义分析及基础知识库的建设。

自从搬到出租屋后杜克已经疯狂网上下载了数千各种环境和语境下的语音片段,从电视电台闻片段到影视剧对白、动物世界或是国家地理频道的科教解说片段,以及各种偷拍、自拍、伪自拍生活现场片段,感谢酷溜土豆、yutub,还有bt和电驴,让杜克知道原来世界还有如此丰富多彩声音。

杜克收集的如此众多声音材对于克里处理能力来说却仿佛是沧海一粟,往往刚刚输入进去,克里就运算解析出来该片段的语音语义特征,从而为语音识别的语音语义特征库增加一份的标本元素,越是不同的语音片段越有价值。

这就像一个人生活过的地方越多,就越能听出不同地方口音是一个道理,每个声音都是有一些特殊特征和普遍特征构成的,现的语音识别软件对于标准音的识别率其实已经很不错了。

如ib很多年前就推出语音识别输入系统iai,安静环境和标准音情况下软件识别率可以达到实用级别。

可惜实际运用环境不会那么理想,而是就像杜克寝室4个人一样千差万别,虽然大家说的都是国话,但是四个来自不同地方的人的口音却大相径庭,刚刚住一起的时候四个人沟通经常有些问题,但是大家很快就适应下来。

人脑强悍的学习能力绝对不是当今电脑所能够比拟的。而现有的语音识别软件却没有这么强悍的学习适应能力,也就是说它没有用来识别这种语音特征差异的知识库,当然就无法将一些未知类型的音很好的识别出来。

不同口音的识别和环境噪音的排除是语音识别俩个难题,要解决这些问题需要大量的第一手语音资料片段来建立一个海量的语音特征知识库,或者是开出像克里这般高智能的超级电脑。

克里根据杜克下载的理论资料,结合各种语音片段分析,不断对语音识别基础算法进行了,并且生成不同的语音识别模拟器--这是主要考虑到地球现主流电脑的运算水平比起克里来说实太低级。

以模拟iphn4的50%运算能力为低基准,克里模拟出不同性能情况下该语音识别算法的准确率和反应时间,原始版本从初基准性能下5秒内能够达到90%的识别准确率--当然这个成绩已经远超现地球上所有语音

举报本章错误( 无需登录 )