《外星代理人》

下载本书

添加书签

外星代理人- 第11部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
    加上杜克从网络上搜索出来的一百多篇顶级学术期刊关于语音识别相关的前沿论文,杜克或者说克里已经站在世界语音识别理论领域的前沿阵地上面。
    毫不夸张地说,单独从语音识别领域的理论知识而言就算是麻省理工研究语音识别的顶尖教授现在都未必比得上。
    可是现在还只是一些纯理论的研究,虽然结合克里的本身对于语音处理一些古老外星知识,已经在地球现有的语音识别理论基础上进行新的创新和发展。
    但是由于克里的星空下,已经有几百年时间不再通过语音这种低效模式进行交流,他们直接以类似人类思维沟通的方式更加快捷。
    而先前与杜克在星舰上的语音沟通不过是比莱姆为了便于创造出一种容易交流的环境,而直接根据杜克大脑记忆而进行的语音合成。
    因此克里没有现成可用的理论来解决杜克面临的语音识别问题,因此接下来杜克需要积累一些真实的语音片段资料来供克里进一步进行分析抽样语音语义特征,来模拟验证现在理论的优劣,这造核武器的技术要用来制作火绳枪,难度也不是一般的小。
    要不说科技行业,领先半步是先驱,领先一步就成为先烈呢。
    董锋看了看杜克,确信杜克没有给自己开玩笑,不禁无奈的笑了笑说道:“不管你了,有点事情做总是好的,看得出来这几天你确实没有白过,以前一起在实验室打游戏都没有你现在这么疯狂,你现在的眼睛已经可以同兔子媲美了。
    不过今天总可以休息一下了吧?如果我没有记错,过不了几天你就要参加GRE考试了。我建议你还是多花点心思在这个考试上,这些专业知识虽然也很重要,不过对于你申请留学来说好像没有什么直接的关系嘛,正经GRE得分高才是王道。”
    董锋不相信杜克能够在这么短短时间内在学术上突飞猛进,因此虽然对于杜克的理想有些不以为然,但是仍然委婉地劝杜克将精力尽量放到GRE考试上,毕竟从申请留学的经验上看如果GRE不是一个非常可观的分数,申请留学不过是一个笑话,更不用说去麻省理工。
    杜克笑了笑,不再接着这个话题,“走,打电话叫菜菜一起好好搓一顿去,我的第一笔工资已经到账了,以前都是蹭你们的,这次我买单。”
    “靠,不会吧,杜克,你的那份网上的工作还真给你钱了?这年头还真是什么事情都遇得到。”董锋满脸不相信,“呵呵,昨天才到账,回头看看附近哪里房子合适先租一套,现在要大量上外网找资料,学校这破网太不给力了。”
    杜克的小说在经过了一个星期的连续三更后,收藏已经突破了二十万,网站方面果断昨天晚上便VIP上架,首订一夜之间便突破一万,形势一片喜人,因此一百章的首期款10万元便打入到杜克的账上,其余5万算是网站扣留的保证金和税金。
    因此杜克手中有钱心不慌,直接带董锋奔附近一个海鲜酒楼而去,点了一只2斤多的澳洲龙虾做主菜,一方面是杜克确实想吃点好的,毕竟实打实的十万现金入手,另外一方面是杜克看到酒楼今天龙虾打折,一斤居然只要388元,这个价位奢侈一下对于一个刚刚入手十万,很快就会入手另外一个十万的人来说不算过分吧?
    “杜克,你确信你不是中双色球大奖了?”等蔡思强来到酒楼,看着那只大龙虾,非常怀疑地问道。
    “拉倒吧,菜菜,疯子已经问过三遍了,我说你们俩今天是不是有毛病啊?
    有得吃还啰嗦什么,兄弟保证这绝对是合法致富,不是偶然所得。”杜克有些哭笑不得的再次解释道。
    因为在等待蔡思强来的闲暇时间里,董锋已经拐弯抹角地问过三次了。董锋,蔡思强难得一致地摇摇头,表示不信,但是并不妨碍俩人同时向龙虾发起猛烈的攻击。
    对于他们这种刚刚出校门的人来说,这道小1千的菜真的算很稀罕了,虽然蔡思强也许在家是吃过。
    所以俩人非常领情,看俩人狼吞虎咽的模样,你绝对看不到有半点客气的意思,“我说,你们不能慢点,哎,给我留点,我也是第一次吃好不好。靠,好歹这是海鲜酒楼,不是街边苍蝇馆子,注意点素质行不行?”
    杜克见势不妙,也赶紧开动,总算在蔡董俩人的虎口中夺出了一份。
    这次聚会,让蔡董二人明白了一件事:就算杜克去不成麻省理工,但是解决温饱问题一定不再是问题。因此在龙虾争夺战后,蔡思强给远方的赵建武打了一个电话,“武哥,报告你一个好消息,杜克找到了好工作,发财了!”
    蔡思强故意卖了一个关子,“啥?杜克发啥财了?”赵建武接到电话一头雾水。
    “绝对是个发财好差事,你想才一个星期啊,你猜杜克这小子都请我们吃什么?哈哈,是龙虾啊,不是那种在阴沟到处爬的,是整整小三斤大的一只澳洲大龙虾!啧啧啧,这鲜美滋味真是意犹未尽啊,武哥,这次你老可是错过好时光了。”蔡思强用非常夸张的语气报告道。
    “大龙虾!?靠,这种好事也不提前通知哥一声,太不耿直了,下次记住一定要提前通知,哥就算打飞的也要赶上!”赵建武听着蔡思强哒吧的声音,隔着几千里都仿佛看到一个杯盘狼藉角斗场。
    “呵呵,要不要让杜克这小子给你说俩句?”蔡思强说着将手机递给了杜克。
    “武哥,你在那边过得还不错吧?”杜克却没有菜菜这么烧包。
    “这里热得要死人,整天只能呆在单位上加班,为啥,单位空调免费用啊,回家用自己那用得起那么贵的电费,这地方真不是人呆的,早知道就留在蓉城了,起码不用受这份走俩步出一身汗的罪。这老外的钱还真不是那么好拿的。杜克,恭喜你找到好差事了,小伙子很不错嘛,一出手就请吃龙虾,下次回来一定要给我补上啊。”赵建武爽朗的说道。
    对于杜克这个小兄弟,他心中其实还是很牵挂,现在听说杜克也混得不错了,心中这份喜悦隔着几千里传过来杜克感觉到也是滚烫滚烫的。
    “好说,坚决按照武哥的指示精神办!什么时候有机会回成都,绝对龙虾侍候,不醉不归!”杜克笑着说道。他们俩分别也没有几天,闲扯了几句就把彼此境况通报了。

第十四章 突破!新输入法神器
    杜克进入一种入魔一样的研究状态,他现在的时间非常宝贵,完全没有多少可以浪费的空间,所以在吃完后就迅速回到自己那个小小的家里。坐在24小时不间断下载的电脑面前,他疯狂搜索下载各种语音片段资料,交给克里进行语音语义分析及基础知识库的建设。
    自从搬到出租屋后杜克已经疯狂在网上下载了数千各种环境和语境下的语音片段,从电视电台新闻片段到影视剧对白、动物世界或是国家地理频道的科教解说片段,以及各种偷拍、自拍、伪自拍生活现场片段,感谢酷溜土豆、youtube,还有BT和电驴,让杜克知道原来世界还有如此丰富多彩声音。
    杜克收集的如此众多声音索材对于克里处理能力来说却仿佛是沧海一粟,往往刚刚输入进去,克里就运算解析出来该片段的语音语义特征,从而为语音识别的语音语义特征库增加一份新的标本元素,越是不同的语音片段越有价值。
    这就像一个人生活过的地方越多,就越能听出不同地方口音是一个道理,每个声音都是有一些特殊特征和普遍特征构成的,现在的语音识别软件对于标准发音的识别率其实已经很不错了。
    如IBM在很多年前就推出语音识别输入系统ViaVoice,在安静环境和标准发音情况下软件识别率可以达到实用级别。
    可惜实际运用环境不会那么理想,而是就像杜克寝室中4个人一样千差万别,虽然大家说的都是中国话,但是四个来自不同地方的人的口音却大相径庭,刚刚住在一起的时候四个人沟通经常有些问题,但是大家很快就适应下来。
    人脑强悍的学习能力绝对不是当今电脑所能够比拟的。而现有的语音识别软件却没有这么强悍的学习适应能力,也就是说它没有用来识别这种语音特征差异的知识库,当然就无法将一些未知类型的发音很好的识别出来。
    不同口音的识别和环境噪音的排除是语音识别俩个难题,要解决这些问题需要大量的第一手语音资料片段来建立一个海量的语音特征知识库,或者是开发出像克里这般高度智能的超级电脑。
    克里根据杜克下载的理论资料,结合各种语音片段分析,不断对语音识别基础算法进行了更新,并且生成不同的语音识别模拟器——这是主要考虑到地球现在主流电脑的运算水平比起克里来说实在太低级。
    以模拟iphone4s的50%运算能力为最低基准,克里模拟出不同性能情况下该语音识别算法的准确率和反应时间,原始版本从最初基准性能下5秒内能够达到90%的识别准确率——当然这个成绩已经远超现在地球上所有语音识别软件水准。
    要知道这个90%准确率是用数千段不同语境的不同口音中英文语音信息进行模拟识别检验,也就是说基本上考虑了各种口音及噪音的过滤处理。
    这个成绩已经比现在只会听英文的苹果Siri要强多了,毕竟Siri现在能够识别的也是比较标准的英文发音。不信你拿印度口音和新加坡口音的英语录音片段试试看Siri能够识别出多少来。
    如果是在一台模拟性能接近双核2G以上主频电脑上,这个指标的识别水平将会提升到2秒以内达到97%以上准确率,反应时间同识别准确率其实有些冲突,因为要识别更加准确必须要原始版本的语音语料库基础资料来源更加丰富。
    声音采样越广泛识别准确率越高,而语音样本库越庞大,用于搜索匹配的时间就会越久导致反应时间的延长,因此语音样本的抽样压缩和语音搜索匹配算法一直是克里
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架