《[世界因你不同--李开复自传]》

下载本书

添加书签

[世界因你不同--李开复自传]- 第72部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
在总部认可并决定谷歌中国先做好搜索的基础 上,我们开始了提高中文搜索的历程。在做中文搜 索之前,我对工程师们说:“那些最酷最吸引眼球的 业务,我们肯定都会去做。但不是现在去做,而是 将来。在我们作出决定之前,大家可以各抒己见。 而现在,一旦公司作了决定,我们希望大家都能够 全力以赴,专注搜索业务!”

从那时开始,只要有任何员工想做搜索以外的
产品,我都俨然成为一个 Mr。No(“说不”先生)! 我总是说:“做好搜索后再说!”
统一思想后,我们就开始在搜索页面的每一个 细节上钻研,在每一个可能的选择上进行测试。当 然,我们选择提高页面搜索质量,让谷歌“读懂中 文”,也意味着谷歌中国要忍受产品很少的“批评”。 面对媒体的批评,面对外在的质疑,我们只有像一 个坚持己见却暂时没有票房的电影导演那样坚持自 己的理想,我们就像一个沉默的剑客一样在聒噪的 环境中专注修炼内功。
顶住压力,不要盲从,向来是成功者必须具备 的重要素质之一。
修复中文搜索并不是一件简单的事情。其中可 能有一万个细节需要工程师们一一进行认证。而这 种修正不可能“跟着感觉走”,而是需要先研究中国 用户的搜索习惯,然后再根据这些习惯提供用户喜 欢的搜索。
在谷歌中文搜索 2000 年上线的时候,出现了一
个严重的技术问题,谷歌中文总是把握不好“分词”
的问题。有一天我看到一篇清华的分析,说在搜索 引擎里面,谷歌的精确度还是不错的,甚至领先其 他中文搜索网站,但是分词做得不够好,原因就在 于投入不够。因为当时谷歌只有五位工作在美国的 华人工程师,他们无法集中精力做好这件事情。
当系统无法准确分词时,就会闹出很多笑话。 比如,用户输入“电脑”两个字,正常的情况是, 页面左侧应出现“电脑”的搜索结果,右侧应该出 现电脑产品广告,但因为分词的错误,可能会把“电 脑”分成“电”和“脑”两个字,出现的结果和广 告居然是关于“电话”和“脑白金”的,真令人啼
笑皆非。
在搜索引擎领域,分词是中文特有的一个挑战, 我们需要做的不是做一个符合语言学的分词,而是 一个符合用户使用习惯的分词。比如说,除了要把 常用词正确分开外,还应该分清最新的网上用词, 比如“打酱油”、“芙蓉姐姐”等等。
而即使分词正确也仍可能造成匹配的问题。比
如说,如果有一篇文章里面提到“清华大学”,但搜
索“清华”,这篇文章就出不来了。但如果分词时把 文章里的“清华大学”分成“清华/大学”,那么搜 索“清华大学”又出不了结果了,谷歌对这个问题 研究了很久。
有一天,谷歌中国工程研究院副院长刘骏跑来 兴奋地说:“开复,你的语音搜索论文可以用在分词 上。如果我们把中文的字当做语音,然后用语音识 别的方法和统计语言模式来识别出所有可能的分词 方法,那么匹配正确时,‘清华’和‘清华大学’就 可能同时出来。还有,我们有这么大的网络语料库, 可以训练出一个非常巨大而精确的语言模型。”后来,
他带领团队真的实现了这方面的突破。
在 2006 年下半年到 2007 年上半年,我们的工 程师一一检查尝试各种领域的各种搜索词,并统计 出所有不合理的搜索结果,然后再向美国的工程师 学习如何在系统里进行修正。可以说,今天谷歌中 文搜索的每一点进步都是在工程师付出的辛勤努力 下得来的。

那时,每天都有很多有关提高搜索质量的会议
在清华科技园大厦召开,谷歌内部的监测系统每天 都在对各家搜索引擎作出比较,我们评估搜索相关 度、网页索引大小、即时更新能力和对垃圾网站的 识别性。为了衡量我们的进度,在我办公室外面就 有一个大牌子,上面可以看到我们当天的四个指标 表现如何,以及和竞争对手的差距又如何。
这是一项极其辛苦而回报率又相当低的工作。 有时一个由五名工程师组成的团队努力半年,也只 不过把某一个指标提升 0。1%而已。但我总是苦口婆 心地鼓励大家:这样的工作是积少成多的。五个人 半年做出的成果有限,但一百个人做两年就会有巨 大的变化。
为了增加中文搜索产品的亲和力,谷歌中国成 立了一支用户体验团队,成员中不乏心理学博士和 硕士。我们将一间办公室隔开,让一些普通网民像 平时那样使用计算机。在隔壁的实验室里,我们通 过安装在计算机上的特殊摄像头将用户使用互联网 的习惯记录下来。这种记录非常精密,比如用户每

一秒眼睛停留在哪里,鼠标停留在哪里等等。通过
这样的实时监测,我们能够真切感受和精确了解中 国互联网用户的使用习惯!
在研究用户体验的过程中,我们也发现了中美 用户很多不一样的地方。比如,美国互联网用户搜 索的目标都比较直接,他们以找到自己想要的信息 为目标,一般只点击搜索结果的前三个,之后就离 开页面。但中国用户的目光更多是四处浏览,他们 愿意尝试更多的搜索结果,停留的时间也更长。中 国用户把搜索当成一种探索,去点击网页上各种有 趣的东西。
还有一个很有意思的现象,就是中国用户有时 候在搜索框里并不完全键入所有的关键字,而是在 键入之后直接拉到搜索页面的最下方去点击相关搜 索。比如,一位用户想搜索“秦皇岛地图”,但他只 输入了“秦皇岛”三个字,搜索结果页面出来后, 他直接在最下方的相关搜索中点击秦皇岛地图。他 说:“已经习惯使用相关搜索这个功能了。”
谷歌中国的工程师认为,造成这种差别的理由
有以下几个:第一,中国用户使用搜索引擎进行探
索的概率很高;第二,一些搜索引擎将前几个搜索 结果出售为广告,用户因此习惯了不信任排名较前 的结果;第三,中文的输入相对来说较慢,因此, 中国的用户宁愿用鼠标多点击几次来完成搜索,而 不是长时间敲打键盘。
用户的体验给了谷歌工程师们很多灵感,比如, 为了满足中国用户的搜索习惯,谷歌在用户键入搜 索内容的时候,就给予一系列的搜索提示,这样就 省去了用户向下拉页面的麻烦。而我们也按照中国 用户的习惯,改变了搜索摘要的长短、排版的版式、 字体的大小,甚至字体的亮度。同时,我们还考虑
了中国用户普遍使用的显示器规格,进而重新设置 版面的安排。
每天,我都和工程师们用巨大的投影屏幕,检 测每一像素的排版、颜色、字体等等。我们对各种 指标进行现场比较,然后研究决定如何改进我们的 中文界面和用户体验。
但是,所有的改进都必须有数据的支持。比如,
我们曾经针对互联网用户做过一项调查,问题如下:
“如果使用搜索引擎,你是喜欢第一页搜索结果有
10 项,还是有 20 项?”结果 90%的互联网用户都选
择有 20 项结果,因为他们想象第一页结果多可以省 时间。但事实却并非如此,在真实的网络环境测试 中,我们却发现大部分用户喜欢第一页有 10 项搜索 结果!这是因为,第一页呈现 20 个搜索结果要比呈 现 10 个搜索结果慢 0。15 秒。在搜索过程中,不少 用户恰恰因为这 0。15 秒带来的负面感觉,就无法忍
受了。
我们在一遍遍地尝试和探索着。工程师们都沉 浸在专注的努力中乐此不疲。对待员工一向宽容的 我,在产品的研发方面有时候就没有那么放松了。 我还是那个 Mr。No;不支持做任何不对搜索有直接 帮助的工作,同时要求团队仔细分析每一个细节, 从字体、空格以及翻译,都绝对不能有一个错误存 在。公司面临的困境以及我们心中的梦想都在激励 着我们不断前进。
那一段日子,我睡觉、洗澡、吃饭的时间都想
着如何把搜索做好。真的像走火入魔一般。就算去
餐馆吃饭,我对服务员也不放过,总是问:“听说过 谷歌吗?”如果得到肯定的回答,我就会进一步追 问对我们的产品的感觉;如果得到否定的回答,我 就会鼓励他们不妨去试试。
虽然我在过去的工作中曾经经历过无数次做产 品的成功与喜悦、失败与挫折,但我对成功的渴望 却从来没有如此强烈过。
这样艰苦努力一年之后,2006 年 10 月的某一 天,我在办公室外面的牌子上终于看到了我们的四 个指标都已经胜出!2007 年 4 月,我们评估了过去
9 个月对中文搜索的改进成果,发现中文精确度的
提升速度超过了公司内部其他任何的语言。另外, 中文的网络索引数量在过去一年也增加了一倍
(2008 年又增加了 10 倍);对于新网页敏感度也降 低到几分钟(就是重要网站的新内容几分钟后就可 能搜索到);作弊网站在网页出现的频率则下降到原
来的 1/40。
在搜索质量不断改善的同时,我们在 2007 年 6
月也终于获得了 ICP 牌照,谷歌把 google。cn 的服
务器逐步搬入中国,然后把上 google。 的用户指 向 google。cn,断网的问题终于彻底得以解决。
可以说,在 2006 年这一年,谷歌中国的工作远 远没有外界想象得那样有趣,与之相反,改善搜索 引擎是最平淡、最不能带给市场惊喜的,但长期来 看,它是一切竞争的根本,是谷歌中国的立足之本。 在这一段时间里,摆在工程师面前更多的是改进, 而不是创新;是对细节的不断改进,而不是炫酷产 品的推出;是以辛勤耕耘一步步赢得中国用户的心, 而不是耀眼的广告和推广。我们几乎把所有的精力 都用在这里,让用户发自内心地认可我们的中文搜
索。
在这个过程中,我们要忍受和拒绝的诱惑有很
多。在竞争对手依然不断推出各种眼花缭乱的产品 的时候,我们必须
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架