《追随智慧》完本全集TXT电子书在线阅读-第28部分-肉色电子书

一边的午夜而那一边的早晨进行。这两天，他为了自己的难题，已经和地球那边联络了无数次，仍然无计可施。现在，他打算再做最后一次努力。
看看到了雷德蒙的上班时间，他把电子邮件送给美国微软总部的研究员黄美玉。黄美玉已经给他出了不少主意，全都无效，无奈之中随便问道：“也许‘采样参数’有问题？”邸烁做的工作是，在一个英语语音识别系统之上，建立汉语语音识别的功能。黄美玉说的“采样参数”，是指分析语音时所确定的频率，事关“样本”多寡，所以意义重大，但这又是一个太简单的问题，所以两天以来谁也没有注意。
现在，邸烁把注意力再次转向电脑屏幕，那个小小括号里的“11”，意味着他选择的采样频率，是在每秒种的声波中，等间隔采样11000次。这与英语语音的采样频率“16”有很大不同。但事实可能是，当我们把每秒钟的声音切割成上万份让机器识别的时候，汉语和英语327这两种截然不同的语言已经完全没有区别。
这念头电闪雷鸣般在邸烁脑袋里面划过。他飞快地打开自己的程序，写下新参数：MFCVERSION〔1〕RESAMPLE〔16〕电脑瞬时间痛快地运行起来，邸烁长出一口气。一边责怪自己怎么会犯这样一个低级错误，一边又恢复了往日的自信。
邸烁和陈正同为清华大学计算机系1998年毕业的博士，差不多同时进入微软中国研究院，又一同进入李开复小组，开始同一个课题的研究－－汉语语音识别系统。
不过，在1999年6月1日这一天，李开复导演的一个小小游戏，把两个人分开了。那时候，邸烁和陈正已经不分彼此地为这个项目倾注了两个月的心血，李开复忽然对这两个人说，语音识别既包含“语音”，也包含“语言”。
两者密切关联但又不是一回事，研究的程序也应先分再合。这道理很明白，所以陈、邸二人没有异议。于是李328开复请两人自由选择，他说两件事情都很重要，相信无论谁做什么都能胜任。两人全都不知如何是好。李开复笑道：“反正总要分开，不如抛硬币来决定。”然后就真的把一枚硬币抛向空中。这种把一个沉重话题化作一场乐事的态度，令两个初出茅庐的学生既惊又喜。3个人在一片笑声中决定，邸烁做“语音”，陈正做“语言”。两者在将来的结合，就将成为微软研究院的“汉语语音识别系统”。
要对“汉语语音识别系统”有个正确了解，我们就要注意到90年代最后两年国内舆论提到的事实：国际商用机器公司1998年在北京推出最新版本“ViaVoice98”。
尽管此项技术在语音识别领域处在领先位置，但却仍未达到成熟的程度，其在一般公众中的宣传价值，也超过了实际应用的价值。如果软件市场真如人们所说是个赌场，那么，国际商用机器公司投出这一“赌注”，与其说是为了商业利益，不如说是为了强占“头筹”。1999年开始的时候，“语音识别”在我们国家的舆论中更加热闹。
《每周电脑报》的文章说：“历经多年研究和挫折之后，过去18个月里面语音识别技术已经达到很高的水平。”329《经济参考报》还宣布，“键盘的终结者”已经出现。
商周在《计算机用户》上说是“百家争‘鸣’”，这有些夸张，但他说的“全面启动”却有充分根据。
计算机专家所谓“语音识别系统”，说白了，就是比尔．盖茨说过的半句话：“让电脑会听，会说。”（另外的半句是“会看，会学习”）不过，还有一个人比比尔．盖茨更早地将语言特性与计算机的功能联系起来。诺姆．乔姆斯基曾经说，人类语言就像一个开关。此人是美国现代语言学领域最有名的一位教授，其基本理论构成了美国语言学的主流。按照他的解释，婴儿的语感是重复的结果。诸如“一头牛”和“一匹马”，其间量词在中国尽人皆知，不用专门教育，更无须复杂的语法规则加以指导，即使3尺孩童，一听也能明白，这里该用“头”，那里该用“匹”。但外国人学来学去总会糊涂。其缘由，概因人的大脑中有着“重复记忆”的能力。这一基本逻辑在计算机科学中的应用，也就是人工智能。它构成了语音识别研究的起点。
就我们所能理解的来看，语言的问题在计算机领域无所不在。乔姆斯基所说的“开关”，与计算机最基本之330“开”与“关”的运行逻辑，在表述上的不谋而合，似乎也就潜在着让计算机来接受人类语言的可能。但是正如我们此前提到的，电脑毕竟不是人脑，所以种种以机械模拟人脑的努力全都毫无结果，惟有李开复以统计学的方法另辟蹊径，终有所成。然而仔细追究起来，其成功的大厦仍然建立在一个最原始的基点上：语感是重复的结果。
“语感”这概念说起来很神秘，实则是可以观察到的。它包含于我们周围无处不在的语言材料中：书籍、文件、报纸、广播、演讲、街谈巷议、电视节目……所有这些，专家们有一个恰当的词汇加以描述，叫做“自然语言”。与此相对的计算机语言，乃是“人工语言”。30年来计算机语音专家所做的全部工作，就是试图在自然语言和人工语言当中建立一个桥梁。
就算不能让机器具有我们人类的七情六欲，至少也该让它既能听懂人话，又能说出人话。但是，平心而论，汉语语音识别的进展，有如汉语的文字输入，一直明显落后于英语。电脑终究是美国人发明的玩意，就算“能听会说”，也是英语优先。幸而电脑并无国籍倾向，也无331民族激情，所以只要中国人在它身上倾注足够的智慧，它也会有足够的耐心来听中国话。只不过，在21世纪将要开始的时候，这一份努力却又由美国人来主持，这情景电脑虽然不在意，但中国人却有点不太好受。
在过去很多年里，微软公司在语音识别的领域并不能说领先。当日李开复在苹果公司向“早安美国”的2000万观众展示他的“小精灵”时，微软连语音识别的研究小组还没有建立起来呢。不过，“小精灵”在苹果“死了”，微软却崛起了一个黄学东小组。黄在语音识别领域取得一系列出色的成果，但这仍属于英文的领域。至于中文语音识别，在我们国家中始终不能振作，直到90年代末期，4大美国公司在北京一起涉足，舆论为之一振，学者趋之若骛。国际商用机器公司声称，他们在这方面的研究已经持续了27年，其技术也的确略胜一筹。余者还有摩托罗拉，已有3年研究中文语音的历史，还有英特尔，也有好几个月了。当李开复在1999年春天启动微软的汉语语音研究时，周围的情势就是这样。他有些着急，但仍旧胸有成竹：微软毕竟多次上演过后发先至的喜剧，这一次期望能够再现。
332打开门，世界前沿原来就在眼前邸烁和陈正1999年春季进入希格玛大厦的时候，对于这些情况并不能完全了解。陈的专业属“人工智能”，邸的专业是分布式计算。两人对于“语音识别”全都是外行。在李开复看来，“人工智能”恰为过去20年计算机领域里的一条失败之途，更与未来语音的进展无关。
他告诉邸、陈二人，他们可以选择自己感兴趣的题目，但不能离开研究院的大框架。邸、陈二人一致表示对李开复的“语音识别”感兴趣。他们从中国的报纸上知道了李开复以往的辉煌，所以希望进入这个领域追随李开复。按照常情，李开复在这个时候既然想要建立语音研究小组，必会想到身边一派竞争情势。他的手下若是没有一批高水准且熟知这一领域的研究员，焉能后来居上？然而他又相信，计算机世界中，人的才智与资历并非总是能够一致，经验常常不是最重要的，甚至有可能成为弘扬智慧的障碍。这道理在他本人已有十几年前卡内基梅隆大学的体会为证。当日两个年轻人的聪慧胜过了15个资深研究者的经验，如今又怎么能说面前这两个年轻人必定不会再现当年的局面？
333接下来的情形，有点像是在学校而不是在研究院或者公司。整个4月份，邸烁和陈正都在阅读李开复的两本书：一本是他的博士论文，另外一本是他后来写的关于语音识别的书。还有李开复指定的另外几十篇论文。
这时候两个人方知什么叫做“世界的眼光”和“世界的前沿”，因为李开复让他们阅读的这些东西，全是过去十几年中世界语音识别研究的经典之作。这情形若是同我们国家大学校园中的研究状况加以比较，不免让人回味。
不少中国学生都有过“直到毕业也没有读过一篇完整的世界水平论文”的经验。就连我们在前面叙述过的“清华园的神奇小子”李劲，也不能例外。所以很多人根本不知道国门之外的人究竟做过什么，以及怎样去做。邸烁和陈正却在刚刚开始的时候，便有机会了解世界上究竟发生了什么。
但事情不仅如此。李开复还觉得有必要开辟一个“两个人的课堂”。“学生”自然就是邸烁和陈正，而“老师”正是他自己。他花了很多时间和两个副研究员谈论书籍和论文的内容，尽可能用简单的方式给他们解释“语音识别”的来龙去脉。邸烁后来回忆道：“他很会讲课，讲334过一次以后，我们再看论文，就很顺利了。”但也有并不顺利的时候，但逢这种时刻，李开复总是笑眯眯地看着这两个人，怂恿他们“猜猜看”，然后笑道：“猜错了嘛！”
“这里的气氛真是好，没有一点压抑的感觉。”陈正说，“一个院长、一个很有名的科学家，没有想到他竟能给我们讲课。他真的是一点架子都没有。所以虽然我们经常会出错误，但却并不紧张。”两个“学生”开口闭口叫着“开复”，心里倒是真的把他当成老师了。当李开复在中国的报纸上成为一个“抢人才”的话题时，看来他在研究院里仍是受到尊敬的老板和导师。研究院的气氛既像学校，又像公司，按照通常的习惯，刚刚走出校门的博士们仍然会在嘴上叫“老师”，从其他公司里来的那些人则要称呼“老板”。事实上，李开复既不好“为师”，也不好“为官”，至少他在表面上不喜欢人家总是记得他的身份。他并没有告诉大家怎样称呼他，但奇怪得很，所有人一进来，全都异口同声地叫他“开复”，他也觉得这样的称呼很自然。
邸烁和陈正两个人在这里遇到的可以当作老师又不必称呼“老师”的人，至少还有黄昌宁。黄是研究院年335龄最长者，62岁这一年退休之后，来到研究院主持自然语言小组的研究工作，眼前这些人从年龄上说，差不多都是他的晚辈。不过，当他和这些年轻人在一起说笑的时候，谁也不会想到他在中国学术界乃是属于德高望重的老一辈人。他的名望不是由于他在计算机专业领域的成就，恰恰相反，用他自己的话说，他在计算机领域里是“半路出家，先天不足”。事实上他是语言学的专家，多年致力于从计算机的视角看语言，在中国的计算语言学界乃是首屈一指的人物。无论是语言学还是计算机学里的人，都会向他提出诸如“从计算角度看语言”之类的问题。黄昌宁总是要花费很多时间来解释：“计算语言学实际上是语言学，是用计算机来研究分析自然语言。”由于他的这种专长，他在国内外一些大学里成了很受欢迎的人。有一次，李开复对黄昌宁说，研究院需要他这样的人，因为“汉字的输入，看来是一个文字问题，但也涉及到语言问题”。仅仅一句话就让两个人彼此沟通。“让我到这里工作的一个原因，是李开复对语音识别的理解。”黄昌宁后来这样说。这情形真有些像王坚经历的重演，又有些像金庸小说中所说的“高手过招”。
336黄昌宁在1999年4月来到希格玛大厦。当邸烁和陈正在计算机方面向李开复不断求教的时候，黄昌宁也成为这两个年轻人在汉语语言方面的指导。下面这些话题，就是那个时候经常谈到的：“汉语和英语的共性”；“语音当中的文字问题和语言问题”；“单字概率与词组概率”；“中文输入习惯和思维习惯不能合拍”；“人的语言能力还是科学家的一个黑匣子”；“什么叫做计算语言中的‘观其半而知其意’”；“人脑子里的语言系统不是按照词典排列的”；“计算语言学为什么要同心理学和数学结合在一起”；“计算机语音科学家面对的最大挑战：把‘一对多’变成‘一对一’”；……
他倾心尽力将自己的语言学知识留在希格玛大厦337中。“我在清华干了这么多年，退休以后才走的，我觉得自己对得起清华。”他这样来回答向他质询的朋友。他整天混迹在年轻人中间，并非不知老之已至。恰恰相反，他对自己的年龄有充分的了解。“我老了，想像力不行了，但洞察力要比年轻人深一些。”他这样说。他似乎已经意识到，由于语言不同造成的文化隔膜行将终结，计算机技术的进步终有一天让人类超越这种隔膜。
但这个世界毕竟是属于年轻人的。“在这里，没有哪一种技术能有5年以上的生命，很快就会改朝换代。”他说，“在大学里面学的东西，出了校门就变了，何况我这把年纪？”后来者总是站在前人的肩膀上1999年6月，微软公司决定加快语音研究，比尔．盖茨也倾向于在微软原有的英文语音识别系统之外，增加日文和中文两大部分。时间相当明确并且迫在眉睫。初步的成果将在秋天拿出来，其中文部分，当然要由中国人来做。这让李开复极为兴奋，他在嘴上说“我们可以做，但不能保证”，心里却想着“舍我其谁”。研究院成立刚刚7个月，他领导的语音研究小组诞生不过两个星338期，小组的第一批成员，邸烁和陈正，又是外行。在这种情形下，比尔．盖茨一般是不会下命令的，但公司的产品部门却说，他们的确需要这个技术。李开复再回过头来看看身边，觉得中国人也的确需要。王坚依据他在国内从事研究多年的经验，认定这件事情“肯定做不成”。
他说：“现在还一行程序都没有，3个月后就要拿出一个像样的东西。这种事情在我们国家是不可想像的。”王坚当时并不了解，微软公司有一个“资源共享”的制度，并且有着“团队合作”的风尚。但李开复和凌小宁却对雷德蒙微软总部的情况有足够的了解，知道黄学东小组那里有什么东西，而且可以肯定北京的工作能够得到黄学东的全力支持。他们也知道微软公司以外的其他地方有什么东西。然而更加重要的是，微软中国研究院有李开复－－世界领先的语音识别专家。研究院起步虽晚，但并非从头做起。这两个人在一起斟酌再三，都觉得虽无十足把握，但完全值得一试。当即决定，在7月份之前搞出一个基本框架。
对于李开复来说，现在的确是审时度势的时候了。
从他在卡内基梅隆大学实现的历史性突破算起，已有10339年。他花了3年的时间才制作出一台应用他的新理论的“小精灵”，但却没有能够让它真正进入千家万户，此后又花了7年的时间，苦心等待机会再次出现。这一期间，语音识别已经不再是让人们敬而远之的书斋里的技术，它在不知不觉当中与人们的生活日愈紧密。这一回，李开复已拥有微软这个庞大而又实力雄厚的舞台，如果能够如愿以偿，就决不会让这项技术继续束之高阁。
他对自己要做的事情并不仅仅抱有幻想。微软中国研究院以及李开复本人的加入，可能会更加激发其他公司在这一研究领域里快马加鞭。虽然你追我赶的热闹气氛和李开复

《追随智慧》

下载本书

追随智慧- 第28部分