瓦茨和斯托加茨通过集中研究介于完全规则网络和完全随机网络之间的中间型网络揭示了某些网络的小世界性质。在规则网络(通常叫做规则点阵)中,节点仅仅和它们直接相邻的节点连接。举个最简单的例子,考虑排成圆周的一系列节点。这些圆点所代表的节点通过代表圆周的线和它们两侧紧挨的节点联系在一起。
规则网络
对一个更精细(但依然规则)的网络,你可以把相隔一个节点的两个节点也连接起来。每个节点就和4个其他节点相连了——两侧各两个邻近节点。
在随机网络中,则是另一种情况,有些节点可能和其他很多节点连接,有些节点则可能只和一个点连接。有些节点可能只和邻近的节点相连;有些可能和圆周另一侧的节点相连;有些可能既和邻近节点又和远处节点相连。这种网络可能看起来很混乱。这就是随机的意思。
在随机网络中,由于随机的长距离连接形成了横跨圆周的连接,通常很容易就可以找到从一个节点到任一个节点相对较短的路径。可是在规则网络中通行就没那么容易。要从圆周的一侧到另外一侧,必须通过邻近的点环绕很长的路径。
随机网络
但是瓦茨和斯托加茨设想,在“中间”网络——既不是完全规则也不是完全随机的网络中会发生什么情况呢?换句话说,假设你在规则网络上随机添加几条连线。事实证明即使只是增加很少比例的连接也会带来和远处节点之间的捷径,这种新的中间网络就形成了小世界(就是说,你可以在很少几步之内到达网络的任一点)。但是这种中间网络保持了规则网络的一个重要特征——它的邻近节点仍然有着比平均数更多的连接(就是说,它们存在着“聚合”),而不是像随机网络,其中几乎不会出现聚合现象。
在数学上能描绘出兼具随机和规则网络性质的图是件不错的事,即便它并不显得那么重要。但是你只需很少捷径就可以使网络成为小世界的事实说明小世界网络可能是自然界的共性。瓦茨和斯托加茨在3个真实的事例中测试了这种可能性:和凯文·培根共戏的电影演员网络、美国西部的电网和微小的线虫的神经细胞网络。在所有这3个例子中,正如假想的介于规则网络和随机网络中间的网络模型一样,这些网络都呈现出了小世界性质。
因此,瓦茨和斯托加茨推断,“小世界现象不只是社会网络的特例或是人造的理想模型——它可能普遍存在于自然界中的各种大型、稀疏网络中。”
中间(小世界)网络
如果是这样的话(事实也的确如此),瓦茨和斯托加茨开辟了一处新领域供数学家和物理学家来探索,在那里所有的重要网络都可以用一套共通的工具来分析。和统计物理学家分析无序气体分子复杂性的方法一样,数学家可以用类似的数学来计算一个网络的定义特征。和所有的气体一样,无论它们包括何种分子,都遵守同样的气体定律,很多网络也遵守类似的数学规律。“每个人都会问,这些完全不同的网络却拥有共同的性质,这是多么不寻常的事情——你是怎么想到的呢?”斯托加茨说。
某几个网络特征可以用类似气体的温度和压强那样的参数来量化,科学家称其为描述性系统变量。任意两个节点之间的平均步数——路径长度——就是这样一个参数。另一个是“聚合系数”——指的是如果两个点都和第三个相连接时,这两点直接相连接的可能性。相对较高的聚合比例是小世界网络违反直觉的特征之一。小世界网络的短路径长度和随机网络比较相似。另一方面,小世界网络的高聚合系数则和随机网络完全不同,反而更接近规则网络。
这种聚合性质(你可以称其为“小集团”的尺寸)在社会网络中尤其值得关注。例如我的妹妹有两个朋友分别叫做黛碧和珍妮特,那么黛碧和珍妮特相互认识的可能会比平均水平更高(她们的确认识)。“存在着一种构成三角形的趋势,这是你在随机网络中看不到的。”斯托加茨指出。
除了聚合系数和路径长度之外,另一个关键的数字是将一个节点和其他节点连接起来的平均连线数量,称为级度系数(节点的“级度”是该节点连接的其他节点数量)。作为演员网络中的一个节点,凯文·培根和很多其他节点连接在一起,他的级度排得很高。毕竟,和其他节点的充分连接是使得培根和其他演员间平均路径长度如此短的原因。但是一个令人震惊的研究结果表明培根远不是连接最多的演员。以连接其他演员的平均步数作为标准的话,他甚至没有排进前1000!
事实证明,培根对网络的真正重要性并非源于他的特殊性,而是他的典型性。很多像培根一样的演员,作为“枢纽”将很多其他演员联系在一起。这些枢纽的存在被证明是很多现实世界网络的一个重要的共同特征。
第五节 无标度的幂
到2004年中期为止,在“连接最多”的排名表(根据和其他所有演员连接起来用的平均步数)上居首的演员是罗德·斯泰格尔,2。679步。培根以2。95步排在第1049位(但是,培根仍然比99%的演员都有更多的连接,能担任起一个重要的枢纽)。第二位是克里斯托弗·李(2。684步),丹尼斯·霍珀紧随其后(2。698步)。唐纳德·萨瑟兰排在第四。在女性中连接最多的是卡伦·布莱克,排在第21位。
正是这些高度连接的演员,或者说枢纽,使得只需几步就能从一个演员到其他任何演员变得容易。随机选取两个演员,你可能可以在三步之内把他们连接起来。需要超过四步的情况会很少见。如果你不断搜索,会找到一些需要更多步数的人,但那可能只是你故意选择很难连接的演员,就像某些只演过一部电影的人(并且记住,我说过你要随机选取两个演员)。
举个例子,我随便想两个人,巴兹尔·拉思伯恩(因为我昨晚看了一部歇洛克·福尔摩斯的电影)和林赛·罗韩(没有原因——我不打算说我看过《金龟车贺比》)。这两个演员来自完全不同的时代,罗韩才出道,出演过相对较少的电影。但你只用三步就能把他们连起来。老迈的拉思伯恩和前逍遥骑士丹尼斯·霍珀共同出演过《吸血女皇》(1966)。霍珀和布鲁斯·麦克菲演过《黑帮二代》,后者和罗韩演过《青春舞会皇后》(2004)。拉思伯恩和罗韩之间的捷径是通过霍珀提供的枢纽促成的,事实上霍珀比培根连接的演员要多很多。(霍珀直接和其他3503个演员相连,比培根多大约1500个。)
像霍珀这样的枢纽使得演员网络成为了小世界。他们使得从一个节点到另一个节点变得容易,就像芝加哥奥黑尔机场或者达拉斯…沃斯堡机场这种将航空网络中更小的机场联系起来的重要航空枢纽那样,让你从一个城市到另一个城市不用转机太多次。
可是,在随机网络或者规则网络中一般都不存在这样的枢纽。在规则网络中,每个节点都有同样数目的连线,所以没有枢纽。在随机网络中存在捷径,但可能很难找到枢纽,因为突出的枢纽会非常稀少。在随机网络中,任意一个节点(演员或机场)被连接的可能和其他所有节点都一样,因此大多数点被连接的程度相当。只有很少的节点会有比平均数多很多或者少很多的连接。如果演员是随机连接的,他们按连接数量的排名会呈正态分布,大多数人的数量和中值接近。但是在很多小世界网络中,连接数量不存在这样的“典型标度”。
这种没有典型标度的分布被称为“无标度”。在无标度网络中,很多偏僻的节点几乎根本没有任何连接,一些节点被适度连接着,而少量点则是超级连接枢纽。对数学家和物理学家来说,这样的无标度分布是“幂定律”的可信特征。
圣母大学的雷卡·亚伯特(Réka Albert)和巴拉巴西(Albert…László Barabási)1999年在《科学》期刊上发表的开创性文章中指明了很多种网络的无标度性质,由此也指明了用幂定律描述这些网络的有效性。网络可以用幂定律来描述的发现在物理学家中引起了共鸣(他们对幂定律“垂涎三尺”,斯托加茨说——显然是因为物理学其他领域幂定律的发现已赢得了若干诺贝尔奖)。
幂定律描述了包含很少大事物和很多小事物的系统,例如城市。有少量人口以百万计的美国城市,很多人口在十万和百万间的中型城市和更多小城镇。地震也是一样,有很多小型地震弱得都感觉不到,较少的中型地震能让碗碟颤动;极少数的破坏性大地震会使桥梁和建筑坍塌。
巴拉巴西和亚伯特在他们的《科学》期刊论文中说明了无标度网络中的一个节点以某个特定连接数和其他节点相连接的概率,如何随着这个特定连接数的增大而降低。也就是说,无标度网络拥有很多弱连接的节点、较少中度连接的节点和少数的巨型节点——像万维网上的谷歌、雅虎和亚马逊。有很少连接的节点很普遍,像小型地震;有大量连接的节点也相应地稀少,像大地震。而且这种连接概率降低的速率可以用幂定律来量化,就像描述城市或地震规模分布的数学一样。换言之,一个好的网络理论不仅要解释凯文·培根(或者丹尼斯·霍珀)如何拥有那样多的连接,而且要解释为什么网络和地震近似。
巴拉巴西和亚伯特提出的解释基于这样一种认识:网络一般不是由拥有固定连接数的节点形成的静态排列,而是在发展和进化的结构。巴拉巴西和亚伯特猜测,当网络通过增加新节点发展时,新连接不是随机形成的。每个新节点倾向于连接那些已经有很多连接的节点。换句话说,富者更富,这种发展过程的结果就是形成拥有丰富枢纽的无标度网络。这个过程的动力学表明“大型网络的发展是由超越个体系统细节的稳固的自组织现象支配的”,巴拉巴西和亚伯特指出。
虽然他们的“优先连接”模式确实预测了枢纽的形成,但没有解释包括聚合在内的很多现实世界网络的其他特征。而且事实证明不是所有的小世界网络都是无标度的。例如巴拉巴西和亚伯特的原作中提出瓦茨和斯托加茨探索的网络既无标度又是小世界。但它们不是。输电线路是小世界但不是无标度,线虫的神经网络也不是,斯托加茨说。尽管如此有很多网络实例既是小世界又无标度,万维网就是个引人注目的例子。社会网络也很典型地既是小世界又无标度,因此按照幂定律理解网络对利用网络研究人类交互来说是个很好的策略。
在巴拉巴西和亚伯特对网络发展进行量化的创举之后,很多其他团队加入了鉴别网络所有重要性质以及建立数学模型来解释它们的探索。在转向这个问题研究的组织中就有微软公司,他们显然对因特网和万维网非常感兴趣。因此他们的顶级科学家们忙于钻研网络数学。这个团队的领导者是一对夫妻搭档,珍妮弗·图尔·恰耶斯和她的丈夫兼同事克里斯蒂安·波格斯。当我访问西雅图外的微软研究实验室时,他们向我展示了为了把握万维网结构的精华,他们为鉴别网络数学所需特征所进行的努力。
“因特网和互联网是自己成长起来的,它们不是被策划的,”恰耶斯指出,“没有人真正规划过因特网,当然也没有人规划过万维网的结构。”因此万维网蕴含了一个优秀数学模型需要把握的很多自然网络的细节,例如小世界性质(从一个网页到任意一个网页只需相对很少几步)和聚合现象(如果一个网页连接了10个其他网页,那10个网页里面的很多网页也很有可能会相互连接)。一个更重要的特征是巴拉巴西指出的优先连接,它调控了网络的成长或退化。当网络成长,有新网页添加进来时,资历较老的网页比新来者趋于获得更多的连接。但资历最老的网页并不总是连接最多的。“这不只是退化的过程。”恰耶斯解释道。例如埃尔塔·维斯塔(AltaVista)曾经是网络搜索引擎界的“卡迪拉克”。但是现在更年轻的谷歌有着更多的连接。因此网站不但要通过资历来获得连接,同样需要美貌——或者说“健康”。
“埃尔塔·维斯塔存在的时间更久,但更多的人倾向于连接到谷歌——某种意义上更好的网页,”恰耶斯说,“当其他所有的条件对等时,资历老的网站会有更多的平均连接数,但如果一个网站比别的更健康,就会弥补资历的不足……如果我有两倍的健康和一半的资历,我将趋向于拥有同样数量的连接。”
万维网的另一个和很多(但不是所有)网络共享的重要特征是它的连接是“定向的”。和因特网的线路向两个方向运行不同,网页超链接只向一个方向前进。“我连接到美国有线新闻网,并不意味着美国有线新闻网也连接到我,”恰耶斯说。(当然,尽管事实应该如此。)
优秀的网络数学自然也需要说明万维网是无标度的。少数站点有大量的连接,更多的有着中等数量的连接,大多数几乎没什么连接。恰耶斯和波格斯强调描述万维网的方程应该不只是预测这种连接的分布,也应预测到网页“强连通分支”(strongly connected component,SSC)的存在。在强连通分支中,你可以通过每次点击一个超链接从任一网页跳转到另一网页。如果一个人的网页在强连通分支中,恰耶斯说,他便可以找到去其他任何强连通分支网页的路径。“我可以跟随一系列超链接到达那个人的网页,而且那个人可以跟随一系列超链接返回到我的网页。”
波格斯指出一些网页可以连接到强连通分支,即使没有连接路径返回它们。一些网页被强连通分支中的网页连接,但并不连接强连通分支的网页。他强调,知道哪些网页在强连通分支内,或者以何种方式与强连通分支相连,对万维网广告客户会很重要。
建立能再现万维网所有这些特征的数学模型的工作仍在进行中。但是迄今为止建立起的万维网和其他网络的模型已经提示我们,未来的数学家们有朝一日可能能够解释在人类事务中遇到的很多网络行为——例如经济、政治和社会网络;生态系统;细胞内的蛋白质网络;还有传播疾病的接触网络。“我认为会诞生一门网络数学,”恰耶斯说,“这是非常令人兴奋的新兴科学。”
第六节 回到博弈论
既然博弈论也宣称其在描述人类行为方面的支配作用,我问恰耶斯博弈论是否会在新型社会网络数学中起作用。幸运地是,她说是的。“我们在尝试解释为什么网络结构是按那样的方式发展起来的,那的确是个博弈论问题,”恰耶斯说,“因此建立起描述因特网和万维网发展的博弈论模型,还有很多工作要做。”
事实上,恰耶斯、波格斯和他们的同事已经提出了一种至少在本质上和博弈论近似的数学方法可以解释在网络发展中出现的优先连接现象(而不是像巴拉巴西和亚伯特那样仅仅设想)。那是一种出于竞争考虑的成本最小化——连接的成本和连接之后的运行成本(有些像买车——你可以买保养费用很高的便宜车,或者支付更多买高性能低维护费的车)。这种平衡可以看作两种不同网络结构的竞争,预测最小成本的数学也预测了一种类似优先连
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。
赞一下
添加书签加入书架