写《长尾理论》的时候,你连杰夫辛顿教授的名字都没听说过,也不认识吧?那个世界上都还没有‘深度学习型人工智能’这个概念,你是怎么预言未来会有这么一种技术来实现你的布局的?”
丁三石觉得自己的大脑已经不够用了。他这辈子没服过几个人,虽然他很服顾诚,但直到今天,他才发现跟顾诚一比,他自己完全就是井底之蛙啊。
除非顾诚是先知或者穿越者,否则怎么可能在两三年之前就预料到今天才略微看得到一点萌芽的未来传媒分发形态?
“你猜对了,我在写《长尾理论》之前,就已经看到今天,甚至看到三年五年之后了。”顾诚毫不谦虚地承认了。他需要这种铁口直断的威望,来让丁三石和马风对自己深信不疑。
“那你今天把这些都告诉我们,你就不怕我们也开始布局,跟马腾那样抄袭你的套路么?”马风对人性的认识更加深刻,第一时间觉得顾诚似乎有什么有恃无恐的阴谋。
顾诚没心没肺地笑了,笑得非常君子坦荡荡:“抄?怎么抄?大数据在我手上,你们有么?人工智能的算法在我手上,你们有么?这些都没有,就算知道我的思路,你们拿什么抄?”
马风一愣,心说确实是这个道理。
难怪顾诚有恃无恐了。
马风暗忖顾诚这人如果不是抱有什么目的,很少跟同行吐露这么多干货的。今天突然说这些,莫非是另有所图?于是他自然而然地问道:
“那你今天和我们说这么多,究竟有何图谋?总不会是突然给我们扫盲开眼的吧?”
顾诚见被戳穿了,也就不再掩饰:“马哥就是贼啊,一下就看出来了。行,那我也不瞒着你们,实话说了吧。未来的深度学习型人工智能,要想运作得好,需要的配套条件千头万绪,我也不可能一个人包打天下,从头做到脚。所以有些配套,我觉得未来会有一定前途,但是还不配我亲自出手的,你们今天要是有意向,就可以自己找资源准备起来了。”
马风和丁三石的耳朵一下子就竖起来了。
顾诚这家伙创造的奇迹太多了,哪怕是他拔根毛下来,一点微末的看不上的小生意,那背后都是无限商机。
当然了,顾诚看不上的生意,一般做起来肯定比较辛苦,或者低俗,要不无法形成垄断不能常年暴利,只能赚个几年快钱,然后就要陷入低门槛的激烈竞争。
但即便如此,那也肯定是一门普通人求都求不来的商机。
见哥们儿都听得很认真,顾诚也不藏着掖着,干脆地伸出三根指头,比划着说:
“未来要做好深度学习型人工智能,关键有三方面的条件。
第一是要有好的算法,这个是核心,就像是软件。
第二是要有充分的大数据,这个就相当于是软件里的输入素材。而且深度学习型软件是可以自我优化自我进化的,输入素材越多、数据标示越好最终的效果就越好越精准。一旦某一方面的大数据有优势,未来的巨头可以很快形成滚雪球效应,跟后来者拉开差距。
第三,就是要有处理这些天量数据的硬件处理速度以目前的人工智能运算量来看,哪怕是解决最简单的图片识别,或者语音智能识别,甚至只是输入法频次统计反馈,都不是任何一个单独的服务器可以承载的。或许每一个需求,都要用一个数据中心的处理能力去处理。
但是同时,每个数据中心处理的多个问题又可能有很高的重复率,数据处理过程量的复用率会很高。所以拥有越多处理需求、越多处理硬件资源的企业,在处理效率上就会有明显的优势。这时候,我们就会发现,依靠传统的‘为每一个新的业务需求购置一批服务器、搞一个专门的数据中心’,效率会非常低下,成本会非常高昂……”
顾诚刚说到这儿,被不怎么懂技术的马风给打断了:“那么怎么解决这一点呢?如果只是钱贵的话,那也不是什么大问题,我们费钱别人也费钱,大家一起涨价不就行了?”
“呵呵……如果是‘你贵我也贵’,确实问题不大,涨价就是了。但是如果人工智能的应用成本太高,它对传统产业和传统咨询类人工岗位的替代效应就不明显了。用人工智能大面积解决问题,必须是其成本明显低于雇佣人类客服、记者、编辑、老师、咨询师、查法律文书卷宗的基层律师、只会开票的基层会计师……
资本家才会把这些重复脑力劳动的基层白领开除掉,改用机器人。不解决成本问题,或许你不会被其他人工智能竞争对手同行甩开,但对于整个人工智能行业消灭人类岗位的进程,起码会造成三到五年的延后。”
马风还在琢磨其中的算计,丁三石却已经听懂了:“确实,就跟今年我看到滨江咱黄易总部隔壁,有几家做新兴产业led的公司,虽然大家都贵,但是卖不出去的主要原因不是因为比同行贵,而是‘买了led的产品之后,售价减去产品全生命周期内省下来的电费,依然比节能灯都贵’,所以那些物业老板才不买。我跟其中一家叫罗莱迪斯的公司老板喝过几次功夫茶,就听他说起过这事儿。
还有隔壁的海康威视,早几年也是这个情况一套监控卖那么贵,之所以卖不出去,不是因为它比竞争对手大华家卖得贵,而是因为多装这几套监控的成本,比多雇佣一个保安都贵了,才卖不出去。这两年成本下来了,那些精明的企业主才开始多装监控少雇保安。”
马风的见识还是很广博的,他做电商起家,各行各业都了解一点。听了丁三石举的例子,他马上就想通了。
人工智能的普及,说到底是跟人力成本在pk价钱,不是跟同行pk价钱。比人便宜才有资本家用。
于是他诚恳地追问顾诚:“那小顾你觉得,有什么快速降低人工智能运算成本的办法呢?总不能让我们去投资英特尔,指望硬件厂商把单位计算效能的cpu价钱加速猛降下来吧?”
“当然不是。”顾诚端起茶杯,作势喝了一口,表情很淡定,“首先,cpu的架构模式,处理深度学习算法需要的并行数据处理时,效率还是太低了。就算要在硬件上下手,也不该找英特尔。”
应该找英伟达,但是这句话顾诚就敝帚自珍了,没必要告诉马风和丁三石。
他从02年就收购了agiea公司,在人工智能用gpu领域的布局,已经占到了先机。未来不管是挖英伟达的技术团队、积累技术储备,还是直接想办法到英伟达投资,都很灵活。
这事儿,他自己就能做,不需要马风和丁三石的配合。
他今天需要说出来的,都是些他不愿意啃的硬骨头。
“其次,即使不在硬件的物理指标上争取跨越式发展,我们还可以在资源配置效率上做文章这个解决方案,就叫做云计算。利用未来网络的进一步便利,把各大互联网公司的数据中心整合起来。
或者让专门的服务器/数据托管公司形成虚拟服务器/虚拟数据中心的架构,实时优化调度计算资源,把闲置的计算力量以一个相对较低的价格临时、分时租赁给出现处理需求的人工智能公司用这些招数,可以轻松做到在硬件物理性能没有飞跃的情况下,靠优化配置节约数倍的计算资源成本。”
“你说的这招,目前技术上实现得了?”马风和丁三石异口同声地狐疑道。
顾诚淡定地耸耸肩:“比较难,但是已经有机会年初的时候,英特尔公司就开始力推双核cpu处理器了,对多线程计算的分配效率和架构也做出了很大优化。我们公司,目前就基于此基础,尝试了内部代码编译服务器的‘分布式编译’架构。你们不信的话可以去参观一下。”
第165章 别人抢破头,诚哥看不上
“未来人工智能时代的具体实现方式,就是利用人工智能的算法,在云端计算大数据。算法相当于工业时代的加工机床,数据就像是被加工的原材料,而云端计算能力则是驱动机床的能源提供者。
我的yy网络科技,乃至蚂蚁金服,乃至我其他一切平台,核心的目的是实现内容推送的人工智能。我的人工智能要‘听得懂人话’,进一步发展到‘哪怕主人不说,也能猜到主人想要什么’的‘读心术’。然后解决‘找到主人想要的内容,然后给他’这个问题。
听得懂,猜得透,找得到帮全人类做到这九个字,就够我顾某人为之奋斗一辈子了。至于钱,于我如浮云,我要那么多有什么用?这里面,的算法和大数据,是必须我亲自解决的,但是背后的基础设施,我不一定要亲自搞。所以云计算这块,你们谁有兴趣,愿意去搞,我可以提供技术服务,或者入一点股份,帮你们搞。这个钱赚得不够轻松,不是从0到1从无到有的钱,我不想受这个累。”
顾诚最后给了一番高屋建瓴的结论,把自己的志向和心态剖析得非常清楚。
只有从0到1的钱,才有垄断利润,才有绝对的暴利。那些从1到n的钱,只是成本大战。或许未来早期的云计算巨头在优化效率上能够比同行高一点,把成本压得更低一些,从而赚到更多的差价但那也只是一点点差价。
顾诚是内容产业的霸主,他没空亲力亲为。他只要确保这个基础设施短板不会拖他的后腿,到了那个时代他想从外部买云计算资源,能够买得到,而且以足够便宜的价格买到,就行了。
就跟米国人没必要亲自跑去沙特狗大户那儿挖石油,他们只要确保石油足够便宜、能够满足米国的工业体系需求、不要再爆发一次类似于1973年石油危机之类的事件就行了。(虽然挖石油也有可能很赚钱)
云计算,就相当于4。0时代的“能源”。
当然,顾诚不在乎亲自赚云计算的钱,不代表他不需要控制和监督云计算。
毕竟,未来的业务形态是“在云端用人工智能算法处理大数据”,既然是“在云端”,那么yy系和支付宝系的大数据肯定是要传到云上去算的。这时候数据安全的问题就很重要,必须防止敌人暗中备份窃取。
后世2017年6月爆发的阿狸系菜鸟物流和顺丰快递之间爆发的数据共享大战,按照顺丰方面的口径,就是因为“菜鸟物流以大欺**着顺丰把其大数据处理服务商和虚拟服务器托管从腾云云改成阿狸云”。
这一招背后,说实话,即使顺丰真换了阿狸云,阿狸云也赚不到几块钱利润(顺丰不算什么大客户)。关键是那个时空2017年的bt之战已经白热化到了无所不用其极的程度。阿狸云害怕菜鸟系中任何一个环节的数据放在腾云云上处理,会被暗中窃取备份。
顾诚可以不赚云计算的钱,但他必须确保帮他处理大数据的云计算供应商不会威胁到他的数据安全
就像米国允许沙特狗大户这些小兄弟赚石油钱,但沙特必须保证米国的能源安全。要是欧派克再想搞个73年石油危机那样的大新闻,米国人的航母舰队会毫不犹豫开到波斯湾的。
幸好,顾诚在阿狸也已经有24%的股权了,他可以充分行使未来对阿狸云运作的监督权限,派驻自己的专人跟踪,防止非法备份。
顾诚的野心之大,终于让马风和丁三石彻底看清了:顾诚的眼光跟他们不是在一个位面层次上的。
马风当机立断拍板:“我愿意投资搞阿狸云计算,不过你得给技术支持。反正阿狸你已经有24%股份了,将来赚了你也少不了好处。剩下的细节慢慢谈吧。我们先去参观一下你们公司的分布式编译服务器中心。”
丁三石犹豫了一下,表示愿意稍微投资参一股,但是无意主导这个生意。
很显然,丁三石那股大起大落之后养成的“人活着,最重要的是开心”毛病又犯了。听顾诚说云计算的钱赚着很累很没门槛壁垒,他又懒得动弹了。
也难怪这厮后来会去养猪。
不是丁三石本人喜欢做的事情,他都是这么懒洋洋的。
……
yy网络科技,研发部编译中心。
作为国内如今最牛逼的互联网公司,yy网络科技的研发部从来不缺钱买最好的编译服务器。
从02年到04年,每年英特尔出了新的服务器用处理器,或者ibm出了新的机组,顾诚都会不吝重金采购,以至于就没见过国内哪个同行的编译中心机子性能比顾诚的公司好的。
yy网络科技的程序员们都是行业精英,他们的时间非常宝贵,怎么能因为写完代码或者自测修改后等机器编译而浪费太多时间呢?
能够多花100万买服务器,让每个程序员修完一块代码bug之后少等哪怕20分钟的编译时间,顾诚都是觉得值得的。
然而,就在这个炎炎夏季里,一些让程序员们觉得不可思议的事情发生了。
公司要求按照顾诚大致描述的那个拓扑结构,结合英特尔最新的多核cpu线程任务分布思想,弄一个闻所未闻的“分布式编译架构”。
所谓“分布式编译”,用外行人听得懂的话解释,大致是这么个原理:
在原本的编译模式下,每次一段代码要被编译成程序时,都只会调用程序员本人的电脑cpu运算资源,或者他直接树状结构连接的那台代码服务器的运算资源,来进行编译。
但是在同一个网段里面,并不是所有程序员的电脑或者代码服务器的cpu都始终处于满负荷运转状态。搞了“分布式编译”之后,可以把同事开着的、cpu闲置的运算资源也调动起来,一起帮助编译,从而加快编译速度。
要是搁在后世,这玩意儿随便找个编译工程师都能搞定。
问题是眼下才05年下半年距离历史上这种架构方法在各大互联网公司试水,起码早了两年多。顾诚几乎是卡着一切必要硬件条件的门槛布置的任务。
当然,历史上分布式编译在08~09年才成熟,并不是说更早技术上就绝对做不到而是更早的时候,大伙儿觉得这东西没什么价值。犯不着为了省这么点编译时间,就去浪费那么多程序员的精力专门架构这种结构。
而历史上的08年,阿狸开始运作“阿里云”这些云计算项目,分布式计算的基础研究已经做了很多,设置分布式架构所需要的操作成本也大大简化,国内各大公司赫然发现“诶?原来只要这么几个小步骤,就能把闲置的电脑计算能力整合起来?貌似还挺方便的”。
(注:我记得我第一份工作,在一沪江一个手机研发公司当码农的时候,09年就搞过分布式编译。不排除其他行业更早,应该是08年就有了。)
顾诚让大家研究这个东西,显然是在为云计算做预演和操练。
然而不理解这事儿的人很多。
那几个被分配到琢磨这事儿的码农,都觉得老板变抠门了:这种事情,犯得着让一组码农花十天半个月去优化么?多买几台服务器才多少钱?这些行业精英半个月的工作时间又值多少钱?顾总怎么突然抠门不会算账了?
负责这个项目组的是一个细心的女运维工程师,名叫叶芷秋,大约27、8岁,研究生毕业后来yy网络科技工作,已经有三年了。因为是第一次做这事儿,所有代码和设置都要另起炉灶,她手下足足管了十几个人做这事儿,进度却依然缓慢,估计还要一周才能彻底搞定。
叶芷秋很心烦,尤其是前阵子她听说老板最近有可能带大客户或者合作伙伴来参观