听懂的人都听得痴了。没听懂的又开始推测图海川的婚姻问题。
“组合序列记录、模式抽象、分类。大脑就靠这三招,在内部建立了一个世界模型。如果这个模型是一座大厦,我刚才描述的局部就比一块砖还小。然而,整个大厦都是用这种机制建成的。这个世界模型的物理位置在大脑皮层,仅仅用了六层细胞,大概一千亿个。我们遇到的每一个需要智能解决的问题,大脑都在建好的世界模型中推演,就像棋手先推演下面几步,再落子。这叫预测。或者根据新的信息,先在世界模型中增添新组件,和旧组件建立连接,再来推演。这就叫学习,或者叫记忆加预测。
“做ai的人都有共识:智能的本质就是记忆加预测。我们头骨里面这个记忆-预测模型,有些人大,有些人小,所有人都有不同程度的歪曲。但大脑解决所有问题都是把它放在整个世界模型中运行。这样来看大脑,它不是通用智能才怪!”
没有一个人说话,没有一个人的眼睛离开图海川的脸。只有一些小国代表受不了自己的译员了,用耳机连上公共翻译。
“一个小巧、简洁、通用的世界模型。听起来就能把人迷死。想制造大脑的人远远不止我一个,古往今来太多了。为什么他们都失败了?我们再回头来看看连接主义者,在我之前最近的尝试。”
“他们的直觉其实是对的。分布式网络,单元最简行为,海量输入数据施加压力,让网络自己学习、生长、进化。这些都是构造大脑的基本原则。世上最复杂的东西都是长出来的,而不是设计出来的。也不要以为‘连接主义’在ai界成了贬义词,它就死掉了。当今主流的ai技术:深度学习或者机器学习,它们的内核还是这些原则,只是设计使用的数学工具先进了无数倍,再加上不声张而已。你最多能听见他们说‘黑箱卷积’或者‘玄学调参’。
“既然原理相同,那为什么从前的连接主义者尸横遍野,当代偷师了连接主义的概率学ai仍然看不到大脑的尾灯?原因只有一个:大脑比它们先出发——大概五亿年。
“大脑的世界模型不是从你出生开始构建的。只有最顶层很少的一部分才跟出生后的学习有关。下面占多数的底层,组合序列早已建好,预测模型早已完美,数据庞大到不可思议,连接复杂到不可思议,都是你继承的遗产。这些部分很多跟你的身体有关,更多的与外部世界有关。随便挑出一个局部,都能让顶尖的概率学ai汗颜。
“我们挑个简单的:皮肤上的压力感受器。你刚出生,它就对外部世界无师自通。给它个尖锐而快速的压力——痛觉,模型预测是荆棘或者爪牙,对策是不经过意识反应直接缩开,越快越好。给它个点状分散、轻微而移动的压力——痒觉,模型预测是昆虫或者腐蚀性物质,对策是没手的去树上蹭,有手就用手挠。给它个宽广、稳定而柔和的压力,模型预测是爱抚,对策是通知某个腺体分泌神经递质,神经递质促进一大片预先编好的组合序列兴奋起来,让你觉得爽,还会启动一整套社交行为。比如四脚朝天亮出肚皮,或者放开奶头笑一下,或者呻吟两声鼓励他继续。”
听众们一直屏息静气,这时突然爆出一片喝彩与掌声。图海川绝望地想:幸亏加的料够多。
“这么庞大复杂的底层模型,当然也是一点点学习外部世界,学出来的。不是我们自己,是五亿年间每一个直系祖先。学习方法是世界让神经建模不行的早点去死,或者终身破不了处,那些就不是我们的祖先。建模够快、够准确的才有资格做祖先。它们把整体建模的菜谱刻在基因组当中传给我们——菜谱,不是蓝图!也就是说,每个人头颅中的世界模型刚一出生,对世界的学习就已经持续五亿年。所以它才会长得那么复杂。
“而连接主义者呢?他们输在起跑线上。人工神经网络从一无所有的白纸开始。不仅节点和连接数量没法跟大脑比,探索阶段的学习数据摄入量,几张打印纸就可以抄完。我说过,他们的原则没有问题。也许让他们搞上一千年,人工神经网络能赶上大脑的水平。毕竟人类操纵进化比自然快得多,看看狗就知道——真正的狗,不是阿尔法狗。但是现代社会不可能等你一千年。阿里集团放手让我玩了十年,已经是理解与慷慨的巅峰了。”
孤零零一只手举起。这是一位小国代表。
“图博士,您的智能学讲座精彩绝伦。但是为国际社会的团结考虑,能否请你不要把进化论这样充满争议的学说带进来呢?我相信我们今天是来达成共识的,不是来争吵的。”
“谢谢您的夸奖,主教大人。这次会议开三天,就算今天我们不争吵,明天后天也一定会。还有,如果您无法接受任何一种包含进化论的表述,那么再听我讲半小时,您会发现我们全体坐上了高速列车,直奔地狱。”
主教似乎被吓住了。他刚坐下,英国技术代表杰米斯爵士又举起了手。
“非常感谢你给同行上的生物课。请问你是生物学家吗?或者神经学家?或者有医科学位?”
“都不是。但2029年上班的第一个月,我的团队就招募了四位顶尖的认知神经学家。其中一位是你的剑桥校友,你们认识。接下去两年我就差跟他们睡觉了。”
爵士笑着说声“真有钱”就坐下了。他身边的嘉德接过来:“也就是说你还是个外行。请问这里有专业人士吗?他刚才说的是权威理论,还是华丽的想象?还有,这些跟我们今天的主题真的有关吗?”
会场安静了片刻。
瑞士代表团一位女士怯生生站起来:“我在海德堡大学教过二十年神经生理学,也许能给个参考。图先生刚才讲的,原则上很准确。只是……省略了很多细节,经过高度抽象。我刚才听起来也像是才明白。”
图海川向她鞠了一躬:“谢谢您证明我的大脑还在正常工作。嘉德女士,我向你担保,刚才这些问题关系重大。因为下面我就要讲为什么别人造不出来,我却造出来了。
“当今的概率学ai做法很精明。他们不去妄想整个世界的数据,而是专攻非常狭窄、非常单纯的一点。比如规则简单到极致的围棋。阿尔法狗上手先看几百万张棋谱,这比任何人加上他的所有祖先能下的棋还要多得多。所以人永远下不过狗了,这样看没有任何意外。课题稍微宽泛一点,概率学ai的吃力程度就指数上升。因为它的架构原则不是为复杂数据准备的,缺乏通用潜力,更没有几亿年累积的世界模型。比如人脸识别,ai最成功的领域之一。从上个世纪开始搞了八十年左右,投入不计其数的智慧、金钱和算力,计算过上百亿张脸,现在ai终于超过人了。还不是完全超越,抗干扰能力和跨年龄识别还远远比不上。大脑呢?刚才那个吃奶的婴儿就会识别人脸。等他八十岁的时候,还能识别八岁时见过的脸!
“正是这样成功的例子,让我在2029年接近完全绝望。这个世界太大、太复杂,数据量无限。我们用概率学ai攻克人脸识别这样一个小小的领域都需要八十年的消耗战,什么时候才能建成一个世界模型?”
图海川的声音变低了,眼睛不再看听众,似乎坐在那里自言自语。听众们全神贯注,跟着浸入2029年那颗独自沉思的大脑之中。
“我想不起从哪天开始,意识到互联网的结构和大脑极其相似。分布式网络,不是设计的而是生长的,自然适应物质世界环境,自然分层,自然分区,底层节点连接着无数感官,接受无数种信息,被这些信息塑造,继续生长。它就在那里。我可能一直都知道。
“但是互联网极端复杂的数据结构和通信协议蒙蔽了我的眼睛,让我不敢向那扇门迈出一步。门后面的东西太庞大、太复杂,而我想要的是简化——直到我认识王招弟博士。万国宝的诞生,第三位需要感谢的人是她。如果说我是一个大号反应池,乱七八糟的东西都腌在里面慢慢发酵,王博士就是一道闪电,瞬间点燃所有反应。”
礼堂中每一双眼睛都转向第六排。王招弟面不改色,仿佛说的是别人。张翰在她旁边,倒被闪得埋头打了个喷嚏。
“我面试她用了25分钟。那时我准备的一堆问题才问到三分之一,问她为什么对自然语言翻译ai感兴趣。她答道:‘语言是头脑之间的通信协议。一百年前世界人民离得很远,各说各的,也就罢了。现在有了互联网,大家直接交谈。但自然语言太多,协议太乱接口太差,白瞎了互联网统一的基础协议。难道不该改进一下吗?’
“面试马上结束。王博士成了我的合作伙伴。我送她出门之后,一个人在走廊里来回横跳。这个面试让我突然明白了,万国宝项目到底站在什么位置上。互联网真正的神经元是人,是几十亿颗大脑!他们已经进化了几百万年,所有底层构建齐备!互联网本身进化了将近一百年,但它的速度比自然进化快千万倍!它就在那里,数据饱胀得无法理解,通信密集得快要爆炸,只等出现一个机制,向上简化!而万国宝,如果按我的想法做成了,就是那统一的数据结构,统一的协议!以前吓倒我的那些复杂细节,现在看来无关痛痒。它和大脑一样,需要的只是连接。统一定义、可以抽象、可以产生概念的连接。这不就是语言吗?霍桑说得再准确不过:我想造一颗大脑,所有大脑组网形成的大脑,比我们更高一层的智能,互联网的灵魂。所有条件已经准备好了。”
张翰经历了周克渊的当头棒喝,今天已经不再震惊。他左看右看听众的神情,猜想那天自己像谁。
“声明一点:2029年的我太过狂妄,没有看清整个局面。今天的世界是这个样子,证明我只对了一半。还有一条路可以走通,建立在概率学ai基础上的道路。究竟是怎么走通的,我到今天也不太明白。我讲完之后,希望戈德曼博士可以教我们。”
戈德曼进入会场以来一言不发。现在置于炉火之上,终于站起来: