学霸的模拟器系统: 第266章 比基尼与凸优化(求订阅求月票)
芝加哥的四月,是个可笑的骗局。
日历上明明写着春天,密歇根大道上的风却依然像刀子一样,刮得人脸生疼。
以太动力的CEO办公室里,百叶窗拉得严严实实。
林允宁手里捏着半截粉笔,盯着黑板发呆。
黑板上没有鬼画符一样的量子力学公式,只有一行孤零零的算式,关于迹公式(Trace Formula)的展开项:
Tr(f *[D]^-s )= Sum( m_i ^-s )
他在尝试利用“完美状空间”的几何性质,去定义杨-米尔斯场算子的谱。
只要证明这个等式成立,那困扰物理学界半个世纪的“质量间隙”,就不仅仅是一个假设,而是几何结构下的必然。
思路是通的,逻辑也没问题。
但在处理非阿基米德边界条件时,总有个余项像个钉子户一样,怎么都消不掉。
“味”
手里的粉笔被捏断了。
林允宁把断粉笔扔进笔槽,拍了拍手上的灰。
三天闭关,虽说没把这座大山劈开,但也算在悬崖上凿了个落脚点。
这种级别的数学难题,急也没用。
得磨。
肚子叫了一声。
林允宁看了一眼墙上的挂钟,十一点四十。
今天星期六,约好了和沈知夏一起吃午饭,。
也该出去觅食了。
半小时后。
南环区,一家越南河粉店。
店面不大,空气里全是九层塔和烫生牛肉的热气。
林允宁坐在靠窗的位置,对面是刚下课赶过来的沈知夏。
她穿着一件白色的羊绒开衫,头发没梳成习惯的高马尾,而是随意地挽在脑后,正熟练地往汤里挤着青柠汁。
“多吃点肉。”
沈知夏夹了几片半熟的牛肉放到林允宁碗里,“看你这几天闭关闭得,眼神都发直了。不知道的还以为你在修仙呢。”
“修仙也没这么累,偏微分方程比雷劫可怕多了。”
林允宁笑了笑,拿起筷子,却没有立刻吃。
他左手拿着那台第一代iPhone,拇指在屏幕上滑动着。
2008年的手机网页加载速度慢得感人,但他还是耐心地等着一张张图片刷出来。
那是一个Facebook的主页。
屏幕上,一个拥有古铜色皮肤的混血女孩,正穿着亮黄色的比基尼,抱着冲浪板站在加州的阳光下。
笑容肆意,长腿紧致,身材火辣,马甲线清晰可见。
林允宁双指放大图片,皱着眉,盯着照片背景里的海浪。
表情严肃得像是在审视一组异常的实验数据。
“咳咳。”
身旁传来两声刻意的咳嗽。
林允宁一抬头,就看见沈知夏咬着筷子尖,眼神戏谑:
“行啊林柠檬,出息了。在实验室憋了三天,一出来就开始看泳装美女?怎么,以太动力要开展模特业务了?”
“别闹。”
林允宁笑着把手机递到她面前,“这是李飞飞教授推荐给我的博士生,做深度学习的,叫克莱尔?王(Claire Wang)。下午来芝加哥面试。”
“面试还要看泳装照?”
沈知夏挑眉笑道,“小姑娘身材是不错,但这跟写代码有关系吗?”
“你看时间戳和地点定位。”
林允宁指了指屏幕下方那行小字,“上周二下午两点,半月湾(Half Moon Bay)。那天加州发了大浪橙色预警,浪高超过五米。”
“能在那种天气下还要去冲浪,还笑得这么灿烂,说明这个人要么脑子缺根弦儿,要么是对风险有着极高的耐受度。
沈知夏低头看去。
在那张充满荷尔蒙的照片下面,是一行极具反差的文字简介:
Princeton CS PhD Candidate (普林斯顿计算机系博士候选人)
Research Interest: Convex Optimization, Manifold Learning (研究方向:凸优化,流形学习)
Status: Bored by Google (状态:觉得谷歌很无聊)
“普林斯顿的博士?”
沈知夏愣了一下,又看了一眼那张比基尼照片,“这人设太割裂了。看着像个混夜店的,结果是搞凸优化的?”
“这也是我头疼的地方。”
林允宁拿回手机,看着那个名叫克莱尔的女孩,“李飞飞亲自推荐的人,技术肯定没话说,就是有点非主流,不知道能不能适应公司文化。”
“非主流好啊,你们的公司文化早该改改了。”
沈知夏笑了,往碗里滴了几滴鱼露,“整天跟你还有新竹这种闷葫芦待在一起,公司都快变成修道院了。
“来个这种活蹦乱跳的,正好给你们那帮闷葫芦科学家一点活气儿。”
她顿了顿,又补了一句,“不过,我看她Facebook上又是冲浪又是音乐节的,能受得了芝加哥这鬼天气?别来了两天就跑路了。”
“所以得想办法把她忽悠住。”
林允宁把碗里的牛肉拌匀,眼神里闪过一丝精光,“光靠钱肯定不行,谷歌已经给了她Offer,她还嫌弃谷歌太土。
“你说,怎么把这条热带鱼,骗到咱们这个冷冰冰的芝加哥来。”
沈知夏吸溜了一口河粉,笑着说:
“简单啊。你也说了,敢在那种天气下去冲浪,这种人不怕困难,就怕无聊。
“你得让她觉得,来芝加哥是一场比冲浪更刺激的冒险。
下午两点,以太动力会议室。
百叶窗拉着,方雪若坐在主位,手里拿着一份打印好的简历,眉头微皱。
“克莱尔?王.......GPA 4.0,ACM金牌,两篇NIPS一作。”
方雪若用笔尾点了点桌面,“履历完美得挑不出毛病。但我看了她的社交账号,这姑娘......很野。”
“野点好,耐造。”
林允宁转着笔,盯着门口,“只要脑子好就行。”
笃笃笃。
门开了。
走进来的克莱尔?王让林允宁愣了一下。
没有比基尼,没有夸张的纹身展示。
她穿着一套剪裁考究的黑色职业套裙,白色真丝衬衫扣到了最上面一颗,那头原本在照片里张扬的粉色头发被一丝不苟地盘在脑后。
鼻梁上甚至架了一副金丝边平光镜。
如果不是提前做了功课,林允宁绝对会以为这是要去麦肯锡面试的高级咨询顾问。
“林先生,方小姐,早上好。”
克莱尔微微鞠躬,声音沉稳,带着标准的加州腔调,“我是Claire。”
方雪若挑了挑眉,显然对这个乖巧的第一印象很受用,指了指椅子:
“请坐。”
面试开始的前十分钟,气氛沉闷得像是在背书。
雪若问职业规划,克莱尔答团队协作;
雪若问项目经验,克莱尔答敏捷开发。
滴水不漏,但也乏善可陈。
林允宁一直没说话,只是靠在椅背上观察她。
这姑娘在演戏。
虽然坐姿端正,但她的左手食指一直在无意识地抠弄右手腕上的一个编织手环一一
那是一个冲浪俱乐部的VIP入场环,磨损得很旧。
而且,在她偶尔调整坐姿时,脚踝处隐约露出一抹青黑色的痕迹,像是一条蛇的尾巴,被黑色的职业丝袜极力遮掩着。
这是一种把自己塞进模具里的不适感。
“Claire。”
林允宁突然打断了她关于“代码规范性”的长篇大论。
他身体前倾,双手交叉放在桌上,眼神变得锐利:
“咱们能不能别装了?”
克莱尔的声音戛然而止。
她推了推眼镜,职业假笑僵在脸上: "Excuse me?"
“我知道你拿到了谷歌的Offer,杰夫?迪恩肯定给出了一个让人无法拒绝的薪资待遇。如果你想要安稳,去山景城晒太阳写代码是最好的选择。”
林允宁指了指窗外灰蒙蒙的天空,“但你既然从新泽西飞到这个鬼天气的地方,还特意穿成这样来见我,说明你根本不想当一颗螺丝钉。”
克莱尔那张一直保持着职业假笑的脸了一下,眼神里闪过一丝被看穿的错愕。
下意识地,她缩了缩左脚,试图把脚踝藏进椅子下面,手指也停止了转动那个手环。
"ResNet(残差网络)。
林允宁没有给她喘息的机会,直接抛出了技术话题,“上个月我们在CVPR上公布了源码。李飞飞教授说,你在我们发布之前就在研究类似的结构。
“我想听听你的看法。不是那种写在论文里的漂亮话,我要听实话,听缺点。
克莱尔沉默了两秒。
然后,她抬起手,摘下了那副碍事的平光眼镜,随手放在桌上。
那种职业性的伪装虽然还在,但眼神变了。
变得锐利,甚至带着一点初生牛犊的攻击性。
“实话?”
克莱尔看着林允宁,语气变得犀利,“实话就是,您确实是个天才,ResNet是个工程学的奇迹,但在数学美感上,它并不完美。
“H(x)=F(x)+ x。这确实解决了梯度消失,把网络堆到了101层。这对于计算机视觉(CV)来说是核武器,因为图像是局部相关的。
“但是,林先生,AI并不只是用眼睛看,更要与人沟通,ResNet如对于自然语言处理(NLP)来说,它太‘笨重'了。”
她站起身,也不管这是面试现场,直接走到白板前,抓起马克笔画了一个长长的序列图。
“语言不是像素点。语言是流动的,是有长距离依赖的。'I love you'和'You love me',字是一样的,意思完全不同。
“目前的RNN(循环神经网络)太慢,无法并行。而ResNet虽然深,但它依然是基于局部卷积的逻辑。如果我们想让机器读懂莎士比亚,或者是理解一篇复杂的论文,靠堆层数是堆不出来的。”
她转过身,看着林允宁,眼神灼灼:
“我在想,未来的方向不应该是更深(Deeper),而应该是更宽,或者是......更关注(Attentive)。
“我们需要一种机制,能让模型在看到‘苹果’这个词的时候,瞬间联想到句尾的‘好吃’,而忽略中间那十个无关紧要的形容词。无论它们距离多远。
“就像......我们在看一张复杂的派对照片时,目光会自动聚焦在那个最辣的女孩身上,而忽略背景里的墙纸。”
说着,她下意识挺了挺饱满的胸口,却又意识到自己的话有些不合时宜,轻咳了一声,掩饰尴尬。
方雪若眉毛一挑,看向林允宁,显然对克莱尔这种突然反客为主的画风有些不适应。
但林允宁却笑了。
他看着克莱尔,满意地点了点头。
这姑娘果然是个天才,而且有着极强的直觉。
她已经摸到了那扇门的把手,只是还不知道怎么推开。
“很有趣的想法。”
林允宁站起身,走到白板前,拿起另一支笔。
“你想要‘关注”。但在数学上,怎么定义这种关注?”
他在白板上写下了一个矩阵乘法的雏形。
“如果我们将每个词都映射为一个向量。我们要寻找词与词之间的关系……………”
林允宁一边说,一边写下了三个字母: Q、K、V。
“Query(查询),Key(键),Value(值)。”
林允宁的声音在安静的会议室里回荡,带着一种引导性的魔力,“如果把每个词看作是在数据库里的一次查询。
“我想找和‘苹果”相关的词。那么‘苹果’就是Query。
“句子里的其他所有词,都举起手中的Key。
“我们计算Q和K的点积(Dot Product),这就代表了它们之间的匹配度??也就是关注度(Attention Score)。
随着他的书写,一行简洁而优美的公式出现在白板上:
Attention(Q,K,V)= softmax((QK^T)/ sqrt(d_k))* V
克莱尔盯着那个公式。
她的瞳孔猛地收缩,像是看到了什么不可思议的东西。
“点积......归一化......加权求和......”
她喃喃自语,随即猛地转头看向林允宁,眼神里满是震惊,“抛弃循环?直接计算所有词之间的相互作用?全连接的拓扑结构?”
“没错。
林允宁看着她,“就像量子纠缠。只要关联度够高,信息瞬间送达,无视距离。最重要的是??”
林允宁指了指隔壁机房的方向:“因为没有了时序依赖,我们可以利用GPU进行大规模并行计算。训练速度将提升成百上千倍。”
克莱尔深吸了一口气。
她知道林允宁在注意力机制和神经网络领域造诣极高,但没想到他居然三言两语就帮她推开了一扇新的大门!
这种数学上的通透感,让她浑身的鸡皮疙瘩都起来了。
比她在半月湾冲过最大的那个浪还要爽。
“这太......性感了。”
她忍不住感叹了一句,完全忘了这是在面试,也忘了自己应该保持矜持。
“所以,Claire。”
林允宁放下笔,靠在会议桌上,看着这个终于露出了真面目的女孩,“你的导师李飞飞,是我的好友,她跟我说了你的情况。
“我知道你在担心什么。
“你觉得芝加哥很冷,很无聊,没有加州的阳光和海滩。如果都是要枯燥地写代码,为什么不去一个自己喜欢的地方定居呢?
“但是,我想告诉你,在谷歌,你只是几万名工程师里的一个,负责给搜索广告优化0.1%的点击率。
“而在这里......”
林允宁指了指白板上的公式,又指了指机房的方向:
“这几千张显卡归你指挥。我们要做的,不是优化旧世界,而是创造一个新的物种。一个能读懂语言、甚至能生成艺术的硅基大脑。
“以太动力用不着听话的工程师,我们缺的是能让台下欢呼的音乐节DJ。
“我知道你是网络红人,也知道你想让全世界都看到你的名字。”
林允宁抛出了最后一个重磅炸弹,“我能给你的,不仅仅是在Facebook上的知名度,而是通过改变世界的算法,让你真正成为AI界的红人。”
克莱尔看着比自己还要年轻的创业者。
又看了看白板上那个还没擦掉的公式。
林允宁所说的愿景,就是她梦寐以求的理想。
她深吸了一口气,重新戴上眼镜,试图找回一点刚才那种职业女性的矜持,但嘴角的笑意怎么也压不住:
“好吧。虽然芝加哥的风确实挺讨厌的……………
“但你们这里的咖啡闻起来不错,而且......老板也很棒。
“我接了。’
林允宁松了口气,伸出手:
“欢迎加入以太动力。”
面试结束,三人走出会议室。
走廊尽头,维多利亚正靠在墙边。
她今天依旧是一身复古的中性吸烟装,手里把玩着一根没点燃的雪茄,眼神像鹰一样扫过走出来的克莱尔。
“谈完了?”
维多利亚直起身,目光扫过克莱尔那双虽然穿着丝袜,但依然能看出紧致肌肉线条的小腿,又看了看她那个稍显凌乱的领口。
“Claire Wang.....我在华尔街见过很多像你这样的人。”
维多利亚的声音低沉而沙哑,带着一种看透一切的老练,“明明是一匹野马,却非要给自己套上笼头,装作是个拉磨的驴。
“你腿上那个纹身,是荆棘还是玫瑰?藏得挺辛苦吧?”
克莱尔愣了一下,下意识地想要遮掩。
但随即意识到在这几个人精面前,伪装已经没有意义了。
她索性大方地笑了笑,那种非主流的气质终于彻底释放出来:
“是一条咬着自己尾巴的蛇,衔尾蛇。意味着无限循环。”
“酷。”
维多利亚吹了个口哨,转头对林允宁眨了眨眼,“BOSS,这个我喜欢。既懂技术,又有品味,还懂得在无聊的规则下面藏点小秘密。这种人才是咱们公司缺少的。”
她走上前,并没有像方雪若那样礼貌性地握手,而是像个老朋友一样拍了拍克莱尔的肩膀:
“既然入伙了,那就别端着了。明天上班,你可以穿你想穿的任何衣服。
“哪怕是比基尼,只要你能把代码写好,也没人管你。当然,前提是别把那帮没见过世面的程序员给吓傻了。
雪若无奈地扶额:
“维多利亚,注意分寸。”
“我在帮她放松,亲爱的。”
维多利亚耸了耸肩,对着克莱尔露出一个迷人的、带有侵略性的笑容,“欢迎来到改变世界的疯人院,小野猫。”
克莱尔看着眼前这一幕。
一个随手写出神级公式的天才老板,一个像女王一样严肃的CFO,还有一个......像是个从电影里走出来的女流氓COO。
这确实不是谷歌。
这里比谷歌......有意思多了。
她推了推并不存在的眼镜,露出了一个灿烂的笑容:
“谢谢。我想我会喜欢这里的。”