图片来源:视觉中国
特约作者 | 周子豪
编辑 | 王伟凯
编者按:
自从OpenAI打开了生成式AI的潘多拉魔盒,大模型依然是2024年最炙手可热的风口,硅谷作为技术发源地,人才蜂拥。任何优秀的组织,一定都是找到了一种方法和对应的工具,去最大程度地激发每一个个体的创造力。但更重要的,是抓住那些稍纵即逝的天才灵感。《AI光年》通过走访一些AI公司员工,记录当下中外大模型公司的变化:掌握未来的人才在哪里?是为第二篇。
从森尼韦尔到旧金山市中心,驱车近40英里,斯坦福大学的硕士生赵鸣将将会参加一场AI创投的活动。这是六月一个周末的傍晚,赵鸣的活动轨迹。
硅谷本地一家美元基金的合伙人举办了这场活动。与会者有数十家AI初创公司的创始人,还有近50位代表不同资本的投资人。活动中,创业者们上台向投资者兜售自己的想法,AI工程师们则在台下观望“行情”。
“这样的场景每周都在硅谷上演。”赵鸣向《AI光年》作者表示。靠朋友牵线,他得到了一张入场券。赵鸣在斯坦福大学主修计算机,现在决心踏入AI行业。
他期待在这场活动中认识更多的科技从业者,以获取行业的前沿讯息。但是,令他惊讶的是,四百多位参与者中有一半是华人面孔。
觥筹交错之间,这些人的身份逐渐明朗:有专程从北京飞来寻求投资机会的风险投资人;也有在谷歌、微软等工作多年的中国籍软件工程师;还有一些在美国顶尖学府研究AI的中国学生。
他们都是中国人在硅谷的缩影。美国麦克罗波洛智库的一份报告(2022)显示,当时在美国工作的顶尖人工智能研究人员中,来自中国的研究人员占38%,美国人占其中37%。而在2019年,这两个数字还是27%和31%。
一直以来,华人都是硅谷科技圈的“中坚力量”。如今,在新的AI浪潮下,硅谷的中国年轻人又在经历什么样的起伏呢?
大公司卷模型,初创公司拼B端
“硅谷做AI的技术员,很多是中国人。”秦天向作者表示。
他是硅谷一家知名科技公司的机器学习工程师(MLE)。2019年从美国一所TOP30高校的计算机专业硕士毕业后,开始在硅谷从事AI相关的算法研究工作。在他的团队里,中国籍工程师占比近40%,“其他人主要来自印度,还有一些是罗马尼亚等国的东欧人。”
根据硅谷指标的报告,硅谷地区的人口主要由亚洲人和白人组成,而在亚洲人群中,华人数量占比最高。2022年,华人占亚洲人口的31%,成为硅谷最主要的亚裔群体之一。此前,秦天的许多中国朋友还是软件工程师。
但2022年年初,OpenAI发布GPT3和DALL-E 2的最新版本后,打破了这个局面,很多人开始向AI方面转型。
以秦天为例,早些时候,他所在的业务线还是开发一款有AI功能的移动相机应用。到2022年6月,公司突然宣布战略调整,砍掉已有近五年历史的产品线,转向大模型领域。
事实上,这种调整在2022年并不罕见。那一年,硅谷的多家科技巨头如Meta、Adobe和Google都进行了重大业务调整,纷纷开发了AI大模型领域,追随OpenAI的步伐。这一转变也促使大量软件工程师流向人工智能业务板块,其中不乏中国人的身影。
毕业于卡内基梅隆大学的张宇,目前在谷歌母公司旗下的自动驾驶公司Waymo工作,负责车载AI系统的研发。张宇介绍,ChatGPT-4出现后,Waymo经历了一期离职潮,部分中国同事也选择了离开。“离职比例不定,有些组可能每周流失一个人。”张宇说。
这些同事大多转投从事大语言模型研发的科技公司,或者重回谷歌,负责其他产品的AI研发工作。张宇感叹:“在硅谷,GPT俨然成了比自动驾驶更火的领域。”
加入这股AI浪潮的不仅有在硅谷打拼多年的“老工程师”们,还有从中国来赶潮的“新人”。
25岁的诗琦是其中的一份子。今年五月,他从国内飞往旧金山,决定加入一家专注AI的初创公司。诗琦不敢确定有多少人和他一样在今年从中国来到了这里,但他相信:“人才和资金总是会流入最先进生产力的地方。”
来硅谷的决定,并非诗琦一时冲动。在这之前,他是一名软件工程师,2021年本科毕业后,便在国内一家互联网大厂工作。起初,初入职场的施琦还希望在业务线上尽可能“施展身手”。但后来,他越发感到实际工作与期待的背离。
2022年前后,诗琦所在的产品线陷入增长的停滞:无论做再多的产品体验优化,用户量不再有突破式的增长。“存量时代好像真的来了”,诗琦感觉提早进入了“养老状态”,每天维护一下系统,再根据需求做些代码修改,就结束了。
朝十晚六,到点下班,不再996的日子,让诗琦感到危机四伏。虽然“清闲”了,但这也意味着“有没有你都是一样了”。
这样的状况促使他萌生了兼职打工的想法。一次偶然的机会,诗琦通过了一家位于美国密歇根州的AI初创公司的面试,开始为其远程工作。2022年春天,该公司的老板突然给诗琦发来一条讯息,说公司拿到一个新模型,是OpenAI最新推出的InstructGPT,邀请他一起内测。
“这和我之前见到的AI是完全不一样的。”诗琦感叹道。尽管GPT-3早在2020年就已面世,但InstructGPT 使用了从人类反馈中进行的强化学习(RLHF),能生成更符合人类偏好和意图的响应。诗琦冥冥中有一股直觉:“它可能会带来不一样的东西。”
从那之后,诗琦所在的公司就开始大规模接入这一语言模型,以研发新产品。这也让诗琦感到了国内与美国在AI推广上的差距:当时,诗琦身边的软件工程师鲜有人接触过GPT,办公室里也没有人谈论有关transformer的论文。但在美国,OpenAI已然成为各大科技公司热议的话题。
诗琦回忆,国内最早一批关注GPT的工程师都爱逛GitHub(开源社区)。那个时候,一些内地工程师开始接入GPT的API,做些套壳的应用。但直到2022年底GPT-3.5发布后,国内的大模型才开始受到资本的追捧。2023年,也被媒体称之为进入了“百模大战”。
2023年末,诗琦选择辞职,凭借此前远程工作的经验,他获得了现在这家公司的邀请。“去硅谷,去离新生产力最近的地方。”他说。
“去硅谷,去离新生产力最近的地方。”
自公司all in AI以来,秦天感受到工作压力变大了。
在2022年夏天前,工作的氛围还较为轻松,按秦天的理解,“这得益于上一个信息时代留下来的竞争壁垒”。负责后端开发的他,每天到点下班,新产品的发布压力也不大,“老的互联网产品维持营收,新产品做2-3年再发布很正常”。
如今,硅谷各大科技公司都不敢在AI竞争中有一丝怠慢。业务线的调整使秦天的日常生活开始变得紧凑,晚上11点下班已成为常态,周末加班也变得不可避免。
OpenAI在AIGC上的进展太快,给了硅谷其他公司许多压力。 2024年2月,在OpenAI发布Sora后,秦天就职公司的股价受到了猛烈冲击。短短一个春天,跌幅超30%。而在上一年,资本市场还对其公司的战略调整充满信心,一段时间内,股价甚至涨幅超60%。
面对OpenAI等大厂的竞争,秦天的公司加快了产品更新的步伐,将发布周期缩短至至少半年一次,以确保公司在这场技术革新的浪潮中保持竞争力,避免被拍在滩涂上。
“产品要加速迭代,与此同时,更多的前沿论文也要研究。”秦天说,一场新技术的军备竞赛正在硅谷上演。秦天主要负责多模态大模型(MLLMs)的开发工作,简单来说,就是让模型可以同时接受语言、视频、音频等数据的输入,从而更全面地理解和生成内容。
多模态领域是一座有待AI工程师开拓的新矿山。一篇五月发表的行业论文显示,减少资源消耗,同时扩大其适用性并最小化性能下降,是当下MLLMs的主要研发目标。
日前,中国智源联合国内多所高校提出的多任务长视频理解评测基准--MLVU,对20个最新流行的多模态大模型评测发现,排名第一的GPT-4的单选正确率不足65%,现有模型在长视频理解上仍然面临巨大挑战。
“我们需要不断地关注是否有新技术的出现,来应对这一全新领域。”秦天说。如当Open AI运用的DIT(Diffusion Transformer)算法架构生成出更好的视频时,秦天和他的同事们就会立即跟踪,从而判断产品迭代的方向。
大公司在大模型赛道上激流勇进,硅谷密集的初创公司也在扎起自己的AI营地。
据诗琦的观察,许多硅谷的初创公司卷B端产品线,这或与这些公司老板们过去的大厂背景有关。“他们可以利用工作中积累的人脉,更快速地打通商业渠道。”诗琦说。
如今,诗琦和他的团队正在研发一款面向企业的端对端的开发者工具,通过AI提升程序员的工作效率。去年9月,微软也曾推出过类似的应用“copilot”,他们期望实现这样的场景:开发者写代码时可以询问这些编程助手,从而更高效地完成工作。
“为技术提效,是不少在美初创公司竞争的方向。”诗琦表示,而端到端意味着创建一个自动化的工作流。整个过程完全由AI实现,客户只需关注最终生成的结果是否符合预期。“想要弯道超车,我们就要更多地思考与这些大公司进行差异化竞争。”诗琦说。
但一些技术难题依然摆在硅谷的工程师们面前。在诗琦看来,提高产品的准确率是他们急需突破的技术点,不同的用户场景有不同的准确率标准。
就以用户情感陪伴为核心的C 端产品而言,拥有70%的准确率或许已经足够。但对于企业级的需求来说,80%才是他们追逐的目标。这也迫使他们去寻找更精准的知识库数据,用于模型的训练。
为了竞争,烧钱是避免不了的。对诗琦的公司而言,每服务一家公司,即使是一个小体量的项目,每个月的推理花费就有数千美元。“这样的单项目成本,放到发展中国家,顶得上一个全职算法工程师的月薪”。
面临高昂的成本,诗琦坦诚地表示公司尚未实现盈利,但近期已有多家规模可观的公司与他们签订了服务合同,他们期望在一年后可以实现盈利。“至少付费是一个积极的信号。”诗琦说。
裁员、创业、回国,硅谷的三重奏
根据硅谷指数的统计,从2019年到2023年,硅谷和旧金山地区诞生了近3000家初创公司,达历史新高。在这其中,能看见不少华人CEO的名字。目前,4家华人创立的AI公司——Scale AI,Cognition AI,Imbue,和Cresta 已跻身独角兽行列,总估值超过180亿美元。
在硅谷,从来不缺创业暴富的神话,但在残酷的竞争下,创业也意味着风险。在秦天的朋友圈中,离开大厂去创业的中国籍工程师仍是少数,更多的人还是选择观望。
与此同时,尽管AI在资本市场上引发了新一轮热潮,但在过去两年里,硅谷却经历了持续的裁员潮。
在硅谷工作的Aria向《AI光年》作者透露,身边的许多中国同事受到了这股裁员潮的影响。据她介绍,被裁的工程师主要从事基础代码编写或debug等调试工作。显然,这是容易被AI取代的工种。
根据就业追踪机构Layoffs.fyi估计,自2022年初以来,已有超过400,000个科技工作岗位被裁减。另一个数据是,2022年到2023年间,美国科技公司的全球裁员总数超过了50万。这是自2008年金融危机以来,科技行业规模最大的一批裁员。
秦天也明显感到,2024年硅谷的就业机会比2019年时少很多。
去年底,美国通货膨胀率折合成年率一度低于3%,与2023年初的6%相比,几乎拦腰斩。硅谷就业分析公司CGC解释称,通货膨胀率回落之后,科技公司难再有涨价的空间,无法通过涨价来提升业绩,裁员控制支出就成为最直接的选择。
“一位被谷歌裁员的中国工程师曾来我们公司面试。”诗琦向《AI光年》作者表示,但他的公司最后没有聘用他。据秦天介绍,在硅谷,一名工作3年左右的AI算法研究工程师的平均年薪在45万美元左右,对很多初创公司来说,这是一笔不小的开支。
“裁员潮让很多有创业梦的中国人不敢行动。”秦天说。
另一方面,签证的严苛规定,也让他们缺少“选择自由”。根据美国的移民法规,在没有绿卡之前,持有OPT实习签证或H-1B工作签证的失业者,必须要在60天或90天内找到新的工作,否则就将面临被遣返回国的风险。
若创业失败,失业可能会使他们无法继续留在硅谷。Aria认为,如今不是AI创业的好时机,和许多中国AI公司面临的处境一样,在硅谷,“如何让AI产品实现好的商业化落地,依旧是个问题”。
大洋彼岸的中国,对AI的狂热似乎才刚刚达到高潮。前不久,世界人工智能大会刚刚在上海落幕。身在异乡,受限于工作精力,秦天较少关注国内AI产业发展的新动态,但他认为,国内学者在AI的算法研究上已经十分领先了。
在全球最大的开源大模型社区Hugging Face公布的世界开源模型排行榜上,多款来自中国的开源模型一度占据前列。
但短时间内,秦天没有归国发展的打算,他认为算力对于大模型的训练至关重要,而缺少先进算力始终是中国AI公司要解决的问题。
2022年8月,英伟达收到美国通知,要求其停止向中国出口A100和H100芯片。
今年7月17日,据彭博社报道,拜登政府正在考虑是否出台一项加强规定,该规定允许对使用任何美国制造技术的外国产品进行控制。它将针对日本的东京电子(Tokyo Electron)和阿斯麦(ASML)等公司的在华业务,这两家公司生产的芯片制造机械对该行业至关重要。
地缘政治的因素,让不少在硅谷的AI技术人才对归国后的就业发展,多了一团疑云。
“即使岗位竞争激烈,也不能放弃去硅谷。”斯坦福大学的硕士生赵鸣向作者感叹,不少在美的AI硕士生把留美作为第一选择。为此,很多学生都会在“luma”等活动平台上蹲守最新的行业交流活动。在他看来,通过社交找工作,是当下在硅谷最现实的捷径。
今年五月,亚布力论坛上,金沙江创业投资董事总经理、合伙人丁健曾表示,以前硅谷AI研究生70%以上能回国,现在几乎没有。
“即使无法确保获得绿卡,但有一段硅谷工作的经历,一定不是坏事情。”赵鸣说。
(赵鸣 秦天 张宇 诗琦 均为化名)
发表评论
2024-07-24 10:06:12
2024-07-24 10:06:12
2024-07-24 10:06:12
2024-07-24 10:06:12