×

AI程序员Devin:通过了面试,但不一定适合职场

admin admin 发表于2024-05-05 07:44:34 浏览12 评论0

抢沙发发表评论

  文|甲子光年,作者|刘杨楠,编辑|栗子

  昨天,AI 圈上演了第一场“大男主爽文”:

  一个少年成名的编程天才,组建起仅有 10 人的编程界奥林匹克“梦之队”,在全球瞩目的科技风暴正中心创办了一家公司。成立不到两个月,其推出的第一款产品还未正式上线就火爆全球,并获得硅谷风投大佬上千万美金投资。

  故事的主角,就是美国人工智能初创公司 Cognition AI 和它的 CEO Scott Wu。

  3 月 13 日,Cognition AI 在 X 上推出了全球首个 AI 软件工程师 Devin。

  Devin 是一个自主代理(Autonomous Agent),掌握全栈技能,能自主学习不熟悉的技术,端到端地构建和部署应用程序,自己改 bug,甚至还能训练和微调自己的 AI 模型。

  Cognition AI 只是在社交媒体上发布了一段演示 Demo,就引来了全球码农们的高度关注。因为 Devin 真的颠覆了人们对开发工具的认知。

  其中,最惊艳的能力是,用户只需在 Devin 界面输入一句指令,它就能端到端处理整个开发项目。

  在 SWE-bench 基准测试中,它无需人类帮助,可解决13. 86%的问题。相比之下,GPT-4 只能处理 1.74% 的问题,且都需要人类提示告知处理哪些文件

  据介绍,Devin 已经成功通过一家 AI 公司的面试,并在 Upwork 上完成了实际工作。一位网友在和 Devin“交手”27 分钟后,评论道:“AI Agent 的时代已经开始。”

  Devin 的出现让一众程序员在深度兴奋、恐慌中开始好奇:是谁创造了 Devin?它真的能够取代程序员吗?

  编程界的奥林匹克“梦之队”

  Devin 背后的公司 Cognition AI 十分神秘,据彭博社报道,这家公司 2 个月前才正式成立。就连X上的官方账号都是今年 1 月注册使用。

  Cognition AI 的长期目标是通过解决推理问题,在广泛的学科领域解锁新的可能性,而“代码仅仅是开始”。公司致力于推动 AI 技术的发展,并通过其产品改变人类与软件的互动方式。

  据「甲子光年」了解,Cognition AI 的核心创始团队由 3 人组成,分别是 Scott Wu、Steven Hao 和 Walden Yan。从 3 人的名字就不难看出,他们都是华人。

  正如他们的公司一般低调,这三位创始人的履历也都十分神秘,并未有过多披露。「甲子光年」仅在网上找到了少量信息。

  出任 Cognition AI公司CEO的是 Scott Wu,年仅 27 岁。他的亲兄弟 Neal Wu 也在这家公司工作。从上中学开始,Scott Wu 就展露出自己在数学方面的天赋,开始参加数学竞赛。

  后来,在亲兄弟 Neal Wu 的影响下,Scott Wu 逐渐迷恋上了竞争性编程。二人均成为了竞争性编程领域的传奇人物。兄弟俩从青少年时期就是国际编程比赛的“常胜”选手。

  Scott Wu 曾在 2014 年举办的 IOI(国际奥林匹克信息学竞赛)上以满分的成绩获得第一名。

  自小展露的编程天赋,不仅让 Scott Wu 在学习和竞赛上取得了傲人的成绩,还让他在商业上也领先于同龄人。

  事实上,Cognition AI 并不是 Scott Wu 参与创办的第一家公司。近期,社交媒体上有人公开了一份 Scott Wu 四年前的一篇博客。根据博客中的描述,4 年前 Scott Wu 曾是 LunchClub 的联合创始人及 CTO。

  在上次创业中,Scott 就展现出了过人的技术能力和商业头脑。Lunchclub是一个以人工智能和机器学习内容为主的美国社交平台,曾获 a16z 400 万美元的种子轮融资,用于在线下连接专业人士。2020 年,Lunchclub 筹集了由 Coatue 和 Lightspeed Venture Partners 领投的 2400 万美元A轮融资,估值超过 1 亿美元。

  Cognition AICTO由 Steven Hao 担任。Steven 毕业于麻省理工学院,此前是 Scale AI 的资深工程师,专注 AI 系统研发。在 Scale AI 之前,Steven 曾在 Jane Street、DE Shaw 和 Quora 工作过。

  与 Scott Wu 一样,Steven Hao 也同样是 IOI 金牌的获得者,并且还获得过 Codeforces 和 ACM-ICPC 等编程竞赛的最高荣誉。他的个人项目包括协作填字游戏网站 Down For A Cross 以及集合的网络实现。

  而 Walden Yan 则是 Cognition AI的首席产品官。据悉,为了创办 Cognition AI,Walden Yan 不惜背着父母从哈佛辍学。对此,Walden 本人回应道:“离开学校创办 Cognition 是我做过最简单的决定。”

  作为一家刚刚成立不到 3 个月的初创公司,Cognition AI 甚至没有一间固定的办公室,团队仅有的 10 名员工分布在硅谷的 Airbnb 和纽约的家庭办公室。

  但正是这样一个连办公室都没有的 10 人小团队,却打造出了让世人瞠目结舌的 AI 开发者 Devin,可见这支小团队的强大实力。除了三位核心创始成员之外,团队其他成员曾在 Cursor、Scale AI、Lunchclub、Modal、Google DeepMind、Waymo、Nuro 等多家知名公司任职。

  值得一提的是,这个 10 人的团队共获得过 10 枚 IOI 金牌,平均人手一块,足见他们在编程和技术方面的能力。

  Scott Wu 表示,这样的团队背景正是 Cognition AI 的优势。

  “教人工智能成为一名程序员是一个非常深入的算法问题,需要系统做出复杂的决策,并展望未来的几步,以决定应该选择什么路线,”Scott Wu 说, “这几乎就像我们多年来一直在脑海中玩的游戏,现在有机会将其编码到人工智能系统中。”

  目前,Scott Wu 并未对媒体透露太多 Devin 的技术细节,只是透露团队找到了将 LLM 与强化学习相结合的独特方法。“这非常依赖于模型和方法,以及如何让事情恰到好处地协调一致。”

  彼得·蒂尔力挺 Cognition AI

  就是这样一支没有固定办公室、但个个都是技术大神的精干团队,吸引到了美国顶级大佬的注意。

  公开资料显示,此前,Cognition AI已经获得了彼得·蒂尔的 Founders Fund 基金领投的 2100 万美元A轮融资。另外根据彭博社记者报道,前 Twitter 高管 Elad Gil 也参与了对 Cognition AI 的投资。

  放眼美国乃至全球的创投市场,彼得·蒂尔都称得上是绝对的传奇。他曾是国际知名支付工具 PayPal 创始人,如今是美国硅谷著名投资人,以投资眼光毒辣著称,被硅谷誉为“大佬背后的大佬”。

  投资圈一句经典名言——“竞争是留给输家的。如果你想创造和获取持久的价值,那就建立一个垄断企业。”正是出自彼得·蒂尔之口。

  在转型职业投资人前,彼得·蒂尔就曾是一位极具传奇色彩的创业者。

  2002 年,彼得·蒂尔以 15 亿美元的价格将其创办的 PayPal 卖给 eBay,个人净赚 5500 万美元。此后,PayPal 核心员工陆续离职创业,打造出当今硅谷一大批企业翘楚,这些人也因此被誉为硅谷“PayPal 黑帮”。

  其中,二号人物埃隆·马斯克(Elon Musk)后来创立了特斯拉,以及美国太空探索技术公司 SpaceX;前执行副总裁雷德·霍夫曼(Reid Hoffman)创立职场社交媒体领英(LinkedIn);联合创始人马克斯·列夫琴(Max Levchin)创办了社交游戏公司 Slide,之后以 1.82 亿美元的价格卖给谷歌;杰里米·斯多普尔曼(Jeremy Stoppelman)创立美国最大的点评网站 Yelp;技术人员查德·赫利(Chad Hurley)和陈士骏(Steve Chen)合伙创办 YouTube。

  “PayPal 黑帮”成员创立的企业中,有 7 家市值超过 10 亿美元。

  离开 PayPal 之后,彼得·蒂尔在 2005 年投资 5000 万美元创办 Founders Fund(创始人基金)风险投资公司,专门投资那些最具技术领先性的前沿科技项目,布局领域包括航空航天、人工智能、高级计算、能源、健康和消费互联网等。

  据说,彼得·蒂尔之所以给这家投资公司起名 Founders Fund,是因为他认为,对于一家创业公司而言,它的成功与失败都取决于创始人。所以他干脆把公司名字起名为创始人基金,并且对于每个投资项目,也都秉承“援助不干涉的原则”,让创始人掌握自己的命运。

  不难发现,彼得·蒂尔的做事风格颇为特立独行。这种个性甚至体现在公司选址上。作为一家科技投资公司,Founders Fund 并没有选择大多科技风投扎堆的硅谷沙丘路,而是把公司开在了沙丘路北 35 英里的金门大桥边。

  当然,在投资方面彼得·蒂尔也是“不走寻常路”。2011 年,Founders Fund 曾公开表达欢迎异想天开的创意,同时也嘲讽了推特(现为“X”)的投资者:“我们想要会飞的汽车,而不是 140 个字符。”

  正是对于创始人改变科技、科技改变世界的偏执追求,让 Founders Fund 在早期投到了不少明星项目,其中 Facebook、Spotify、Palantir、SpaceX、Airbnb、Lyft 和 Wish 等,如今都是各自领域的巨头公司,为 Founders Fund 带来了可观的回报。

  而在 AI 领域,彼得·蒂尔的投资眼光更是毒辣。

  尽管 Founders Fund 在人工智能领域投出的项目并不多,但每一家都在 AI 界有着不可撼动的地位。

  例如 8 年前推出 AlphaGo,在全球点燃深度学习浪潮的 DeepMind;2022 年底推出 ChatGPT,引爆当前大模型浪潮的 OpenAI;以及将数据标注行业从“劳动密集”转为“技术密集”的 Scale AI。

  这些如今正在书写全球 AI 技术发展的顶级公司,背后都有 Founders Fund 的名字。

  彼得·蒂尔分外钟情那些技术偏执狂——例如马斯克、扎克伯格、哈萨比斯、奥特曼。而 Cognition AI CEO Scott Wu 也不例外。

  所以不难判断,被 Founders Fund 认可的 Cognition AI,其未来发展也必将不可限量。

  对于最新投出的 Cognition AI,彼得·蒂尔也给予高度评价,认为这家公司会成为下一个人工智能领域的超级公司,未来必将与 OpenAI、DeepMind 和 Scale AI 齐名。

  距离代替程序员还有3-5 年?

  被硅谷顶级投资大佬看中,2 个月前刚刚成立公司,做出全球首个 AI 程序员 Devin,尽管还没正式对外上线,但已吸引了全球科技圈的围观。

  Scott Wu 和他 10 人小团队的经历,颇有爽文男主的意味。

  连贯、稳定的推理能力是 Devin 最让人兴奋,也最令人“恐慌”的地方。

  Devin 在许多方面似乎确实远远领先于其他编码助理。用户只需给 Devin 发送一条指令,它就能够自动启动并完成这些工作。当 Devin 工作时,它会告诉用户它的工作计划,并显示它正在使用的命令和代码。

  在 Devin 完成任务的过程中,用户可以提示其解决相应问题,它会在中途整合反馈。目前,大多数人工智能系统在类似的长时间工作中都很难保持连贯性并专注于任务,但 Devin 能够在不偏离轨道的情况下完成数百甚至数千个任务。

  计算机科学家塞拉斯·阿尔贝蒂(Silas Alberti)也尝试过 Devin,并表示这项技术是一次飞跃。据他描述,这不像是助理编写代码,而更像是真正的工人在做自己的事情。

  “这感觉非常不同,因为它是一个可以为你做事的自治系统,”阿尔贝蒂表示,Devin 擅长项目原型设计、修复错误以及以图形形式显示复杂数据。“其他助手在四五步后就脱轨了,但 Devin 几乎毫不费力地完成整套工作流程。”

  「甲子光年」就 Devin 的横空出世访谈了多位国内技术从业者。国内部分从业者认为,尽管 Devin 看似“遥遥领先”,但依然要理性看待 Devin。

  始智 AI wisemodel 创始人兼 CEO、清华校友总会 AI 大数据专委会副秘书长刘道全刘道全表示:“此前 Wisemodel 社区里讨论认为,代码是大模型最明确的应用方向之一,因此我们 Devin 的出现并不意外,这是迟早的事。”

  “很多 AI 产品都是问世之前吹得非常厉害,但上线后感觉也就那样。现在 Devin 的演示视频看似能解决很多东西,但真正大规模应用是有局限的。首先是使用成本高;其次,目前来看,程序员的极限就是 AI 的极限。AI 写出来的代码程序员看不懂,那也没有意义。”某 AI 初创公司工程主管告诉「甲子光年」。

  从实际落地应用来看,一位云测试/AI 数据标注公司 CTO 坦言:“在企业里做开发,真正写代码的时间可能只占 20%,大部分时间都在理解、沟通客户需求,设计方案、查资料。因此,或许还需要3-5 年时间,Devin 之类的 AI 程序员才能够替代人类开发者的初级工作。”

  对此,刘道全也表达了相似的观点:“Devin 在完成很明确的任务上有优势,但谁来分配任务,以及在整体系统开发过程中,往往在具体的开发任务不是最难的,而是怎么把系统的整体架构搭起来,组成一个完整的系统更加关键。”

  不过,在 Cognition AI 的介绍中,用 AI 写代码只是一个开始,“推理”才是 Cognition AI 真正的野心。

  或许 Cognition AI 接下来在推理方面的后续成果更值得期待。

群贤毕至

访客