×

谁能治好英伟达“依赖症”?

admin admin 发表于2024-05-05 07:33:38 浏览8 评论0

抢沙发发表评论

  文数科星球,作者丨苑晶,编辑丨大兔

  在 AI 圈,除了 OpenAI,就属英伟达(NVIDIA )最为知名。

  对于广大生成式 AI 企业而言,这家企业的重要性是毋庸置疑的。它为前者既提供着 GPU 硬件,又提供名为“CUDA”的并行计算平台和编程模型。

  一直以来,“转译”兼容英伟达 CUDA,成为了非生态开发人员的既有工作模式。这样做可以在不依赖硬件的前提下,享受到其 GPU 加速软件所带来的相关好处。

  但日前,这种“坐车不买票”的便宜被占到头了。

  在最新版本的 CUDA 里,英伟达开始禁止以转译模拟的方式兼容 CUDA。一些熟悉平台的开发者倍感头疼,但好处是,这项规定也客观推动着国产 GPU 行业的发展。

  我们有可能治好“英伟达依赖症”吗?

  三种挑战者

  极盛之后,便是多事之秋。

  就在最近,英伟达经历了股价暴跌 5.6% 的事件。据数据,其市值缩水 1300 亿美元,且创下美股单日市值暴跌最高纪录。似乎,美资本市场正在大幅撤资科技概念,这无疑为红得发紫的 AI 巨头们蒙上了一层阴影。

  对于英伟达而言,如今面对的,更是前有群狼、后有猛虎的格局。所以,业界产生了一种质疑:英伟达的生态壁垒,能否扛住此次对手的竞相分食。

  应该说,长期以来,CUDA 是成功的。“我认为,英伟达的生态壁垒仍旧稳固,在过去,Intel、AMD 等公司尝试打破格局,但都失败了”,一位问询者回答数科星球。

  技术上,其平台拥有面向 AI 和 HPC(高性能计算)的多种算法框架。另外,CUDA 还拥有一套编程工具和库,使得开发者能够使用如C、C++或 FORTRAN 等语言编写高效能的代码。

  用个游戏平台的例子横向比较下,CUDA 很像 Steam,而 Epic、Origin 等平台多年来未对 Steam 形成超越的原因,是前者内置的游戏多、玩家多。

  现在,CUDA 同样拥有天量开发者和软件配套。

  按照软件的通用逻辑,规模经济下,英伟达的优势很难被打破。但在新的竞争格局中,变革的速度显然正在加快。截至目前,至少有三种力量试图打破这一垄断:

  其一,是生成式 AI 公司发起的“革命”。逻辑是,现在,英伟达几乎挡了所有生成式 AI 公司的盈利之路。在此前披露的财报中,其全年营收达到了 600 多亿美元,同比增 126%,利润达到了近 300 亿美元,同比增长 581%。

  “我估摸,去年 OpenAI 应该有 18 亿美元的收入,整个生成式 AI 大概有 60-70 亿美元收入,英伟达一家涨这么多,不合理吧。”一位行业高管称。不合理之处在于,以 OpenAI 为首的企业已对“自己干活、英伟达赚钱”的模式颇为不满,并已纷纷投入到自研芯片的进程之中。

  其二,是来自华为等企业的挑战。在国内的 IDC 或智算中心的建设项目中,华为已借助强大的政企资源获得了数量可观的订单。这样的情况同样在摩尔线程、壁仞科技等企业中发生。

  在运算效率上,国产卡还赶不上 NVIDIA ,属“三块顶一块”的程度,成本也略高。但乐观者分析,当海量订单转化成规模优势,制造成本也将随之降低,届时,国产 GPU 芯片将复制国产电动汽车行业的成功。

  其三,是来自 Intel 和 AMD 的“怨念”。作为 CPU 行业的两大巨头,实际上,二者在 GPU 领域同样拥有顶尖产品。这些年,CPU 行业极其眼红 GPU 的发展,但却无处下嘴。在经历了长时间的“跟随式”竞争后,两个大厂已摩拳擦掌、准备趁虚而入。

  AIGC 还有时间说 No

  由此可见,英伟达对转译甚至反汇编的担忧不无道理。

  另外,业界预测,GPU 行业将很快迎来下一轮发展周期。一位技术专家对数科星球表示,今后的 GPU 行业极有可能快速进入到大并联时代。而届时,随着算力成本进一步降低,生成式 AI 的市场将更加广阔。

  新的产品,已在酝酿,而这块蛋糕,也是英伟达的必争之地。

  当下,英伟达想留住市场和用户,但它的竞争对手却不这么想。其实,从生成式 AI 的角度而言,开发者对 CUDA 的依赖是有可能扭转的。

  “我认为,本质上,CUDA 不是技术有多牛,而是开发者习惯了”,一个 AI 从业者回答。在他看来,在竞争对手中,都拥有类似 CUDA 的编码器。缺少的,只是开发者。

  我们曾在一篇文章中谈及此事。以往,开发者迁移这件事并非从未有人染指,就在去年,华为鸿蒙就曾以“刷屏”的方式,让国内主流互联网企业加入了其中。

  截至去年 9 月,鸿蒙版 App 就已逾 5000 款应用上线。

  “我认为,对软件开发者来说,这不是一个技术问题,而是利益分配的问题”,一名 ISV 开发者说。据他了解,诸如用友等公司在加入中国软件为主导的国产系统项目开发后,投入了巨大的成本重新开发应用。

  让厂商为此事买单的核心逻辑是,补贴到位、一切好谈。

  还有,生成式 AI 行业仍属早期。对比较为成熟的并行计算场景,对大多数企业而言,改弦易辙似乎还有时间。

  另外,对国有创新项目而言,技术自主化又是必须的。目前在数科星球所接触的企业中,就有相当多的公司面对国央企下发的海量订单。

  在以上因素的加持下,信创 CUDA 似乎是一件可以被期待的事情。

  国内 GPU 的机会

  英伟达为何如此成功?国内企业的反超机会在哪里?

  纵览这家公司的发展历史会发现,其先后赶上了区块链(挖矿)、自动驾驶和大模型几轮浪潮,市值超越 2 万亿美元。更为关键的是,它不仅是硬件生产商,也是一家软件企业。

  在破解英伟达软件护城河的方向上,业界给出了两种思路:即“直道赶超”和弯道超车。而前者要在底层编程上和它硬碰硬,后者的机遇则在推理型 AI 算力之中。

  “我们的看点是,哪家能依据自己的工具,培养出一批极其有活力的开发者”,亚杰基金合伙人谭茗洲对数科星球说。在这条道路上,国内的科学家要能利用国产软件进行诸如气象、电磁物理等科学实验。

  在 AI 推理领域,国内的机会在于提升卡与卡之间的通信效率。“原理上,只要通信带宽足够大,训练、推理就会非常快”,西安电子科技大学电子工程学院教授吴家骥回答。

  根本而言,提升单卡算力存在极限。其背后是单位密度的晶体管数量存在物理极限。而在“带宽派”的看法中,卡和卡之间的集群计算能力才是未来 GPU 行业竞争的关键,在这一点上 NVIDIA NVLink-C2C 中就可实现每秒 900GB 乃至更高的一致互联带宽。

  “我认为,硬件上,我们十分有信心实现追赶”,一位从业者说。这一点,在牺牲流片良率的麒麟 9000s 和牺牲机器尺寸的 EUV 光刻工厂的案例中均有体现。只是,难点仍然是软件生态。

  “形象的比喻是,你或许可以做出电脑,但没法做出操作系统”,吴教授补充说。在他的理解中,若国内在本轮算力中心建设浪潮中,未培养足够专注并行计算的人才,那么很有可能在未来的商业竞争中,该产业的发展仍处于受制于人的局面。

群贤毕至

访客