Meta公布AI芯片细节 一文看清大型科技公司AI硬件布局

文章正文
发布时间:2023-05-21 22:50

K图 META_0

  Meta已经制造定制的计算机芯片,帮助其完成人工智能和视频处理任务,并首次在公开场合谈论这些芯片的细节。

  本周早些时候,这家社交网络巨头首次披露其内部硅芯片项目,并在周四举行一场讨论其人工智能技术基础设施投资的活动。

  投资者一直在密切关注Meta在人工智能和相关数据中心硬件方面的投资,该公司开始“效率之年”,其中包括至少2.1万人裁员和大幅削减成本。

  虽然设计和制造自己的计算机芯片过于昂贵,但Meta基础设施副总裁亚历克西斯·比约表示,Meta认为性能的提高将证明该项投资是合理的。该公司还一直在对其数据中心的设计进行全面改革,更多地关注液体冷却等节能技术,以减少多余的热量。

  通过一种新型计算机芯片,Meta可扩展视频处理器,或MSVP,该处理器用于处理和传输视频给用户,同时减少能源需求。比约说,“没有任何商业上可用的硬件”可以符合Meta的需求,即高效地处理和传输每天40亿个视频的任务。

  Meta还研发另一个处理器,也是该公司训练和推理加速器(Meta Training and Inference Accelerator,简称MTIA)中的第一个处理器。这一芯片系列旨在帮助完成各种人工智能领域的任务。新的MTIA芯片专门处理“推理”功能,即让已经训练好的人工智能模型做出预测或采取行动的功能。

  比约表示,新的人工智能推理芯片有助于优化Meta一些推荐算法,这些算法用于在人们的新闻源中显示内容和广告。她说,Meta为其人工智能芯片家族制定“多代路线图”,其中包括用于训练人工智能模型的处理器,但她拒绝提供新的推理芯片以外的细节。

  比约还指出,由于Meta并不像谷歌母公司Alphabet或微软(Microsoft)等公司那样销售云计算服务,因此该公司并不觉得有必要公开谈论其内部数据中心芯片项目。

  她说:“如果你看看我们正在分享的东西——我们开发的前两款芯片——它肯定会让你对我们内部正在做的事情有一点了解。”“我们不必为此做广告,我们也不需要为此做广告,但你知道,全世界都感兴趣。”

  Meta工程副总裁阿帕纳·拉马尼表示,该公司的新硬件是为与其PyTorch软件有效配合而开发的,PyTorch软件已成为第三方开发人员创建人工智能应用程序时最受欢迎的工具之一。

  新硬件最终将用于支持与虚拟现实增强现实相关的任务,以及新兴的生成式人工智能领域,生成式人工智能通常指的是能够创建文本、图像和视频的人工智能软件。

  拉马尼还表示,Meta已经为公司的开发人员开发一款生成式人工智能编码助手,帮助他们更轻松地创建和操作软件。这款新助手类似于微软在人工智能初创公司OpenAI的帮助下于2021年发布的GitHub Copilot工具。

  此外,Meta表示,它已经完成了名为“研究超级集群”(Research SuperCluster,简称RSC)的超级计算机第二阶段,该公司去年详细介绍这一项目。Meta使用这台包含16000个英伟达A100 gpu的超级计算机来训练该公司的LLaMA语言模型,以及其他用途。

  拉马尼表示,Meta将继续按照自己的信念行事,即为开源技术和人工智能研究做出贡献,推动技术领域的发展。该公司透露,其最大的LLaMA语言模型LLaMA 65B包含650亿个参数,并在1.4万亿个token上进行了训练,token指的是用于人工智能训练的数据。

  实际上,随着生成式AI热潮出现,科技巨头都在硬件领域有所布局。谷歌母公司Alphabet此前公布一款人工智能超级计算机的细节,称其比竞争对手英伟达(Nvidia)的芯片更快、更高效。

  不过,谷歌的研究人员表示,谷歌的TPU结果没有与英伟达最新的人工智能芯片H100进行比较,因为它是最新的,采用了更先进的制造技术。此前英伟达曾指出,其最近的全行业人工智能芯片测试结果显示,旗舰H100芯片底层的Hopper计算架构与A100相比有了显著改进。

  另一方面,微软则与英伟达进行多年合作,构建世界上最强大的AI超级计算机之一。英伟达首席执行官黄仁勋表示,英伟达最新的芯片H100的测试结果明显快于上一代芯片。

  黄仁勋在一篇博客文章中写道:“Hopper提供了比A100高出4倍的性能。”“生成式人工智能的下一个层次需要新的人工智能基础设施来训练具有高能源效率的大型语言模型。”英伟达最近表示,H100芯片已经全面投产,并推出了一项云服务,允许企业租用由这些芯片驱动的人工智能计算能力。