您当前的位置:首页 >> 传感器
传感器

为迎接超大模型时代,Meta 想要打造“当今世界最快 AI 超算”

发布时间:2025-09-24

期的公司的超算坦克部队难以跟上未来会大静态培训的能够,决定“重新驶向”,转用最顶尖的 GPU 和统计数据传输因特网关键技术,承接一个以外重新坦克部队。

这台重新超算,能够都能在大小以 EB(有约10亿GB)为其他部门的统计数据集上,培训具有有约万亿轸生产量的超大神经因特网静态。

(例如,底下面国科研政府部门智源 BAAI 开发的“悟道”,以及Skype去年用 Switch Transformer 关键技术培训的混搭专家管理系统静态,都是轸生产量达到万亿分级的大静态;相比来看,此当年在业界相当著名的 OpenAI GPT-3 语言静态,性能和泛用性仍未相当更让人惊讶,轸生产量为1750亿左右。)

Meta 开发团队选择了三家在 AI 测算和统计数据底下面心模组多方面最著名的的公司:英伟达、Penguin Computing,和 Pure Storage。

只不过一致来说,Meta 反之亦然从英伟达订货了760台 DGX 统一标准培训管理系统。这些管理系统包涵共计6080块 Ampere 涡轮程式 Tesla A100 Tensor 框架 GPU,在初期,乃至以当年,都是最顶级的 AI 培训、直觉、管理系统性三合一管理系统。底下面间的因特网通信则转用了英伟达 InfiniBand,统计数据传输更快将近200GB每秒。

存储器多方面,Meta 从 Pure Storage 订货了共计 231PB 的闪存模组、系统设计程序和缓存容量;而所有的座机架木料、装置安装和统计数据底下面心的后续管理社会活动,则由从 Facebook 以当年就在一站式该的公司的 Penguin Computing 都由。

这样筹组出来的新超算坦克部队,Meta 将其年初命名为 AI RSC:

图底下面显示的是 RSC 第一阶段(P1)的轸数技术细节。截图缺少:Meta

相对来说于之当年 FAIR 转用 V100 DirectX木料的测算坦克部队,穿越时空 RSC 对于产出分级的测算座机图像类插值带来了20倍的性能进一步提高,接入英伟达多卡通信开放性的更快进一步提高了有约9倍,对于大规模语义处理类 workflow 的培训更快也进一步提高了3倍——节约的培训时间以则有其他部门。

毫无疑问道一提的是,在 Meta 刚做 RSC 更新方案的时候,新冠流感马上大作了。所有单一新建的工期都察觉到了极大的不确定性,RSC 能否成功更新换代,遮盖了一个巨大的问道号。

然而,的公司业务发展和 AI 科研的能够,很难赶紧新冠流感。都由 RSC 更新和新建的开发团队,以及还包括英伟达、Penguin Computing、Pure Storage 等三家硅谷的公司在内的关键技术合作方,只好在极大的工期心理压力下,完成统计数据底下面心的装修建设项目、装置的产出和运输、现场装座机、布线、自动转化成等一系列相当繁琐和关键技术决定极佳的社会活动。

更是滑稽的是由于初期以外美各地都有在家隔离令,整个 RSC 工程建设项目开发团队的多位都由人,都只好在家底下面远程社会活动……开发团队底下的研究课题员 Shubho Sengupta 问道到,“最让我更让人羡慕的是,我们在只不过远程办公的条件下完成了(RSC 的更新社会活动)。显然工程建设项目的简单性,只不过没有人和其它开发团队成员见面就能把这些事都办了,简直太惊奇了”

就现有来看,RSC 仍未是世界上接入更快平均更快的 AI 微控制器之一了。

但是 Meta 仍不意味着。

承接当今世界平均更快、最当年提的 AI 超算

为了意味着 Meta 在产出环境和 AI 研究课题这两大多方面日益增长的算力需求,RSC 能够持续更新拟于。

按照 Meta 的 RSC 第二阶段(P2)方案,到今年7月初,也即半年之内,整个测算坦克部队的 A100 GPU 总人数进一步提高到当年所未见的1.6万块……

穿越时空 RSC 转用的 DGX A100 单座机生产量是760台,折合6,080张DirectX——这样测算的话,也就是说 RSC 将在 P2 于是又缩减9,920张DirectX,即 Meta 能够于是又从英伟达订货1,240台 DGX A100 微控制器……

就连英伟达也问道到,Meta 的方案,将让 RSC 踏入英伟达 DGX A100 截至现有第二大的客户部署坦克部队,没有人之一。

算力进一步提高了,其它配套设施,还包括存储器和因特网,也要跟上。

按照 Meta 的原计划,RSC 的 P2 完成后,其统计数据存储器总量将达到1 EB——折合有约10亿 GB。

不数如此,整个超算坦克部队的单个端口之间的通信增益也获得了史无当年例般的进一步提高,达到当年所未见的16TB/s,并且付诸一比一过载(也即每个 DGX A100 测算端口也就是说一个因特网接口,不注意到多端口共享接口争抢增益资源的持续性)

(这底下还有个点毫无疑问道实质上提一下:按照 Meta 开发团队的有约,像 RSC 这样转用 DGX A100 端口筹组超算坦克部队的做法,都能反对的端口上限也就是1.6万了,于是又多就会注意到过载,意味着追加投资者的极大转化成获利值得注意增大。)

在统计数据当年提的角度,Meta 这次也没有人忘了在官方网站底下面专门介绍其统计系统设计软件方式则,以求令公众急切。

“无论是监测有毒具体内容,还是创造重新增强现单一验——为了承接重新 AI 静态,我们则会用到来自的公司产出管理系统,取自想像的统计数据,”Meta 问道到,这也是为什么RSC 从设计之初就加入了统计数据隐私和统计数据当年提多方面的考虑。只有这样,Meta 的研究课题院才都能当年提地采用密码、留言板转化成后的想像统计数据来培训静态。

1)RSC 被设计为很难和真正的互联网反之亦然连结,而是和位处 RSC 设在附近的一座 Meta 统计数据底下面心来进行连结;

2)当 Meta 的研究课题执法人员向 RSC 的一站式器导入统计数据的时候,这些统计数据首先要通过边上隐私审查管理系统,证实统计数据仍未来进行了留言板转化成;

3)在统计数据年初投入到 AI 静态插值的培训之当年,统计数据也会于是又次来进行密码,并且密码是周期性生成和抛弃的,这样即使有旧的培训统计数据存储器,也很难被出访;

4)统计数据只会在培训管理系统的内存底下面解密,这样即使有恰巧闯进 RSC,对一站式器来进行力学出访,也很难破解统计数据。

或许是出于保密的目的,Meta 甚至连 RSC 的只不过一致设在都没有人声称……

不过根据已知的持续性,RSC 的附近必定一座 Facebook/Meta 统计数据底下面心存在。并且,图表方式则在自 RSC 的核定视频,图底下面我们可以看不到,AI RSC 位处右上,右边则是 Meta 的一座统计数据底下面心。图底下面展现出大量较高的树木。

硅星人原则上可以确定,上图底下面的 Meta 统计数据底下面心位处新泽西州宾夕法尼亚州 Henrico 县。该县是新泽西州北部第二大的统计数据底下面心集底下面地,也是连结欧洲、南美、东南亚地区、南非的多条暗礁光缆在新泽西州的末端设在。至于 RSC 的实际设在,其原称某种程度是 QTS Richmond 统计数据底下面心。

右方为 Meta 统计数据底下面心,左边为 QTS Richmond 也即 Meta AI RSC 设在截自 Google Maps

之后,让我们来看看开销……

不考虑同样颇为昂贵的存储器和因特网配套,我们就先只看测算的以外:

每台 DGX A100 的标准售价为19.9万美元,Meta 大宗订货无疑有购买者,但假设没有人购买者的话:RSC 这次 P2 的拟于开销,数DirectX订货的以外,就将近2.5亿美元……)

当然,按照以当年的 Meta 市值来看,这笔费用简直是九牛一毛。假若真的承接出以外世界第二大不下于平均更快的 AI 超算,对于这家的公司的业务,无论是其从当年的框架业务,还是未来会的元地球人产品,原计划都都能带来相当大的希望。

Meta 是这么说的:“最终,我们在 RSC 后面的努力,将都能为作为下一个关键测算平台的元地球人铺就路段。原计划,AI 涡轮的系统设计和产品将会担纲举足轻重的剧情。”

注:题图来自于 Meta,版权属于原著者。如果不同意采用,请尽速建立联系我们,我们会立即删除。

本文来自微信公众号“硅星人”(ID:guixingren123),著者:星体 杜晨,编辑:Vicky Xiao,36氪经授权披露。

心脑血管外科
小儿神经内科
新冠风险在上升,为了健康,五一提前做好这些事儿!
假期第一天确诊新冠,谁有我心酸?
端午新冠病例持续增多!新冠已不再发烧,有这5个症状要注意

上一篇: 9只小金毛一天被主人买了大半,只剩最后一只时,主人顿时懊

下一篇: 6缸SUV最廉价不到30万 自主豪华任君选 50万全搞定

友情链接