首页 > 资讯 >

火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍

2023-04-18 15:56:11 来源:扬子晚报

AI大模型技术应用爆发,云市场也在加速变革。

4月18日,火山引擎在其举办的“原动力大会”上发布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,让大模型训练更稳更快。火山引擎总裁谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各行业的智能化升级。


(资料图片)

“国内有数十家做大模型的企业,大多已经在火山引擎云上”,谭待认为,大模型不会一家独大。与其他云厂商力推自家大模型不同的是,火山引擎将接入多家大模型深度合作,为企业和消费者提供更丰富的AI应用。

会上,火山引擎宣布与字节跳动国内业务并池。基于内外统一的云原生基础架构,抖音等业务的空闲计算资源可极速调度给火山引擎客户使用,离线业务资源分钟级调度10万核CPU,在线业务资源也可潮汐复用,弹性计算抢占式实例的价格最高可优惠80%以上。

让大模型训练快速跑起来

自2022年底发布以来,ChatGPT成为人类历史上最快获得上亿用户的消费级互联网应用。最新的GPT-4大模型,更是在法律、数学、生物学等多项测试中超过90%人类。

谭待表示,国内很多科技公司投入到大模型建设中,不少公司有优秀的技术团队,也有丰富的行业知识和创新想法,但往往缺乏经过大规模场景实践的系统工程能力。火山引擎要做的就是为大模型客户提供高稳定性和高性价比的AI基础设施。

据悉,火山引擎机器学习平台经过抖音等海量用户业务长期打磨,支持单任务万卡级别的超大规模分布式并行训练场景。GPU弹性计算实例可灵活调度资源,随用随取,最高可以为客户节省70%的算力成本。

字节跳动副总裁杨震原认为,业务创新需要试错,试错要大胆、敏捷,但试错也一定要控制成本。通过潮汐、混部等方式,火山引擎实现资源的高利用率和极低成本。以抖音推荐系统为例,工程师用15个月的样本训练某个模型,5小时就能完成训练,成本只有5000元。火爆全网的抖音“AI绘画”特效,从启动到上线只用一周多时间,模型由一名算法工程师完成训练。

字节跳动副总裁杨震原分享抖音的机器学习实践

MiniMax是目前国内少数已经推出自研大模型产品的AI技术公司,拥有文本、视觉、声音三种通用大模型引擎能力。据MiniMax联合创始人杨斌介绍,MiniMax与火山引擎合作建立了超大规模实验平台,实现千卡级常态化训练;超大规模推理平台有万卡级算力池,支撑单日过亿次调用。在火山引擎的云上,MiniMax大模型业务实现快速突破。

谭待透露,火山引擎的大模型云平台获得智谱AI、昆仑万维等众多企业的良好反馈。国内大模型领域,七成以上已是火山引擎客户。

向“多云多模型”架构演进

有评论称,大模型将成为云厂商弯道超车的机会。谭待对此表示,大模型还在发展初期,面临数据安全、内容安全、隐私保护、版权保护等许多问题需要努力解决。但可以预见,大模型将带动云上AI算力急剧增长,AI算力的工作负载与通用算力的差距会越来越小,这会为各家云厂商带来新的机会,同时也会对数据中心、软硬件栈、PaaS平台带来新的挑战。

以数据中心的算力结构为例,谭待表示:“大模型需要大算力,虚拟化会带来资源损耗,规模越大就损耗越多。未来3年内,大规模的算力中心,都将形成‘CPU+GPU+DPU’的混合算力结构,CPU负责通用计算,GPU负责AI计算,DPU负责资源卸载、加速和隔离,提升资源效率”。

此次原动力大会上,火山引擎发布了新一代自研DPU,实现计算、存储、网络的全组件卸载,释放更多资源给业务负载。火山引擎尽管是“最年轻”的云厂商,其自研DPU已达到业界领先水平,网络性能高达5000万pps转发能力、延迟低至20us。基于自研DPU的各类计算实例性能也有显著提升,例如适用于大模型分布式并行训练场景的GPU实例,相较上一代实例集群性能最高提升3倍以上。

自动驾驶公司毫末智行与火山引擎合作打造智算中心,为DriveGPT自动驾驶生成式预训练模型提供强大的算力支持。毫末智行CEO顾维灏介绍,DriveGPT使用量产车4000万公里的人驾数据训练,参数规模达1200亿,对自动驾驶认知决策模型进行持续优化。

谭待表示,在大模型及下游应用发展推动下,无论传统企业还是初创企业,对AI算力都有迫切需求,企业使用多家云服务将成为常态。同时,各行业有自己高质量的私有语料,大模型不会一家独大,而是会在千行百业生长,形成多模型共生甚至协作的生态。“未来将是‘多云多模型’的时代”,谭待称。

图:火山引擎总裁谭待宣布支持“多云多模型”的未来架构

火山引擎也顺势推出了分布式云原生平台、多云安全、多云CDN、veStack混合云平台等系列产品,支持客户更好地使用多家云服务。“字节跳动用过全球几乎每一朵公有云,以及大多数CDN,形成一套完整的分布式云管理体系和架构实践”,谭待坚信称火山引擎是最懂多云和分布式云的云服务商,这些技术能力都会毫无保留地提供给客户。

杨震原进一步表示,火山引擎对内对外提供统一的产品,抖音、今日头条等APP开屏都加上了“火山引擎提供计算服务”。杨震原说:“数字化时代,机器学习可以智能、高效地围绕目标解决问题。数字化的下一步是智能化,我们在机器学习方面的技术积累和经验,都会通过火山引擎提供给外部客户,帮助更多企业做好智能化”。

悦悦 晓风

校对 李海慧

上一篇:

《狂飙2》期待原班人马,张若昀、黄景瑜、徐冬冬也将重磅加盟?

下一篇:

最后一页

x
推荐阅读

火山引擎发布大模型训练云平台:支持万卡训练,集群性能提升3倍

《狂飙2》期待原班人马,张若昀、黄景瑜、徐冬冬也将重磅加盟?

环球快看:加拿大税务局称仍尽力避免大罢工 尚无延期报税计划

亿纬锂能(300014):新产能持续释放 新产品、新技术持续突破 今日讯

流产后要注意什么?_流产后要注意什么 流产后注意事项有什么-天天速读

1158万人!今年高校毕业生数量再创历史新高!找工作更难了...|热门

当前要闻:新冠抗体“保护期”快到了,需再接种疫苗吗?

讯息:1999 元!小米这大屏旗舰又要杀疯了

融资丨资管核心系统领跑者「赢和信息」完成B轮融资

捷尼赛思全球累计销量超90万,年内有望破百万 观天下

今日聚焦!地产销售还能“爬坡”吗?

【日运】十二星座2023年4月19日运势播报_全球视点

全球快消息!桑尼浅谈 | 固收+:普通投资者保值增值的首选

环球今日报丨2023年4月17日24时起国内成品油价格按机制上调

浆面条的酸浆怎么做_浆面条 全球快资讯

多家西媒:巴尔韦德或被禁赛4-12场,甚至缺席下赛季初的比赛

快手&微短剧,双向奔赴

苏丹武装部队宣布已重新控制苏丹国家电视台大楼并恢复广播 全球快播

23中国信科SCP001今日发布发行公告_天天热头条

『魈温』冷笑话什么的,魈魈不知道啊! 天天资讯

弹弹堂幸运神武器 弹弹堂幸运神

加快战略性新兴产业发展 河北省累计实施500多个高技术产业化项目|今日热文

人民网评:严处消极比赛,让“飓风”驱散篮球沙尘

每日快看:股指弱势上行 关注结构性机会

春假+“五一”,七天小长假去哪里?“Do都城”研学活动上新啦

专访安本中国区总经理:未来持续增配中国是确定性趋势

前沿热点:韩日时隔5年再度举行局长级“2+2”外交安保对话

世界要闻:【手慢无】 性价比太高!IAM空气净化器KJ500F-J3优惠价开抢

快播:楼市“弱复苏”:70大中城市房价3月继续反弹,但环比涨幅不大

广交会外贸“窗口”历久弥新,“中国智造”引外商蜂拥而至_天天新视野

【环球播资讯】首轮遭遇开门黑,却仍在搞副业,勇士下份大合同,注定与你无缘

余承东:和特斯拉相比,华为遥遥领先

焦点观察:龙虎山风景区门票优惠政策_龙虎山风景区

贝瑞基因(000710.SZ):控股股东高扬及其一致行动人拟转让所持3.8085%股份予黄麒玮 世界滚动

利用生物炭技术进行边际土地生态利用研究获进展 焦点日报

创纪录!全红婵害羞了 正式解锁5个满分动作 207C水花消失-环球即时看

环球即时看!本命年送什么礼物好男士

晚餐食谱大全简单方便_家常晚餐食谱 焦点短讯

即时焦点:建立网上"土地超市" 推进“标准地”改革

石家庄邮电职业技术学院优势专业有哪些-当前速递

重点聚焦!特效治疗药水配方哪买买不到 特效治疗药水配方哪买

南阳市公安机关反邪教警示教育进乡村主题活动正式启动 当前视点

【环球播资讯】欢乐颂5

第15届贵州茶产业博览会开幕 以茶会友共话茶事

中青报的调查显示,88.3%受访青年表示喜欢自由度高的工作,大家怎么看这个数据?-环球动态

中越边境云南河口药企实现中药材进口“零突破”_环球聚看点

这就是信心|旺——消费信心加速回归

丘栋荣一季度狂买美团,称港股长期吸引力是足够的,仍有系统性机会

全球微资讯!漫·议|火灾现场跳舞蹭流量,如此“玩火”过了头

c语言return 0_c语言return