首页 探索 100%稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理

100%稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理

快科技5月29日消息,摩尔线程与国内领先的数据智能服务商滴普科技共同宣布,摩尔线程“夸娥”(KUAE)千卡智算集群与滴普企业大模型Deepexi v1.0已完成训练、推理适配,获得…

快科技5月29日消息,摩尔线程与国内领先的数据智能服务商滴普科技共同宣布,摩尔线程“夸娥”(KUAE)千卡智算集群与滴普企业大模型Deepexi v1.0已完成训练、推理适配,获得产品兼容互认证明。

基于摩尔线程夸娥千卡智算集群,滴普科技成功完成了LLaMA2 700亿参数大语言模型的预训练测试。

训练时长共计77小时,全程无故障连续运行,集群训练稳定性达到100%,训练效率和兼容性均达到预期。

有趣的是,兼容互认证明的发证时间是2023年9月28日,也就是相关适配工作早就完成了,如今才公开。

100%稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理插图

北京滴普科技有限公司成立于2018年,定位于数据智能服务商,为客户提供数据智能基础设施、企业大模型产品,以及数据智能创新服务。

目前,滴普科技已与中国海诚、中核装备院、百丽时尚等企业开展产业落地实践,成为产业大模型落地的领先企业。

滴普科技的Deepexi企业大模型,在语义、视觉、语音、跨模态等方面表现优越,可运用模型工具链,为企业提供高质量的数据准备、模型训练、调优、部署及推理服务,快速构建不同领域的模型、智能体应用。

100%稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理插图1

摩尔线程夸娥方案是业内首个跑通、跑完国产大模型的千卡集群,基于全功能MTTS4000GPU,提供软硬一体化的全栈解决方案,具备模型覆盖、推理加速、CUDA兼容、断点续训、分布式训练、集群可靠性等8大核心能力。

在此之前,摩尔线程已经第一家接入无问芯穹,夸娥千卡集群先后适配无穹Infini-AI大模型开发与服务平台、完成LLama2 700亿参数大模型训练测试、完成MT-infini-3B 3B(30亿参数)规模大模型实训。

憨猴集团也基于摩尔线程的夸娥千卡智算集群,成功完成了7B、34B、70B不同参数量级的大模型分布式训练,效率、精度、稳定性都相当完美。

100%稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理插图2

【本文结束】如需转载请务必注明出处:快科技

责任编辑:上方文Q

本文来自网络,不代表点评灵立场。转载请注明出处: https://www.dp0.com/tech/tansuo/83502.html
上一篇
下一篇

作者: 主编Tom

为您推荐

联系我们

联系我们

13671985997

在线咨询: QQ交谈

邮箱: 6702331@qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部