发布日期:2025-02-26 22:33 点击次数:90
上证报中国证券网讯(记者李兴彩)在DeepSeek App上线一个月之际,联想正式宣布,旗下大模型训推一体AI算力平台联想问天WA7780 G3、大模型推理AI算力平台联想问天WA7785a G3全新升级,单机即可部署DeepSeek-R1满血版大模型(具备671B参数)。联想表示,此次升级将大幅降低客户部署难度和成本,同时提升模型训练和推理性能,为DeepSeek等最新AI应用的落地和规模化发展提供强有力的支持。
当前,众多企业积极探索并部署DeepSeek-R1满血版大模型以期提升业务效能与竞争力。然而,在实际应用中,用户在本地接入时不可避免遇到算力基础设施匮乏、训练推理服务性能难以达标等一系列难题。针对该行业痛点,联想问天WA7780 G3、联想问天WA7785a G3与DeepSeek-R1满血版大模型特点进行了深度适配调优,单机即可部署DeepSeek-R1满血版大模型,助力企业高效完成本地化部署,加速客户智能化升级。
具体来看,联想问天WA7780 G3大模型训推一体服务器内嵌Transfomer Engine,支持FP8优化,可以帮助DeepSeek-R1满血版大模型获得更好的模型训练和推理性能;在显存方面,可提供超1T HBM3e,充分满足DeepSeek-R1满血版大模型FP8精度下不低于800GB显存容量的需求;显存带宽高达4.9TB/s,可以在推理解码阶段实现极致加速;在高速互联方面,GPU P2P通信带宽达900GB/s,同时单机提供3.2TB/s的高带宽低延迟网络扩展,能够为DeepSeek-R1满血版大模型提供极低的通信延迟。
联想问天 WA7780 G3大模型训推一体服务器
联想问天WA7785a G3服务器则聚焦于AI算力优化,该大模型推理AI算力平台原生支持FP8,提供超1.5T HBM3e,为DeepSeek-R1满血版大模型插上性能腾飞的翅膀。此外,联想正在加速推进DeepSeek 671B-R1和V3模型及一系列蒸馏模型与其AI服务器的适配。
联想问天 WA7785a G3服务器
据悉股票投资平台,联想正与DeepSeek在个人智能与企业智能两大领域开展更全面、深入的合作。其中,聚焦企业智能,联想中国基础设施业务与DeepSeek的深度融合,正快速实现从训练到推理的全链条产品适配。