京东云推出vGPU池化方案，可令“大模型推理大幅降本”

来源：IT之家发布时间：2023-08-16 11:44:11 阅读量：6225

，据京东云官方公众号报道，京东云日前推出 vGPU 池化方案，官方表示，“该方案可提供一站式 GPU 算力池化能力，令 GPU 利用率最高提升 70%，大幅降低大模型推理成本”。

图源京东云官方公众号

京东云表示，凭借其“自主研发的混合多云操作系统云舰”，京东云在原有支持混合多云 CPU 算力池化能力基础上，针对大模型训练所需的泛算力池化能力，进一步增加了针对 AI 应用所需的调度管理能力，包括卡管理、节点管理、异构资源调度管理等，为包括大模型训练在内的多种 AI 应用，提供一站式算力池化解决方案，从而全面提升资源利用率。

京东云同时称，自家池化方案具有四大优势，IT之家转录相关内容如下:

算力切分灵活:支持任意比例切分和动态调整机制，可实现按显卡算力、显存做细粒度切分，一张物理卡可供多个容器使用，与整卡算力相比，性能衰减在 2% 以内。
精细化配额管理:支持灵活的配额管理，按显卡型号 / label 配额，有效保障资源按需分配，提升推理稳定性和训练性能。
多场景适配:适配主流 CUDA 版本和不同 GPU 芯片适配，支持 TensorFlows、Pytorch 等行业主流的 AI 训练框架。
多节点管理:支持节点虚拟分组和节点组指定应用使用，全面提升大模型训练效率。

京东云表示，在使用场景中，开发者可以根据卡型号申请资源，按算力和显存切分，统一由控制器根据用户指定的调度策略调整。仅在训练、微调和推理任务启动时进行动态分配，在任务结束即可以释放，支持多任务算力隔离和任务冷启动。

从实践效果看，通过 GPU 异构资源池化，AI 运行效率显著提高，整体 GPU 利用率提升 70%。结合任意切分和按需分配，在同等 GPU 数量的前提下，实现了数倍业务量扩展和资源共享，降低了硬件采购成本，使用更少的 AI 芯片支撑了更多的训练和推理任务。

广告声明:文内含有的对外跳转链接，用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多企业信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险，需谨慎。

分享到： QQ空间新浪微博腾讯微博人人网微信

上一篇：台积电德国建厂依然无法完全消除欧洲汽车厂商芯片短缺

下一篇：返回列表

为你推荐

: 火速护盘！当天制定回购方案，当天下场买股！上市公司真金白银看好后市

4月25日，不少上市公司在下跌中果断实施回购。25日晚间，恒瑞医药、建霖家居、劲嘉股份等公司纷纷公告在盘中实施了回购；威...更多
2022-04-26 01:11:00

: 人弃我取时间已到！券商首席一致看多，A股迎接反攻时刻？

4月25日，上证指数重挫逾5%，失守3000点，创下2020年7月以来新低。盘后，券商中国记者采访了多位券商策略、宏观分...更多
2022-04-26 01:11:00

: 实实在在赚钱了！2021年收入增34%，这家公司要冲击“纯SaaS业务模

4月25日，新三板挂牌公司和创科技晒出了2021年“成绩单”，2021年实现收入1.45亿元，同比增长34%；经营现金流...更多
2022-04-26 01:00:00

: 高玩不买单了水冷头一哥EKWB裁员1/4：业绩持续暴跌

虽然AIO一体式水冷很方便，但分体式水冷依然是目前散热最好、效果最炫的方案，只不过价格很贵，只有高玩才会折腾。然而这个高...更多
2022-04-26 00:38:00

: IEEE发布首个供应链金融区块链国际标准蚂蚁集团牵头制定

，IEEE计算机协会区块链和分布式记账标准委员会召开全体会议，《基于区块链的供应链金融标准》正式发布。这是IEEE发布的...更多
2022-04-26 00:37:00

: 外媒预计在建设P3晶圆厂后三星电子还将在平泽建设P4晶圆厂

，据国外媒体报道，此前有报道称，三星电子2020年年中开始在韩国平泽建设的P3晶圆厂，将在下月开始设备的安装，设备的进入...更多
2022-04-26 00:35:00

: 万华化学首季净利降近两成2021年分红超78亿

25日盘后，万华化学披露2022年第一季度报告。一季度，公司在营业收入增超30%的情况下，净利润回落近两成。具体来看，一...更多
2022-04-26 00:35:00

: 盈利下滑、应收账款和现金流状况恶化！泽达易盛股价较高点已跌超八成

董事长、财务总监协助调查，股价暴跌，业绩下滑，笼罩在泽达易盛头上的疑云久久不散。3月17日晚，泽达易盛发布重大事项公告，...更多
2022-04-26 00:34:00

24小时热点

精彩推荐