大模型竞赛进入下半场,IT团队普遍面临一个尴尬现实:算力集群越建越大,GPU利用率却越来越低。戴尔科技集团与OpenCSG近日推出的联合方案指出,症结在于数据效率而非算力不足。该方案并非单一硬件,而是完整四组件系统:戴尔的Dell Pro Max with GB10提供算力、戴尔的PowerScale作为智能数据底座、OpenCSG的CSGHub承担调度中枢、OpenCSG的Xnet协议充当流转引擎,共同解决数据提交慢、存储成本高、GPU空转、PoC到生产断层四大痛点。
PowerScale:存储从"仓库"到"调度中心"的三重跃迁
传统存储只被动存放数据,不参与计算流程。PowerScale通过三项技术实现跃迁:
第一,数据直连GPU。常规路径需经CPU中转、内存拷贝、协议转换四道关卡。PowerScale通过RDMA协议直送GPU显存。根据戴尔与OpenCSG的实测数据, GPU利用率可大幅提升。
第二,单一命名空间。传统架构下开发机、集群、生产环境数据割裂,团队大量时间浪费在找数据、对版本。PowerScale的OneFS文件系统将全链路统一视图管理,所有模型、数据集、实验记录在同一逻辑空间内流转,无需手动迁移。
第三,智能分层。PB级数据全放全闪存成本失控,全放机械盘性能崩溃。PowerScale自动识别数据热度,训练中频繁访问的热数据保留在全闪层,温数据下沉混闪,历史数据自动归档。可让企业的综合存储成本得到显著优化,数据工程师专注治理而非搬运。
Xnet协议:激活PowerScale的增量流转能力
PowerScale的硬件能力需OpenCSG的Xnet协议才能完全激活。传统HTTP/FTP每次全量覆盖,Xnet采用Git式增量机制仅传变动文件块。针对微调和迭代场景,传输时间得到显著节省,并支持断点续传与多线程并发。
GB10的衔接价值:从桌面到集群的统一算力
戴尔的Dell Pro Max with GB10并非孤立工具,而是切入PowerScale生态的"第一块积木"。这内置Grace Blackwell架构的"桌面AI超算",128GB统一内存供GPU使用,可在工位跑70B-200B模型。开发者在本机完成PoC后,数据通过OpenCSG的Xnet自动同步至PowerScale,镜像推送到Staging集群验证,无需适配即可生产部署。
结语
从算力驱动到数据驱动,转型关键不在引擎而在油路。PowerScale通过数据直连、智能分层、单一命名空间,加上OpenCSG Xnet的增量流转,将数据从成本中心变为创新引擎。当大模型能力同质化,决定成败的是数据流转速度。戴尔与OpenCSG的方案,正提供了让数据流动起来的完整基础设施。
