数据共享是AI开放计算架构的核心支撑,二者通过“数据-算力-生态”协同推动AI产业从封闭走向开放普惠。
📌 背景:AI时代的“数据刚需”与算力挑战
AI大模型训练需千万级标注数据,但中国80%高质量公共数据仍“沉睡”,数据供给缺口达60%3。同时,2024年国内智能算力规模虽达32%,但面临高端供给不足、成本高、跨平台兼容难等问题5。这一背景下,数据共享与开放架构成为破解瓶颈的关键。
🧩 数据共享与AI开放计算架构的协同逻辑
🔗 数据共享:开放架构的“燃料供给”
案例:中科天机开放全球12公里+中国区域3公里分辨率气象数据,覆盖160余项要素,免费向全球提供35。
价值:相比ECMWF数据年均190万的获取成本,显著降低商业气象大模型的数据门槛,催生新能源、低空经济等62个AI场景35。
🏗️ AI开放计算架构:数据价值释放的“引擎”
中科曙光联合20余家企业发布国内首个AI开放计算架构,以GPU为核心实现“五级开放”:
开放层级 核心措施 目标
部件级 适配多品牌GPU 打破硬件壁垒
系统层 算存网电冷协同优化 提升算力效率
软件层 兼容主流AI框架 降低开发成本
数据集层 开放气象等专业数据 支撑场景化大模型训练
(补充说明)该架构已应用于曙光AI超集群系统,支持万亿参数大模型训练,推动算力普惠24。
✅ 结论:开放生态重塑AI产业格局
数据共享与AI开放计算架构形成“数据供给-算力支撑-场景落地”的闭环:
制度创新:31个省份出台数据要素改革方案,12家国家级数据交易所运营,为开放提供政策保障3;
技术突破:中科天机通过7大技术实现数据高分辨率与低成本获取,开放架构解决跨平台兼容难题