智算运维
习近平总书记指出,推动科技创新与产业创新融合发展,是发展新质生产力的基本路径。产业是基础,科技打头阵,以科技创新推动产业创新落地。抓产业创新,就要守牢实体经济根基,坚持推动传统产业改造升级和开辟战略性新兴产业、未来产业新赛道并重。然而智算中心万卡集群正是科技创新与产业创新融合的典范。
在AIGC(生成式人工智能)驱动的新一轮技术革命中,智算运维服务正经历从“被动响应”到“主动使能”的范式重构。随着大模型训练与推理任务的复杂化,智算运维的边界已从传统的硬件监控与故障响应,逐步扩展至全生命周期治理和全链路协同保障,涵盖基础设施、AI平台、AI模型、跨域协同等全栈能力重构。超大规模智算集群的运维主要面临集群管理难度大、异构算力资源协同难、故障定界定位链路长等挑战。
在此背景下,由中国通信标准化协会TC628标准推进委员会主办,TC628 WG3智算运维工作组(组长单位:中国移动集团网络事业部)与中国移动黑龙江公司共同承办的“万卡赋智,重塑运维” ——万卡集群智能运维首期沙龙,计划于6月25日在黑龙江哈尔滨举行。本次沙龙将重点聚焦“AIGC时代智算运维服务的范式重构与变革”,旨在探讨如何通过AI技术驱动、跨层跨域协同优化等,构建全栈一体协同的新型智算运维模式,加速建设“全域全时全场景”AI应用生态,深化技术普惠,全面释放新质生产力动能,更好服务赋能实体经济发展。
以下为本次沙龙精彩议程预告,更多精彩议题敬请期待….

