位于贵州省贵安新区的华为云数据中心(云上屯)。
新华社记者 刘 续摄
每秒百亿、千亿次的浮点运算能力,拍字节(PB)级的数据存储规模……许多人可能对这些指标没有太多概念,但如果说起春节档电影中的特效、渲染和如今我们经常使用的生成式人工智能、人脸识别、即时翻译等,人们应该不会陌生。
近日,国际数据公司(IDC)与浪潮信息联合发布《2025中国人工智能计算力发展评估报告》(以下简称《报告》)。《报告》显示,大模型和生成式人工智能推高算力需求,我国智能算力增速高于预期。2024年,我国智能算力规模达725.3百亿亿次/秒(EFLOPS),同比增长74.1%;市场规模达到190亿美元,同比增长86.9%。
智能算力规模持续扩大
在山东济南一个大型智算中心建设现场,一个个集装箱“大块头”在吊臂的牵引下缓缓上升、移动,最终在预定位置落地。智能计算中心像“搭积木”一样,很快拼接成型、完成搭建。
由119个预制化集装箱拼接而成,总功耗达到10兆瓦,电能利用效率(PUE)降至1.1以下,结构材料80%可循环利用,运维基本实现自动化、智能化……这座浪潮信息元脑“算力工厂”从开始建设到正式投运,仅用了120天。
作为数字经济发展的重要底座,算力主要分为超算算力、通用算力和智算算力等类型。其中,超算算力通常以超级计算机为载体,主要用于尖端科研领域;通用算力一般由CPU(中央处理器)承担主计算工作,适用范围较广;智能算力则专为人工智能应用设计,支持AI算法模型训练与运行,GPU(图形处理器)在其中发挥关键作用。
当前,随着大模型、生成式人工智能蓬勃发展,算力结构进一步演化,对智能算力的需求与日俱增。120天建成的“算力工厂”,正是中国智能算力规模快速增长的缩影。
“2024年,中国智能算力增速是同期通用算力的3倍以上。”国际数据公司(IDC)中国副总裁周震刚介绍。
近年来,从国家到地方再到各类经营主体,都在大力推进算力资源布局建设,一系列利好措施的推动下,中国智算算力规模不断增长,服务模式持续完善,软硬件生态逐步构建,绿色低碳发展格局加速形成。
“在庞大的数据和算力推动下,人工智能的综合表现得到了显著提升。”中国信息通信研究院人工智能研究所所长魏凯表示,以基础语言模型为例,其通过不断扩展和优化,在各类自然语言处理任务上均取得了更好的效果。同时,多模态模型在视觉理解上的进展也相当显著。
周震刚说,预计未来两年,中国智能算力规模仍将保持高速增长,其中2025年将较2024年增长43%,2026年中国智能算力规模将达到2024年的两倍。
行业落地应用速度加快
当前,智能算力行业落地应用速度加快,大量企业主动“拥抱”大模型。《报告》显示,42%的企业开始进行大模型的初步测试和重点概念验证,17%的企业已经将技术引入生产阶段,并应用于实际业务中。
制造业场景复杂、门类繁多,数据量庞大且碎片化严重,大模型在制造业面临落地难、成本高等问题。“比如在质检领域,要获取全部的缺陷样本非常困难。”思谋科技创始人贾佳亚介绍,针对这一问题,公司发布了面向高端制造的工业多模态大模型,它可以通过理解和学习少量实际缺陷图片,依据文本描述生成真实的缺陷图像,从而辅助训练缺陷检测模型,提升质检效果。
“过去,收集各种缺陷类型需要工厂生产线运转两三个月;如今,借助大模型的深度学习能力,只需要一个星期甚至更短的时间。”贾佳亚说,该大模型已累计生成上百种缺陷类型,在消费电子和新能源等领域实现了应用。
对大模型及生成式人工智能需求的日益增长,正显著推动我国人工智能算力基础设施的快速发展,促使企业通过应用高性能计算设备、优化数据中心基础设施、提升存储和网络能力等,进一步支持复杂的人工智能运算任务。
除了自建智能算力基础设施,很多企业也通过购买云计算服务的方式,来实现智能化转型。华为云大数据与人工智能领域总裁尤鹏介绍,华为云推出人工智能云服务,并构建了相应的大模型工具链,让企业在无需改造、自建机房或运营维护人工智能算力基础设施的情况下,就能使用大模型来适配不同场景需求。目前,华为云盘古大模型已在30多个行业、400多个场景中落地,覆盖制造、医药研发、煤矿、钢铁等多个行业领域。
“当前,人工智能在互联网、金融、制造等领域的渗透度持续增加,不仅反映了市场对先进人工智能技术的迫切需求,也体现了中国企业在全球人工智能竞赛中的积极布局和投入。”周震刚说。
多样化需求带动新方向
流淌在群山间的蓬勃算力驱动着文化创新。在贵州贵安新区超级计算中心内,一排排服务器机柜整齐矗立、高速运转。1秒钟,数据在这里就可运算3亿亿次。它与北京、上海、广州等38座城市实现了网络直联,省内单向时延为3毫秒、至粤港澳大湾区也仅需10毫秒。
将三维场景中的模型按照设定好的环境、灯光、材质及渲染参数,以逼真的方式呈现在二维屏幕上……影视作品中纤毫毕现的细节、精彩绝伦的画面都离不开渲染,而智能算力的发展,为其提供了算力保障。
贵安新区科创产业发展有限公司技术研发部项目经理刘廷娟介绍:“今年春节电影档,我们为《哪吒之魔童闹海》中的1900多个特效镜头提供了渲染算力支持。”
“一部三维动画影视作品的数据素材量有可能超过250TB,假设用一台工作站来渲染,需要约600年的时间才能完成。但如果采用成千上万台服务器同时渲染,就只要几个月时间。”贵安新区科创产业发展有限公司综合部部长彭本黔说,除了缩短制作周期,强大的算力加持也让影片质量更有保障。
当前,不同行业和应用场景的多样化需求,对算力发展提出了新的要求。
“金融行业需要高安全性和低延迟的计算环境,医疗行业需要处理大量医学影像数据,制造业需要实现实时生产优化,互联网行业需要处理大规模用户数据和内容推荐等。”浪潮信息高级副总裁刘军举例,这些需求对算力底层架构提出了高性能、低延迟、高安全性、可扩展性和成本效益等新要求。
“通过资源池化、智能调度、多租户支持、异构计算和边缘计算等技术,人工智能算力基础设施能够灵活应对这些需求,确保资源的高效利用和业务的稳定运行,从而推动人工智能技术在各行业的广泛应用。”刘军说。
专家表示,经历了一定时间的算力规模积累后,中国算力产业的发展需要实现从量变到质变的跨越。在持续扩大算力规模、达成供需平衡的同时,还需要解决各行业应用算力中的难点,以实现从扩大算力规模到高质量释放算力价值的转变。
