大模型崛起引发算力需求激增 中国公共云增速为何放缓?
近年来,中国公共云服务市场的增长速度正在持续下滑。
这与全球公共云的发展趋势形成鲜明对比。
阿里云智能集团副总裁安筱鹏近日在接受21世纪经济报道记者采访时表示,全球的云计算发展,尤其是公共云的发展态势是不均衡的。比如中国的服务器数量和美国相比差距不是很大,但美国65%的算力都是以公共云的方式提供,而中国只有约28%。
这将直接导致算力利用效率存在巨大差异。安筱鹏称,公共云像是时速达350公里的高铁,让算力的利用效率可以达到40%,而私有云的利用效率只有5%。“尤其是在人工智能时代,GPU资源的紧缺导致算力资源变得紧缺,这个时候更需要把GPU算力的利用水平进一步提高,而最高效、最便捷的方式,就是用公共云的服务。”
公共云或是大模型时代的最优解
以亚马逊推出云计算服务AWS为起点,过去十几年,全球范围内掀起了一股“上云”热潮。而在国内,以阿里云、腾讯云为代表的云厂商,也在加速推动产业上云。
公共云的本质是将计算资源规模化并进行共享,让使用者可以按需使用。通过这种方式,可以大大提升计算资源的使用效率,这在人工智能时代,也变得更加重要。
国家信息中心信息化和产业发展部近期发布的《“人工智能+”时代公共云发展模式与路径研究》(以下简称“《报告》”)指出,尽管公共云和专属云都可以用于训练基础大模型,但训练全球领先的基础大模型需要调度至少万张GPU高效协同工作,在此背景下,只有极少数公共云具备相应能力。
浪潮信息董事长彭震近日在接受21世纪经济报道记者采访时表示,现在要找一个可以承载万卡的机房非常困难,无论是在中国还是海外都非常困难。而且公共云的优势是资源获取比较快,可以按需使用,当训练任务比较急迫或者需要暂停时,租用公共云远比自己建机房要划算。
事实上,大模型催生的巨大AI算力需求,已经让算力资源紧缺成为了制约大模型规模化应用的主要瓶颈。
据估计,大模型所消耗的计算资源每3~4个月就翻一倍,所以算力需求的增长速度已经远超芯片性能提升和产能扩张速度的上限。市场数据显示,截至2023年8月,英伟达GPU H100的全球供给缺口超过43万张,即使是美国订单也无法得到保障。
而公共云将是破解该瓶颈的核心手段,通过多路复用,公共云能够有效缓解大模型算力紧缺的问题。尤其对中国市场来说,在高端算力芯片进口受限的背景下,公共云也是提升我国算力供给能力的重要途径。
《报告》指出,国内大量自建IDC的平均资源使用效率往往不到5%,而亚马逊AWS、谷歌等公共云厂商的数据中心资源使用效率一般可达30%~40%。所以,破解我国算力瓶颈的关键路径之一在于提高既有芯片和产能的利用率,而非盲目新建投入。
而通过发挥公共云大规模机器调度、异构芯片兼容能力,不仅能将已有先进芯片集约化利用,还能充分利用已有的通用CPU资源,为AI大模型训练和推理应用提供必要的算力支持。
中国公共云为何脚步放缓?
在人工智能技术的推动下,国际市场算力正变得越发集中,公共云也保持快速增长,但我国公共云市场却呈现出增速放缓、算力供给分散的特征。
对此,《报告》分析认为,我国公共云市场增速持续走低的主要原因,一是需求不足,二是供给分散。从需求端看,最积极使用公共云的互联网行业近几年发展持续低迷,占据IT支出大头的政企行业更加青睐私有云、混合云和专属云。
从供给端看,则是我国云市场近年来出现了明显的分野,头部云厂商更聚焦发展公共云,但有大量云厂商更多在混合云、私有云、专属云等本地部署的云上发力,这导致算力建设日趋分散化。
Gartner数据显示,2021年中国混合云占比达到了42%,2024年中国混合云占比将达到70%,远高于全球平均水平(50%)。
安筱鹏向21世纪经济报道记者表示,中国公共云渗透率偏低有多方面原因。首先是大家的认知没有达成共识,包括一些管理、财务制度不够完善,“有些地方的财务制度,只接受买硬件,要买软件和服务时,就不允许”。
此外,还有一些人觉得公共云不安全。“但实际上,公共云和私有云的安全性是一样的。整体来说,中国企业对公共云的接受程度还比较低,不仅比美国低,甚至比欧洲还低。”安筱鹏说。
彭震从用户角度提出,很多企业客户非常注重数据隐私,他们不希望将自己的隐私数据放到公共云上,所以即便成本更高,他们也更倾向于进行私有化部署。
另外从公共云服务结构来看,我国与全球发展情况也存在差异。目前,我国公共云服务形式主要以提供IaaS为主,PaaS、SaaS的市场占比较低。
Gartner数据显示,2022年,我国公共云市场IaaS、PaaS、SaaS市场规模占比分别为58.24%、16.12%、25.64%,以IaaS为主。同年,全球公共云市场IaaS、PaaS、SaaS市场规模占比分别为31.50%、28.84%、39.67%,SaaS是主体。
有云厂商人士向21世纪经济报道记者表示,SaaS市场占比越高,说明整个云服务生态越繁荣也越健康,因为IaaS和PaaS更偏向基础设施,同质化会比较严重,如果一个市场都在做IaaS,那只会陷入恶性竞争。
算力资源应以需求为导向
对于中国公共云未来的发展,一位IDC服务商高管告诉21世纪经济报道记者,首先要解决的是算力利用率的问题,只有先提高了算力资源利用率,才能够往前去探索更多可能性。
“我们面临的问题,不是因为建设布局方面导致的,因为一个算力中心,如果本身利用率就不高,那把它和其他算力中心连起来利用率也不会高。所以算力最重要的是要服务于应用,在算力上跑什么应用将决定这个算力的使用率高不高”,该高管表示。
国家信息中心信息化和产业发展部主任单志广近日在接受21世纪经济报道记者采访时提到,现在全国多地在抢建算力中心,主要推手不是应用需求,而是建设厂商的供给需求。但目前大模型技术在落地场景上还存在问题,尚未形成典型的杀手级应用,所以对中国的算力需求很有限。如果智能算力建得太早、太多,可能会形成算力经济发展过热的问题。
单志广指出,对于地方而言,不能简单地把建设智算中心和算力节点视为发展数字经济、培育新质生产力的任务抓手,认为建好了就万事大吉,更应该强调以需求为引导,调整算力建设思路,综合考量本地发展、民生、治理等方面的需求,评估对地区未来5到10年的潜在增长量与对周边地区的辐射能力,再根据本地情况谋定算力建设方案。
《报告》也写道,“集约化发展是公共云实现规模化经营,提升产业竞争力的必然要求”。基于此,《报告》给出了三条建议:
一是加强对算力资源布局和结构优化引导,鼓励适度超前、“质”“量”同步规划建设算力资源,支持以公共云服务方式提供算力服务,避免盲目上马、无序建设造成重复投资;
二是鼓励市场主体通过集约化建设、规模化经营降低单位算力资源供给成本,提供更有竞争力的产品和服务;
三是加强政企协同,通过多元化生态运营的模式,推动区域小散数据中心资源整合,提高存量资源的综合利用率。
长远来看,公共云的发展是大势所趋,只不过中国公共云当下遇到了一些挑战。云计算是一个庞大的产业生态,它的发展需要政府、服务提供商以及企业客户共同来推动,令人欣慰的是,现在已经可以看到各方的努力,而公共云主导中国算力市场,或将只是时间的问题。