欢迎来到彩壳资讯
彩壳资讯
当前位置:网站首页 > 数码 > 解决“算力偏科学”问题,智能计算中心下一步将走向何方?

解决“算力偏科学”问题,智能计算中心下一步将走向何方?

日期:2023-09-29 04:47

十年前,英国《经济学人》以工业作为评价中国GDP的主要指标,但现在算力已成为新指标。似乎每个公司、每个城市都在努力提升算力。

有读者疑惑地留言。每个人都在谈论他们的计算能力可以支持这个大模型和那个大数据多少FLOPS。数字越大算力越强吗?

并不真地。

衡量计算能力的高低,除了运算次数之外,还取决于计算能力的精度,即它能支持多高的数据精度和计算复杂度。

如果说运算次数(FLPOS)代表了内力的价值,那么算力的准确度就如同“身技”,决定了内力能否正确、运用好。一次武林对决中,有人用屠龙刀劈砍,令狐冲却凭借独孤九剑的剑法,一击命中。你认为谁更好?

不同的计算任务对算力的要求不同,需要适当的“技能”才能最大限度地发挥算力的价值。

具体来说,根据数据类型的不同,适配的算力精度也不同:

例如科学计算、天气预报、计算化学、分子建模、天体物理模拟等对数据精度要求较高,需要双精度计算能力(64位、FP64)。它是超级计算机提供的通用计算机。计算能力。

AI模型训练、自动驾驶、智慧城市、AIGC等业务需要学习大量数据,训练复杂的深度学习模型,同时处理大量数据-scale 浮点数据更适合单精度计算(32位,FP32)和半精度计算(16位,FP16)。近年来,预训练大模型呈爆发式增长,涌现出DALLE、ChatGPT、紫动太初等一波大模型。 参数往往达到数千亿。大型模型的高效训练需要使用大量的单精度计算能力。

在实际应用中,训练和部署的模型只需要根据输入数据推断出各种结论,例如人脸识别、车牌识别、语音识别等。这个AI推理过程处理的是整数数据更适合整数计算能力(INT8)。

那么问题就来了。一般来说,在某一领域,存在高精度科学研究、智慧城市、自动驾驶等高性能计算,带来对通用算力的需求;它还需要AI模型训练和AI应用。推理等支撑工业数字化转型、智能化转型,对专用算力的需求也非常高。

如果该地区的算力配置不够多样化,缺少某种类型的算力,那么就相当于等待用户上战场迎敌,却发现没有可用的招式或事倍功半,这必然会限制本地数字化的发展。

因此,各地在建设智能计算中心时,必须从长远考虑计算能力的多样化和通用性。

但现实情况是,很多地方的智能计算中心都处于“先批后建”、独立运作的阶段。由于AI产业/科学计算/工业数字化等的快速发展,迫切需要补充某种专用算力来应对算力。我们对算力的渴求,缺乏对通用算力的统筹规划。

随着东数西算工程、数字中国等一系列举措的推进,“十四五”进入新的发展时代,专用算力的通用化问题已成为刻不容缓的事情制约了当地数字经济的发展。

前不久发布的《智能计算中心2.0时代展望报告》还强调,目前一些地区选择的算力配置是“片面的”,只能满足一些细分场景的需求,无法兼顾多行业、多领域的综合算力需求。 。要推动通用算力和专用算力融合,驱动应用纵深发展。

对于大学、科研机构、企业、政府等各类算力用户来说,算力的融合能带来哪些好处?

破解“算力偏见”,算力整合的价值是什么?

总之,算力融合意味着用户可以随意使用不同的计算资源,无论是办公数字化所需的通用算力、AI应用所需的专用算力,还是天气预报和生物预测。如果你需要高性能算力,你可以融入别人、学习别人,以支持自己业务的发展,成为算力方面的“多面手”。

从这个角度来看,通用算力和专用算力的融合将带来三个明显的价值:

首先是数字经济的可持续性。数字经济已经成为各地区发展的主旋律,其中包含的算力应用场景非常广泛。算力可以根据应用场景进行部署,更快建立优势。例如,某省会城市希望建设人工智能高地。同时,高校牵头建立遥感产业集群。专用算力和通用算力的融合可以支撑更丰富的应用场景,为当地数字经济的长期可持续发展作出贡献。为发展提供算力保障。

二是综合成本降低。算力基础设施建设成本极高。尽早规划配置多种算力,可以提高基础设施的利用率,既保证足够的算力,又能精益满足各种任务的需求,从而提高算力。算力综合效益,降低算力使用成本,让该地区算力更具普惠性,惠及更多用户。

三是多元化供应的可靠性。算力的融合意味着需要不同的计算单元、多种架构的共存、多种软硬件的兼容。新的算力基础设施变得开放、多样化、兼容,相当于“不要把鸡蛋放在一个篮子里”。 “它可以降低供应链的不确定性风险,让算力从长远来看更加安全可靠。

算力的融合,相当于武林高手。无论是华山剑法、少林功夫、武当太极,以及各种“身法”,他自然都能游刃有余地应对任何计算任务的挑战。

纵横2.0阶段:数字人需要什么样的算力基础

在即将到来的数字经济浪潮中,每个人都将成为江湖儿女,加入潮流。这时,通用算力基地就如同通晓一切武功、身法的“神助攻”,可以提供全精度、多样化的算力。算力让用户能够更从容地应对业务变化和挑战。

国家工业信息安全发展研究中心在《报告》提出,智能计算中心在2017年至2021年快速扩张的1.0阶段主要提供专业算力,从2022年开始进入2.0阶段,需要利用CPUGPU等加速芯片的异构重叠,实现高精度通用算力和低精度专用算力的综合供给。

可见,智能计算中心下一步的重点是发展成为通用算力基地。打造这样一个通用算力基地,有两个基本要求:“一横一纵”:

一恒:多种算力需要多种架构,智能计算中心必须“横向”兼容。

智能计算中心1.0阶段,采用垂直一体化烟囱式解决方案,满足高性能计算、人工智能、大数据计算等不同应用负载。通用性和兼容性都比较低。多元化的通用算力基础必须实现不同架构的芯片平台、不同领域的算法模型、数据集的横向兼容,让用户能够适应业务场景和计算任务。选择最合适的算力解决方案。

一纵向:通用算力需要软硬件协同,智能计算中心必须“纵向”耦合

不同技术路线的芯片、算法、模型、应用等要素需要连接产业链上下游,解决软硬件兼容问题。软件开发人员通过软件优化、架构集成、软硬件协作来提高计算的整体性能。

打破垂直整合模式,走向“横向”兼容和“纵向”耦合,成为智能计算中心2.0时代的关键,从而支撑千行百业驰骋数字化时代。

技巧与窍门:智能计算中心的未来挑战

智能计算中心1.0阶段正在快速拓展。统计显示,目前我国已有30多个城市正在建设或拟建智能计算中心。未来,数字经济80%的场景和计算资源将由智能计算中心承载。这是一个巨大的机遇,但机遇越大,责任就越大。

如前所述,智能计算中心在2.0阶段必须朝着“横向”兼容和“纵向”耦合的目标迈进。我们要一次吃一顿,算力的整合要一步步做好,每个环节都要做好,互相适应错误。

具体来说,智能计算中心的算力整合必须从四个核心环节进行工作,即:算力生产、算力聚合、算力调度、算力释放。

在算力生产方面,需要具备多元化算力供应的能力。为了实现不同架构芯片的多元化集成,智能计算中心的架构已从同构计算转向异构计算。国内外科技公司如Google、Intel,以及阿里巴巴、百度等都在进行异构计算的研发。 《智能计算中心2.0时代展望报告》,中科曙光5A级智能计算中心也以其全算力精准覆盖、多元化算力供应成为行业示范典范

在算力聚合方面,要推动通用算力和专用算力融合。目前,行业内各厂商智能计算中心的建设理念比较相似,都强调融合发展。

在算力调度方面,综合算力如何被各行业灵活、精益地使用?这就需要多样化算力的统一调度和运行。从宏观上看,在东数西算工程的推动下,国家算力综合网络体系已初步形成,为智能计算中心的算力调度奠定了基础。从微观来看,智能计算中心的建设者/参与者也开始建设算力运营平台,利用精细化、智能化手段提升算力运营调度水平,比如曙光智能计算等等。

从算力释放来看,算力融合的本质目的是让千行百业能够用好算力、正确使用算力。因此,如何更灵活地将多元化算力释放到数字产业中并提供算力服务应用是智能计算中心2.0阶段的首要任务。

从生产到使用,通过临时部署,智能计算中心2.0将成为真正意义上的公共算力基础设施,为万千行业交出澎湃的内功和适应能力。

新的数字视野已将英雄帖子传播给各行各业的骑士。这个时代,巨大的产业机遇等待着大家去争取、赢得属于自己的奖牌。

多元化算力为己所用,开辟多元化未来。智能计算中心2.0阶段,一定会出现更多传奇的人和事。

-->

关灯