智能计算中心20时代展望报告(附下载)发布时间: 2024-04-17 来源:智能计算领域

  ,深圳、武汉、西安、许昌、成都、珠海横琴、南京、合肥、上海、大连、沈阳等近30个城市正在积极布局和建设智算中心,已运营12,在建17。

  在高速扩张1.0阶段,智能计算中心的建设发展和实际应用仍面临面临一些挑战。

  自动驾驶、智慧医疗、智慧城市、生物科学、设计制造等不同场景对算力需求不完全一样,既需要32位、64位等高精度的通用算力,也需要整型算力、16位等低精度的专用算力。

  但当前个别地区选择的算力配置出现一定“偏科”现象,只能满足一部分细分场景的需求,不能兼顾多产业、多领域对融合算力的需求。

  在高速扩张1.0阶段,智能计算中心的建设发展和实际应用仍面临一些挑战待解决。

  目前,在智能计算中心的建设过程中,投资主体由政府主导,建设主体多为行业头部企业,运营主体为具体负责智能计算中心投入建设使用后的运营服务机构,投-建-运往往由不同的单位负责。

  但是,建筑设计企业往往重视前期设备选型和采购基建,对建后运营的模式、服务标准等的关注和投入不足,出现“管头不管尾”“建设运营割裂”的现象,导致投资所需成本浪费、使用体验不佳。

  随着智能计算中心规模的一直增长,智能计算中心自身能耗和碳排放将带来不小挑战。尤其是超大规模预训纺模型的出现和快速迭代,智算中心的电力成本和设备成本均明显地增加。例如,干亿级参数A模型GPT-3训练一次的耗电量约为19万干瓦时,相当于2021年中国人均用电量的228倍。未来应加强考虑大型智算中心的节能降耗问题,加快推进绿色智算中心标准。

  一方面,智能计算中心投建成本高昂,据统计,国内智能计算中心的平均投资所需成本高达21.1亿元,且行业价格标准缺失,高昂的投建成本使得后期应用成本增高、投资回收周期增长,给地方政府带来较大的经这压力。

  另一方面,智能计算中心的使用成本高昂。AI可以建立超越专家的模型,也带来昂贵的模型训练成本,openAI花费高达1200万美元训练GPT-3语言模型。

  在行业引导2.0阶段,智能计算中心建设应遵循“有序发展”“算网一体”的新格局,由1.0阶段的粗放式扩张走向2.0阶段的精细式规划

  智能计算中心应以安全可信且强耦合的软硬件为底层支撑,以算力、算法、数据等资源流通开放为核心要素,实现公共算力服务、数据开放共享、产业生态创新等功能的集聚,成为AI和实体经济融合发展所依托的新型智能算力基础设施平台。

  为实现不同架构芯片的多元融合,智能计算中心的体系结构已经从同构计算走向异构计算,并通过整合更多领域的异构计算,形成超异构计算。

  基于冯诺依曼体系架构的硬件算力提升日渐乏力,程序执行效率的提升空间还很大计算性能的提升将从依赖硬件算力逐步演进到由“软硬协同”来驱动。基于“软硬协同“的架构优化成为计算性能提升的重要探索方向。

  在智能计算中心2.0时代,传统芯片制造商、终端厂商、软件开发商等应更多通过软件优化、架构整合、软硬件协同来提升计算整体性能。

  智能计算中心2.0应在提供多元算力服务的基础上,更深层的聚焦于产业运营、生态运营从源头出发真正发挥算力价值,有效切实的用好智算中心,促进产业创新和应用落地。

  智能计算中心2.0的基础要求是绿色节能,要将液冷技术、储能技术、蓄冷技术、算力调度、智能运维等创新技术加速应用于智能计算中心建设中。

  智能计算中心2.0应发挥算力基础设施的公共属性,通过合理、多元化的技术配置,使其兼顾通用性和专用性,可让更多领域场景、不同技术路线的应用扎根其上,充分释放每P算力的价值成效。积极地推进跨区域的智算中心连入统一算力网络,通过算力、数据的灵活共享和高效调度,促进不一样的地区、不同应用之间算力峰谷的互补,大幅摊低中小城和企业用户的应用成本,逐步提升其公共性和通用性,促进普惠化发展。

  智能计算中心2.0应结合地方承受能力做出合理评估,根据实际的需求进行适度超前部署以建带用、以用促建,以公共性、通用性为原则,满足区域内政府、企业、高校等各类用户、各类应用场景的需求,发挥集约共享带来的规模效益,后续可再根据运行情况和产业发展需求来做扩容建设。

  海量/完整电子版/报告下载方式:公众号《人工智能学派》返回搜狐,查看更加多