科技it前沿吧 关注:14,695贴子:708
  • 1回复贴,共1

浪潮信息加速智算系统创新切实解决大模型算力难题~

只看楼主收藏回复

目前,在生成式AI的背景下,大模型研发也进入到了万卡时代,面对新的需求,算力基建亟需完善,改善算力供给,推进算力普惠已经成为了行内共同目标。在助力大模型生产力释放上,浪潮信息一直走在前方,多年来,浪潮信息聚焦技术创新,加速大模型开发,为打造人工智能产业良好发展环境而贡献力量。


IP属地:湖北1楼2023-12-01 20:53回复
    算力供给基建化,缓解“买不起”困境
    大模型,特别是千亿参数级别具备涌现能力和泛化能力的大模型是通用人工智能的核心。但大模型对海量算力资源的消耗,急剧抬高了准入门槛。以ChatGPT的总算力消耗3640PFdays计算,这对于自建、自研大模型,往往需要少则几亿,多则数十亿的IT基础设施投资,这就导致大模型不仅是一个技术密集型产业,同时也是资金密集型产业,资本的力量在大模型产业发展中扮演越来越重要的角色,高昂的资金门槛使得具备技术能力的初创公司和团队面临“买不起”的难题,难以开展创新。
    为解决这一困境,除通过政策引导、政策补贴等方式降低企业融资成本外,还应大力发展普适普惠的智算中心,通过算力基建化使得智算力成为城市的公共基础资源,供用户按需使用,发挥公共基础设施的普惠价值。用户可以选择自建算力集群,或者是采用智算中心提供的算力服务来完成大模型的开发。

    通过大力发展智算中心新基建,中国和美国大模型产业的发展已经呈现出完全不同的发展路径。在美国,算力的私有化决定了大模型产业技术只能掌握在少数企业手中,而中国大力推动的算力供给基建化,为大模型创新发展提供了一片沃土,将使得整个产业呈现“百模争秀”的全新格局。
    算力效率工程化,化解大模型算力系统“建不了”难题
    即使解决了算力供应的问题,通用大模型开发仍然是一项极其复杂的系统工程,如同F1赛车的调校一样。F1赛车的性能非常高,但如何调校好这部赛车,让它在比赛中不仅能跑出最快圈速,而且能确保完赛,对整个车队的能力要求是非常高的。


    IP属地:湖北2楼2023-12-01 21:07
    回复