预测台风、研发新药、识别故障、制定生产计划……当人们对人工智能(AI)大模型的认知还停留在对话、写诗、作画之时,中国的人工智能大模型已然成为实体经济发展新引擎。
7月7日,在华为开发者大会2023上,华为云盘古大模型3.0正式发布,其在煤矿、铁路、气象、金融等领域展现出来的能力令人咋舌。与此同时,华为在2023世界人工智能大会(WAIC)期间,启动大模型联合创新、发布大模型训推一体化解决方案、推出首个万卡AI集群等一系列在人工智能领域的“大动作”引发业界高度关注。业内人士认为,科技领军企业的发力方向表明,中国人工智能产业正在“走深向实”,将重塑千行百业。
做实事 AI大模型落地实体产业
(相关资料图)
在煤矿行业,盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以极大地减少安全事故。
在铁路行业,盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%,成为货运列检员身边有力的数字助手,将列检员从每日数百万张的“图海”检测中解放出来。
在金融行业,盘古金融大模型能根据客户的问题,为柜台工作人员自动生成流程和操作指导,将原来平均需要5次的操作降低为1次,办结时间缩短5分钟以上。
在制造行业,过去单产线制定器件分配计划,往往要花费3个小时以上才能做齐1天的生产计划,而盘古制造大模型1分钟即可做出未来3天的生产计划。
在药物研发领域,原来一款新药研发平均需要10年时间、花费10亿美元。盘古药物分子大模型助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%。
在气象领域,盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型,原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真,现在盘古气象大模型通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。
就在7月6日,国际学术期刊《自然》(Nature)杂志正刊发表了华为云盘古大模型研发团队研究成果——《三维神经网络用于精准中期全球天气预报》。《自然》审稿人对该成果给予高度评价:“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”
“盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。”华为常务董事、华为云CEO张平安在发布盘古大模型3.0时表示,“我们始终坚持AI for Industries(人工智能服务千行百业)的战略,在深耕行业的道路上不断前行。我坚信大模型将重塑千行百业。”
“除了对话、写诗、作画等应用之外,要将大模型切实投入到城市发展、金融科技、生物医药、工业制造、科学研究等领域,在实体产业落地,为社会经济带来实实在在的价值。”中国工程院院士邬贺铨说。
中国科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,中国10亿参数规模以上的大模型已发布79个。除华为外,百度、阿里、科大讯飞(002230)、美团、百川智能、云知声、腾讯等头部企业相继在该领域布局。
截至目前,中国开发的人工智能大模型已经在智慧矿山、药物研发、气象、政务、金融、智能制造、铁路管理等领域展现出巨大的应用潜力。业界专家认为,当前,利用大模型加速千行百业的数字化、智能化转型,深耕实体经济行业,已经成为中国产业界的共识。
“下一步,人工智能大模型要加强制造业技术、产业、应用进一步融合,更深入地研发面向制造业的大模型,为中国制造业的数字化转型和智能化升级提供坚实支撑。”中国工程院院士、系统仿真及制造业信息化专家李伯虎说。
扎深根 夯实根技术大算力底座
7月6日,工业和信息化部在2023世界人工智能大会公布,我国人工智能核心产业规模达到5000亿元,企业数量超过4300家,算力规模位居全球第二,同时已建成2500多个数字化车间和智能工厂,经过智能化改造,研发周期缩短约20.7%、生产效率提升约34.8%、不良品率降低约27.4%、碳排放减少约21.2%。
人工智能赋能千行百业的“头雁效应”正在加速显现,而各项根技术创新是基础。据张平安介绍,华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,以及异构计算架构CANN、全场景AI框架昇思MindSpore,AI开发生产线ModelArts等,为人工智能大模型开发和运行提供分布式并行加速、算子和编译优化、集群级通信优化等关键能力。基于华为的AI根技术,人工智能大模型训练效能可以调优到业界主流GPU的1.1倍。
深度应用催生对算力的巨大需求,而算力也是训练人工智能大模型的基础。在华为开发者大会2023上,张平安宣布单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架。同时,这些框架中90%的算子,都可以通过华为端到端的迁移工具平滑迁移到昇腾平台。此外,在大模型训练过程中经常会遇到GPU故障,研发人员不得不经常重启训练,时间长,代价大。昇腾AI云服务可以提供更长稳的AI算力服务,千卡训练30天长稳率达到90%,断点恢复时长不超过10分钟。
据介绍,华为在各个单点创新的基础上,发挥云、计算、存储、网络以及能源的综合优势,进行架构创新,推出了昇腾AI集群。目前,昇腾AI集群已支撑全国25个城市的人工智能计算中心建设,其中7个城市公共算力平台入选首批国家“新一代人工智能公共算力开放创新平台”。在2023世界人工智能大会期间,华为宣布昇腾AI集群全面升级,集群规模从最初的4000卡集群扩展至16000卡,成为业界首个万卡AI集群。16000卡的AI集群意味着什么?“据我们评估,一个1750亿参数、100B数据的大模型,只需半天时间就可以完成。”华为昇腾计算业务总裁张迪煊透露。
大开放 构建合作共赢产业生态
“过去一年,在各方伙伴的共同努力下,昇腾AI产业取得了不小的进展:开发者数量翻倍,达到了180多万;基于昇腾AI,原生孵化和适配了30多个大模型,到目前为止,中国有一半左右的大模型创新,都是由昇腾AI来支持;已经发展了30多家硬件伙伴、1200多家ISV(独立软件开发商),联合推出了2500多个行业AI解决方案,使得我们能够规模 化服务于运营商、互联网、金融等等不同行业场景。”华为轮值董事长胡厚崑在2023世界人工智能大会上表示。
昇腾AI繁荣的产业生态源自华为的开放式创新。华为持续开放AI模组、加速卡等,提供丰富的接口开发文档和参考设计,以及软硬件技术支持,助力合作伙伴推出多种硬件产品,激发创新活力。2023世界人工智能大会上,23家企业推出昇腾AI系列新品,覆盖推理服务器、训练服务器、边缘计算智能网关、工控机、开发者套件、机器人、无人机等。此外,华为全新推出“昇腾伙伴网络”(简称APN)合作伙伴计划,将通过总经销商供货的销售支持、华为与总销售商双方的技术支持模式,以及多种商务权益激励,鼓励合作伙伴基于昇腾AI打造自有品牌的产品或解决方案。
在AI大模型领域,针对大模型研发周期长、部署门槛高等挑战,华为联合科大讯飞等四家合作伙伴共同发布大模型训推一体化解决方案,结合昇腾AI基础软硬件能力、合作伙伴大模型和训推一体平台优势,通过共同设计、联合开发、协同上市、持续迭代,为行业用户提供“开箱即用”的大模型一体化解决方案,重塑大模型开发流程,解决各行业大模型落地需求,让大模型在行业充分发挥价值。
此外,在工业和信息化部、中国电子工业标准化技术协会的指导下,中国信息通信研究院、工业和信息化部电子第五研究所、华为等单位联合成立“大模型产业工作组”,共同推进中国大模型应用落地及产业孵化。
据张平安介绍,目前华为云全球开发者数量已超过460万,云商店上架的商品已达1万多个。华为云提供了易用可靠的大模型工具套件、汇聚海量多行业场景API的开天aPaaS,以及包含丰富优质课程和技术认证的大模型专属社区,希望与开发者及伙伴一起,共同探索盘古大模型与行业结合的创新路径。此外,华为云还联合中国公共关系协会、文化大数据产业委员会以及多家伙伴单位,共同倡议成立大模型高质量数据联盟。联盟将汇聚来自各成员单位的开放数据,打造覆盖千行百业的高质量数据集,促进行业大模型的蓬勃发展。
“人工智能的发展,关键是要脚踏实地,推动人工智能走深向实,赋能产业升级。”胡厚崑表示,“面向未来,华为在人工智能发展上有两个着力点:第一,打造强有力的算力底座,来支撑中国人工智能产业的发展。第二,真正让人工智能服务好千行百业,服务好科研创新。”