GPT类人工智能的快速迭代之因、发展挑战及对策分析

时间：2023-09-07

3月15日，OpenAI公司发布了全新一代多模态大模型GPT-4。相比于4个月前问世的ChatGPT，GPT-4在图片识别、图文数据综合处理、逻辑推理等领域的能力有了质变飞跃。美国在人工智能大模型领域的快速迭代创新使我国存在被快速甩离主流发展路线甚至在关键环节上有被“卡脖子”之虞。“执果索因”回溯美西方人工智能领域飞速进展之源，“庖丁解牛”解析我国相关领域发展困局之因，“尽锐出战”综合施策扭转不利态势，对于打赢人工智能举国之战，支撑高水平科技自立自强，避免未来在人工智能大模型领域美西方对我国“极限施压”具有重大现实意义。

一、美国人工智能大模型快速迭代之因

从2018年发布GPT-1开始，OpenAI公司旗下的GPT系列产品呈现超快迭代、一路狂飙之势，不到5年即迭代了四代产品。从GPT-3到GPT-4甚至仅历时3个多月，远超摩尔定律。2023年3月15日，多模态大模型GPT-4横空出世，震撼全球。究其原因，在于GPT的快速迭代得到技术、资金、政策等要素的全方位加持。

（一）“创新力”成就人工智能大模型技术迭代

科技创新是人工智能发展无尽的前沿。回顾GPT类人工智能的发展历程可知，OpenAI公司自GPT-1开始，就将坚持创新视为人工智能大模型的必由之路。为了避免谷歌在人工智能领域形成垄断，OpenAI与谷歌开启了狂飙竞速。2018年，OpenAI推出了1.17亿参数的GPT-1，谷歌推出了3亿参数的BERT。更擅长“写作文”的GPT与更擅长“完形填空”的BERT采用了不同的技术路线，竞争结果是发布更早的GPT-1完败于晚4个月发布的BERT。但出师不利后，OpenAI并没有改变技术策略，而是坚持走“大模型路线”加速创新。2019-2020年，在几乎没有改变模型架构的基础上，OpenAI陆续推出参数更大的迭代版本GPT-2、GPT-3，前者有15亿参数，在性能上已经超过BERT；后者则有1750亿参数，几乎可以完成自然语言处理的绝大部分任务。GPT-3发布之后，OpenAI研究人员依旧在思考如何对模型进行进一步升级。经过创新性地引入“人类反馈强化学习机制”（RLHF），OpenAI获得了更好遵循用户意图的语言模型InstructGPT，并最终成功构建了InstuctGPT的姊妹模型——ChatGPT。

（二）“钞能力”确保创新型企业可持续高投入

2015-2020年间，用于训练人工智能大模型的计算量增加了6个数量级。计算量的增加导致其需要庞大资金投入，否则难以为继。据估算，OpenAI的模型训练成本高达1200万美元，GPT-3的单次训练成本高达460万美元。人工智能公司DeepMind从零开始训练AlphaZero的花费在3500万美元左右。目前，ChatGPT每月的计算成本可能达数百万美元。美国官方对人工智能的投资逐年增加。2020年达到18.37亿美元，较2019年增长了25%，支出前三位的美国政府机构分别是国防部（14亿美元）、宇航局（1.391亿美元）和国土安全部（1.123亿美元）。美国国家科学基金（NSF）在2021年要求将8.68亿美元资金用于与人工智能相关的方面，并拨款1.6亿美元用于新增8家人工智能研究所；NSF还与合作伙伴共同宣布向11个其领导的国家人工智能研究中心投资2.2亿美元。美国民间掀起人工智能投资热。据Leonis Capital统计，自2020年至今，对生成人工智能的风险投资增长了400%以上，2022年已达21亿美元。

（三）“政策力”全方位夯实人工智能发展基础

一是积极建立人工智能顶层规划体系。美国先后发布《维护美国人工智能领导力的行政命令》《美国人工智能计划》《人工智能，自动化和经济（2016）》《人工智能战略概要（2018）》《国家人工智能计划法案（2020）》《关键和新兴技术国家战略》《人工智能/机器学习战略计划》等一系列人工智能战略与政策，建立起了美国政府在人工智能领域的顶层规划体系。二是积极夯实人工智能开发必备的训练数据基础。美国在《维护美国在人工智能领域领先地位》行政令中指出：所有机构的负责人应审查他们的联邦数据和模型，以确保更多非联邦人工智能研究团队访问和使用的机会。这也给美国人工智能大模型发展奠定了坚实的数据基础。三是主动完善人才战略培养体系。美国完善K-12阶段基础教育及高等教育的人工智能学科建设及储备人才培养；同时通过发展STEM领域的学徒制和终身学习计划帮助美国工人获得人工智能技能培训，培养满足人工智能时代要求的全方位专业人才队伍。

二、我国人工智能大模型发展的现实挑战

以国内最早投入人工智能领域的领军企业百度为例，GPT-4发布一天之后，百度发布了号称“中国版ChatGPT”的“文心一言”。但无论产品表现，还是资本市场反响，“文心一言”明显“技不如人”。我国与美国在人工智能大模型方面的差距有快速拉大之患。

（一）发展失衡：重应用需求轻技术创新

与国外人工智能企业更注重自然语言处理等基础技术不同，国内企业更看重终端产品的应用需求。据《中国新一代人工智能科技产业发展报告(2021)》数据，截至2020年底，中国人工智能企业布局在应用层的占比高达84.05%。以应用需求为主要牵引动能的发展模式，势必导致我国人工智能企业更急于实现业务应用和商业化。产品略有雏形即被迫“仓促上阵”。例如，百度机器人刚具备基本对话功能，便急切通过小度AI及其家电场景应用谋求快速盈利。阿里无人驾驶技术刚实现开放道路上低速行驶，便急于推出无人车配送概念。反观OpenAI，2019年其用于云计算技术的研发支出已达3100万美元，三年内翻了13倍之多，但员工整体薪酬仍低于行业均值，基础设施比人金贵、技术研发比盈利重要俨然成为了独特企业文化。

（二）融资失调：总量不足与结构化短板并存

在投融资规模上，美国规模优势明显。根据2021年美国智库数据创新中心报告，2020年获得100万美元以上资金的活跃人工智能公司数量，美国约为中国的5.4倍；在风险投资和私募股权融资额方面，美国约为中国的2.5倍；在研发投入方面，美国公司约为中国公司的5.3倍。在投融资全链条中，我国存在明显弱项。由于初创型企业融资金额与估值相对较合理，泡沫较小，国内资本更倾向于参与人工智能企业的早期投资。以2021年为例，人工智能行业A轮融资占比为37.9%，明显领先于C轮融资占比的11.37%。据IT桔子数据显示，截至2022年11月，人民币交易有42.8%投向了早期AI项目，仅有7.2%投向中后期AI项目（远低于美国同期的18.8%）。但这与人工智能产业发展所需的庞大接续投入特征不匹配，容易导致技术性强而融资能力不够的公司“高开低走”，难以为继。

（三）人才失序：人才资源储备仍显短缺

我国高校人工智能专业培育起步较晚，2019年，教育部印发了《教育部关于公布2018年度普通高等学校本科专业备案和审批结果的通知》，全国共有35所高校获首批建设“人工智能”本科专业资格。但与美西方人才储备情况相比差距依旧明显。一方面是人才供需严重失衡。根据工信部相关数据，人工智能不同技术方向岗位的人才供需比均低于0.4，人才供不应求成为常态。从细分行业来看，智能语音和计算机视觉的岗位人才供需比分别为0.08、0.09，相关人才极度稀缺。另一方面是高层次科研人才与美国差距较大。《2019年全球AI人才流动报告》显示，美国高校培养了全球44%的人工智能领域博士，大于欧盟（21%）和中国（11%）的总和。《智慧人才发展报告（2021）》也显示，相比中国（10.69%），美国人工智能高层次学者数量占全球的67.87%，领先优势明显。

三、启示与建议

（一）发挥新型举国体制优势，加快推动人工智能技术创新

一是建议建立人工智能产业重点企业清单管理制度，形成各类企业自主申报、跟踪监测、动态调整、持续更新等配套机制，加快形成以头部平台企业为先导、以人工智能龙头企业为主体、以广大科技型中小企业为补充的企业“雁阵”，以产业攻关为导向推进我国人工智能技术的快速迭代。二是依托全国一体化大数据中心和“东数西算”工程加快数据要素释放，作为大模型训练素材。三是加强人工智能领域国际合作，在“一带一路”科技创新合作专项规划框架内组织实施人工智能国际大科学计划和大科学工程，打造科技共同体，共建联合实验室。

（二）借助资本市场改革红利，引导社会资本助力产业发展

一是充分利用创业板、科创板对于高科技、创新型企业的融资“倍增器”功能，不断完善我国多层次资本市场的建设，为涉及核心关键技术、稀缺紧俏产业与服务的人工智能企业开辟绿色通道，适时降低投资者准入门槛，进一步缩短新股注册审核流程与时间，以更高质量的风险共担、收益共享机制缓解企业融资瓶颈；二是优化政府引导基金“指挥棒”作用。一方面坚持“全国一盘棋”，力戒各地“重复建设”，以更可预期的投资策略、更精细的标的清单管理统筹推进基金运行；另一方面引导地方产业引导基金在确保长期、全局利益最大化的基础上合理降低本地“返投”比例。精准引导社会资本投向，更好地调动银行、担保等金融机构对企业的贷款和担保，解除人工智能高新技术企业挑战更先进技术、更强算力的后顾之忧。

（三）涵养合作共赢市场生态，推动针对关键环节集智攻关

一是提振数据和算力资源的关键支撑作用。藉由规划指引、政策补贴、试点示范、揭榜挂帅等方式，在保障数据安全的基础上，加强数据归集、算力统筹、算法开源等平台和基础能力建设。二是推进政产学研用融合联动协同创新。围绕人工智能产业发展规律与技术创新特点，推动行业层面在算力能力、算法技术等方面的联合攻关，支持政产学研用各界合作构建训练与测试标准数据集，加速共性基础技术创新研发。

（四）构筑人工智能人才高地，确保人才梯队系统性鲁棒性

一是强基固本。系统研究人工智能学科特点，结合人工智能涉及的基础学科与应用学科，依托高校优势学科完善人工智能学科人才培养体系。特别是积极探索“高校+企业”的科技协同创新机制，推进“企业家出题、大学生答题”“课题组给技术、好企业用技术”的联动模式。二是两翼并举。将人工智能相关领域人才培养向两头延伸，一方面注重中小学人工智能科普，探索将相应课程与实践纳入“小升初”、中考考核范围，推动高校、科研院所科普活动走进中小学；另一方面加快硕博研究生人工智能相关基础研究能力、原始创新能力的培养，优化国家重大专项、基金的投向。三是筑巢引凤。紧密围绕我国人工智能攻坚克难之急需，出台差异化的引才聚才政策，打好“政策补贴+揭榜挂帅+优胜劣汰”组合拳，完善“候鸟型人才”“星期六专家”等人才共享机制，更好实现全球高端人才为我所用。

（作者：徐凌验，国家信息中心信息化和产业发展部，未来产业和平台经济研究中心副秘书长；原文刊发于《中国经贸导刊》2023年第8期）