[ 我们对20位科学家和工程师的深度调研进行了比较分析,总结出了中国可以通过算法和软件的应用创新在四个方面持续强化中国现有价值链。这四个方面分别是:智能化产品服务设计、智能化生产制造、智能化供应链管理以及智能化运营管理。 ]
[ 我们认为,核心算法和软件的持续创新根本上还是取决于基础科学的发展和投入。无论是关键的软件还是硬件技术,每一种产品都是基础科学几十年来理论积累的产物。因此,我们强调基础科学投入的长期性与稳定性是提高核心算法与软件原创性的关键所在。 ]
在上一篇文章《中国突围中高端价值链,应发力硬科技》中,我们采用机器学习聚合分类研究,在全球5228种产品类别中系统性地识别了当前中国高度进口依赖的88种“卡脖子”关键产品。而为了突破西方对中国在关键技术上的制裁,本文基于美国麻省理工学院经济学家阿西莫格鲁(Acemoglu)提出的偏向性技术进步理论,结合近期我们对全球及国内顶级学术机构及科技互联网公司共计20位人工智能科学家、算法工程师和数据分析师的调研分析,发现了当前发达国家对中国在中高端价值链上的制裁主要集中在以芯片、光刻机和半导体为代表的硬件技术上。
而相比硬件,近年来中国在软件方面的自主研发和迭代速度进步明显。因此,我们建议中国可通过自身市场、资本与数据要素优势,集中突破部分“卡脖子”的关键软件和算法技术。具体来说,中国可利用对软件与算法的创新应用,持续强化现有的七大优势产业链。在稳固现有价值链竞争优势的基础上,围绕一些数据敏感度较低且可贸易度较高的行业(如光学器件、化学、机电控制等),不断提升中国软件技术与西方高端硬件技术相互间的依赖性,最终帮助中国顺利迈入全球中高端价值链。
破局之机:数据密集型产业的崛起
回顾人类历史上的经济增长变化,东西方世界真正出现巨大经济增长差距就是从19世纪工业革命初开始。围绕这种差异,一大批经济学家试图解释经济增长的源泉到底是什么。古典增长理论认为劳动和资本要素是经济增长的核心动力。而新古典经济学家在此基础上进一步纳入了全要素概念将技术视为外生变量解释经济增长。而从20世纪80年代开始, 卢卡斯(Lucas)和罗默(Romer)等人试图把技术进步内生化,并解释了经济增长的源泉是知识的分享和积累。
近10年来,随着以大数据、云计算和人工智能为代表的新一代信息技术的发展,琼斯(Jones)和托内特(Tonetti)研究了数据在生产过程中的基本模式,并定义了数据作为生产要素对经济增长的作用。尽管数据作为信息,其本身无法被直接应用于生产,但通过分析和预测数据(信息)指导经济物品的生产与应用,将显著降低经济物品的交易成本,从而提高劳动生产率。
偏向性技术进步理论指出了当技术创新使某生产要素边际产出相对其他生产要素显著增长时,技术就会“青睐”(偏向)该要素。同时,该要素的边际产出和规模报酬将呈现递增特征。结合中国经济增长的实际情况,依靠传统生产要素投入拉动中国经济增长的潜力越来越小,无论是劳动还是资本要素的边际产出近年来均呈现显著递减特征。相反,以数据为代表的新生产要素近年来呈现出边际产出递增的特征。这是因为信息时代下新一代技术创新(比如云计算、大数据、人工智能、区块链等)几乎都是围绕数据要素生产和发展的。正如偏向性技术进步理论的核心观点,技术创新偏向数据要素从而带动市场资源集中流入数字产业,最终导致数字密集型产业规模报酬显著递增。
根据我们的预测,2025年中国所拥有的数据规模将占世界数据圈的30%,这意味着中国将成为拥有数据规模全球第一的经济体。庞大的数据规模将进一步支持中国发展数据密集型产业以支持中国经济增长。
数据产业的核心竞争力:软件和算法
尽管中国数据规模正以惊人的速度持续扩张,但如何高效地使用数据来指导经济产品服务创新,是数据密集型产业向高质量方向发展的关键,也是中国经济持续增长的源泉。我们认为,真正对数据密集型产业拥有绝对控制权,不仅仅取决于数据规模,更取决于核心算法和软件系统。
基于我们的研究,长期以来,中国在软件与核心算法上依旧整体处于被西方国家“卡脖子”的状态。比如,在核心工业软件领域,国产EDA(电子设计自动化)与发达国家EDA工具相比,在性能上(如工具完整性、稳定性、工艺设计等)仍存在代际差距。在操作系统上,绝大部分手机和个人电脑依旧被三家美国公司(谷歌、苹果、微软)所垄断。在核心算法方面,中国国产的高端机器人在稳定性和易用性上仍与日本、美国、德国和瑞士等国家存在差距,反映了中国在中高端制造业上仍未能掌握相匹配的核心算法。
然而,基于我们对全球和中国顶级高校及科技互联网公司20位人工智能科学家和工程师的最新调研情况来看,相比当前“卡脖子”的硬件技术,中国在关键软件领域率先突破的可能性更高。这是基于目前中国在算法和软件领域具备的三大优势:
一是在经济层面。中国拥有数据、人力资本与市场要素优势。正如我们提到的,中国拥有全世界最大的数据圈。同时,庞大的消费市场能够为数据密集产业提供丰富的应用场景。另外,根据2020年中国专业IT社区CSDN(Chinese Software Developer Network)的统计,在中国从事软件开发与算法设计相关的学生或工程师已经超过800万人(根据CSDN活跃用户计算),其中一线开发人员已经超过60%。强大的人力资本优势使得软件和算法开发可以快速在丰富的场景中进行迭代应用。
二是在制度层面。政府将大力支持数据要素市场的培育。2020年4月中共中央、国务院公布了《关于构建更加完善的要素市场化配置体制机制的意见》,明确了将数据作为新型生产要素。意见同时指出了未来中国将围绕数据要素在数据共享、数据融合、数据确权、数据定价以及数据安全等一系列方面推行改革。毫无疑问,国家“数据红利”的释放将推动数据密集型产业的发展应用,这将有利于软件和算法的迭代创新。
三是在技术层面。受益于开源软件运动,高级算法与软件的可得性不再困难。开源软件被描述为其源码可以被公众使用的软件,并且此软件的使用、完善和分享方面不受许可证的限制。根据全球最大开源项目托管平台GitHub统计,到2025年全球参与开源软件的平台用户数量将达到1亿用户。其中,中国开源软件参与者的数量及开源贡献度增长已成为全球最快。
破局之道:加快软件与算法在中国价值链上的应用与创新
正如上述分析,我们认为中国有能力通过自身市场、人力资本与数据要素优势,集中突破部分“卡脖子”的关键软件和算法技术。进一步,利用软件与算法的快速迭代和持续创新强化中国现有的七大优势产业链。在稳固现有价值链的竞争优势基础上,围绕一些数据敏感度较低且可贸易度较高的行业,不断提升中国软件技术与西方高端硬件技术间的依赖性,最终帮助中国顺利迈入全球中高端价值链。
首先,基于我们对全球及国内20位AI科学家和工程师的调研发现,中国在软件和算法优化与应用层面与西方国家的距离越来越小。比如激光雷达技术从2019年到现在,短短两年间进步巨大。2019年的时候,激光器、接收器、主控FPGA和采样用的ADC,这四个最核心软硬件都是被国外垄断的。现在国内已经有顶级的激光器生产商,主控和采样都ASIC(特殊应用集成电路)化了,只剩接收器还没有完全解决。再如,在语音识别领域,目前全球最先进的新一代语音识别系统“Wenet”也是由中科院和西工大AI科学家自主创新完成的,且整套算法框架完全不同于英国AI科学家Danial Povey所创造的“Kaldi”语音识别系统 (上一代国际最先进的语音识别系统)。
进一步,我们对20位科学家和工程师的深度调研进行了比较分析,总结出了中国可以通过算法和软件的应用创新在四个方面持续强化中国现有价值链。这四个方面分别是:智能化产品服务设计、智能化生产制造、智能化供应链管理以及智能化运营管理。
1。智能产品与服务设计。利用增强学习(Reinforcement Learning)、神经网络模型(Neutral Network)以及自然语言处理(Natural Language Processing)对客户的消费行为和模型进行预测,从而设计新的产品。
在我们的调研中,很多公司早已开始利用大数据对客户体验和购买模式进行预测,从而进一步基于预测结果对产品服务进行设计和创新。此外,工程师和设计师可以采用创成式设计(Generative Design)实现产品创新。即通过设定对产品的约束条件(比如颜色、形状、材料、体积),结合创成式算法(如参数化系统、进化系统、形状语法及拓扑优化算法等)可自动生成上万种产品设计方案。
2。智能化生产制造。通过监督式和无监督式机器学习(Supervised Learning & Unsupervised learning)算法,提高产品生产制造的效率和品质。比如,中间品制造生产过程中有诸多分拣作业,如果采用智能化机器分拣,则可大大提高产品生产效率。此外,通过对质量差异化的产品进行深度学习(Deep Learning),再基于对产品各个生产环节上所获得的监控数据,可使机器视觉更快、更精确地识别出产品表面的不同生产缺陷。
3。智能化供应链管理。利用深度学习算法可优化供应链运输路线和仓位管理。比如通过将历史运输路线和实际交付成果进行神经网络训练,从而分析运输方案对供应链上交易成本的影响,以帮助管理者确定最优运输路线。此外,基于神经网络算法,可帮助制造商实时检测库存变化、及时调整库存规模,从而有效控制库存短缺或过剩的状况。
4。智能化运营管理。监督式学习可有效帮助企业优化运营决策并降低运营成本。利用回归模型(Regression)、决策树(Decision Tree)及随机森林模型(Random Forest)对生产管理系统或机器设备进行故障预测,从而有效降低运营成本。另外,制造商通过传感器监控可收集设备所处环境的温度、照明及湿度变化,从而预测故障事件发生的概率以降低故障产生带来的不确定性。针对一些生产任务,机器学习可以对生产复杂程度与生产规模进行匹配分析,从而计算具体生产任务所需的员工数量。
最后,在我们的调研分析中,绝大多数人工智能科学家表示中国在软件和算法的应用层面与美国等发达国家几乎是齐头并进。在中国的优势产业链上,我们看到已经有越来越多的企业开始涌入人工智能浪潮,通过对图像处理、语音处理、自然语言理解等应用性算法将人工智能应用在各个产业链的不同场景中。在国家政策和代码开源的支持下,价值链上更多的中小企业可积极通过算法和软件应用,来强化或提高自身在制造生产环节上的竞争力。而在稳固现有价值链竞争优势的基础上,在部分细分行业中,提升西方高端硬件技术在中国软件系统上的使用依赖性是中国迈入中高端价值链的关键突破口。
比如,中国在无人机、自动驾驶和区块链等细分领域上的软件和算法创新,很可能未来会让部分国外制造商逐步适应和接受中国的软件系统。在EDA领域,尽管在先进制程IC(集成电路)设计方面,EDA工具几乎被国际三大巨头所垄断,但国产EDA在40纳米及28纳米制程工艺上近年来进步非常明显,结合5G、汽车电子、区块链等新兴领域对IC设计的新需求,这可能为EDA与国外中高端制造商提供相互合作与学习的方向。
破局之障:软件与算法创新的瓶颈——基础科学
企业的数字化和智能化不可能一蹴而就,目前全球也没有一个通用的模板可以套用。在中国价值链上,对于大部分提供中间品、资本品和消费品的泛制造业公司来说,如何对算法和软件进行创新,并根据不同的细分场景提供相应的解决方案,依旧是当前主要面临的挑战。在我们所调研的20位AI科学家和工程师中,几乎所有人都提到了中国在核心算法与软件原创性上仍与发达国家有不小的差距。此前西方国家可能将关闭对中国GitHub开源代码分享的消息让国内很多算法工程师和科学家都感到了紧张。
我们认为,核心算法和软件的持续创新根本上还是取决于基础科学的发展和投入。无论是关键的软件还是硬件技术,每一种产品都是基础科学几十年来理论积累的产物。因此,我们强调基础科学投入的长期性与稳定性是提高核心算法与软件原创性的关键所在。其次,要寻求在重点基础科学领域实现引领和突破。软件和核心算法的原创性本质上就是数学信息科学与技术理论的原创。因此,立足当前实际情况,集中要素资源支持数学信息科学领域的基础理论发展与创新是必要的。另外,尽管西方部分学术机构对中国存在诸多戒备,但我们还是需要鼓励中国科研机构更加广泛、积极地与国际顶级学术机构进行合作。多元化和国际化的科学研究团队有利于持续推进基础科学领域的创新。
(程实系工银国际首席经济学家,张弘顼系工银国际资深经济学家)