在7月8日举办的2023世界人工智能大会“大模型与深度行业智能”创新论坛上,中国科学技术信息研究所党委书记、所长,科技部新一代人工智能发展研究中心主任赵志耘做了《人工智能大模型技术发展及行业应用的思考》的主旨演讲。
首先,赵志耘书记介绍了全球人工智能大模型发展态势。
大模型技术群正在快速壮大。自谷歌2017年发布Transformer网络结构以来,仅用五年多时间全球已迅速成长出庞大的大模型技术群,衍生出涵盖各种技术架构、各种模态、各种场景的大模型家族。
大模型推动人工智能产业化进入“工业化时代”。大模型技术最大的突破就在于通用性,以ChatGPT为代表的大模型通过“大数据+大算力+强算法”的路径显著增强了通用性、泛化性,推动人工智能从以专用小模型定制训练为主的“手工作坊时代”迈入以通用大模型预训练为主的“工业化时代”。
大模型加速人工智能场景创新,深度改变行业生产力。大模型开辟数字内容领域新赛道,已经率先在AIGC(人工智能内容生成技术)产生大规模产业应用。同时,大模型也在不断加速实体经济智能化升级,其内容和代码生成能力与设备操控、机器人等技术相结合,将带动传统实体经济行业生产力和生产效率革命式升级换代。
大模型呈现通用和专用互促共进的新局面。大模型技术路线使语言、视觉等通识能力的形成成为可能。另外,金融、医疗等垂直领域的专业类大模型快速涌现,正在发挥其领域纵深优势不断深化落地,提供针对特定业务场景的高质量专业化解决方案。
接下来,赵志耘书记分析了中国人工智能大模型发展情况。
中国人工智能领域的战略部署为大模型发展奠定了坚实基础。我国政府高度重视人工智能发展,自2017年发布实施新一代人工智能发展规划以来,部署启动2030—“新一代人工智能”重大项目、支持建设国家新一代人工智能开放创新平台、鼓励构建产学研创新联合体等。经过政产学研各方协同努力,我国建立起涵盖大模型理论方法和软硬件技术的体系化研发能力,形成了紧跟世界前沿的大模型技术群。
中国大模型技术沿各技术路线迅速发展。在自然语言处理、机器视觉和多模态等领域涌现出盘古、悟道、文心一言、通义千问、星火认知等多个具有行业影响力的预训练大模型,总体水平紧跟世界前沿。
中国大模型产业化已经形成通用类大模型与专业类大模型并行发展的态势。通用类大模型持续拓展应用领域,正在从办公、生活、娱乐向医疗、工业、教育等加速渗透。垂直领域专业类大模型不断深化落地,金融、教育、医疗、遥感等垂直领域发展起一批专业化大模型,发挥其领域纵深优势,提供针对特定业务场景的高质量专业化解决方案。
中国大模型落地应用空间广阔。我国众多产业对于高质量发展的需求,为大模型的落地应用提供了场景支撑,将进一步推动与各行业深度融合,成为驱动产业转型升级的重要力量。同时,我国也在不断推进的人工智能算力基础设施及基础数据平台等建设,为大模型发展提供了基础能力支撑。
最后,赵志耘书记指出,目前我国大模型的发展尚处于早期阶段,基础研发能力仍有待提高,面临智算能力差距较大、基础模型算法原创性不足、缺少高质量训练数据、有组织的工程化能力相对薄弱以及人才资源缺乏等诸多挑战。为此,赵志耘书记建议,一是加强资源和研发力量统筹,促进大模型有序发展;二是加快基础研究和技术创新,提升学术和开源影响力;三是强化大模型发展中的场景牵引作用,打造大模型标杆项目;四强化国际合作,积极参与全球人工智能治理。