6月14日,2024北京智源大会在京举行。全球领先真机实验成功率突破95%的泛化抓取技术、全球首个端到端基于视频的多模态具身导航大模型NaVid、全球首个智能心脏超声机器人等多项人工智能领域的创新成果集结亮相,引发业内关注。
开幕式上,北京智源人工智能研究院院长王仲远作2024智源进展报告,介绍了智源研究院在语言、多模态、具身、生物计算大模型领域的前沿探索和研究进展,以及大模型全栈开源技术基座的迭代升级与版图布局。
王仲远介绍,现阶段语言大模型已具备一定的理解和推理能力,但这并不是让人工智能感知、理解物理世界的终极技术路线。未来大模型将以数字智能体的形态与智能硬件融合,以具身智能的形态从数字世界进入物理世界。
中关村科学城管委会副主任、海淀区副区长唐超表示,海淀区拥有一大批顶尖科学家和产业领军人才,在产业发展方面,已基本形成芯片、框架、大模型、数据技术与处理服务等全产业链部署,集聚企业超千家,占全市的2/3、全国的1/6。海淀区将规划全球首个人工智能街区,以五道口和大钟寺为先导区,规划53平方公里建设人工智能创新策源地和产业高地,强化产学研用一体化的协同创新。
在零一万物、创新工场董事长李开复与清华大学智能产业研究院院长、智源学术顾问委员张亚勤的对话中,张亚勤归纳了大模型的“三个做对了”和“三个需改进”。他说,规模定律、“Token-Based”(“基于词元的机制”)、通用性是现阶段大模型的正确选择。与此同时,当前大模型也面临效率低下、未能真正理解物理世界、边界问题的挑战,有待进一步解决。
人工智能技术正在加速进步,产业进入爆发期。百度首席技术官王海峰认为,大模型为通用人工智能带来曙光,可以从两个角度解读,一是人工智能技术的通用性,二是能力的全面性。从人工智能技术发展趋势来看,未来几年,规模定律依然有效,大语言模型仍有很大提升空间,多模态大模型会越来越好用,智能体技术逐渐成熟从而加速应用爆发。
北京智源大会由北京智源人工智能研究院主办,以“全球视野、思想碰撞、前沿引领”为特色,汇聚海内外研究者分享研究成果、探寻前沿知识、交流实践经验。自2019年10月首度亮相至今,大会已成功举办5届,成为国际人工智能交流的一张名片。