飞象原创(魏德龄/文)通用大语言模型使用得越多,就越会发现它的不专业。即便是搜索行业资料,也可能会让某一领域的知识与毫不相干的内容产生逻辑推理关联,甚至会把多个数据当成一道道应用题,从而在幻觉中编造数据,让人误以为真。
通用大模型之于电信领域自然也出现了专业性的问题,在真实的电信环境中,认知局限性问题使其还难以真正应用于行业。
通用大模型的局限性
今年2月份的一项测试表明,GPT-4在专门评估电信知识的TeleQnA数据集上得分不到75%,在基于3GPP标准文档的3GPPTdocs Classification数据集上得分甚至低于40%。微软的轻量模型Phi-2在包含500道通用数学题的MATH500基准测试中仅取得10%的得分。
SK电讯此前在开发网络操作助手的过程中也发现,尽管作为一项风险最低的任务,但在使用通用大语言模型+RAG的情况下,准确率却低于60%,无法达到商用标准。另外,将通用LLM应用于客服场景的多项任务时,调查显示满意度仅为约40%。
在AI与通信领域的融合成为行业未来方向的大背景之下,LLM在处理电信技术知识、合规要求以及网络故障排查方面显然暴露出了能力不足的问题。
其中的原因在于,电信网络拥有着复杂且深入的专业知识。开发人员需要将分散的复杂知识整合为统一数据库,构建电信专业大语言模型及嵌入模型所需的训练数据集。数据类型可能包括专业知识、设备手册、标准文档、应急处理文档和行业术语。
英伟达此前在GTC大会上又这样解释电信大模型与通用大模型所存在的本质区别,关键在于语言信息内容的不同,网络数据超越了文本、视频和图像,还包括日志、模拟信息、架构图等信息。为了能够助力人工智能理解电信网络中每天产生的百万连接与超3800TB的数据,就需要训练能够理解网络语言的专用电信模型。
聚焦电信大模型
基于此,电信大模型自然成为行业聚焦点,对于这一概念在模型的命名上不同的厂商尽管有所差异,但又殊途同归,例如,SK电讯自研的电信大语言模型(Telco LLM),英伟达的产品为多模态大语言模型LTM(Large Telco Model),其中电信与模型成为核心关键词。
GSMA也已经推出GSMA Open-Telco LLM Benchmarks,旨在提升大语言模型(LLM)在电信领域应用表现的开源社区。该社区提供了业内首个用于评估AI模型在真实电信用例中表现的框架,并得到了Hugging Face、哈利法大学、Linux基金会以及多家领先的移动网络运营商和厂商的支持。支持该项目发布的电信运营商包括Deutsche Telekom、LG Uplus、SK电讯和土耳其电信,以及技术供应商华为。
SK电讯的Telco LLM的微调流程从一个预训练的基础模型开始,例如Claude或GPT,在数万亿个Token上进行训练后,通过电信任务数据和指令数据对基础模型进行微调得到。据称该模型对电信领域具有深入理解,是一个强大的领域专用基础模型。之后,可以进一步基于特定用例的数据与人工反馈数据进行精调,使其更易快速集成至具体产品和服务中。
英伟达专门为电信行业定制的多模态大语言模型LTM能够作为网络AI智能体的核心组成部分,自动化复杂的决策流程、提高运营效率与员工效率,并增强网络性能。该模型利用NVIDIA AI Enterprise软件平台中的NVIDIA NIM和NeMo微服务,推动新一代AI在网络运营中的应用。LTM能够使AI智能体掌握电信网络的专属语言,理解实时网络事件、预测故障,并自动化解决方案。借助NVIDIA NIM微服务,LTM能够高效、精准、低延迟地针对电信工作负载进行优化。
电信大模型在实际业务中的工作职责与其他行业AI相似,目前也是先从助手的角色做起。
先从助手做起
客服助手是目前很多运营商所选择的AI率先落地领域。由于电信知识和业务逻辑已嵌入在模型中,不再需要冗长、复杂、难维护的提示,从而大幅降低服务成本。客服人员可以在日常对话的过程中,即时获得大模型所给出的提示,AI依据用户的对话可以提取出关键词与主题,再与专业知识库中的内容相结合,带来准确、有逻辑、贴近业务需求的辅助提示。
电信运营商还会对电信大语言模型进行分词器优化,使得模型能够更好地理解和处理文本的含义,并且符合服务地语言的语境和表达方式,让其所服务的当地语种也能达到与Llama3和GPT-4相近的性能表现。
在网络优化方面,不久前软银也曾演示过关于体育场突发流量的优化案例,操作人员只需通过对话叙述“明天将会在东京某体育场举行棒球比赛,我需要如何准备?”的网络需求情况,该模型作为NVIDIA NIM微服务的一部分,便可根据网络流量的变化自动调整网络配置,从而在几分钟内实现对网络资源的分配。而这项任务在过去最长可能需要几天来进行。
面向未来,电信大模型还会驱动智能体从而扮演网络优化中的不同角色,包括网络规划代理、网络规划代理、网络健康代理、网络运营中心代理、网络保障代理与网络部署代理。例如,通过NVIDIA AI Enterprise提供的额外工具所构建的网络AI智能体,能够实现包括减少宕机时间、优化客户体验与增强安全性等能力。AI智能体可以通过预测故障来减少宕机时间,从而提升网络韧性。同时,AI驱动的优化能够加快网络速度、减少故障,确保用户享受无缝连接。此外,AI还能持续扫描网络威胁,并实时降低网络攻击风险,全面增强网络安全性。
从目前的试水情况来看,“助手”一职显然还证明处在AI处在极早期的阶段,电信大模型还有很长的路要走,证明该领域绝非简单灌注数据就能标榜为“专业”,AI想要助力电信业突破香浓极限,还要先能够做到专业知识的融会贯通,而非简单的班门弄斧。