飞象原创(魏德龄/文)刚刚过去的2024年,新变化与新技术时刻环绕在企业身边,“降本增效”“出海创收”“高质量发展”等成为企业在讲述自身发展策略时的关键词。与此同时,o1与智能体又成为伴随AI技术演进时,被业界所更多聊起的新话题。
如今,即便是体育比赛也开始更多讲求高阶数据,对于企业而言,无论是发展变革,还是AI赋能,其背后都与企业对于数据资源的有效挖掘,存在着巨大关系。
发展变革与AI赋能的背后
告别粗放式发展的背后,重点在于企业正在从以往的“堆人与堆技术”转变为对于“降本增效”的关注,背后需要创新技术对企业实现更多助力。例如,对于中国的制造业企业而言,随着智能化转型,将朝着提升技术含量和附加值的方向发展,智能制造、自动化、机器人技术等将成为重点。
从企业数据的发展过程中,将持续从生产数据向分析数据的过程推进。当数据在生产环节中诞生,便可能会在公有云和私有平台上进行分配,再传送至不同的云上,最后以SaaS模式对客户进行服务分析。肯睿Cloudera在近期的媒体沟通会上,结合当下的市场情况给出了三个趋势观察结果。
当数据变得越来越多,企业在数据管理中正面临从传统数据仓库向数据湖仓一体转变的趋势。以往分析任务可能依赖于报表系统和数据仓库。然而,随着业务需求对数据实时性、完整性以及对结构化和非结构化数据的支持提出更高要求,数据的重心逐渐向数据湖仓一体倾斜。
另一个趋势是了解数据资产需要数据网格或数据编织,作为企业数据治理的重要手段,通过整合多种数据格式和语言,为数据分析和对外服务提供支持。“在跨域数据中,数据网格和数据编织为企业提供了沟通与协作的新模式。”Cloudera大中华区技术总监刘隶放描述了企业数据管理的新方向。
例如,对于存在多个不同资方的企业而言,由于数据安全性和复杂的股权结构,数据的归属和跨域使用问题变得突出,数据网格理念尤其是在面对不同资方,以及解决跨部门、跨架构的数据协作问题上,提供了“以数据为产品”的有效对话模式。
第三个趋势在于人工智能应用生命周期需要可信数据。企业成功应用AI的关键在于从0到1的积累过程。“企业不要去羡慕市场上的生成式AI有多火,要先把马步扎实。”刘隶放专门在媒体会上强调了企业数据资产文化积累的重要性。
例如,在大语言模型大热之前,许多企业已具备成熟的数据资产和相关文化,如OCR系统、智能客服等。没有这些基础,仅依赖现成模型难以实现真正的突破。在AI应用中,数据不仅是支撑技术的基础,更是企业构建独特竞争力的核心。结构化和非结构化数据的组织能力以及对数据资产的深度利用,决定了企业能否从AI中获得实质性价值。
Cloudera也正在顺应上述市场环境趋势需求,为AI提供一个集中可信的数据中心,为模型和平台的构建提供坚实的数据基础。Cloudera不仅支持在公有云和私有平台上的AI部署,还注重跨平台能力,推动现代化数据架构的发展,实现数据和应用的无缝连接。
务实AI策略与数据管理挑战
面向2025年,Cloudera发布了五大科技趋势预测。揭示了在未来一年生成式AI和AI Agent等创新技术的发展趋势。其中包括生成式AI的应用将趋向务实,AI Agent将在商业决策中发挥重要作用。同时,企业面临着AI生成数据激增的挑战,亟需提升数据治理能力。企业需要强大的数据管理和多云策略来访问、存储和分析数据,从而获取数据的最大价值,充分发挥AI潜力。
首先便是企业对于AI的态度变化,预计生成式AI热度将减退,企业会采取更务实的AI策略。Cloudera预测,企业将不再相信生成式AI的大肆炒作,而是专注于制定与企业整体目标一致的技术投资计划。在很多企业内部的生成式AI应用过程中,初期通常从内部知识库问答系统入手。这种简单应用易于实现且安全可控,可以通过开源模型和提示词调整生成式AI结果。而一旦这一应用进行对外服务的话,就需要面临更高的准确性和可靠性要求,一直存在的致幻率问题将会严重影响客户体验。
预计到2025年,企业将在生成式AI应用上分化为两大阵营。一类是已成功应用生成式AI的企业,通过成熟应用实现了显著成效,背后的核心价值在于规模化的知识获取和洞察生成,数据质量是确保AI模型成功运行的关键。而另一类企业由于缺乏足够的数据储备,难以从生成式AI中获得相同效益。因此他们将更倾向于采用传统AI或确定性机器学习模型,以提升效率和生产力。
第二个预测是AI Agent将重塑商业决策,2025年将会迎来一个井喷式发展。Agentic AI正在推动创新浪潮,改变实时问题解决和决策过程。AI智能体高效优化任务,迅速应对挑战,并实时灵活调整。这将促使企业构建事件驱动型架构,支持AI能够及时响应现实事件,从而彻底改变电信和物流等行业。
第三是“全天候”AI为数据管理带来新挑战。以某国内制造业企业为例,该企业将电池信息的收集频率从每小时一次提升到每几分钟一次,显著增加了数据的实时性和精准性。但数据量的爆发也带来了存储和分析方面的挑战,需要更高效、更廉价的存储解决方案。企业面临算法优化和数据管理的多重挑战,需结合成本控制和技术提升来实现数据价值的最大化。
当AI如同空气无处不在,渗透至个人生活的方方面面。面对数量庞大且种类繁多的AI生成数据,企业如何从中挖掘出有价值的信息,成为亟待解决的问题。企业努力从不断增长且种类繁多的AI生成数据中获取洞察力,糟糕的数据管理可能会导致企业被信息流淹没,难以有效地利用这些数据资源。为了充分释放AI潜力,企业需要强大的数据管理和多云策略来访问、存储和分析数据,无论数据是在本地、云中还是在边缘,都能提炼获取数据的最大价值。
这也引出了下一个预测内容,当企业在2025年致力于推动生成式AI的全面生产和规模化部署,单纯的混合云架构已无法满足企业需求。当前企业的AI算法与分析算法需要能够跨云访问数据,并同时追求经济性。由于数据在公有云和私有平台间的传输价格非常昂贵,企业需要平衡分布算力和数据,在利用这一环境来构建AI算法。
德勤的研究指出,企业采用生成式AI的最大障碍是合规风险和治理问题。随着企业开始在本地或公有云中运行私有AI模型和应用,混合数据管理平台的需求日益增长。这类平台集成了本地与云数据源,因此具备更高的灵活性且支持更广泛的数据访问,在保障模型端点安全和治理的同时,赋予企业更强的控制力。
最后一个预测是私有大语言模型(LLM)将逐渐取代公有大语言模型,成为企业优选。“私有大语言模型将成为企业的优选,从合规到隐私保护,这是不可回避的趋势。”刘隶放点明未来企业的人工智能发展过程中,将会聚焦合规与隐私需求。
预计到2025年,企业将加快定制AI解决方案的步伐,包括AI聊天机器人、虚拟助手和专属代理应用等,以满足特定行业或业务的需求。越来越多企业将采用企业级LLM,这将对GPU的高性能支持提出更高要求,以比传统CPU更快的速度运行,同时确保数据管理系统具有更高的安全性和隐私保护。RAG技术将得到更广泛的应用,将通用LLM转化为行业或组织专属的数据仓库,从而为现场支持、人力资源和供应链等领域的终端用户提供更加精准、可靠的数据支持。