首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 人工智能 >> 正文

肯睿Cloudera助力企业将AI与分析部署到开放式数据湖仓一体架构,统一企业数据

2024年9月3日 15:13  CCTIME飞象网  作 者:刘隶放

肯睿Cloudera大中华区技术总监 刘隶放

肯睿Cloudera的客户大多运行着庞大的数据湖,从而为关键大规模数据分析和AI用例(包括企业数据库)提供助力。根据IDC发布的IDC MarketScape:中国实时湖仓市场2024年厂商评估》报告中的数据显示,未来12个月,选择外部合作来构建数据管理服务的企业比例将从58%快速增长至85%。数据量的快速增长、对数据管理需求的升级以及技术架构复杂度和独立开发成本的上升,都将推动企业开始越来越多地考虑湖仓一体的管理解决方案。

肯睿Cloudera在平台中提供Apache Iceberg能够帮助用户避免厂商锁定,实现开放式湖仓一体架构。借助由Apache Iceberg支持的开放式湖仓一体架构,企业可以更好地利用分析和AI的力量。近日,肯睿Cloudera还宣布了现代化数据目录和Iceberg REST集成这两项关键增强功能更新,以加强元数据管理,进一步提高开放式数据湖仓一体架构内部的开放互通性,满足数据全生命周期内日益增长的安全和治理需求。

将AI和分析部署到开放式数据湖仓一体架构中有诸多优点,其主要优势之一是能够将不同来源的数据集中到一个单一且连贯的存储库中。开放式数据湖仓一体架构融合了数据湖的灵活性,以及数据仓库的结构化查询功能,可以容纳种类型、格式和速度的原始数据和处理后的数据。这种统一的数据环境不仅避免了维护独立数据孤岛的工作,还便于AI和分析应用无缝访问数据。

肯睿Cloudera可助力企业充分利用开放式数据湖仓一体架构的以下优势:

数据湖和数据仓库的集成:开放式数据湖仓一体架构整合了数据湖的存储灵活性,以及数据仓库的查询性能和结构化查询功能,实现了两者的紧密结合。

开放性:开放式数据湖仓一体架构中的“开放”一词指的是与各种数据处理框架、分析工具和编程语言的互通性和兼容性。这种开放性使数据科学家、分析师和开发人员能够充分利用他们的首选工具和方法来探索、分析数据并从中获得洞察,以更好地协作和创新。无论是基于SQL的传统查询、先进的机器学习(ML)算法,还是复杂的数据处理工作流程,开放式数据湖仓一体架构都能提供一个可适应各种分析工作负载的灵活、可扩展的平台。

可扩展性和灵活性:与传统数据湖一样,开放式数据湖仓一体架构也能够横向扩展,容纳来自不同来源的大量数据。它可以灵活存储原始数据和处理后的数据,帮助企业适应不断变化的数据要求和分析需求。随着数据量增长和分析需求的变化,企业可以连续横向扩展其基础设施,以满足不断增加的数据摄取、处理和存储需求。这种可扩展性确保了数据湖仓一体架构即使在数据复杂性和使用模式发生变化时,也能保持响应速度和性能

统一的数据平台:开放式数据湖仓一体架构作为数据存储、处理和分析的统一平台,减少了维护独立数据孤岛和ETL(提取、转换、加载)流程的需要。将AI和分析部署到开放式数据湖仓一体架构中可以促进数据的民主化和自助式分析,让整个企业的用户都能够自主访问、分析数据并从中获得洞察。通过提供统一、可访问的数据平台,企业能够打破数据孤岛、实现数据和分析工具访问的民主化,并在各级培养数据驱动决策的习惯。这种数据和分析的民主化可提高企业的敏捷性和竞争力以及员工的协作能力和数据素养data-literate

支持现代分析工作负载:开放式数据湖仓一体架构支持基于SQL的查询和高级分析框架(如ML、图形处理等),满足了各种分析工作负载的需求,包括即席查询(Ad Hoc Query)、复杂数据处理和预测建模等工作。

数据治理与安全:肯睿Cloudera近日发布的元数据管理解决方案的两项关键增强功能,满足了数据全生命周期内日益增长的安全和治理需求。肯睿Cloudera的Iceberg REST Catalog集成允许使用第三方引擎无缝访问Apache Iceberg表,帮助用户在充分利用各种工具的同时,确保统一的安全性和治理。该集成能够简化数据访问,并维持各个平台上的数据权限和溯源,通过更大程度地减少独立安全层数量来降低成本和数据泄露的风险

此外,肯睿Cloudera的共享数据体验(SDX)现已发布以云原生容器形式提供的技术预览版,实现了端到端的统一数据安全、治理和元数据管理,并且已得到增强,具有更出色的弹性、扩展性和性能。SDX还提供各种工具的自助式数据访问、通过整合安全功能,更大程度地降低违规风险,并支持覆盖云和本地数据的统一视图窗口管理。

开放式数据湖仓一体架构代表了一种现代化的数据管理和分析方法,助力企业充分挖掘其数据资产潜力的同时,实现开放性、可扩展性和互通性。

点击此处了解有关肯睿Cloudera开放式数据湖仓一体架构的更多信息。

编 辑:路金娣
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
中国电信邵广禄:面向AI大模型的智算集群及网络的实践和展望
精彩专题
CES 2024国际消费电子展
2023年信息通信产业盘点暨颁奖礼
飞象网2023年手机评选
第24届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像