飞象网讯(易欢/文) 在数字化转型浪潮下,微服务及容器化的业务部署使得应用架构的复杂度急剧增加,可观测性技术凭借远超传统应用性能监控的强大能力开始崭露头角,成为现代企业IT运维不可或缺的利器。Gartner更是将应用可观测性列为“2023年十大战略技术趋势”,并表示“如果能够在战略中予以规划并成功执行,可观测性应用将成为数据驱动型决策的最强大来源”。
技术的走向和认可必然带来市场的火热追捧。近年来,我们看到国内外的很多厂商都在积极的对可观测性技术进行探索实践,基调听云便是其中之一。与国内很多竞品公司选择开源方式不同的是,基调听云从进入赛道开始便坚持自研,为此投入了大量精力和人力进行研发,打造了从应用性能管理、可观测性到应用安全的一体化全栈技术能力,具备数据治理程度更高、数据间关联性更强的优势。年初重磅推出了“观云”、“安云”两款硬核产品,一记组合拳再次强化了其标杆地位。
虽然赞誉不断,但基调听云并没有沉浸在现有的成绩里,而是一直紧跟时代需求不断对技术进行升级迭达。尤其是在AI技术火热的当下,可观测性平台如何与AI技术相结合为用户提供更加灵活智能安全的体验也成为基调听云思考的重点。“我们更愿意尝试新技术和市场探索,尽管这可能导致试错成本” ,在基调听云CEO陈靖华看来:“现阶段,AI更多地被用作辅助工具来提高效率,而非完全取代人工决策。未来,随着技术的不断进步,我们期待AI能在自动化领域发挥更大的作用,但仍需谨慎对待其在关键决策中的应用。”
创新迭达
聚焦“可观测性+安全”复合能力
大多数人都会有这样的疑问,为何在监控运维技术和经验都日趋成熟的今天仍然会有很多的P0级事故发生?对于这个问题,陈靖华曾不止一次的公开强调,那是因为仍然有未知的风险无法被发现。“这种“未知的未知”问题就像黑天鹅事件一样,不仅难以预测,突然发生时还会引起连锁反应,并带来巨大负面影响。可观测性平台就是要着力解决这种‘未知的未知’问题。”
不仅如此,还有一个值得关注的问题是,随着云原生技术的快速发展和广泛应用,在有效观测和管理各类应用性能、确保其稳定运行的基础上,应用安全问题成为另一个严重影响应用稳定性和业务连续性的关键问题。如何提升应用安全防护的能力,及时发现和解决潜在的安全风险。基于对市场痛点的洞察,基调听云年初推出了“观云“和”安云“两款产品。
其中,基调观云平台的设计初衷和最终目标是具备更加灵活多变的探索未知问题的能力。为了达成可观测性能力的跃迁,观云平台首次引入了强大的数据湖仓和轻应用架构,为用户提供了全新的数据探索和系统观测体验。基调安云(ASPM)则是通过复用生产环境现有APM数据的方式,零Agent部署实现旁路实时运行态风险预警和防护。ASPM的应用资产梳理能力,可以主动梳理线上API资产、线上组件资产,并实时观测API的入侵状况。同时,针对已发现的漏洞,还可在进程级别进行热补丁修复。
基调听云的定位就是聚焦可观测性和应用安全两大领域,持续完善相应的产品能力,不断延伸自身的技术及业务布局。如今,这两款产品仍在不断的进行快速迭代,推出了诸多新功能,并计划在年底前补充更多能力。据陈靖华介绍,在数据治理过程中,基调听云的系统已经实现了从最初的支持SPAN模型、链路追踪模型,到现在的支持用户体验RUM及手机端应用数据模型、指标模型、日志模型、事件模型和安全漏洞及威胁数据模型的跨越式发展。
此外,为了进一步完善系统,基调听云与上下游合作伙伴展开合作,帮助他们将数据以标准化模型的形式转化和接入到其系统中。陈靖华对记者坦言:“目前,国内跟进的厂商并不多,因此我们需要在这个过渡期内协助客户完成数据迁移和对接工作。”不仅如此,基调听云还建立了AI辅助分析能力,预计将在本月上线以帮助用户和技术人员高效地分析数据湖仓中的可观测性数据。
在安全领域,过去几年基调听云主要关注组件和服务的适配,今年则投入大量精力进行各种代码漏洞的高效识别和修复方案研究。同时,陈靖华认为API和应用安全在企业安全领域是一个亟待解决的问题。“通过探针技术,我们甚至可以在一个API未被访问之前发现潜在的安全隐患,并为客户提供有针对性的解决方案。“
值得一提的是,为了更好地应对安全威胁,基调听云还建立了两个闭环:一是知识库闭环,利用生成式 AI能力结合知识库和知识图谱为用户提供关于漏洞的详细信息和修复建议;二是拦截闭环,在发现攻击时迅速采取阻断措施阻止威胁扩散。此外,还可以利用终端用户体验的可观测性数据对内部人员进行异常行为预警,以便及时发现并防范潜在风险。“总而言之,我们在产品迭代和安全防护方面取得了显著进展,并将继续努力为客户提供更优质的服务。“
拥抱AI
助力企业实现更高效的运维管理
ChatGPT 的爆火把人工智能推到了前所未有的高度,熙熙攘攘,彷佛遍地是AI,各行各业都在通过引入AI以便加速企业数字化转型的进度,实现降本增效。在可观测性技术层面,AI的引入和融合如何更好的提升用户体验也是基调听云探索创新的方向之一,但在此前提下,基调听云更多的是保持理智的心态把AI技术应用到更加贴合的场景中,真正的匹配行业的现实需求。
实际上,在AI大模型火热之前,许多企业和厂商投入大量资源研发AI智能运维(AIOps)技术,但成效甚微,甚至出现了许多烂尾项目。客户对AIOps的满意度不高,厂商也难以收回投资,导致其热度逐渐消退。如今,AIOps已被重新定义为更细分领域的“事件智能解决方案”领域,专注于告警事件的收敛和聚合,以减少告警时间过多对用户的打扰和注意力的分散。
在陈靖华看来,造成AIOps发展困境的主要原因之一是缺乏统一的数据标准。由于不同厂商的监控产品数据割裂,且数据处理方式和定义存在差异,导致AI模型难以获得高质量的数据源。因此,建立一套跨越整个行业的统一监控数据和语义标准显得尤为重要。
近年来,许多企业开始转向可观测性领域,试图通过建立统一的监控数据和语义标准来解决AIOps所面临的数据标准和数据质量问题问题。在此基础上,企业可以利用AI技术进行数据分析、故障诊断和预测等任务,从而提高运维和安全防护的效率和质量。例如,通过自然语言处理技术,用户可以向AI引擎提出需求,AI引擎则会在数据仓库中自动生成相应的查询语句,从而快速获取所需数据。此外,企业还可以利用生成式AI技术对运维和安全知识库进行增强搜索,帮助员工更快地解决问题。
尽管如此,陈靖华也再三强调,目前,生成式AI(如GPT)虽然取得了一定进展,但仍存在幻觉问题,即有时会生成不准确或虚假的信息,这在需要高精度的运维和安全事件处理中是不可接受的。因此,在现阶段,AI更多地被用作辅助工具来提高效率,而非完全取代人工决策。未来,随着可观测性领域的发展和AI技术的不断创新,企业仍有望在未来实现更高效的运维和安全管理。
谈及未来的产品计划,陈靖华坦言,即将进行重大产品升级,从第三代产品过渡到第四代产品。“明年,我们将废弃现有的四条独立的产品线,并将其能力重新整合到全新的云平台中。这一变革将涉及新产品和分析逻辑的重构,并将我们的主要收入来源从三个独立产品转变为统一的云平台。用户将享受到更统一、更高效的体验,新平台将兼顾快速分析和未知问题探索的能力。安云作为安全可观测性的核心组件,将在新平台上得到进一步强化,提升安全防护能力。”
此外,陈靖华透露称,在安全领域,基调听云计划拓展全生命周期管理,覆盖测试和开发环节,打造更全面的安全防护体系。与此同时,还将探索云原生场景下的安全挑战,如容器镜像安全和网络安全性,利用可观测性能力创新安全防护。
可以预见的是,随着数字技术的不断发展和安全需求的日益增长,基调听云的创新迭代在引领行业潮流的同时必将为用户带来更强大的功能和更高效的体验,为企业数字化转型提供更优质的护航能力。同时,我们也期待基调听云能够保持创新精神,在安全领域实现后来者居上的超越。