首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

合合信息IPO:升级文档解析技术,助力上市企业财报解读

2024年9月10日 11:41  CCTIME飞象网  

在A股市场迎来中报季的背景下,上市公司的财报披露成为投资者和市场分析师关注的焦点。特别是在巨额募资活动的背景下,财报的准确性和透明度对于投资者决策具有至关重要的影响。合合信息的文档解析技术通过辅助大模型深度解读财报,为金融行业从业者提供了强有力的工具,以应对海量财报文件的分析需求。

随着人工智能技术的深入发展,部分企业和个人开始尝试用大模型进行财务报表分析。针对大模型“理解力”薄弱,数据读取错误等问题,合合信息大模型“加速器”方案优化升级了PDF文档解析技术,将非结构化的PDF内容转换为结构化数据,提高大模型图表类数据提取准确性和版面理解能力,助力大模型实现从“泛读”到“精读”的能力跨越。

在巨额募资活动中,投资者需要对公司的财务状况、资金使用计划和未来盈利能力有清晰地了解。合合信息的PDF文档解析技术能够准确识别和解析财报中的各类复杂表格、图表和文本,确保关键信息不被丢失或误解,为投资者提供了更为精准的数据分析和决策支持。

文档解析技术是大模型理解和处理文档的前提,相关能力的缺失,会导致大模型在理解版面不同区域的内容排列顺序、要点时遇到障碍,影响大模型的“理解力”,财务报表中的关键信息可能会丢失或被误解,使得模型生成的答案不够精准,无法正确回答用户的查询。

图 1:合合信息PDF文档解析技术在大模型表格解析中的效果

据了解,合合信息PDF文档解析技术具备多文档元素识别、版面分析能力,可以识别文档中的段落、公式、页眉、页脚等多种元素,并进行对应的处理。在应对财报中常见的无线表、合并单元格、不规则行距、跨段、跨页等障碍时,该技术也能做到准确还原各类表格结构。

为了让大模型像专业人士一样阅读文本,PDF文档解析技术可对各类学术文献进行版面元素的识别及阅读顺序的判定。该技术不仅能够准确定位文档中的关键信息段落,还能根据PDF文档的布局和格式,推断出人类阅读时的顺序,而非机械地判定为从左至右排序,避免把完整的段落文字“拦腰斩断”,真正做到了“所见即所得”。

图 2:合合信息PDF文档解析技术对双栏论文的解析效果

合合信息技术团队成员表示,上市公司年报页数大多集中在200至300页的范围内,一个熟练的分析师可能在几天到一周的时间内完成对年报的基本分析,PDF文档解析工具最快能在1.5秒完成百页文档的解析,按8小时为一天工作时间计算,解析工具可帮助大模型在一日内对数千家企业的年报数据进行精准分析。

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
中国电信邵广禄:面向AI大模型的智算集群及网络的实践和展望
精彩专题
CES 2024国际消费电子展
2023年信息通信产业盘点暨颁奖礼
飞象网2023年手机评选
第24届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像