多模态文本智能技术方案 - 财报，业绩电话会，研报，新闻

多模态文本智能技术方案

搜索文档

搜狐网· 2026-01-06 12:57

公司资本运作与战略布局 - 公司为科创板上市企业，近期更新港股IPO招股书，重启“A+H”上市布局 [1] - 本次募集资金将重点用于强化AI核心技术研发，以巩固核心技术壁垒 [1] 核心技术能力与产品表现 - 公司核心C端产品扫描全能王APP的常规印刷体文档字符平均识别率达99.77%，手写体文档字符平均识别率达97.00% [2] - B端TextIn产品线支持上千种文档类型识别，单文档最大支持500MB，解析速度快至1.5秒/百页 [2] - 公司技术具备语义级识别、跨页表格还原等复杂场景处理能力，并全面兼容MCP标准接口，可集成至多个主流大模型体系 [2] 技术认可与商业化进展 - 公司技术在国际顶级技术赛事中多次斩获表格识别、票据识别等项目冠军，参赛方包括百度、华为、科大讯飞等知名企业 [3] - 2025年下半年以来，公司加快AI技术商业化落地，推出扫描全能王“翻页自动拍”功能、多模态文本智能技术方案 [3] - 公司联合亚马逊云科技推出面向医疗行业的智能文档处理解决方案，并携手火山引擎发布“大模型加速器”升级版 [3] 市场地位与行业前景 - 公司是行业内少有在国内外市场同时布局且取得规模化成果的AI应用公司 [4] - 公司核心产品用户基数大、粘性高，已形成“产品－付费－现金流－研发”的良性循环机制 [4] - 随着港股IPO进程推进，公司将进一步打通双融资渠道，为技术研发持续注入动力 [4]

合合信息推出多模态文本智能技术落地方案，助力AI实现智能推理

21世纪经济报道· 2025-10-21 16:29

行业发展趋势 - 多模态大模型正成为人工智能发展的重要方向，其利用文本、图像、音频、视频等多种信息形式进行表达、理解和交流 [1][4] - 根据2025年Gartner人工智能技术成熟度曲线，多模态AI将在未来五年内成为各行业提升所有应用和软件产品功能的核心技术 [4] - 行业对AI系统的需求正从“功能实现”向“业务赋能”深化，旨在推动AI系统从辅助工具进化为具备自主决策能力的业务伙伴 [15] 技术突破与创新 - 合合信息推出“多模态文本智能技术”方案，通过文本相关空间位置理解深层语义逻辑，实现对多模态信息的“立体化综合化理解” [3] - 哈尔滨工业大学车万翔教授分享“多模态思维链”技术，将推理逻辑分解为一系列可解释的跨模态推理步骤，以生成更精准可靠的结论 [4] - 南开大学周宇教授介绍系统化的OCR幻觉缓解方案，为提升多模态大模型的可视文本感知能力提供有效路径 [4][8] - 技术方案将文本智能认知程度从语义理解拓展到类人推理及自主机器决策，形成从感知到认知再到决策的技术实现路径 [15] 应用场景与案例 - 小红书hi lab团队分享基于单视觉语言模型的多语言文档布局解析工具“dotsocr” [9] - 华中科技大学刘禹良教授介绍首个覆盖甲骨文专家破译全流程的辅助考释框架AlphaOracle，在“劳”等字的辅助破译上取得突破 [11][12] - 合合信息文本智能技术帮助用户解决复杂场景下的文档图像问题，方案已在金融、医药、教育等专业领域开展应用 [8][15] - 技术方案处理对象从传统文档延伸至多种承载文本信息的媒介，如论文、财报、视频、自然场景，实现对业务流程的智能重构 [14][15]

合合信息(SH:688615)

多模态大模型

通用人工智能（AGI）

Artificial Intelligence

Artificial Intelligence

多模态文本智能技术方案

dots.ocr