多模态文本智能技术方案
搜索文档
合合信息推出多模态文本智能技术落地方案,助力AI实现智能推理
21世纪经济报道· 2025-10-21 16:29
随着人工智能深入各行各业,多模态大模型正在成为AI发展的重要方向之一。近期,由中国图象图形 学学会、中国人工智能学会、中国计算机学会和中国自动化学会联合主办,上海交通大学承办的第八届 中国模式识别与计算机视觉学术会议(PRCV 2025)顺利举行。大会期间,"多模态文本智能大模型前 沿技术与应用"论坛(简称"论坛")获得了广泛关注。论坛汇集了来自华南理工大学、哈尔滨工业大 学、南开大学、华中科技大学、小红书及合合信息技术团队的顶尖专家与学者,深入探讨多模态文本智 能领域的最新技术突破与场景应用案例。 图说:中国图象图形学学会(CSIG)常务理事、 华南理工大学教授金连文致辞 如同人类需要同时调用视觉、听觉、触觉等多感官来全面地理解外部世界,大模型也需要综合处理文 字、图片、表格等文本信息后做出判断。"实战"应用标准对大模型的多模态内容深度整合能力提出了新 的要求,语义割裂、场景理解局限、决策失误等常见的模型缺陷制约了其在行业中的应用发展。合合信 息在论坛期间推出"多模态文本智能技术"方案,该方案可通过文本相关空间位置理解深层语义逻辑,实 现对多模态信息的"立体化综合化理解",赋予模型真正的文本"阅读理解"能力 ...