Workflow
多模态大模型
icon
搜索文档
【全球招募】用AI唤醒千年文明!探元计划NextGen数智活化赛道:五大文化场景等您“揭榜挂帅”
腾讯研究院· 2026-01-20 17:53
文章核心观点 - 腾讯探元计划NextGen发起“数智活化赛道”,旨在通过AI、多模态大模型、XR、计算机视觉等前沿技术,解决文化遗产在公众理解、体验互动与技艺传承方面的痛点,推动文化资源的数字化焕新与活化利用[2][4][7][56] 赛道议题与目标 - 赛道致力于通过前沿技术激发创新内核、重塑表达形态、创造体验革命,以产生新动能、新形态、新场景[5] - 议题一为“文化垂类多模态智能体”,要求智能体具备深层次语义理解、低幻觉推理和自主决策能力,能生成满足特定文化、审美与情感需求的数字内容[5] - 议题二为“沉浸式互动体验场景创新”,要求在交互感知、多感官数据融合、沉浸式呈现、情感计算、虚实融合及数字人/机器人导览等技术应用上创新产品和业态[6] - 议题三为“人机协同技艺传承发展”,旨在通过构建技艺“数字基因库”、智能化教学系统、生成式设计引擎等方式,实现AI驱动的个性化技艺传承与创意生产转化[7] 五大特定命题场景 - **场景一:云居智友(云居寺多模态智能体)** - 类型为博物馆/国家级档案文献遗产,痛点为石经内容难懂、叙事方式陈旧、体验单薄参与感低[8] - 期待构建一个懂历史、有温度、能创作、可交互的垂类多模态AI智能体,打通“石经—人心”的“最后一公里”[9] - **场景二:杭州西湖(文化遗产活化叙事系统)** - 类型为世界文化景观遗产,痛点为游客停留于浅层观光,难以触及千年文脉[15] - 期待基于游客动线与三维模型,用AI重建历史风貌,生成隐私安全的个性化沉浸式游览影像[16] - **场景三:海岱智游(大汶口文化沉浸式互动体验)** - 类型为博物馆/考古遗址,痛点为展陈静态、公众难理解史前社会与符号含义、古代制陶技艺流程断裂[19] - 期待形成可应用的AI体验系统平台,实现与“虚拟先民”对话、模拟制陶、解码八角星纹,让观众“进入历史”[19] - **场景四:廊桥智传(木拱桥营造技艺智能传承系统)** - 类型为非物质文化遗产(联合国人类非遗),痛点为技艺认知门槛高、年轻传承动力不足、实操成本高昂[29] - 期待开发智能教练系统,融合知识图谱与实时动作识别技术,引导用户动手拼装实体模型,像搭建乐高一样理解结构原理[29] - **场景五:广东醒狮“虚实共生”传承课堂** - 类型为非物质文化遗产(国家级),痛点为陈列展览缺乏互动性与体验性,需数字技术赋能传播[36] - 期待借助先进技术手段,对醒狮动作细节、发力方式等进行动作捕捉与结构化呈现,实现数字动态呈现和观众互动体验[36] 项目申报与支持 - 项目流程分为三大阶段:项目申报(2025年12月—2026年1月)、项目遴选与公示(2026年2月—3月)、项目共创孵化与成果沉淀(2026年4月—10月)[48] - 项目遴选将应用腾讯Cultech-SQI评价体系,聚焦场景代表性(S)、创新性(Q)和话题性(I)[50][52] - 资金支持包括:共创落地项目共选出2-3个,每组有机会获得数十至百万元扶持资金;概念探索项目共选出3-4个,每个项目有机会获得20-40万元扶持资金[52] - 额外支持包括北大等行业权威专家“陪伴式”孵化、腾讯SSV技术能力与传播资源连接、纳入北大文化创新案例库以及优秀成果通过探元平台走向国际舞台[52] 参与方式与目标群体 - 寻找拥有AI大模型、XR、计算机视觉、生成式AI、人机交互等核心技术能力,能独立承接特定命题场景的技术团队[43] - 同时开辟“开放命题”通道,鼓励文化场景单位(如文博机构、非遗中心)与技术团队组成联合体进行联合申报,共同提出创新解决方案[44][45][46] - 申报截止日期为2026年1月31日[53] - 该赛道由北京大学文化产业研究院负责运营,聚焦世界文化遗产、博物馆及非物质文化遗产三大文化资源,旨在通过科技赋能形成新模式、新业态和新产品[56]
2026 年AI 应用的胜负手:多模态,从AI视频到机器人
2026-01-20 11:54
**会议纪要核心要点总结** **一、 涉及的行业与公司** * **核心行业**:人工智能(AI),特别是**多模态大模型**及其应用领域,包括AI视频生成(短剧/漫剧)、自动驾驶、机器人[1][2][3]。 * **提及的海外公司/产品**:谷歌(Gemini)、OpenAI(GPT-4O, Sora)、特斯拉、Meta、李飞飞团队[3][5][17][29]。 * **提及的国内公司/产品**: * **大模型公司**:MiniMax(海螺模型)、字节跳动(豆包)、快手(可灵)、昆仑万维(Skyreels)[13][22][26][27]。 * **A股投资标的**:**兆驰股份**(旗下风行)、**昆仑万维**、**富博集团**、**万兴科技**、中文在线、掌阅科技[25][26][30]。 * **港股投资标的**:**MiniMax**、**快手**[27][30]。 **二、 核心观点与论据** 1. **AI应用行情进入“聚焦”阶段**:计算机及AI应用行情进入2.0阶段,核心是聚焦到**能够明确放量的核心AI应用场景**[1]。 2. **多模态是2026年AI应用的“胜负手”**:大模型正从文本向多模态快速演进,多模态技术的成熟将驱动应用爆发,是空间最大、最明确的放量方向[1][2][29]。 3. **多模态大模型的技术演进路径**: * **动态理解**:从GPT-4O开始,向“原生多模态”发展,旨在直接从动态数据中学习,对机器人、智能硬件至关重要。但目前动态理解准确率(约90%多)仍远未达到文字理解的成熟度,且存在理解因果关系能力不足等问题[5][6][8][9]。 * **动态生成**:视频生成以**扩散模型(Diffusion Model)** 为主流。Sora采用的**DiT(Diffusion Transformer)结构**是关键突破,使模型参数可扩展(scalable),显著提升了生成质量和细节[10][19]。当前视频生成模型参数已达**千亿**级别[20]。 * **理解与生成一体化**:趋势是将大语言模型(LLM)置于生成模型前端,以更好地理解用户意图,从而提升生成内容的可控性、遵循指令能力,并降低“抽卡率”(生成多次选择最优)。案例包括Luma、GPT-4等[11][12][15][16]。 * **向世界模型演进**:世界模型旨在直接从像素点等动态内容中学习物理规律(如重力),而非通过文字描述。技术路径尚未收敛(涉及JEPA-3、高斯扩散等不同方法),但对自动驾驶和机器人是长期利好[3][16][17][18]。 4. **核心应用场景一:AI视频(短剧/漫剧)已进入生产环境** * **产业现状**:一致性、画质、物理合理性等问题已得到较好解决,达到工业生产级应用。AI生成视频与真人视频的界限预计在半年内将难以分辨[14][15][21][23]。 * **市场空间与增长**:受多模态技术成熟驱动,市场自2025年10月起爆发。当前整体市场规模约**1000亿**出头,其中AI漫剧约**200亿**出头。预计2026年将实现**倍数增长**[24]。 * **成本与需求**:高品质(1080P以上)AI视频生成成本已降至**千元级**(一两千元),较好画质成本在**两三千元**级别,且成本仍在快速下降[23]。C端需求旺盛,类似游戏,用户易投入。以字节跳动“红果短剧”APP为代表的平台流量正在快速崛起[23][24]。 5. **核心应用场景二:自动驾驶与机器人(主题性机会)** * 多模态理解及未来的世界模型发展将利好该领域。目前世界模型尚处科研向早期应用过渡阶段,预计2026年下半年进入试验环境,2027年上半年进入生产环境。当前投资机会更偏主题性[3][21][28][30]。 **三、 投资机会与建议** 1. **AI视频产业链投资机会**: * **IP与内容方**:偏传媒行业机会(如中文在线、掌阅科技)[25][30]。 * **平台与AI工具方**:寻找“AI视频时代的Midjourney”,即基于底层大模型(如Sora、豆包、海螺模型)封装成优秀AI工具或平台的公司[25]。 * **重点推荐**:**兆驰股份**(风行,预期差大)、**昆仑万维**(Skyreels)、**富博集团**、**万兴科技**[25][26][30]。 * **港股**:首推**MiniMax**(海螺模型迭代),关注**快手**[27][30]。 * **业绩预期**:跟踪的核心公司2026年在AI视频方向的收入增速均呈**翻倍**趋势[27]。 2. **自动驾驶与机器人**:作为主题性机会,关注在相关领域有布局的公司[28][29][30]。 3. **算力与存储**:多模态应用落地爆发将利好底层算力和存储需求[29][30]。 **四、 其他重要信息** * **国产大模型进展**:国产多模态大模型(如MiniMax海螺、快手可灵)通常落后海外约半年。随着海外Sora、Gemini等确立领先地位,预计国产模型将在2026年**一季度末至二季度**全面跟上[22]。 * **关键时间节点判断**: * AI视频生成:目前已进入生产环境,成本快速下降[23]。 * 世界模型:2026年下半年进入试验环境,2027年上半年进入生产环境[28]。 * **风险提示**:世界模型的技术路径尚未完全收敛,自动驾驶与机器人领域的应用落地时间晚于AI视频[17][28]。
机器人国际顶刊封面:用AI教会仿生人脸机器人“开口说话”—— 网红博主“U航”的人脸机器人登上Science Robotics封面
机器人大讲堂· 2026-01-17 12:04
文章核心观点 - 胡宇航博士及其创立的公司“首形科技”在仿生机器人领域取得重大突破,其研发的机器人面部表情系统实现了对任意语音流的“零样本”实时唇形同步,并具备跨语言泛化能力,标志着人形机器人正从文本交互迈向丰富情感交互的新阶段 [1][11][12][25] 人物与公司背景 - 核心人物胡宇航(网名“U航”)毕业于美国哥伦比亚大学,是首形科技创始人,其研究聚焦机器人自主学习与自我建模 [3][10] - 胡宇航博士在读期间已在《Science Robotics》和《Nature Machine Intelligence》等国际顶级期刊发表三篇论文,学术成果丰硕 [3][6] - 基于前沿学术探索,胡宇航创立了“首形科技”,并获得多家顶级投资机构的青睐 [3][11] 技术突破:软硬件解决方案 - 研究团队在《Science Robotics》开年封面论文中提出全新解决方案,旨在解决人形机器人说话时表情僵硬的“物理鸿沟” [12] - **硬件重构**:摒弃传统刚性连杆,设计了一套拥有**10个自由度**(全脸25-DoF)的专用唇部驱动机制,并藏于可快拆的柔性硅胶皮肤之下,能物理实现闭唇音、圆唇音等复杂动作 [15] - **算法核心**:提出基于Facial Action Transformer的自监督学习框架,实现了机器人唇部运动对任意语音流的“零样本”实时生成 [12][19] - **系统架构**:机器人面部集成了扬声器、麦克风、高清摄像头及用于实时处理的**Nvidia Jetson AGX**边缘计算单元,采用磁吸式快拆连接器便于维护 [18] 技术原理与学习管线 - **模型架构**:FAT模型采用双路Transformer设计,一路编码器处理历史电机指令保证时间连贯性,一路解码器接收视觉特征数据预测未来口型,两者结合精准预测电机控制信号 [14] - **自监督学习管线**:构建了从虚拟到现实的闭环学习流程 [20] 1. **Sim-to-Real**:利用Wav2Lip等算法将音频转化为数字视频,作为机器人的“完美构想” [20] 2. **视觉编码**:使用变分自编码器将视觉图像压缩为高维潜变量 [20] 3. **动作生成**:FAT模型接收音频和视觉潜变量,直接预测物理电机运动指令 [20] - **自我优化**:系统通过对比摄像头拍摄的真实自我与脑海中的完美构想,实现自我纠错与持续优化,无需人工标注数据 [21] 性能与泛化能力 - 实验数据显示,该系统的唇形同步误差显著低于传统的音频振幅驱动方法 [22] - 系统展现出惊人的跨语言泛化能力,在未针对特定语言微调的情况下,成功实现了包括中文、日语、俄语、希伯来语在内的**11种语言**的唇形同步 [22] - 量化评估显示,所有非英语语言的同步误差均未超出英语(基准)的误差范围,证实了其跨语言泛化能力 [24] - 系统甚至能跟随AI生成歌曲的旋律和歌词,生成流畅的演唱动作 [22] 行业意义与未来展望 - 该技术标志着人形机器人正从“文本自然交互”迈向“丰富情感交互”的新阶段,当大语言模型解决“说什么”,该技术解决了“怎么说” [25] - 这项进展预示着具身智能的“微表情时代”,生动细腻、能产生情感共鸣的物理面部将成为未来人机共存时代的关键情感接口 [25] - 文章末尾列举了包括人形机器人在内的广泛机器人产业链相关企业名单,显示了该领域的活跃生态 [29][30][31][32]
热芒科技加速布局多模态大模型 推出新型智慧终端
证券日报网· 2026-01-16 22:15
公司战略与产品创新 - 公司近期申请了一项名为“基于多模态大模型的迭代式问题求解框架构建方法及系统”的专利,加速布局多模态大模型 [1] - 公司发布了一款名为“会教书”的新型智慧终端护眼灯,将护眼灯的光从物理照明升维为“可听、可看、可说、可理解”的智慧场 [1] - 公司创始人表示,其目标是通过科技力量让学习重归温柔与从容,并称“不是来卖灯,是来宣布一个传统作业时代的结束” [3] 产品技术特点与功能 - 该智能护眼灯经过国AA级认证,采用紫光全光谱等全球顶尖技术,无限贴近自然光 [2] - 国际多家权威机构通过实验、论文等方式验证了紫光具有预防近视、延缓近视、减缓视疲劳等优势 [2] - 产品核心能力融合人工智能、光学工程、人因工程、沉浸式交互技术与大数据,并融合了多模态AI感知、精密光学设计、实时语义链接与智能行为决策四大核心技术底层 [3] - 产品具备实时精准的AI辅导作业、突破空间限制的远程陪学、基于深度学习的数据服务等功能,从“照明工具”向“教育伙伴”跃迁 [3] 市场定位与行业洞察 - 公司瞄准家庭教育等细分场景,洞察到作业时间已成为中国家庭的情绪高压线,而传统护眼灯在此场景中缺席 [2] - 公司重新定义了光存在的价值,指出传统护眼灯解决了“看得清”的问题,但忽视了孩子学习中的认知需求、情感陪伴和个性化引导 [2] - 公司的突破意味着护眼技术将成为未来护眼灯产品的标配,行业竞争正从提供优质“光源”迈向提供智能化“服务”的高维度跨越 [1]
泽宇智能(301179.SZ):自主研发的多模态大模型产品目前已深度应用于电网智能巡检领域
格隆汇· 2026-01-15 15:10
公司业务与技术进展 - 公司自主研发的多模态大模型产品已深度应用于电网智能巡检领域 [1] - 该产品技术指标具有突破性,检出率高、误检率低、泛化性强,赢得行业高度认可 [1] - 公司持续推进该领域技术迭代升级 [1] 战略合作与发展 - 公司于2025年年底与云深处科技达成战略合作 [1] - 合作旨在聚力打造更高效、可靠的电力巡检智能化解决方案 [1]
沈阳公安交警运用跨模态智能体+AR眼镜让违法车辆无处遁形
新浪财经· 2026-01-14 08:00
核心技术创新与应用 - 沈阳公安交警研发中心自主研发了跨模态违法车辆深度挖掘智能体,并与AR智能眼镜实现有机融合 [2] - 该智能体依托多模态大模型的跨模态推理分析能力,整合交管大数据,对前端感知设备的视图信息进行智能化解析 [2] - 该融合应用实现了对违法车辆的智能挖掘、精准预警与高效处置的全链条闭环管理 [2] 功能与能力提升 - 执勤民警佩戴AR智能眼镜后,可直观观察路面动态,并通过智能体数据分析洞悉车辆背后的海量关联数据,使违法车辆无处遁形 [2] - 该技术能精准识别“飙车炸街”、车辆改型等多种隐蔽性强、识别难度大的交通违法行为 [2] - 该应用为基层执勤民警配备“最强大脑”,大幅提升了单兵作战能力 [2] 特定场景应用拓展 - 针对校园周边交通管理场景,依托AR智能眼镜实现了家长预约车辆智能识别功能 [3] - 在上下学高峰时段,执勤民警可快速识别车辆是否为已登记在专属数据库的预约车辆,以及是否按指定区域规范停放 [3] 多元功能与行业意义 - AR智能眼镜具备图像实时回传等多元功能,能适配路面巡查、应急处置、现场执法等多场景应用需求 [4] - 跨模态智能体与AR眼镜的创新融合,丰富了智慧交管的应用场景,提升了单兵执勤的智能化、科技化水平 [4] - 该技术为构建安全、有序、畅通的道路交通环境提供了坚实的科技支撑 [4]
合合信息多模态文本智能产品上新,覆盖AI教育、AI健康、AI Infra多元场景
新浪财经· 2026-01-13 20:35
行业趋势与公司战略定位 - 人工智能产业进入“落地为王”的新阶段,AI技术与多元化场景的融合成为行业焦点[1][10] - 合合信息集中发布了基于多模态大模型的系列创新产品,覆盖AI教育、AI健康管理、AI基础设施及AI Agent应用等多个领域,展现了文本智能技术与垂直场景结合的创新潜力[1][10] - AI大模型发展正从通用能力向行业纵深落地演进[2][11] 消费级AI产品与应用 - 在通用文档处理领域,旗下产品扫描全能王推出“CS-AI一站式智能化文档解决方案”,实现从影像数字化向文档全周期智能服务升级,覆盖扫描、阅读、编辑和学习等核心场景[2][11] - CS-AI预计将在跨境电商、出境游、专业文档翻译等市场中展现强劲的出海潜力[2][11] - 在教育领域,公司面向国内及海外市场推出AI错题学习管理工具“蜜蜂试卷”/“QuizAI”,可智能识别手写体试卷,提供批改及“举一反三”等互动学习功能[2][13] - 在健康领域,公司推出AI饮食健康助手Appediet,用户通过拍照即可识别食物营养成分,生成热量报告,并可结合用户健康数据定制饮食计划[4][15] 企业级AI基础设施与智能体 - 在企业级市场,Agent智能体的规模化落地正将AI基础设施推至重要位置,高质量数据成为关键[6][17] - 据IDC预测,到2028年全球数据量将增长至393.8ZB,2023至2028年期间复合年均增长率达24.4%[6][17] - 公司旗下TextIn发布AI基础设施产品xParse,旨在以AI赋能通用文档非结构化数据挖掘,释放数据价值[6][17] - 据麦肯锡2025年AI报告,62%的受访组织已经在试验智能体类应用[7][18] - TextIn打造了Agentic AI产品INTSIG Docflow,能够像“数字员工”一样对合同、票据、报表等高复杂度非结构化文档进行解析、分类、抽取、审核、比对及跨系统业务流转[7][18] 商业数据智能与分析 - 公司旗下启信慧眼推出了多项AI原生应用,作用于企业风险管控、营销与智能决策[8][19] - “AI智能寻源”功能让客户实现“一句话从3.4亿家企业中,找到合作目标”,在具体使用场景中帮助客户寻源拓客效率平均提升超过30%[8][19] - “AI准入尽调”功能将行业知识与全盘数据相结合,给出供应商合作建议[8][19] - “AI关系洞察”功能用AI透视隐形风险,智能锁定关键风险[8][19] - 启信慧眼AI原生应用功能已在制造、医药、半导体、电子、能源、汽车、金融等多个行业中应用,日均风险扫描次数超过2000万次[8][19] 未来展望 - AI技术正向着多模态融合、Agent智能体规模化的方向加速突破[8][19] - 公司将持续深耕AI领域,推进多模态文本智能技术研发,不断拓宽技术应用边界,探索AI应用落地的新机遇与商业化增长的新路径[8][19]
合合信息发布多款多模态大模型产品
新浪财经· 2026-01-13 18:38
公司产品发布 - 合合信息发布了一系列基于多模态大模型的产品 [1] - 新产品覆盖多个领域,包括AI教育、AI健康管理、AI基础设施以及AI Agent应用 [1] - 具体发布的产品包括扫描全能王的“CS-AI一站式智能化文档解决方案”、AI饮食健康助手Appediet、AI基础设施产品xParse以及启信慧眼的AI原生应用 [1]
拍照改试卷、修复图像、定制个性饮食……跨越落地“最后一公里”,这些上新的AI有点厉害
扬子晚报网· 2026-01-13 18:22
行业趋势:AI进入“落地为王”与行业纵深阶段 - AI产业发展进入“落地为王”新阶段,焦点在于AI技术与多元化场景的融合[1] - AI大模型发展正从通用能力向行业纵深落地演进[1] - 在企业级市场,Agent智能体的规模化落地正将AI基础设施推至重要位置[4] 公司产品发布:合合信息基于多模态大模型的创新应用 - 公司近期集中发布了系列基于多模态大模型的创新产品,覆盖AI教育、AI健康管理、AI基础设施、AI Agent应用等多个领域[1] - 在通用文档处理领域,扫描全能王“CS-AI一站式智能化文档解决方案”实现从影像数字化向文档全周期智能服务升级,覆盖扫描、阅读、编辑和学习等核心场景[1] - 依托文档解析与版面还原技术优势,CS-AI预计将在跨境电商、出境游、专业文档翻译等市场展现强劲出海潜力[1] 垂直场景应用:AI教育 - AI错题学习管理工具“蜜蜂试卷”与“QuizAI”可智能识别手写体试卷,提供批改及“举一反三”等互动学习功能,实现个性化“因材施教”[1] 垂直场景应用:AI健康管理 - AI饮食健康助手Appediet,用户通过拍照即可识别食物营养成分,生成热量报告[2] - Appediet可结合用户健康数据定制饮食计划,并提供个性化营养分析报告、健康食谱推荐等服务,打造“人人可用的AI随身营养师”[2] 企业级市场:AI基础设施与数据价值释放 - 高质量数据成为AI基础设施发挥效能的关键,国际数据公司IDC预测到2028年全球数据量将增长至393.8ZB,2023至2028年复合年均增长率达24.4%[4] - 企业数据以碎片化、杂格式形态沉淀,拉低模型训练效果并限制智能应用落地深度[4] - 公司智能文本处理企业级AI产品线TextIn发布AI基础设施产品xParse,以AI赋能通用文档非结构化数据挖掘,在知识库与Agent落地、智能翻译、合规风险管理等场景具备应用前景[4] 企业级市场:AI Agent与业务流程优化 - 麦肯锡2025年AI报告提到,62%的受访组织已经在试验智能体类应用[4] - Agentic AI产品INTSIG Docflow能像“数字员工”一样,对合同、票据、报表、招投标文件等高复杂度非结构化文档进行解析、分类、抽取、审核、比对及跨系统业务流转,让AI深度作用于企业核心业务流程优化[4] 企业级市场:商业数据智能分析与风险管控 - 启信慧眼推出多项AI原生应用,作用于企业风险管控、营销与智能决策[5] - “AI智能寻源”功能用AI自动拆解寻源品类的结构化参数,让客户实现“一句话从3.4亿家企业中,找到合作目标”,帮助客户寻源拓客效率平均提升超过30%[5] - “AI准入尽调”功能将行业经验与全盘数据结合,给出供应商合作建议[5] - “AI关系洞察”功能用AI透视隐形风险,智能锁定关键风险,降低决策门槛及业务风险[5] - 启信慧眼AI原生应用功能已在制造、医药、半导体、电子、能源、汽车、金融等多个行业中应用,日均风险扫描次数超过2000万次[5]
合合信息多模态文本智能产品"上新",覆盖AI教育、AI健康、AI Infra多元场景
格隆汇· 2026-01-13 15:48
核心观点 - 人工智能产业进入“落地为王”新阶段,AI技术与多元化场景融合成为行业焦点 [1] - 合合信息集中发布基于多模态大模型的系列创新产品,覆盖AI教育、健康管理、基础设施及智能体应用等多个领域,展现了文本智能技术与垂直场景结合的创新潜力,为AI商业化落地提供新思路 [1] AI产品与垂直场景应用 - 在通用文档处理领域,公司旗下扫描全能王推出“CS-AI一站式智能化文档解决方案”,实现从影像数字化向文档全周期智能服务升级,覆盖扫描、阅读、编辑和学习等核心场景 [2] - 该解决方案可自动修复图像质量问题,实现智能重排文档与优化排版,并依托文档解析与版面还原技术优势,预计在跨境电商、出境游、专业文档翻译等市场展现强劲出海潜力 [2] - 在教育领域,公司面向国内外市场推出AI错题学习管理工具“蜜蜂试卷”与“QuizAI”,可智能识别手写体试卷,提供批改及“举一反三”等互动学习功能,实现个性化教学 [4] - 在健康领域,公司推出AI饮食健康助手Appediet,用户通过拍照即可识别食物营养成分并生成热量报告,还可结合用户健康数据定制饮食计划、提供营养分析及食谱推荐 [7] 企业级AI基础设施与智能体 - 在企业级市场,Agent智能体的规模化落地将AI基础设施推至重要位置,高质量数据是其发挥效能的关键 [8] - 据IDC预测,到2028年全球数据量将增长至393.8ZB,2023至2028年复合年均增长率达24.4% [8] - 针对企业数据碎片化、格式杂的问题,公司旗下TextIn发布AI基础设施产品xParse,以AI赋能通用文档非结构化数据挖掘,应用于知识库与Agent落地、智能翻译、合规风险管理等场景 [8] - 麦肯锡2025年AI报告提到,62%的受访组织已在试验智能体类应用 [9] - 公司打造Agentic AI产品INTSIG Docflow,使产品能像“数字员工”一样,对合同、票据、报表、招投标文件等高复杂度非结构化文档进行解析、分类、抽取、审核、比对及跨系统业务流转 [9] 商业数据智能分析应用 - 公司旗下启信慧眼推出多项AI原生应用,作用于企业风险管控、营销与智能决策 [10] - “AI智能寻源”功能用AI自动拆解寻源品类的结构化参数,过滤信息杂质,让客户实现“一句话从3.4亿家企业中,找到合作目标”,在具体场景中帮助客户寻源拓客效率平均提升超过30% [10] - “AI准入尽调”功能将行业经验与全盘数据相结合,给出供应商合作建议 [10] - “AI关系洞察”功能用AI透视隐形风险,智能锁定关键风险,降低决策门槛及业务风险 [10] - 启信慧眼AI原生应用功能已在制造、医药、半导体、电子、能源、汽车、金融等多个行业中应用,日均风险扫描次数超过2000万次 [12] 行业趋势与公司战略 - AI技术正向着多模态融合、Agent智能体规模化的方向加速突破 [12] - 公司将持续深耕AI领域,推进多模态文本智能技术研发,不断拓宽技术应用边界,探索AI应用落地新机遇与商业化增长新路径 [12]