模型核心能力与技术创新 - 首款全栈国产化深度推理大模型"紫东太初"4.0发布,具备"边看、边识、边思"的类人多模态推理认知能力 [1] - 在带图思考多模态复杂推理和工具调用能力上全面超过GPT5 [1][4] - 模型完成了从纯文本思考到细粒度多模态语义思考的三重跃迁,引入了类人交叉注意力机制,实现从全局到局部再到上下文交互式的思考过程 [3] - 具备视觉注意力机制,可进行平移、放大、旋转等操作模仿人类探索过程,从被动分析迈入主动思考新阶段 [3] - 在视频多模态应用上能实现180分钟长视频深度理解,在视频问答等6项任务中达到SOTA性能 [4] - 具备三大核心技术创新:低成本高覆盖的真实事件数据合成、批判式多轮反思学习、难度敏感的自适应强化学习 [5][6] - 相较3.0版本,整体推理性能显著提升约15% [4][6] 产业应用与性能提升 - 模型将以更高性能赋能实体经济,包括工业智能、具身智能、医疗智能等领域 [4] - 与华工科技合作的高精度激光焊接技术具备更强空间交互能力,推理速度提升约15%,有望再次提升当前每43秒完成一辆新能源汽车车身焊接的速度 [4] - 多模态推理、逻辑思维和智能体能力全面对标GPT4.1nano和GPT4O等先进模型 [4] 平台建设与产业生态 - 同步发布"紫东太初云"平台,是国内首个多模态大模型原生协同云及全栈国产化万卡智算云 [6] - 平台涵盖算力服务、大模型训推、应用开发、具身智能四大核心板块,提供全链路能力 [6] - 与四川并济科技等5家企业共同启动"十万卡多模态大模型异构智能训练平台",为大模型技术加速迭代提供支持 [6] - 中国已进入算力经济时代,算力与数据、算法共同构成数字经济关键资源,经济拉动效应显著 [6]
紫东太初4.0发布 国产大模型迈向“边看、边识、边思”新阶段
第一财经·2025-09-20 00:08