Workflow
紫东太初4.0发布 国产大模型迈向“边看、边识、边思”新阶段
第一财经·2025-09-20 00:08

9月19日,首款全栈国产化深度推理大模型"紫东太初"4.0在武汉发布,具备"边看、边识、边思"的类人多模态推理认知能力,特别是在带图思考多模态复杂 推理和工具调用的能力上,全面超过了GPT5。 2024年图灵奖得主理查德·萨顿表示,人类数据正在迅速接近极限,智能体将越来越多通过与世界交互而获得持续学习的能力,潜力远超以往。 中国科学院自动化研究所副总工程师、武汉人工智能研究院院长王金桥在接受第一财经记者采访时介绍,从3.0原生的多模态统一框架到4.0多模态细腻度的 复杂思考,紫东太初完成了国产大模型从"纯文本思考""简单操作带图思考"到"细粒度多模态语义思考"的三重跃迁。 以推理"赢得一场斯诺克需要几步"为例,"紫东太初"4.0通过输入的图片可先定位白球、粉球和红球的位置,再通过台上不同球的得分进行复杂的推理和数 学计算,进一步告诉大家他要做5杆斯洛克才能赢得这场球。 "紫东太初4.0从理解能力、模态推理、动态推理三大能力引入了类人的交叉注意力机制,使大模型能够像人一样,实现对世界的理解从全局到局部再到上下 文交互式的思考过程。"王金桥说,通过视觉注意力关注到某一个区域,然后进行平移、放大、旋转、增强等一系列 ...