多模态深度推理

搜索文档
国产大模型紫东太初4.0发布!
环球网资讯· 2025-10-05 12:16
模型技术进展 - 紫东太初4.0多模态推理大模型发布,实现了从纯文本思考、简单操作带图思考到细粒度多模态语义思考的跃迁 [1] - 模型具备细粒度多模态语义思考能力,能像人一样主动深度思考,动态适应和处理更复杂任务,并在视觉语义层面展现清晰可解释的推理过程 [1] - 模型具备音频理解能力,例如用户说“我想挂一个呼吸科的号”,它能自动操作APP并根据症状选择门诊 [1] - 模型具备视频理解能力,能对180分钟的长视频进行片段精准定位和内容总结 [1] - 模型能在真实场景中通过汽车、机器人等进行动手操作 [1] 研发与迭代历程 - 紫东太初大模型由中国科学院自动化研究所联合武汉人工智能研究院研发 [1] - 自2021年首次推出以来,紫东太初已完成4次迭代,迈向多模态深度推理的新阶段 [1] 行业应用布局 - 紫东太初已在具身智能、低空经济、智慧医疗等多个产业中实现布局 [1] - 模型为城市基础设施与行业需求提供定制化解决方案 [1]
紫东太初4.0发布 国产大模型深度推理能力再升级
新华社· 2025-10-05 10:27
模型技术演进 - 紫东太初多模态大模型已完成4次迭代,实现从纯文本思考到细粒度多模态语义思考的跃迁 [1] - 模型进入多模态深度推理新阶段,能够动态适应和处理更复杂的任务 [1] - 模型具备细粒度多模态语义思考能力,可在视觉语义层面展现清晰且可解释的推理过程 [1] 核心能力与应用场景 - 在音频理解中,模型可根据用户语音指令(如“我想挂一个呼吸科的号”)自动操作APP并选择门诊 [1] - 在视频理解中,模型能对180分钟长视频进行片段精准定位和内容总结 [1] - 模型能在真实场景中通过汽车、机器人等载体进行动手操作 [1] 产业布局与解决方案 - 紫东太初大模型已在具身智能、低空经济、智慧医疗等多个产业中实现布局 [1] - 模型技术为城市基础设施与行业需求提供定制化解决方案 [1]
不靠价格战,豆包大模型靠技术杀出重围
经济观察网· 2025-06-12 21:51
字节跳动AI产品发布 - 火山引擎发布豆包大模型1.6、视频生成模型Seedance 1.0 pro及升级Agent开发平台等AI云原生服务 [1] - 豆包大模型日均tokens使用量超16.4万亿,较去年5月增长137倍 [1] - 豆包大模型在中国公有云大模型市场份额达46.4%,排名第一 [1] 产品技术亮点 - 豆包1.6支持多模态理解和图形界面操作,可自动完成预订酒店、整理Excel等任务 [2][3] - Seedance 1.0 pro支持生成1080P多镜头视频,在Artificial Analysis评测中两项任务全球第一 [3] - 豆包1.6-thinking在复杂推理、数学竞赛等评测中跻身全球第一梯队 [2] 行业应用与客户覆盖 - 豆包大模型服务全球TOP10手机厂商中的9家、80%主流汽车品牌、70%系统重要性银行及超50%的985高校 [2] - 在金融行业提供智能展业、投顾等方案,服务华泰证券、招商银行等客户 [6] - 在教育行业与北大、浙大等高校合作推动智能化转型 [6] 商业模式与成本优化 - 豆包1.6首创按输入长度区间定价,综合成本为豆包1.5或DeepSeek R1的三分之一 [4][5] - Seedance 1.0 pro每千tokens仅0.015元,生成5秒1080P视频成本3.67元 [5] - 降价源于技术突破与规模效应,非价格战,日均调用量超16万亿tokens摊薄边际成本 [7][8] 企业合作案例 - 联想集成豆包大模型至AI桌面助手"如意",实现AI搜索、写作等功能 [10][12] - 瑞幸推出AI点单助手"Lucky",基于豆包大模型实现意图识别与快速下单 [11] - 百胜中国引入豆包大模型于智能客服与员工培训,降本增效 [11] 战略与行业趋势 - 公司定位Agent智能体为AI时代核心形态,未来将围绕Agent持续演进技术 [13] - 大模型被视为软件生产调度核心,豆包1.6编程能力显著提升并即将开放TRAE编程助手 [14] - Agentic AI被视为产业数字化转型新引擎,将重塑企业流程与行业格局 [16]