阿里大模型

搜索文档
腾讯,最新发布!
中国基金报· 2025-08-04 19:33
腾讯混元开源模型发布 - 腾讯混元宣布开源四款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,最小仅0.5B [1][2] - 模型亮点在于Agent和长文能力,支持从端侧到云端、从通用到专业的多样化需求,手机也能运行 [1][3] - 消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景 [2] - 支持垂直领域低成本微调,具有较强的开放性,主流推理框架和多种量化格式均能支持 [2][4] 模型技术特点 - 原生长上下文窗口达到256k,可一次性处理相当于40万中文汉字或50万英文单词的超长内容 [4] - 技术上通过数据构建和强化学习奖励信号设计,提升模型在任务规划、工具调用和复杂决策等Agent能力 [3] - 知识密度显著高于同尺寸模型,专业领域接近更大模型效果 [3] - 可以在回答效率与深度间自由切换,256K超长上下文窗口 [3] 模型应用场景 - 已在腾讯会议AI小助手、微信读书AI问书AI助手中应用,实现对完整会议内容、整本书籍的一次性理解和处理 [4] - 适用于实时响应场景,推理性能与准确性双优 [3] - 支持边缘计算到专业微调,抗幻觉能力优 [3] - 手机、PAD都可部署,推理速度飞快 [3] 行业开源趋势 - 开源成为全球大模型领域的重要主题,中国大模型表现尤为亮眼 [1][6] - 腾讯混元大语言模型持续推进开源,已覆盖文本、图像、视频和3D生成等多个模态 [7] - 阿里近期发布三款重磅大模型,分别斩获基础模型、编程模型和推理模型等主流领域全球开源冠军 [7] - 字节跳动开源AI Agent开发平台Coze Studio,降低AI应用开发门槛 [7] - 小米开源声音理解大模型MiDashengLM-7B,刷新多模态大模型最好成绩 [8] - 百度开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家模型等10款模型 [8] 行业影响 - 开源模型将成为推动中国人工智能发展最强劲的引擎 [9] - 中国科技公司选择开源路线,不仅是为了竞争,更是为了加速AI的采用和创新 [9] - 这一趋势将推动中国AI领域的快速发展,甚至可能缩短技术差距 [9]
腾讯,最新发布!
中国基金报· 2025-08-04 19:30
腾讯混元开源模型 - 腾讯混元宣布开源四款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调 [4] - 模型的亮点在于Agent和长文能力,通过数据构建和强化学习奖励信号设计提升任务规划、工具调用和复杂决策等能力,原生长上下文窗口达到256k,可一次性记住并处理相当于40万中文汉字或50万英文单词的超长内容 [6] - 四个模型已在Github和HuggingFace等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台宣布支持部署,只需单卡即可部署,部分PC、手机、平板等设备可直接接入 [6][7] - 腾讯混元大语言模型持续推进开源,已覆盖文本、图像、视频和3D生成等多个模态,未来将推出更多尺寸、更多模态的模型 [9][10] 中国大模型开源趋势 - 全球开源领域异常热闹,中国大模型表现抢眼,开源模型将成为推动中国人工智能发展最强劲的引擎 [8][11] - 阿里近期发布三款重磅大模型,分别斩获基础模型、编程模型和推理模型等主流领域全球开源冠军 [10] - 字节跳动开源AI Agent开发平台Coze Studio,旨在降低AI应用开发门槛 [10] - 小米开源声音理解大模型MiDashengLM-7B,在22个公开评测集上刷新多模态大模型最好成绩 [10] - 百度开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家模型等10款模型 [11] - 昆仑万维开源全新推理大模型Skywork MindLink,能够根据任务难度自适应整合推理和非推理的生成回复 [11] - 智谱AI发布新一代旗舰大模型GLM-4.5,专为智能体应用打造,在复杂推理、代码生成及智能体交互等通用能力上实现融合与技术突破 [11]