人工智能模型开源

搜索文档
通义DeepResearch重磅开源
上海证券报· 2025-09-18 13:10
目前,通义DeepResearch的模型、框架和方案均已全面开源,用户可在Github、Hugging Face和魔搭社 区下载模型和代码。 模型训练 通义团队构建了一套以合成数据驱动、贯穿预训练与后训练的完整训练链路。模型能力基于一种多阶段 数据策略,旨在创建海量高质量的代理训练数据,而无需依赖昂贵的人工标注。 同时,该链路以Qwen3-30B-A3B模型为基座进行优化,为了确保训练的高效性与模型的鲁棒性,团队 创新性地设计了覆盖真实环境与虚拟环境的RL算法验证与真实训练模块,并结合高效异步强化学习算 法及自动化数据策展(Data Curation)流程,显著提升了模型的迭代速度和泛化能力。 在推理阶段,团队设计了ReAct和基于自研的IterResearch的Heavy两种模式,前者用于精准考察模型的 基础内在能力,后者则通过test-time scaling策略,充分挖掘并展现了模型所能达到的性能上限,即使在 长任务中,也能实现高质量的推理。 模型性能 在Humanity's Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-DeepSearch、 ...
通义首个深度研究Agent模型DeepResearch开源
证券时报网· 2025-09-18 11:58
人民财讯9月18日电,近日,通义首个深度研究Agent模型DeepResearch正式开源。该模型参数仅30B(激 活3B),在多个权威评测集上取得SOTA成绩。 ...
腾讯混元发布4款小尺寸模型并开源 支持消费级显卡运行
新浪科技· 2025-08-04 16:08
腾讯混元模型发布 - 公司发布4款小尺寸开源模型,参数规模分别为0.5B、1.8B、4B、7B,全部开源并支持消费级显卡运行[1] - 新模型兼容主流芯片平台包括ARM、高通、MTK、Intel等,适用于手机、电脑、智能座驾及智能家居设备[1] - 模型已在Github和Huggingface等开源社区上线,获Arm、高通、Intel、联发科技等终端芯片平台支持部署[1] - 实测显示新模型在语言理解、数学、推理等领域得分达领先水平[1] 模型技术特性 - Hunyuan-4B具备32K最大输入/输出能力,总参数48B,激活参数4B,支持256K超长上下文窗口[2] - Hunyuan-7B总参数7B,激活参数7B,最大输入16K/输出32K,同样支持256K上下文窗口[2] - 4B版本适合实时响应场景,在推理性能与准确性上实现双优[2] - 7B版本知识密度显著高于同尺寸模型,专业领域效果接近更大模型,可在消费级GPU高效运行[2] 应用场景优势 - 模型支持金融、教育、医疗等垂直领域低成本微调[2] - 4B版本被推荐为智能座舱优选方案,7B版本适合家用电脑部署[2] - 所有模型支持在回答效率与深度间自由切换,更新时间均为2025年07月25日[2]