Qwen最新闭源模型
搜索文档
Qwen最新闭源模型曝光!实测夸克“对话助手”
华尔街见闻· 2025-10-24 18:50
产品定位与核心功能 - 夸克App的“对话助手”模式旨在超越简单问答,专注于完成任务 [1] - 产品定位为专业领域的回答方,与具备娱乐基因的豆包形成差异化竞争 [3] - 在相同问题下,夸克通过引用权威资料和数据来源来体现专业性,而豆包更侧重于亲切聊天和提供情绪价值 [4] - 夸克对话助手整合了Agent能力,用户可直接提出需求(如获取四六级复习资料网盘链接),系统会自动查找并提供一键转存网盘的独家体验 [6] - 产品已从聊天机器人演进为能在同一会话中完成搜索、创作、阅读乃至执行任务的智能助手,实现“AI从会说话变成会做事” [11] 技术能力与模型优势 - 产品升级的技术核心是首次亮相的Qwen最新闭源模型,具备全球领先的推理和搜索融合能力 [12] - 算法团队重点突破了“搜索推理”与“可信生成”两大技术方向 [12] - 在测试中,夸克模型对“strawberry有几个r?”的问题展现了严谨的推理过程,得出3个r的正确答案,而市场同类模型工具则直接错误地回答2个r [13] - 公司自建了医疗、教育、法律、财经等多个垂直知识库,通过结构化、标准化的专业数据训练,增强模型在健康、学习、法律等专业领域的推理与理解能力 [13] - 模型回答专业问题(如“法律责任如何界定”或“糖尿病饮食建议”)时并非模糊生成,而是依托权威知识库进行可信推理,构建“AI可信度”这一关键护城河 [13] 用户体验与应用场景 - 针对大学生写考研论文等复杂任务,夸克能在一个界面内自动解析题目、扫描纸质文件、翻译外文、整理内容并保存到网盘,重构了原本需要频繁切换搜索引擎、Word和网盘应用的繁琐流程 [9] - 用户只需说出“这道题的正确答案是什么?”或“提取文字”等指令,即可完成一系列复杂操作,极大减少了操作摩擦感 [9] - 产品正在落地AI“自主完成复杂任务”的能力,响应了OpenAI发布ChatGPT Atlas浏览器后行业对复杂任务处理能力的关注 [6] - 用户会根据自身需求和场景选择最合适的产品,不同模型产品的底蕴和基因决定了其服务上限 [9]
比Qwen3-Max更Max?夸克抢先用上最新闭源模型
机器之心· 2025-10-24 12:32
产品发布与核心功能 - 夸克于10月23日上线了对话助手,实现了AI搜索与对话的深度融合,用户可在单一App内完成信息查找、问题解答与任务处理 [2] - 该对话助手采用了性能超越Qwen3-Max的Qwen最新闭源模型,据称在业界具有绝对领先性 [4] - 产品已全面上线,用户下载最新版夸克App即可免费体验 [7] 技术优势与模型能力 - 依托Qwen最新闭源模型的强推理和长文本理解能力,助手能快速精准回答提问,在处理复杂问题和多轮对话时表现更出色 [6] - 参考Qwen3-Max模型,其预训练数据量达36T tokens,总参数超过万亿,在数学推理、复杂指令理解等领域表现优异 [29] - Qwen3-Max-Instruct版本在SWE-Bench Verified测试中获69.6分,位列全球第一梯队;在Tau2-Bench上以74.8分超越Claude Opus 4 [30] - Qwen3-Max-Thinking-Heavy在AIME25和HMMT数学评测中获双满分,为国产大模型首次,证明了领先的逻辑推理能力 [30] 系统架构与可靠性 - 夸克采用“模型+系统”的双轮驱动策略,通过自研的可信系统(含实时信息检索、信源追溯和交叉验证)提升答案的准确性和可信度 [32] - 公司与通义实验室成立专项联合研发小组,深度定制了一款更擅长搜索与信息甄别的专属模型,提升生成内容的专业性与可靠性 [32] - 结合自建的专业知识库以及搜索和工具领域的多年积累,助手能通过多链路实时检索提供高质量、可溯源的信息 [6][33] 实际应用表现 - 在AI搜索功能中,助手能快速响应指令,例如为用户直接提供夸克网盘资源链接 [10] - 在处理复杂事件(如Meta AI裁员新闻)时,助手能搜索197篇资料并筛选出38个参考信源,回答条理清晰,涵盖关键事实 [11][13] - 助手展现出强大的理解能力,能深度解读传统文化对联中蕴含的地理、历史及天文知识 [14] - 在写作能力上,助手可根据图片内容创作符合古诗格律的诗歌,并能模仿特定公众号风格撰写剧评 [16][18] - 在逻辑推理测试中,助手能快速准确地解答图像推理题 [20] - 在垂直领域应用上,助手能快速识别并提取手写表格信息(耗时不到10秒),并在医疗咨询等场景提供专业解答 [23][25] 战略定位与行业意义 - 该产品体现了公司“模型即应用”的战略,旨在让AI从技术工具转变为用户可直接感知和交互的应用本身 [35] - 产品并非简单地在搜索引擎中加入对话框,而是用大模型重新定义信息获取方式,使搜索、问答、任务处理在统一对话界面中无缝完成 [35]