Workflow
比Qwen3-Max更Max?夸克抢先用上最新闭源模型
机器之心·2025-10-24 12:32

产品发布与核心功能 - 夸克于10月23日上线了对话助手,实现了AI搜索与对话的深度融合,用户可在单一App内完成信息查找、问题解答与任务处理 [2] - 该对话助手采用了性能超越Qwen3-Max的Qwen最新闭源模型,据称在业界具有绝对领先性 [4] - 产品已全面上线,用户下载最新版夸克App即可免费体验 [7] 技术优势与模型能力 - 依托Qwen最新闭源模型的强推理和长文本理解能力,助手能快速精准回答提问,在处理复杂问题和多轮对话时表现更出色 [6] - 参考Qwen3-Max模型,其预训练数据量达36T tokens,总参数超过万亿,在数学推理、复杂指令理解等领域表现优异 [29] - Qwen3-Max-Instruct版本在SWE-Bench Verified测试中获69.6分,位列全球第一梯队;在Tau2-Bench上以74.8分超越Claude Opus 4 [30] - Qwen3-Max-Thinking-Heavy在AIME25和HMMT数学评测中获双满分,为国产大模型首次,证明了领先的逻辑推理能力 [30] 系统架构与可靠性 - 夸克采用“模型+系统”的双轮驱动策略,通过自研的可信系统(含实时信息检索、信源追溯和交叉验证)提升答案的准确性和可信度 [32] - 公司与通义实验室成立专项联合研发小组,深度定制了一款更擅长搜索与信息甄别的专属模型,提升生成内容的专业性与可靠性 [32] - 结合自建的专业知识库以及搜索和工具领域的多年积累,助手能通过多链路实时检索提供高质量、可溯源的信息 [6][33] 实际应用表现 - 在AI搜索功能中,助手能快速响应指令,例如为用户直接提供夸克网盘资源链接 [10] - 在处理复杂事件(如Meta AI裁员新闻)时,助手能搜索197篇资料并筛选出38个参考信源,回答条理清晰,涵盖关键事实 [11][13] - 助手展现出强大的理解能力,能深度解读传统文化对联中蕴含的地理、历史及天文知识 [14] - 在写作能力上,助手可根据图片内容创作符合古诗格律的诗歌,并能模仿特定公众号风格撰写剧评 [16][18] - 在逻辑推理测试中,助手能快速准确地解答图像推理题 [20] - 在垂直领域应用上,助手能快速识别并提取手写表格信息(耗时不到10秒),并在医疗咨询等场景提供专业解答 [23][25] 战略定位与行业意义 - 该产品体现了公司“模型即应用”的战略,旨在让AI从技术工具转变为用户可直接感知和交互的应用本身 [35] - 产品并非简单地在搜索引擎中加入对话框,而是用大模型重新定义信息获取方式,使搜索、问答、任务处理在统一对话界面中无缝完成 [35]