Workflow
系统级全局AI
icon
搜索文档
夸克x千问,AI浏览器还能这么玩?
机器之心· 2025-12-01 12:06
AI浏览器行业市场前景 - 全球AI浏览器市场正高速爆发,2024年规模约45亿美元,2034年将达到768亿美元,年复合增长率高达32.8%[1] - 行业处于新旧秩序更替阶段,OpenAI、Perplexity等原生AI势力与Google、Microsoft等传统巨头正以不同方式诠释AI浏览器的未来[3] 行业竞争格局与产品战略 - 国际厂商呈现两大路径:原生AI势力(如OpenAI Atlas、Perplexity)试图重构信息获取方式,而传统巨头(如Chrome、Microsoft Edge)选择基于既有生态进行稳健升级[3] - 国内厂商普遍将AI能力与国民级应用深度捆绑,以润物细无声的方式渗透具体场景,构建一站式智能平台[4] - 夸克通过融合阿里千问大模型,定位为国内首个操作系统级智能中枢,强调浏览器与AI的乘法式重构而非简单加法[7] 夸克AI浏览器产品创新 - 发布六大AI套件实现系统级全局AI能力,包括千问读屏、快捷框、侧边栏、悬浮球、划词、截屏,支持从首页搜索框、侧边栏、桌面悬浮球等多入口随时唤起AI[15] - 突破传统浏览器AI交互局限,实现真正的全局桌面唤起,仅需一句指令即可完成搜索对话、写作创作、总结翻译等任务[8] - 通过智能标签管理功能按域名和最近使用排序,有效解决多标签页管理难题,并能识别处理高内存标签提升流畅度[26][28] 核心功能体验升级 - 在线文档编辑支持浏览器内直接处理PDF文档,无需下载即可进行高亮标注和图文编辑,并支持一键格式转换和快速翻译[30][31] - 跨端流畅传输功能实现文字、文档、网页、大文件(支持100G)在不同设备间的无缝同步,打破地点限制[34][36] - 云端存储与浏览器深度集成,支持一键无损备份网页内容,独家的分栏模式优化资料管理体验[38][39] - 产品坚持清爽无广告的极简设计理念,配合底层性能优化,提升信息获取效率[40] 技术底座与模型能力 - 夸克基于阿里通义千问大模型技术底座,Qwen3-Max参数规模突破万亿级,预训练数据量达36T tokens[44] - 针对浏览器场景进行深度定制,模型具备精准识别网页结构、用户意图与上下文关系的能力[44] - 多模态融合设计与实时推理引擎确保长文总结、专业分析等场景下仍保持毫秒级响应速度[45] - 在实际测试中展现出强大的逻辑推理能力(如解决复杂逻辑题)、专业问题处理能力(如法考真题解析)和创意写作能力(如模仿鲁迅风格)[48][49][59]
夸克AI浏览器来了!深度融合千问,迎来“Chrome级”进化时刻
量子位· 2025-11-28 12:11
行业趋势:AI重塑浏览器入口形态 - 全球浏览器行业正从被动网页展示窗口向更高的AI操作层和系统层演进,负责调度理解、执行任务和承接整套AI能力[7][8] - 浏览器被视为AI时代的核心入口竞争焦点,AI将深度渗入浏览器底层能力层,成为系统结构的一部分,使浏览器变成真正的AI协作中枢[18][19] - 在该趋势下,中国浏览器行业面临如何进入AI化下一阶段的现实问题,需打造具备系统级全局AI能力的产品以参与全球竞争[9][51] 公司战略:夸克AI浏览器对标全球领先 - 夸克浏览器全面进化为新一代AI浏览器,战略上全面对标Chrome,目标打造全球领先的AI浏览器并加入全球主战场竞争[2][10][16] - 公司依托阿里完整的技术生态和最强大的Qwen大模型,实现有别于AI插件形式的深度技术融合,将国产浏览器技术线推上新高度[3][11] - 此次升级是重大版本发布,而非功能层小修小补,旨在让浏览器具备"参与任务"的能力,推动浏览体验从"够用"走向"顺手"[10][15][42] 技术核心:深度融合Qwen大模型 - 夸克将阿里最强大的Qwen家族模型直接接入浏览器底层,千问AI助手参与整体任务流,实现全局AI能力[5][11] - Qwen3-Max在首届AI大模型真实投资比赛Alpha Arena中以22.32%的收益率赢得比赛,账户价值达$12,232,展现了在复杂决策与多变量推理任务中的稳定性[12] - Qwen模型家族自23年全线开源以来累计发布300+模型、全球下载量突破6亿次、衍生模型超过17万个,在Chatbot Arena子榜单Vision Arena中Qwen3-VL拿下全球第二、开源第一[12][13] - Qwen模型覆盖文本、视觉、语音、视频、代码、图像等全模态方向,形成规模完整、能力均衡的模型家族,在内容理解与信息处理上具备天然优势[14] 产品功能:系统级全局AI交互体验 - 发布千问六大AI套件:千问悬浮球、快捷框、截屏、划词、侧边栏、读屏,实现系统级全局AI能力[21] - 千问悬浮球作为桌面AI快速操作台,可随时唤起进行录音、截屏提问、润色总结翻译等操作[23] - 千问快捷框解决临时提问需求,千问划词支持指哪答哪,千问截屏可解析图片内容,千问读屏可直接共享屏幕内容给AI[26][27][28] - 新增千问侧边栏作为沉浸式AI第二屏,实现边浏览边总结、边看边对话的同场操作,承载更长更复杂的思考链路[31][32][35][36] - 支持快捷键Alt+空格唤起快捷框,可进行翻译、总结、研究分析、格式转换、做表格、做PPT等操作,实现一句话指令AI接手干活[39][40][41] 用户体验优化:提升浏览效率与流畅度 - 对标签管理场景进行智能化优化,支持排序、分组、识别并处理高内存标签,避免浏览器卡顿[44][45] - 强化PDF处理能力,支持万能编辑(包括修改PDF图片中的文字)和对照翻译功能,生成双栏对照排版[46][47] - 在底层进行针对性优化,实现启动更快、占用更低、卡顿更少的流畅体验,并保持搜索无广告、界面干净简约[48][49] - 整体浏览体验从过去的断续跳转转变为连续流,协作更连续高效,工具不再打断工作生活节奏[29][37][49]