通义千问Qwen3

搜索文档
GPT-5降价反击!OpenAI打响B端争夺战
第一财经资讯· 2025-08-09 21:01
GPT-5发布与技术特点 - 新一代GPT-5发布,距GPT-4发布已过去2年4个月24天,但未展示出AGI能力或全新功能[2] - 主要优化为幻觉降低:比GPT-4o低45%,比OpenAI o3低80%[2][14] - 被定义为「统一的系统」而非单一模型,包含基础模型、深度推理模型和自动调度的「路由器」[4][19] 定价策略与市场竞争 - 输入价格降至1.25美元/百万tokens(GPT-4o为2.5美元),输出保持10美元/百万tokens,显著低于Claude Opus 4(75美元)和Gemini 2.5 Pro(15美元)[4][5] - 目标直指B端专业开发者市场,当前Anthropic占据32%份额,OpenAI仅25%,较2023年50%份额大幅下滑[6][8] - 通过降低token消耗(编码场景减少22%)和工具调用次数(减少45%)优化成本[15] 能力提升与工程优化 - 编码能力提升:SWE-Bench准确率74.9%(o3为69.1%),多步骤指令遵循69.6%(o3为60.4%)[14] - 新增「最低推理强度」功能,可平衡响应速度与工具调用频率[15] - 开源两款推理模型并登陆AWS平台,打破此前与微软的独家授权限制[15] 产品设计与用户策略 - 取消多模型选择功能,自动根据问题复杂度调用基础或深度推理模型(需通过特定prompt触发)[19][21] - 简化前端交互,将复杂技术封装至后台,例如自动联网搜索功能[22] - C端用户增长迅猛:周活达7亿(3月为5亿),年化收入120亿美元[16] 行业趋势与竞品动态 - Anthropic因长上下文、稳定推理和强编码能力赢得AI Coding等新兴B端市场[11] - 阿里巴巴通义千问曾推出类似自动调度功能但后续停用,反映B端与C端需求差异[22][24] - 专业开发者反馈被视为模型迭代关键,推动OpenAI战略重心向B端倾斜[15]
DeepSeek月均下载量暴跌72.2%!周鸿祎:梁文锋不屑于做APP,他把技术全都开源免费【附大模型行业市场分析】
前瞻网· 2025-07-25 09:34
DeepSeek下载量变化 - 2025年二季度月均下载量从一季度的8111.3万骤降至2258.9万,降幅达72.2% [2] - 用户流失主要因第三方平台分流,59.2%转向百度App,38.6%转向豆包App [2] - 阿里、字节、百度等大厂推出低价同类API进一步挤压市场空间 [2] DeepSeek开源策略与行业影响 - 采用低成本高性能开源模式,训练成本仅600万美元+2048块H800 GPU [3] - 开源推动第三方平台开发更优质服务,加速AI技术普及 [3] - 创始人梁文锋专注AGI研发而非流量变现,技术全开源免费 [4] 国内大模型竞争格局 - 截至2024年4月国内推出305个大模型,其中10亿参数以上达254家 [4] - 百度文心4.5性能超GPT4.5但API价格仅1%,文心X1价格约为DeepSeek-R1一半 [5] - 主流模型特点:文心系列侧重综合能力,通义千问采用混合推理,DeepSeek-R1数学推理强且成本为国际模型1/10 [6] 技术成本优势与行业应用 - DeepSeek-R1推理成本为OpenAI的1/30 [5] - AI大模型成为城市规划和工业革新核心驱动力,提升动态规划与决策效率 [7] - 轻量化、低成本化趋势加速行业大模型开发与规模化应用 [9]
通义千问深夜更新!Qwen3升级版迈向“分离训练”时代,性能全面超越Kimi-K2,Agent能力亮眼
硬AI· 2025-07-22 16:22
核心观点 - 阿里巴巴通义千问团队发布Qwen3-235B-A22B-Instruct-2507-FP8模型,性能全面超越Kimi-K2等顶级开源模型及Claude-Opus4-Non-thinking等闭源模型 [1][3] - 新模型在Agent能力、多语言长尾知识覆盖、用户偏好契合及长文本处理(256K上下文)方面实现显著升级 [5][8][9] - 技术路线革新采用"分离训练"模式,将Instruct模型(快思考)与Thinking模型(慢思考)独立训练以提升专项能力 [11][12] - 团队暗示后续将推出专注于复杂推理的"Thinking"模型,进一步强化技术领先性 [1][15] 性能表现 - 在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等测评中表现卓越 [3] - 具体数据: - **知识领域**:MMLU-Pro得分83.0(超越Claude-Opus4的86.6)、GPQA得分77.5(超越Kimi-K2的75.1) [6] - **推理能力**:AIME25得分70.3(远超Kimi-K2的49.5)、HMMT25得分55.4(对比Kimi-K2的38.8) [6] - **编程能力**:LiveCodeBench v6得分51.8(超越Kimi-K2的48.9) [6] - **Agent能力**:BECL-V3得分70.9(对比Claude-Opus4的60.1) [6][7] 技术升级 - **分离训练**:Instruct模型专注于指令遵循、文本理解和知识问答,追求响应速度与准确性 [11][12] - **多语言能力**:MultilF得分77.5(对比Kimi-K2的76.2),PolyMATH得分50.2(超越Kimi-K2的44.8) [7] - **长文本处理**:上下文窗口扩展至256K,增强复杂任务处理能力 [9] 行业影响 - 国内开源AI竞赛进入白热化阶段,性能迭代速度加快(如Kimi-K2到Qwen3的快速更替) [14] - Agent能力被视为未来AI应用的核心竞争力,新模型在BFCL测评中的表现验证其领先性 [5] - 模型已在魔搭社区和HuggingFace开源,推动开发者生态建设 [15]
展览综述|AI不止会聊天,还会陪你逛展!HI! WAIC带你揭秘四大展馆暗藏科技彩蛋!
36氪· 2025-07-18 14:13
这个夏天,来WAIC 2025解锁一场AI科技的沉浸式盛宴。四大主题展馆,3000余件前沿展品、800多家企业同台竞技,7万平方米展区让你一次看尽全球AI 产业的全景演练。 想在这么大的展览里逛得有收获、拍得尽兴,可不仅靠"随便走走"。"Hi! WAIC"智能助手这次化身你的专属策展师,贴心为不同兴趣人群定制私人专属 观展路线。 无论你是硬核技术控、产业应用达人、消费电子爱好者,还是投资创业者,都能找到自己的"宝藏展区"和专属看点。 开发者&技术极客Vibe Coding H1核心技术馆 H1馆揭开AI能力黑盒,谷歌、亚马逊云科技、思科等海外巨头,阿里巴巴、华为、蚂蚁集团等国内大厂,AI六小龙、北斗七星、科创八杰等科创新秀聚 首,全馆集中呈现「国产化突破」「开源繁荣」「基础设施升级」「大模型与算力协同」四大关键词。 · 看点揭秘 在国产化突破方面,华为展示了业界最大规模的"昇腾384超节点真机",曦智发布全球首款"天枢光电混合计算芯片",推动光电计算商业落地;安擎推出 EG8420H4服务器是一款全新企业级高性能4U人工智能服务器产品,泽丰聚焦探针卡等半导体测试国产替代,超擎数智则通过XDR交换机展现本土系统 ...
英伟达H20恢复销售事件点评:Q2国产云维持高增速,H20出货预计带动国内云厂Capex上升
国信证券· 2025-07-16 13:17
报告行业投资评级 - 行业投资评级为优于大市(维持) [1] 报告的核心观点 - 英伟达H20恢复销售带动库存出清与国内资本开支增长,后续特供GPU顺利则资本开支持续积极 [3] - 二季度国内云维持高增速,客户方案落地后下半年预计加速增长,H20恢复供应带动云厂资本开支上升,利好下游需求 [3] - 二季度模型层进一步向头部集中,国内科技厂商加速追赶海外先进水平,算力供应恢复推动模型层迭代 [3] 各部分总结 AI芯片算力层 - 英伟达H20依托CUDA生态壁垒是国内AI开发者首要选择,其“性能阉割”但保留推理优势,满足出口管制同时维持市场份额 [5] - 英伟达一季报库存减记和采购义务损失45亿美元,对应H20库存收入预计达百亿美元量级,恢复采购将带动云厂囤货和资本开支增长 [3][6] - 后续中国特供版GPU预计基于BLACKWELL架构,若进展顺利国内四季度资本开支将持续积极,此前推出的B30有性能缺陷,新特供版将改善 [6] 国内云厂商 - 二季度国内云厂商AI客户数小幅下降但场景渗透率提升,预计维持高增速,业务场景跑通后下半年将加速增长,阿里云、腾讯云、百度云有不同增速表现 [3][9] - 二季度国产卡买租占比提升,但受良品率和交付能力限制无法满足算力需求,云厂消耗库存卡,资本开支受H20断供影响二季度环比平稳 [3][9][10] - H20恢复供应和英伟达B系列特供芯片供应,将推动云厂需求增速出现季度性向上拐点,预计三季度恢复H20采购,四季度制定采购预算 [10] AI模型层 - 阿里聚焦通用高性能开源模型,4 - 6月开源Qwen3等多个模型,打造AI生态与工具链 [3][13][14] - 字节跳动进行模型升级与功能拓展,4 - 6月发布豆包系列模型等,覆盖多创作场景 [3][15] - 腾讯实现多领域模型创新与开源,4 - 6月上线“元宝”等,提升应用体验 [3][16] - 百度在基座模型与开发工具创新,4 - 6月发布文心大模型4.5Turbo等,推动技术落地 [3][17] - DeepSeek 5月发布DeepSeekR1 - 0528,提升思维深度与推理能力 [18]
阿里缩减合伙人人数,AI纳入核心业务范畴
雷峰网· 2025-06-30 19:21
核心观点 - 阿里巴巴2025财年年报显示战略聚焦AI和电商,将AI增补进核心业务范畴,从"电商和云计算"变为"电商、AI+云" [2] - 公司合伙人团队精简9人,保留业务一线负责人,体现"留下有话事权的人,做更聚焦的事"的管理思路 [2][3] - AI成为业务核心驱动力,相关产品收入连续七个季度三位数增长,云业务财年营收重回双位数增幅 [6][7] - 电商业务由蒋凡全面主导,整合国内外资源并推动AI技术应用,618大促GMV同比增长10% [10][13][16] - 公司加速构建超级APP生态,整合饿了么、飞猪等业务,淘宝闪购日订单突破6000万 [17][19] 战略调整 - 年报内容减少437字,不再单独阐述"经营原则",AI被提及35次 [2][5] - 合伙人名单显示业务聚焦:云业务5人、电商2人,非核心业务仅保留3名高管 [4][20] - 放弃阿里云分拆、叫停盒马菜鸟上市,减持非核心资产累计亏损427亿元 [16] - "1+6+N"架构被打破,盒马聚焦鲜生和NB业态,大文娱更名虎鲸文娱 [20] AI业务进展 - 通义千问Qwen3模型全球评测领先,开源200多款模型下载量超3亿次 [9] - AI技术反哺电商:重构搜索推荐系统,广告推送覆盖更多场景 [10] - 云业务客户从互联网向制造业延伸,开源模型开发者优先采用阿里云产品 [6] - 未来三年重点投入基础设施、基础模型和原生应用三大领域 [9] 电商变革 - 蒋凡整合淘天集团与海外业务,速卖通实现连续六季度双位数增长 [13] - 推行"确收GMV"考核指标,1688全面入淘实现产业带直供 [16] - 用户运营双路径:88VIP高净值用户与月卡性价比用户并行 [17] - 即时零售协同效应显著,淘宝闪购零售订单同比增长179% [17] 行业竞争 - 京东拓展酒旅外卖业务促使阿里重新定义"聚焦"与"协同" [18] - 电商平台集体向超级APP转型,整合本地生活与即时配送 [19] - 行业从流量扩张转向存量深耕,竞争重点转为生态布局与用户黏性 [19]
华为HDC开发者大会2025亮点梳理-20250622
国投证券· 2025-06-22 14:01
报告行业投资评级 - 领先大市 - A,维持评级 [8] 报告的核心观点 - 6月20 - 22日华为开发者大会(HDC 2025)召开,展示新产品新技术亮点,本周计算机行业指数下跌,板块震荡调整,AI应用回调多,个股在稳定币等金融科技方向表现较好 [14][20][24] 根据相关目录分别进行总结 本周行业观点 - 华为HDC 2025大会有1.2万名全球开发者参与,展示5个新产品新技术亮点 [1][14] - HarmonyOS 6操作系统已搭载超40款华为终端产品,9000多个应用参与70多个系统级创新体验打造,3万多鸿蒙应用和元服务加速开发更新,全场景互联架构实现毫秒级低时延,HarmonyOS6开发者Beta启动,鸿蒙注册开发者超800万,工具下载超110万次,AGC服务月均调用1.7亿次,开发者提交版本超27万次,完成超216万用户心愿单,TOP5000应用覆盖99.9%使用时长 [2][15] - 大会发布HMAF鸿蒙智能体框架,打造新AI生态体系,推动人机交互演进,小艺智能体开放平台有50多个鸿蒙系统插件,还发布鸿蒙应用AI编程工具DevEco CodeGenie,累计生成代码813万行,280万行被采纳 [3][16] - 会上发布盘古大模型5.5,含多种大模型,华为云面向5个领域发布盘古行业思考大模型,从盘古5.0到5.5核心能力全面升级,架构层面有升级并提出消解幻觉创新方案 [4][17] - 华为云发布CloudRobo具身智能平台,赋能联网设备成具身智能机器人,展示双臂机械臂应用,毫米精度成功率超90%,还发布CodeArts Doer开发工具 [5][18] - 大会发布基于CloudMatrix384超节点的新一代昇腾AI云服务,整合芯片提供服务,单卡推理吞吐量跃升至2300 Tokens/s,提升近4倍,支持混合多专家MoE大模型推理,一个超节点支持384个专家并行推理 [6][19] 市场行情回顾 本周板块指数涨跌幅 - 本周上证综指跌0.51%,深证成指跌1.16%,创业板指跌1.66%,计算机行业指数跌1.87%,跑输上证综指1.036pct,跑输深证成指0.71pct,跑输创业板指0.21pct,计算机板块震荡调整,AI应用回调多 [20] - 本周计算机行业指数在中信30个行业指数中排第17,在TMT四大行业中排第4 [23] 本周计算机个股表现 - 本周计算机板块在稳定币等金融科技方向表现较好,后续关注AI、机器人、自主可控等中长期产业方向 [24] - 周涨幅前十股票有楚天龙(36.59%)、四方精创(29.21%)等;周跌幅前十股票有新北洋( - 12.65%)、*ST迪威( - 12.63%)等;周换手率前十股票有雄帝科技(205.60%)、御银股份(190.02%)等 [27] 行业重要新闻 - 华为在HDC 2025推出盘古大模型5.5,推理效率提升8倍,部分能力超越顶尖模型,同步发布昇腾AI云服务,单卡推理吞吐量提升4倍,支持16万卡级联训练,服务1300余家客户 [28] - Meta以143亿美元收购Scale AI 49%股份,挖角顶尖人才组建AGI攻坚团队,弥补Llama 4数据短板 [28] - MiniMax开源混合架构模型M1,支持100万上下文输入,推理成本降低,能耗降低70%,在部分场景表现超越DeepSeek - R1 [28] - 谷歌发布Gemini 2.5 Flash - Lite,为最轻量化、具成本效益模型,在编码等场景实现速度与经济性双突破,已获企业部署 [28] - 阿里通义千问开源Qwen3全系列32款MLX量化模型,适配苹果MLX,各模型有4种精度量化版本 [28]
早资道 | 雷军:小米工厂月产两三万辆车;曹操出行开启招股
搜狐财经· 2025-06-17 09:27
小米汽车 - 小米汽车工厂目前月产能达到2-3万辆,工厂高度自动化,绝大部分工序由机器完成[2] 曹操出行 - 曹操出行启动港股招股,计划全球发售4417 86万股,每股定价41 94港元,预计募资18 53亿港元,估值约228 23亿港元[2] - 引入6名基石投资者包括梅赛德斯-奔驰、未来资产证券(香港)、无极资本、国轩高科(香港)、亿纬亚洲和速腾聚创[2] 360集团AI技术 - 360集团发布"纳米AI超级搜索智能体",内置80个大规模模型,具备意图解析和多模态生成能力[3] - 该智能体可自动生成短视频素材、进行跨平台数据分析,并提供个性化推荐与商业调研报告[3] 阿里巴巴AI合作 - 阿里巴巴发布兼容苹果MLX架构的通义千问Qwen3新版本,可能为Apple Intelligence进入中国市场铺路[4] - iOS 18 6开发者测试版已发布,可能成为Apple Intelligence在中国上线的载体[4] 拉卡拉国际化战略 - 拉卡拉筹划在香港联合交易所上市,以推进国际化发展战略,加快数字货币在跨境场景的应用[5] - 该事项需提交公司董事会和股东大会审议,并经相关监管机构批准[5]
深度推理模型写高考英语作文谁更强?记者实测,名校英语教师点评
贝壳财经· 2025-06-09 09:24
大模型高考英语作文测评结果 - 讯飞星火X1以平均分19.5分排名第一,内容完整且紧扣主题,语言准确句式多样,结构清晰段落衔接自然 [22][27] - DeepSeek R1以平均分19分排名第二,内容详实建议具体,理由全面语言精准,但超字数限制被扣分 [7][27] - 百度文心X1以平均分18.5分排名第三,内容创新建议详实,理由充分语言优秀,结构合理过渡流畅 [26][27] - 通义千问Qwen3以平均分17分排名第四,内容基本完整建议合理,语言准确表达得体,但理由稍简略 [14][27] - ChatGPT o3以平均分14.5分排名第五,内容覆盖要点但理由浅显,语言有错误句式单调,结构发展不足 [10][27] - 腾讯混元T1以平均分13分排名第六,内容基本相关但理由泛泛,语言口语化句式简单,结构松散结尾随意 [19][27] 大模型英语写作能力分析 - 各模型均能完成写作任务,但在内容细节、逻辑关系、观点表达精准性等方面差异较大 [27] - 部分模型语法句法选词精准到位逻辑清晰,部分模型逻辑性欠缺展开不够具体深入 [28] - AI作文立意创新性强于真实考生,因信息搜索整合能力更强,但句式丰富度不及优秀考生 [28] - 模型内嵌评分标准和写作方向差异明显,内容简繁程度与内部数据库密切相关 [28] 国内大模型近期发展动态 - DeepSeek于5月28日更新R1-0528版本 [29] - 腾讯于5月21日迭代混元T1和混元Turbo S [29] - 阿里巴巴于4月29日开源新一代通义千问Qwen3 [29] - 百度于4月25日发布X1 Turbo [29] - 科大讯飞于4月20日升级讯飞星火X1 [29] - 4-5月国内主流大模型集中进行推理层面更新,带来英语写作等能力进步 [29]
中企出海,先上云
经济观察报· 2025-06-06 13:56
中国企业出海与云计算应用 - 中国企业在出海初期多采用单系统上云策略,管理层对核心系统上云持谨慎态度,部分企业仍需自建线下数据中心[1] - 爱诗科技作为AI视频生成领域的独角兽,其产品PixVerse海外月活达1619万,成立首日即定位全球化,通过公有云解决数据归集与模型训练难题[2][3] - 广汽集团等传统企业从出口贸易转向海外运营,车联网数据激增推动对云服务的需求,但自建IDC成本高且合规挑战大[6][12] 云计算的技术与成本优势 - 阿里云灵骏智算集群支持千卡规模任务连续30天稳定训练,效率超90%,帮助企业避免自建万卡集群的高额投入(数十亿元)与长周期风险[11][12][13] - 爱诗科技借助阿里云PAI平台实现训练成本不足Meta十分之一,仍达成5秒生成视频的效率[11] - 广汽集团通过阿里云技术优化使数据库TCO下降30%,云服务费用较AWS降低50%[9][10] 云厂商的全球化布局与竞争 - 阿里云在新加坡、欧洲等四大区域设立27个技术服务中心,PAI平台覆盖17个国家,通义千问模型支持119种语言[14][15] - 2024年阿里云中国IaaS市场份额第一(948亿元规模),但营收增速低于10%,显著落后于AWS等国际云厂商(增速20%+)[15][16] - 阿里云计划三年投入3800亿元强化基础设施,需补足本地化团队建设以提升海外市场拓展能力[17] 行业趋势与战略转型 - 初创企业直接采用全面上云策略,依托云厂商技术快速打开海外市场,而传统企业逐步接受核心业务上云[3][12] - 汽车行业智能化需求推动车联网出海,云服务成为应对数据合规与本地化训练的关键[6][12] - 云厂商从基础设施提供商转向技术赋能者,降低AI等先进技术的使用门槛[4][13]