Workflow
通义千问模型Qwen3(千问3)
icon
搜索文档
美怎么也没料到,中方动真格了?阿里开源模型发布,特朗普慌了
搜狐财经· 2025-05-08 09:05
阿里巴巴开源千问3模型 - 阿里巴巴宣布开源新一代通义千问模型Qwen3,引发全球关注 [1] - 千问3采用混合专家(MoE)架构,兼具"快思考"与"慢思考"能力,能根据需求灵活调整算力消耗 [3] - 该模型在多个基准测试中表现优异:AIME25测评81.5分刷新开源纪录,LiveCodeBench超越Grok3,ArenaHard超越OpenAI-o1和DeepSeek-R1 [5] - 部署成本显著降低,仅需4张H20即可运行满血版,显存占用仅为性能相近模型的三分之一 [5] 国内AI模型发展现状 - 近期国内科技公司密集发布低成本高性能AI模型:百度推出文心一言4.5和X1,火山引擎发布豆包1.5,科大讯飞升级星火X1 [3] - 阿里巴巴开源千问3成为国内AI模型升级浪潮中最具影响力的事件 [3] - 阿里通义已开源200余个模型,全球下载量超3亿次,Qwen衍生模型数超10万个,超越美国Llama成为全球第一开源模型 [6] 阿里巴巴AI战略布局 - 公司将"实现通用人工智能(AGI)"设为首要目标 [6] - 未来三年计划投入超过3800亿元人民币建设云和AI硬件基础设施,投入额超过去十年总和 [6] - 千问3开源是公司迈向AGI的重要战略步骤 [6] 中美科技竞争态势 - 美国试图通过限制半导体设备进口和英伟达H20芯片对华出口来遏制中国AI发展 [6] - 阿里巴巴开源千问3展现中国在AI领域的自主创新能力和技术实力 [6][9] - 该事件可能提升中国在全球AI领域的话语权,推动技术应用创新,缩小与美国差距 [9]
零售业变天,大棋局开启
商业洞察· 2025-05-02 17:30
即时零售行业趋势 - 零售业大趋势从商品到服务全面电商化、在线化,并向即时化、近场化发展,要求产品和服务更快更近交付[3] - 年轻消费群体对即时消费需求更高,超50%的95后希望当天或半天收货,7%要求两小时内送达[10] - 商务部预测2025年即时零售规模超万亿元,2030年超2万亿元,未来5年复合增长率15%[12] 阿里战略布局 - 淘宝天猫即时零售业务"小时达"升级为"淘宝闪购",首页一级入口覆盖50城并快速推广全国,联合饿了么投入百亿级补贴[6][7] - 整合饿了么商家资源与淘系品牌优势,初期覆盖200家核心品牌,打通天猫旗舰店与小时达货盘及价格[7] - 饿了么基础设施(400万骑手、30分钟履约网络)与淘宝闪购协同,形成"淘侧赚人、饿侧赚钱"的生态闭环[19][20] 竞争格局与差异化 - 京东侧重供给侧能力建设,美团通过"闪电仓"扩展即时零售,阿里则聚焦需求侧补贴强化价格感知[8] - 阿里采用平台模式连接商家资源,与京东美团自营仓配体系形成差异,避免供应链博弈[26] - 淘宝闪购已接入300万家门店,包括Apple授权店、绫致集团、迪卡侬等品牌[17] 技术及组织支撑 - 阿里将即时零售业务整合至淘宝闪购统一管理,饿了么全力协同,实现组织架构高效联动[8] - 通义千问AI模型技术全球领先,为业务提供算力支持,2024年阿里AI大模型数量居全球第三[25][26] - 同城零售体系分层明确:远场(淘宝天猫)、中场(同城零售)、近场(饿了么3公里范围),现中场配送时效已近场化[15] 行业影响 - 即时零售推动电商从计划性需求向突发性需求转型,对商品力、仓配力、算力提出更高要求[13] - 30分钟送达成为新标准,覆盖品类从餐饮扩展到数码、医药、宠物等全品类"万物闪购"[12] - 2025年或成中国零售业"电商化+即时化+近场化"三化融合元年[8]
联想百应智能体接入千问3 重塑IT运维与AI办公体验
中国经济网· 2025-04-30 14:24
公司动态 - 联想携手通义千问模型Qwen3深度升级百应智能体,在IT运维和AI办公领域实现突破 [1] - 千问3是国内首款混合推理模型,具备混合推理模式、支持MCP、多语言等先进能力 [1] - 百应智能体在IT运维场景中通过千问3升级本地推理模型,提升问题诊断和故障处理的精准度与智能化水平 [1] - 百应智能体将推出离线智能桌面运维功能,支持复杂网络或离线环境下的异常定位与自动修复,保障企业IT系统7×24小时稳定运行 [1] - 联想百应智能体PC端即将上线千问3本地模型一键部署功能,企业可调用本地大模型,确保核心数据全程锁定在本地设备 [1] 产品与技术 - 联想百应Copilot办公超级智能体与千问3深度融合,重构Word长文档分析、多语言协作等核心能力,提升办公效率 [2] - 千问3支持119种语言及方言的实时翻译,助力百应Copilot在企业海外业务拓展、跨文化团队沟通、跨国会议语音转写与决议提炼中发挥作用 [2] - 百应Copilot创新引入"深度思考开关",用户可在轻量级快速交互与深度推理模式间自由切换,结合企业知识库与检索增强生成(RAG)技术,实现精准问答与智慧决策 [2] 行业影响 - 联想百应智能体与千问3的深度融合为企业提供高效、安全的智能化服务,推动企业在数字化浪潮中快速发展 [2]
事关AI,腾讯重大宣布!互联网领涨恒生科技,513770涨逾1%
新浪财经· 2025-04-30 10:15
市场表现 - 恒科指小幅高开0.21%,科网板块表现强劲 [1] - 港股互联网ETF(513770)场内价格涨逾1%,美团-W、阿里巴巴-W、快手-W、腾讯控股集体上涨 [1] 公司动态 - 阿里发布新一代通义千问模型Qwen3并开源,登顶全球最强开源模型 [2] - 腾讯宣布重构混元大模型研发体系,围绕算力、算法和数据三大核心板块加码AI投入 [2] - 腾讯2024年第四季度取得双位数收入增长,受益于AI赋能的广告平台升级、视频号用户参与度提升以及长青游戏的增长 [2] - 阿里云2024年4季度对外商业化收入同比增长11%,AI相关产品收入连续6个季度保持三位数同比增长 [2] 行业趋势 - 互联网企业竞相加码AI,AI已成为业绩增长的关键驱动力 [2] - 互联网龙头基于数据+资金+触达入口优势,有望在AI时代扮演更重要的角色 [2] - AI时代商业化的逻辑是"软件解决硬件需求",互联网龙头有望通过提升生产力效率实现更高远期商业化利润 [2] 投资观点 - AI技术发展仍有较大空间,相关主要标的集中在港股 [3] - 科技股财报业绩验证基本面逻辑,或持续支撑港股相对行情表现 [3] - 中证港股通互联网指数累计涨幅超33%,优于恒指、恒科指同期表现,区间最大涨幅高达53.59% [3] - 港股互联网ETF(513770)年内日均成交额7.14亿元,流动性佳 [3]
马斯克:下周推出Grok 3.5;阿里千问3发布并开源,参数仅为DeepSeek-R1三分之一丨AIGC日报
创业邦· 2025-04-30 07:47
阿里千问3发布 - 阿里巴巴开源新一代通义千问模型Qwen3,参数量为235B,仅为DeepSeek-R1的1/3 [2] - 采用混合专家(MoE)架构,激活参数量仅需22B,预训练数据量达36T tokens [2] - 性能超越DeepSeek-R1和OpenAI-o1等领先模型,部署成本大幅下降,仅需4张H20即可部署满血版 [2] - 模型集成"快思考"与"慢思考"功能,在推理、指令遵循、工具调用、多语言能力等方面均有增强 [2] AI存储设备新突破 - 韩国浦项科技大学团队揭示电化学随机存取存储器(ECRAM)工作机制 [2] - 该技术有望提升智能手机、平板电脑等设备的AI性能并延长电池寿命 [2] - 标志着AI硬件向高效能、低能耗方向迈出重要一步 [2] ChatGPT漏洞事件 - OpenAI确认ChatGPT存在漏洞,会向未成年用户生成色情内容 [2] - 漏洞导致模型超出规范限制,公司正在积极部署修复措施 [2] - OpenAI政策明确禁止向18岁以下用户展示此类内容 [2] Grok 3.5即将发布 - 马斯克宣布下周将向SuperGrok订阅者发布Grok 3.5早期测试版 [2] - 该版本是首个能准确回答火箭发动机和电化学技术问题的AI [2] - 模型能从第一原理推理并得出互联网上不存在的答案 [2] 行业信息服务 - 提供AIGC产业日报订阅服务,精选行业新闻 [3] - 会员服务可解锁人形机器人、商业航天、AGI等热门赛道行业图谱和报告 [5]
九号公司一季度净利润同比增长236%;因时机器人完成近亿元B3轮融资|未来商业早参
每日经济新闻· 2025-04-30 07:34
因时机器人融资 - 公司完成近亿元人民币B3轮融资 由神骐资本领投 源禾资本 华盖资本跟投 久谦资本担任独家财务顾问 [1] - 公司成立于2016年 专注于微型伺服电缸和灵巧手研发与量产 核心产品应用于人形机器人 医疗 3C制造 新能源 半导体等领域 [1] - 融资反映智能制造和机器人领域投资热度 微型精密运控零部件作为核心部件市场需求增长 [1] 九号公司业绩 - 一季度营业收入51.12亿元 同比增长99.52% 归属于上市公司股东的净利润4.56亿元 同比增长236.22% [2] - 业绩增长主要来自电动两轮车 电动滑板车 服务机器人等业务销量提升 以及创新和经营策略优化 [2] - 智能短交通行业受益于便捷环保出行需求增加和技术进步 [2] 阿里千问3模型 - 阿里巴巴推出新一代通义千问模型Qwen3并进行开源 是国内首个混合推理模型 [3] - 模型参数量为DeepSeek-R1的1/3 成本大幅下降 在ChatBot Arena等榜单性能超越DeepSeek-R1和OpenAI o1等顶尖模型 [3] - 开源举措有助于推动国内AI技术发展和应用普及 混合推理模型在性能和成本方面具有优势 [3]
阿里王炸!成本仅需DeepSeek-R1的1/3
是说芯语· 2025-04-29 16:15
阿里巴巴开源新一代通义千问模型Qwen3 - 阿里巴巴于2025年4月29日开源新一代通义千问模型Qwen3 该模型参数量仅为DeepSeek-R1的1/3 但性能全面超越 成为全球最强开源模型 [2] - Qwen3采用创新技术路径 成本大幅下降 仅需4张H20就能部署满血版 显存占用仅为性能相近模型的三分之一 [2] - Qwen3是国内首个"混合推理模型" 集成"快思考"与"慢思考" 面对简单需求可低算力"秒回"答案 遇到复杂问题可多步骤"深度思考" 有效节省算力消耗 [2] - 模型总参数量235B 激活仅需22B 提供2款30B和235B的MoE模型以及6款不同规模的密集模型 API可按需设置"思考预算" 满足不同场景需求 [2] - 4B模型适合手机端 8B可在电脑和汽车端侧部署应用 [2] Qwen3对AI产业的影响 - 降低AI技术应用门槛 中小企业无需高算力投入就能部署复杂AI应用 [2] - 推动全球AI开源生态繁荣 以宽松的Apache2.0协议开源 吸引全球开发者参与 [2] - 提升中国在全球开源AI生态的影响力 阿里通义此前已开源超200个模型 下载量超3亿次 千问衍生模型超10万个 [2] - 加剧AI行业竞争 促使其他企业和研究机构加大研发投入 推动技术创新进步 [2] AI Agent发展现状 - Agent技术从最初按固定规则回应 到如今能自主决策、协作共事 经历了巨大飞跃 [2] - 2011年IBM Watson在智力问答节目中战胜人类选手以及苹果Siri推出 标志着AI Agent进入成熟阶段 [2] - 2022年ChatGPT问世 让AI Agent拥有自主执行复杂任务能力 [2] - 判断Agent成熟度的维度包括:上下文窗口提升 思维链与推理引擎发展 环境交互能力 多模态处理整合 [2] - 当前Agent技术仍面临可靠性与稳定性、安全边界、隐私与数据安全、幻觉与错误决策等技术挑战 以及责任归属、工作替代与转型等社会与伦理挑战 [2] - Qwen3这样的模型进步 可能为Agent发展注入新动力 推动其不断完善成熟 [2]
软件ETF(159852)涨超1%,卫宁健康涨超7%,机构:短线建议关注软件开发等行业的投资机会
21世纪经济报道· 2025-04-29 10:42
市场表现 - A股三大指数低开震荡回升 人工智能概念盘初活跃 [1] - 软件ETF(159852)盘中震荡走高 现涨1.04% 成交额突破5000万元 [1] - 成分股卫宁健康涨超7% 广联达、石基信息、深信服等多股跟涨 [1] 行业ETF - 软件ETF(159852)紧密跟踪中证软件服务指数 为全市场相关挂钩产品中规模最大 [1] - 中证软件服务指数覆盖30只业务涉及软件开发、软件服务等领域的上市公司证券 [1] - 十大重仓股包括科大讯飞、金山办公、同花顺、恒生电子等 [1] - 软件ETF(159852)配备场外联接基金(A类:012619 C类:012620) [1] 人工智能技术进展 - 阿里巴巴推出新一代通义千问模型Qwen3并进行开源 [1] - 千问3是国内首个"混合推理模型" 参数量仅为DeepSeek-R1的1/3 成本大幅下降 [1] - 该模型在ChatBotArena等榜单中性能全面超越R1、OpenAI-o1等全球顶尖模型 登顶全球最强开源模型 [1] - 知情人士表示这是今年上半年阿里云最核心的技术产品发布 [1] 机构观点 - 4月是年报和一季报密集披露期 市场将从预期驱动转向基本面验证 [2] - 预计短期市场仍以区间震荡为主 政策托底与经济韧性为结构性机会提供支撑 [2] - 未来市场有望呈现科技领涨、红利防御、消费复苏与内需驱动的特征 [2] - 短线建议关注软件开发、互联网服务、有色金属以及食品饮料等行业 [2] - 中期"宽货币+弱美元"格局下 小盘、成长风格更为占优 [2] - 政策和产业端具备持续催化的板块将是后续交易重心 包括机器人、人工智能、国产算力产业链等方向 [2]
阿里巴巴,登顶全球开源模型!
证券时报· 2025-04-29 10:41
模型性能 - 千问3在GPQA、AIME24/25、LiveCodeBench等多个权威基准测试中全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球开源模型 [1] - 在奥数水平的AIME25测评中获得81.5分,刷新开源纪录 [1] - 在LiveCodeBench测评中突破70分大关,表现超过Grok3 [1] - 在Arena Hard测评中以95.6分超越OpenAI-o1及DeepSeek-R1 [1] - 采用混合专家架构,总参数量为235B,激活参数量仅需22B [2] 技术亮点 - 国内首个"混合推理模型",集成"快思考"与"慢思考",可在思考模式与非思考模式之间无缝切换 [3] - 提供8款不同尺寸的模型版本,包含2款30B、235B的混合专家模型和6款稠密模型 [3] - 推理能力显著提升,在数学、代码生成和常识逻辑推理方面超越QwQ和Qwen2.5 instruct models [4] - 支持MCP协议,具备强大的工具调用能力,在BFCL评测中拿下70.8的新高 [5] - 旗舰模型部署成本仅为满血版R1的25%—35%,成本大降75%—65% [5] 开源与应用 - 采用宽松的Apache2.0协议开源,首次支持119多种语言 [6] - 已上线魔塔社区、HuggingFace、Github等平台,全球开发者可免费下载模型并商用 [6] - 个人用户可通过通义APP直接体验,夸克即将全线接入 [6] - 阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个 [7] - 超越Meta的Llama,成为全球第一开源模型 [7]
阿里发布并开源千问3,称成本仅需DeepSeek-R1三分之一
第一财经· 2025-04-29 08:33
模型性能与架构 - 千问3是国内首个"混合推理模型",集成"快思考"与"慢思考"功能,参数量仅为DeepSeek-R1的1/3 [1] - 千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B,预训练数据量达36T [2] - 在ChatBot Arena等榜单中性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型 [1] - 具体性能表现:ArenaHard 95.6、AIME'24 85.7、CodeForces Elo Rating 2056等指标领先竞品 [2] - 30B参数MoE模型实现10倍以上性能杠杆提升,仅激活3B就能实现上代Qwen2.5-32B模型性能 [3] 成本与部署优势 - 部署成本大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为DeepSeek-R1的三分之一 [1][3] - 所有千问3模型都是混合推理模型,API可按需设置"思考预算"灵活满足不同场景需求 [3] - 通过优化架构实现稳定且高效的"思考预算"控制能力,对简单需求可"秒回"答案 [2] 产品发布与开源 - 公司开源了2款30B、235B的MoE模型,以及6款密集模型(0.6B至32B) [3] - 用户可在魔搭社区、HuggingFace等平台下载商用,或通过阿里云百炼调用API服务 [4] - 个人用户可通过通义APP体验,夸克即将全线接入千问3 [4] 技术路线与发展规划 - 未来将通过优化架构和训练方法扩展数据规模、增加模型大小、延长上下文长度 [4] - 计划拓宽模态范围并利用环境反馈推进强化学习以进行长周期推理 [4] - 团队表示Qwen3是通往AGI和ASI旅程中的重要里程碑,正过渡到以训练Agent为中心的时代 [4]