Workflow
编程模型
icon
搜索文档
阿里云副总裁最新发声!
证券时报网· 2025-07-27 17:03
AI技术发展现状 - AI模型技术正经历从"渐进式创新"到"指数级跃迁"的转变,大模型呈现"周级迭代"爆发态势 [1] - 技术变革由三大核心要素驱动:数据爆炸(互联网时代数据指数级增长)、算力飞跃(CPU→GPU→专用AI芯片)、算法突破(Transformer架构实现性能质变) [1] - 通义千问开源模型家族全球下载量突破4亿,衍生模型达14万个,超越Meta Llama成为全球第一开源模型 [2] 开源生态与产业应用 - 通义大模型已深度赋能金融、制造、教育等行业明星客户 [2] - 开源降低技术门槛,开发者平等参与创新,企业无忧采用前沿成果,形成"开源-反馈-进化"正向循环 [2] - 阿里云AI相关收入连续七个季度保持三位数增长,云计算业务因AI驱动上季度增速达18% [5] AI Agent技术突破 - AI技术范式从语言能力转向任务执行,2025年为Agent落地元年,企业级智能体突破对话层局限 [3] - Agent采用"感知-决策-执行"一体化架构,推动AI从增强搜索向自主服务载体跃迁 [3] - L3智能体将成为产业基座,实现涌现智能与生态自组织驱动的生产力革命 [3] 公司战略与产品进展 - 阿里发布三款冠军大模型:千问3基础模型(全球最智能非思考基础模型)、推理模型(比肩Gemini2 5pro)、Qwen3-Coder编程模型(超越GPT4 1) [5] - 公司宣布未来三年投入超3800亿元建设云和AI硬件基础设施,投资额超过去十年总和 [5]
一周三连发,这开源“劳模”为何只有阿里做得?
凤凰网财经· 2025-07-26 17:58
阿里开源模型技术突破 - 阿里通义千问在四天内连续发布三款重磅模型:千问3非思考模型、Qwen3-Coder编程模型、千问3推理模型 [1] - 千问3非思考模型性能大幅提升,获基础模型领域冠军,被权威机构评为"全球最智能的非思考基础模型" [1] - Qwen3-Coder在代码能力及Agent调用能力方面超越GPT4.1和Claude4等闭源模型,登顶HuggingFace模型总榜冠军 [1] - 千问3推理模型在7项核心能力上可比肩Gemini-2.5 pro等顶尖闭源模型,创下全球开源模型最佳性能表现 [2] 开源战略与市场影响 - 阿里开源行为在全球巨头构筑技术壁垒的背景下显得格外突出 [4] - Qwen3-Coder开源免费可商用,API价格仅为同级对手的三分之一到二分之一 [5] - 阿里已开源300余款模型,衍生社区模型超14万个,超越Meta的Llama系列成为全球第一大开源模型家族 [8] - 开源策略迅速引爆硅谷,获得推特创始人、风投机构及HuggingFace高管的高度评价 [6][7] 全栈AI能力支撑 - 阿里是中国唯一具备软硬一体垂直整合能力的全栈AI公司 [10] - 底层基建:拥有自研飞天操作系统及强大数据中心,提升算力效率降低训练成本 [11] - 模型研发:通义实验室汇聚顶尖AI人才,产出覆盖全尺寸、全模态、多场景的模型矩阵 [11] - 应用场景:庞大商业生态为AI提供丰富试验田,覆盖C端和B端亿级用户应用 [11] 商业战略与未来布局 - 采用"开源模型+云"双轨战略,通过开源吸引开发者,引导用户使用阿里云服务 [13] - 过去七个季度阿里云AI相关收入持续三位数增长,云计算业务增速回升至18% [14] - 未来三年将投入超过3800亿元建设云和AI硬件基础设施,创中国民企投资纪录 [14] - 战略目标是通过开源引爆开发者生态,赋能千行百业实现AI普惠化 [13] 行业竞争格局 - 阿里开源行为旨在推倒闭源模型构筑的技术壁垒,将AI定价权交还市场 [5][8] - 开源模型性能已可比肩顶尖闭源产品,改变行业竞争格局 [1][2] - 全球AI竞争进入深水区,流量玩法红利消退,技术实力和战略耐心成为关键 [16]
阿里,最新发布!
证券时报· 2025-07-23 11:59
阿里通义千问AI编程大模型Qwen3-Coder发布 - 阿里正式发布并开源全新AI编程大模型Qwen3-Coder,编程能力登顶全球开源模型阵营,超越GPT4-1等闭源模型,比肩全球最强编程模型Claude 4 [1] - Qwen3-Coder是千问系列首个采用混合专家MoE架构的代码模型,总参数480B,激活参数35B,原生支持256K上下文并可扩展至1M长度 [2] - 该模型在代码占比70%的7.5T数据上进行预训练,后训练阶段进行了编程任务及智能体任务的强化学习 [2] Qwen3-Coder技术性能 - 最强大版本Qwen3-Coder-480B-A35B-Instruct在Agentic Coding、Agentic Browser-Use和Agentic Tool-Use三类任务中获得开源SOTA [3] - 在Terminal-Bench测试中得分37.5,高于Claude Sonnet-4的35.5和GPT4-1的25.3 [2] - 在SWE-bench Verified测试中,500轮得分为69.6,接近Claude的70.4 [2] - 在执行任务时能调用的工具数量比Claude多几倍 [3] Qwen3-Coder应用场景 - 具备"氛围编程"功能,可完成写代码、补全代码、修Bug等基础编程任务 [4] - 编程工作效率大幅提升,代码测试、查询生成等工作从数小时降至数分钟 [4] - 新人程序员一天可完成资深程序员一周的工作量,生成品牌官网最快只需5分钟 [4] - 普通人用一句话即可生成复杂3D物理模拟过程 [4] 商业化与市场表现 - 采用阶梯计费方式,256K-1M档输入价格6美元/百万token,输出价格60美元/百万token [4] - 有望取代昂贵的Claude成为Agent领域最受欢迎的编程模型 [4] - 千问系列编程模型全球下载量已突破2000万次,是全球最受欢迎的开源编程模型 [6] - 阿里巴巴内部已大量使用,一汽集团、中国石油、建设银行等行业头部企业也已接入 [6] 行业竞争格局 - AI编程成为检验模型性能的重要领域,科技巨头加大投入布局 [5] - 谷歌以24亿美元引入初创公司Windsurf核心团队及技术 [5] - ChatGPT用户请求中近29%与编程相关,反映企业用户对AI辅助开发的兴趣 [5] - AI编程有利于补强云服务生态黏性,是大模型商业化的重要机会点 [5]
红杉专访 OpenAI Codex 团队:AI Coding 的未来,应该是异步自主 Agent
Founder Park· 2025-06-11 22:39
产品定位与核心功能 - Codex Agent 是 OpenAI 推出的全新编程模型 codex-1,能够并行处理多个任务并独立完成编程全流程,目标是从「代码补全」升级为「任务委托」的助手 [1] - 产品核心理念是让 AI 在云端独立环境异步完成任务并交付完整方案,而非仅提供实时代码补全 [6] - 模型与 o3 同源但通过强化学习微调,重点解决从「优秀程序员」到「优秀软件工程师」的转变,学习专业开发者的工程实践品味和偏好 [6][14][27] 技术实现与创新 - 采用容器化环境统一训练和生产环境,解决现实代码库缺乏一致测试框架和文档标准的难题 [6][28] - 模型支持长时间任务执行(最长30分钟),具备制定计划、引用工作成果和输出验证信息的能力 [29][34][37] - 训练重点包括 PR 描述规范、代码风格一致性、测试验证等工程实践细节,相当于为模型补足「三年工作经验」 [15][27] 行业影响与未来趋势 - AI 编程将大幅降低开发门槛,预计专业软件开发者数量增加而非减少,催生更多个性化软件需求 [6][25][26] - 开发者角色将从编码转向审查、验证和高层规划,顶尖用户每天可通过 Codex 完成超10个 PR [21][26] - 2025年可能成为「Agent 之年」,编程交互方式将融合同步与异步体验,界面可能类似 TikTok 信息流 [54][49][52] 产品生态与战略 - OpenAI 愿景是未来仅保留通用助手 ChatGPT,通过接入专用工具实现多功能,而非构建独立智能体 [6][39][48] - Codex CLI 作为终端环境中的协同工具,与云端独立工作的 Codex Agent 形成互补 [13][38] - 竞争优势在于模型泛化能力,可结合 Operator、Deep Research 等其他 Agent 获取外部上下文信息 [47][48] 用户体验优化 - 采用「富足心态」使用模式更高效,建议并行运行多个任务并接受多次尝试 [6][19] - 修复 Bug 是典型优势场景,能自主验证问题并提供可行方案 [17][18] - 任务粒度设计是关键挑战,建议先通过「提问模式」生成高级计划再细化执行 [30][31]