开源模型
搜索文档
硅谷大佬带头弃用 OpenAI、“倒戈”Kimi K2!直呼“太便宜了”,白宫首位 AI 主管也劝不住
AI前线· 2025-10-28 17:02
硅谷AI模型使用趋势转变 - 硅谷正从昂贵的闭源模型转向更便宜的开源替代方案,这一趋势在Reddit上引发热议[2] - 知名投资人Chamath Palihapitiya透露其团队已将大量工作负载从Bedrock迁移至Groq平台上的中国模型Kimi K2,原因是性能显著更优且成本远低于OpenAI和Anthropic[2][6] - 多家知名技术平台如Vercel、Cline、Cursor、Perplexity和GensparkAI已宣布接入Kimi K2模型[2] Kimi K2模型技术特点 - Kimi K2是由月之暗面团队开发的混合专家大型语言模型,总参数量达1万亿,激活参数量为320亿[2] - 该模型采用Groq平台部署,通过开放的API实现"token进、token出"的服务模式[3] DeepSeek模型成本优势 - DeepSeek 3.2 EXP模型将API成本降低高达50%,收费标准为每百万次输入28美分,每百万次输出42美分[5] - 相比之下,Anthropic的Claude模型同类服务收费约3.15美元,价格是DeepSeek新模型的10到35倍[5] - 该开源模型已在亚马逊云科技和谷歌云平台上可用,多家初创公司正在测试或已投入使用[5] 模型迁移的技术挑战 - 将工作负载从一个模型切换到另一个模型需要几周甚至数月时间,因为模型需要经过微调与工程适配才能在同一个系统正常工作[3][7] - AI模型迭代速度快,用户面临是否承受迁移麻烦或等待其他模型迎头赶上的复杂博弈[7] 中美AI开源领域竞争格局 - 当前高性能闭源模型主要来自美国,而高性能开源模型主要来自中国,形成结构性竞争[11] - 中国在开源AI模型领域投入力度大,代表作品包括DeepSeek、Kimi和阿里巴巴的通义千问Qwen[10] - 美国在闭源模型、芯片设计、芯片制造、半导体制造设备和数据中心等其他技术环节保持领先[10] 开源模型部署与安全考量 - Groq接入中国模型的做法是获取模型源代码,在美国本土数据中心进行部署和分支开发,由美国人操作[3][16] - 企业可将开源模型部署在自有基础设施上,实现数据本地化,避免数据传回中国的风险[15][18] - 模型安全通过社区竞争循环保障,各大安全公司和云服务商积极测试寻找漏洞[18] AI发展面临的能源挑战 - 能源企业负责人预测未来五年电价可能翻倍,这将直接影响AI运营成本[12] - 科技公司可能面临更高的电费费率,通过"交叉补贴"方式承担数据中心能耗成本[13] - 成本问题将逐渐转化为能耗问题,对科技巨头构成潜在公关危机[12]
“比OpenAI更好更便宜!”爱彼迎CEO一句话引爆硅谷,阿里AI正悄然拿下全球科技巨头
第一财经· 2025-10-22 18:01
文章核心观点 - 阿里巴巴通义千问模型凭借其成本效益和性能优势 正从全球AI巨头特别是OpenAI手中赢得关键客户和市场份额 标志着由OpenAI主导的AI时代走向终结 一个更加多元开放的竞争格局正在形成 [1][2][3] 全球科技巨头采用情况 - 爱彼迎CEO公开表示公司大量依赖通义千问 认为其比OpenAI模型更好更便宜 并解释技术选型基于成本与效率的务实考量 凸显硅谷对经济高效开源模型的青睐 [1] - 苹果公司计划在中国市场的核心产品线中引入通义千问以支持AI功能 英伟达CEO公开称赞其为最好的开源AI模型 马斯克也曾对其视觉模型生成效果表示赞赏 [2] - 亚马逊在其人形机器人操控系统中采用通义千问模型 用于帮助机器人更精准地理解环境和规划行动 表明其应用已从软件扩展至实体机器人领域 [2] 阿里巴巴战略与市场影响 - 阿里巴巴CEO明确提出将通义千问打造为AI时代的Android 通过全面开源与全球开发者共建开放生态 该战略已取得显著成效 [3] - 通义千问系列模型全球累计下载量突破6亿次 并催生了超过17万个衍生模型 反映出其生态的活跃度和广泛影响力 [3] - 全球科技巨头的实际应用投票表明 AI行业正从一家独大转向多元竞争 更快更便宜且足够好的开源模型成为主流选择 [3]
美国焦虑中国AI开源模型领先,英伟达看中的 Reflection AI是啥由头?
傅里叶的猫· 2025-10-21 23:34
以下文章来源于AI产业链研究 ,作者研究 AI产业链研究 . 围绕人工智能展开研究,涵盖基础设施、算法及应用等多个方面,同时也会分享研究过程中的一些心得 体会 中国开源模型在海外逐渐占据越来越大的市场份额是不争的事实。关于中国开源模型的讨论也越来越 多,DeepSeek 本周新推出的一款 OCR 模型更是在X上引发广泛关注 —— 这实际上是一款新发布的开 源视觉语言模型(VLM)。 它并不是又一款普通的 OCR 工具,而是 "光学上下文压缩" 领域的突破性成果:将图像作为编码和处理 海量文本数据的超高效率载体,成功解决了大型语言模型(LLMs)的核心痛点之一 —— 在处理长上下 文时,避免内存、延迟或令牌成本的激增。当然,更关键的是它的开源属性。 这几天,一张图片在海外 AI 圈刷屏—— DeepSeek 在投资领域的表现同样亮眼。在 2025 年 10 月的 Alpha Arena 赛事(Hyperliquid 平台举办的实盘加密货币交易竞赛)中,DeepSeek-V3.1 以 1 万美元本 金参赛,三天内斩获 40.4% 的回报率登顶排行榜 —— 不仅超越了 Grok 4(33.4%)和 Claude ( ...
张亚勤院士:AI五大新趋势,物理智能快速演进,2035年机器人数量或比人多
机器人圈· 2025-10-20 17:16
AI产业规模与代际演进 - 人工智能时代产业规模预计将比前一代(移动互联时代)至少大100倍[5] - 移动互联时代产业规模比PC互联时代至少大10倍[5] AI技术发展的五大新趋势 - 趋势一:AI技术从鉴别式、生成式走向智能体AI,过去7个月智能体AI任务长度翻倍且准确度超过50%[7] - 趋势二:预训练阶段规模定律放缓,更多工作转移至训练后阶段如推理和智能体应用,前沿模型智力上限仍在提升但迭代速度放缓[7] - 趋势三:物理智能和生物智能快速发展,VLA模型推动智能驾驶规模化落地,预计2030年10%车辆将具备L4功能[7] - 趋势四:AI风险快速上升,智能体出现使AI风险至少增加一倍[8] - 趋势五:AI产业新格局形成,呈现基础大模型+垂直模型+边缘模型架构,后两者未来发展空间更大[8] 大模型发展格局预测 - 预计2026年全球基础大模型约8-10个,中国占3-4个,美国占3-4个[8] - 中国大模型发展具独特性,表现为更快算法、更高效率、更低价格[8] - 未来开源模型将成为主流,开源与闭源模型比例预计为4:1[8] 成本与算力动态 - 过去一年推理成本降低10倍,但智能体复杂性使算力需求上涨10倍,形成乘数效应[7] 长期产业机遇 - 新一代人工智能是原子、分子和比特融合,是信息智能、物理智能和生物智能融合[3] - 具身智能快速爆发,预计2035年机器人数量有望超过人类[8]
当着白宫AI主管的面,硅谷百亿投资人“倒戈”中国模型
环球时报· 2025-10-15 11:24
行业格局转变 - 全球AI行业格局正从美国主导的不计成本追求极限参数的上半场,转向由性价比、商业效率和生态价值主导的新阶段[3] - 中国AI的地位从过去的追赶者提升为与美国并驾齐驱的竞争者,两者形成两种价值机制在同一舞台上并行的比拼[5][7] - 制胜关键不再仅体现为参数更多、模型更大,更在于能以更低的成本、更快的速度稳定服务用户[7] 中国AI模型表现 - 以DeepSeek、Kimi和Qwen为代表的中国开源模型矩阵,在多项关键性能指标上实现了对Meta的Llama系列的全面反超[5] - Kimi K2版本K2-0905在全球知名AI编程评测平台Roo Code上获得超过94%的评分,成为首个在该平台突破90%评分的开源模型[4] - Kimi K2在全球公认的LMSys Chatbot Arena上登顶开源第一,被誉为全网领先的开源文本模型[7] - DeepSeek在复杂的推理任务上超越了OpenAI的o1-preview版本,并成功将高端技术推向商业场景[7] 市场应用与生态突破 - 中国模型在Anthropic限制API服务后迅速填补市场空白,在高价值领域抢占用户市场[3][4] - 硅谷知名投资人查马斯将其公司的大量工作需求从亚马逊旗下AI平台转向中国模型Kimi K2,理由是性能强且比OpenAI和Anthropic便宜太多[1][3] - Cursor、Perplexity、Vercel等全球知名开发平台及应用相继宣布接入中国模型[4] - 中国在开源能力、成本效率与生态落地上实现弯道超车,展现出巨大的市场应用潜力[4][7]
蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌
机器之心· 2025-10-14 14:33
模型发布与市场反响 - 蚂蚁集团在短短十余天内连续开源三款大模型,最新发布的是全球首个开源万亿参数思考模型Ring-1T [3][6] - Ring-1T上线HuggingFace仅四天下载量便突破千次,显示出较高的市场关注度 [3] - 此次正式发布的Ring-1T完成了完整的训练流程,包括通过大规模可验证奖励强化学习和人类反馈强化学习进一步增强能力 [7] 技术性能表现 - 在IMO 2025测试中,Ring-1T首次尝试便解出4题全对,达到IMO银牌水平,成为首个在国际奥数赛题上取得获奖级成绩的开源系统 [7] - 在八个重要基准测试中,Ring-1T性能几乎全面超越其Preview版本,在ARC-AGI-v1、Arena-Hard-v2.0等高难度测试中表现尤为突出 [12][14] - 在逻辑推理任务ARC-AGI-v1上,Ring-1T刷新开源SOTA,显著领先Gemini-2.5-Pro,非常接近GPT-5-Thinking (High) [16] - 在ICPC World Finals 2025中,Ring-1T成功解出5题,表现超越Gemini-2.5-Pro (3题),逼近GPT-5-Thinking (6题) [19] 实际应用演示 - 在代码生成方面,Ring-1T能够快速生成功能完整的游戏代码,如Flappy Bird和贪吃蛇小游戏,实现交互功能与平滑动画 [20][23] - 模型在逻辑推理测试中表现出色,能够准确分析复杂情境并给出合理解答,如三只兔子赛跑问题和俱乐部成员身份推理题 [29][33] - 在创意写作领域,Ring-1T能够生成符合播客口语化风格的历史文案,语言生动且具吸引力 [40] 技术创新与工程突破 - 团队开发了强化学习算法IcePop,通过"双向截断+Masked Clipping"机制解决MoE模型训推不一致问题,显著提升训练稳定性 [45][46] - IcePop让模型在AIME25等复杂推理任务上成绩更优,输出更稳、更具多样性 [48] - 蚂蚁自研了强化学习基础框架ASystem,采用SingleController + SPMD架构,解决万亿规模训练的硬件资源调度与效率瓶颈 [50] - ASystem通过显存透明卸载与跨节点显存池化技术降低OOM风险,并实现权重秒级交换 [51] - 系统集成大规模Serverless Sandbox,支持毫秒级冷启动和10K/s吞吐量的奖励评估 [51] 开源战略与行业影响 - 蚂蚁集团在9-10月密集上线多款新品,平均每4天发布一个新模型,展现出快速迭代能力 [52] - 公司开源的不只是模型,还包括底层能力如强化学习框架AReaL,让社区能复用其在RL工程上的积累 [52] - 蚂蚁将开源视为AI普惠落地的现实路径,旨在让AI能力像电力与支付那样无处不在 [52]
英伟达,再次押注“美版DeepSeek”
证券时报网· 2025-10-13 20:31
Reflection AI融资与估值 - AI初创公司Reflection AI近期完成20亿美元融资,由英伟达领投8亿美元,公司估值达到80亿美元[1] - 本轮融资距离其3月份1.3亿美元的A轮融资仅过去7个月,估值从当时的约5.45亿美元大幅跃升至80亿美元[1] - 本轮投资者还包括光速创投、红杉资本、DST、埃里克·施密特以及1789Capital等[1] Reflection AI团队与技术定位 - 公司成立于2024年3月,CEO Misha Laskin曾帮助开发谷歌Gemini训练流程,联合创始人Ioannis Antonoglou是谷歌DeepMind创始工程师及AlphaGo幕后功臣[2] - 团队成员曾在DeepMind、OpenAI等前沿实验室主导开发AlphaGo和Gemini等先进AI系统[4] - 公司定位为OpenAI和Anthropic等封闭式实验室的开源替代方案,以及DeepSeek等中国AI公司的西方版本,旨在填补美国"DeepSeek形状的空白"[4] Reflection AI技术路线与商业模式 - 公司构建了能在Frontier规模下训练大规模MoE模型的LLM+强化学习训练平台,并已在自动化编码场景验证有效性[5] - 对"开放"的定义接近Meta或Mistral的策略,会开放模型权重供公众使用,但训练数据和完整流程不公开[5] - 主要收入将来自大型企业在其模型上构建产品以及各国政府建设主权AI系统的项目[5] 英伟达近期投资活动 - 英伟达9月至今已进行8笔对外投资,总金额超过1000亿美元[8] - 投资包括向OpenAI投资高达1000亿美元建设算力数据中心,向英特尔投资50亿美元开发AI基础设施,以及约9亿美元收购AI网络芯片初创企业Enfabrica[8] - 其他投资包括向英国自动驾驶企业Wayve投资5亿美元,向英国AI基础设施公司Nscale投资6.83亿美元,以及参与具身智能公司Dyna Robotics的1.2亿美元A轮融资[9][10][11] 行业投资趋势 - 风险投资机构今年迄今已向人工智能初创企业注入1927亿美元资金,创下全球历史新高[6] - 2025年有望成为首个VC资金半数以上流向AI行业的年份[6] - Reflection AI融资速度之快和金额之高反映出投资者对当前领域的强烈兴趣和迫切的"FOMO"情绪[6]
深度|硅谷百亿大佬弃用美国AI,带头“倒戈”中国模型
Z Potentials· 2025-10-12 14:32
文章核心观点 - 硅谷顶级投资人查马斯·帕里哈皮蒂亚公开将其公司部分AI工作负载从亚马逊Bedrock转向中国模型Kimi K2,标志着全球AI应用进入商业理性主导阶段 [1][4] - 中国AI产业在2025年完成从"追赶者"到"平行竞争者"的转变,以Kimi和DeepSeek为代表的中国模型在开源能力和商业化部署方面设定新节奏 [13][23] - 全球AI格局正形成"技术攻顶"与"应用共荣"双轨并行的发展范式,中国在应用生态构建方面展现出独特优势 [16][23] 硅谷大佬的行业信号 - 查马斯·帕里哈皮蒂亚作为身价超百亿美元的投资人,其职业经历包括将Facebook用户从4500万增长至7亿,对产品增长和商业本质有深刻理解 [3] - 他选择Kimi K2的原因是"性能足够强"且比OpenAI和Anthropic"便宜太多了",体现其务实投资哲学 [1] - 这一选择被视为强烈的市场领先指标,预示AI行业从不计成本探索转向商业理性主导 [4] 全球开发者生态采纳 - 估值93亿美元的云端开发平台Vercel已集成Kimi K2 API,使全球数百万开发者可直接调用其能力 [4] - AI原生代码编辑器Cursor、AI搜索应用Perplexity等关键开发者工具均已集成Kimi,证明其已从关注对象转变为实际生产工具 [12][5] - 开发者用代码进行的"投票"是比任何排行榜都更有力的市场证明 [5] 市场转折点与竞争格局 - 2025年9月5日Anthropic调整API服务政策限制部分地区访问,意外创造市场真空 [7] - 月之暗面在同一天发布K2-0905更新版本,专注代码和智能体能力,在Roo Code平台取得超过94%的评分,成为首个突破90%的开源模型 [8] - 这次精准卡位将Kimi从"长文本专家"推向"全球编程高手"的新高度 [9] 权威报告佐证行业变革 - 《State of AI Report 2025》首次将中国AI体系提升为"平行竞争者",指出中国在开源AI和商业化部署方面设定节奏 [13] - 报告在年度最重要技术进展中仅列出三个大语言模型:OpenAI的o1、中国的DeepSeek-v3系列和Kimi-K2系列,中国模型占据三分之二席位 [14] - 报告评价DeepSeek在复杂推理任务上超越o1-preview,Kimi K2被誉为"全网最强的开源文本模型"并在LMSys Chatbot Arena登顶开源第一 [21] 中美AI发展范式对比 - 美国采用"技术攻顶"范式:以OpenAI、Anthropic为代表,追求AGI终极目标,走精英技术路线 [16] - 中国采用"应用共荣"范式:以字节跳动、月之暗面等为代表,通过高性价比开源模型构建繁荣应用生态 [16] - Kimi战略聚焦AI编程这一高价值企业级赛道,提供性能、成本与可靠性的最佳结合,类似Anthropic的成功路径但更开放和具性价比 [20][22] 中国AI产业里程碑 - DeepSeek的技术突破代表中国AI的第一次"技术破局",证明核心模型能力达到世界水平 [23] - Kimi在全球的商业渗透代表第二次"生态突围",展示引领潮流的价值创造路径 [23] - 中国AI已走完追赶阶段,开始自信探索并引领自己的发展范式 [23]
阿里通义7大模型霸榜全球开源前十;滴滴App海外中文打车服务已上线12个国家|36氪出海·要闻回顾
36氪· 2025-10-05 21:06
人工智能与开源模型 - 阿里通义7款模型入选全球前十开源模型榜单,其全模态大模型Qwen3-Omni登顶,可处理文本、图片、语音和视频,音视频能力狂揽32项开源最佳性能SOTA [4] - 阿里通义共开源300多个模型,全球下载量突破6亿次,衍生模型超17万个,位居全球第一 [4] - 百型智能完成数千万人民币Pre-A轮融资,其AI外贸员工能为出海企业自动化执行寻找买家、精准营销等任务,客户已累计近千家,中小企业占比超八成 [9][10] - 未名拾光获数千万元B+轮融资,资金将用于深化AI技术平台建设及加速业务全球化布局 [9] 新能源汽车与出行服务 - 比亚迪9月乘用车及皮卡海外销量达70851辆,同比增长107%,公司已进入欧洲、东南亚、南美等多个全球市场 [5] - 小米SU7 Ultra高端纯电动汽车首次在日本亮相,未来在日本将采取在智能手机门店同步销售EV的策略 [4][6] - 滴滴App海外中文打车服务新上线澳大利亚、新西兰、埃及,目前已覆盖全球12个国家,超1000个城市 [5][7] - 文远知行自动驾驶科技公司在阿联酋哈伊马角启动Robotaxi与Robobus试运营,预计2026年初正式商业化运营 [7] 自动驾驶与智慧交通 - 千里科技目标在未来18个月完成Robotaxi全链路产业布局,计划在全球10座城市实现规模化运营,在单一城市部署超1000辆Robotaxi [8] - 文远知行与阿联酋哈伊马角交通局合作,其自动驾驶车辆被正式纳入当地公共交通体系 [7] - 吉利集团旗下时空道宇以“一箭12星”方式成功发射,完成吉利星座一期组网部署,在轨卫星增至64颗,实现除南北极外全球实时通信覆盖 [5] 储能与清洁能源 - 亿纬锂能与TSL Assembly达成战略合作,计划于2026–2030年期间在中东欧地区部署总规模达1GWh的储能系统项目 [8] 生物科技与制药 - 天境生物完成近6亿元人民币C2轮融资,资金将用于推动产品三期临床试验与上市申报,加速创新药管线国际化 [10] - 辐联科技完成7700万美元融资,资金将用于推进全球放射性药物管线研发及比利时生产设施建设 [11] - 未名拾光是一家生物基创新原料研发商,已与欧莱雅、宝洁等品牌建立联合开发合作 [9] 消费品牌与全球化布局 - 口腔护理品牌参半在全球的经销商数量已接近千家,实现了超市、便利店、酒店、美妆店等多元化零售场景的全球覆盖 [9] - 园林电动工具研发商劳尼克斯完成数千万元天使轮融资,聚焦德、法、英等欧美高端市场 [10] 游戏与文娱产业 - 超170家中国企业参加2025东京电玩展,腾讯控股在展会期间公开了与卡普空共同开发的《怪物猎人》系列最新作品 [12] - 英雄游戏公司预定于10月发布RPG游戏《二重螺旋》,将上线多语言版本并持续推进本地化 [12]
专家:2035年机器人数量或比人多
21世纪经济报道· 2025-10-04 13:41
AI产业规模与代际演进 - 新一代人工智能是原子、分子和比特的融合,是信息智能、物理智能和生物智能的融合 [1] - 移动互联时代产业规模比PC互联时代至少大10倍,人工智能时代产业规模将比前一代至少大100倍 [1] AI产业发展五大新趋势 - 第一大趋势是从鉴别式AI到生成式AI,并走向智能体AI,过去7个月智能体AI的任务长度翻倍、准确度超过50% [3] - 第二大趋势是预训练阶段的规模定律(Scaling Law)放缓,更多工作转移至训练后阶段如推理和智能体应用,推理成本降低10倍,但智能体复杂性使算力上涨10倍 [3] - 第三大趋势是物理智能和生物智能快速发展,如VLA模型规模化落地智能驾驶,预计2030年10%的车辆将具备L4功能 [3] - 第四大趋势是AI风险快速上升,智能体出现后让AI风险至少增加一倍 [4] - 第五大趋势是AI呈现新的产业格局,形成基础大模型+垂直模型+边缘模型局面,未来更大发展在于垂直模型和边缘模型 [4] AI模型产业格局与预测 - 预计2026年全球基础大模型约有8至10个,其中中国有3至4个,美国有3至4个 [4] - 中国在发展大模型方面呈现独特性,表现为更快的算法、更高效率、更低的价格 [4] - 未来开源模型将成为主流,开源与闭源模型之间的比例预计约为4:1 [4] 具身智能发展预测 - 具身智能将快速爆发,预计到2035年机器人数量有望超过人类数量 [4]