开源模型
搜索文档
中国AI的性价比 已成全球杀器
凤凰网· 2025-11-05 08:32
"我们很大程度上依赖阿里巴巴的Qwen模型。它非常好,速度也很快,而且很便宜。"近期,爱彼迎 (Airbnb)联合创始人兼CEO Brian Chesky的一番公开表态在全球AI圈掀起波澜。 值得一提的是,Brian Chesky与OpenAI CEO奥特曼私交甚好,但在自家产品的技术选型上却没有念 及"私情"——"我们也会用OpenAI的最新模型,但在实际生产中通常不会大量使用,因为有更快、更经 济的模型可供选择"。 这场选择背后,中国AI模型悄悄改写全球市场规则。 开源与便宜,中国模型的杀手锏 中国大模型的圈粉早已不是个案。 曾将Facebook用户从4500万做到7亿的硅谷传奇投资人查马斯・帕里哈皮蒂亚在播客节目中一度直言, 已将核心业务负载从美国AI模型转向中国的Kimi K2模型,理由简单直接:"K2的性能够强,而且比 OpenAI和Anthropic便宜太多" ;国外初创公司GlueAI创始人Evan Owen也表示,他们团队同样频繁使用 Kimi K2。 《机器之心》近期在统计Thinking Machines Lab所发的新研究博客时统计,TML在该篇博客中共计点 名"Qwen"38次之多,称 ...
硅谷大佬带头弃用 OpenAI、“倒戈”Kimi K2,直呼“太便宜了”,白宫首位 AI 主管也劝不住
36氪· 2025-11-04 18:50
刚刚,这样一个消息在 Reddit 上引发热议:硅谷似乎正在从昂贵的闭源模型转向更便宜的开放源替代 方案。 被称为"SPAC 之王"的知名美国企业家和投资人 Chamath Palihapitiya 公开表示,其团队是 Bedrock 的前 20 大用户,但现在已将大量工作负载迁移至 Groq 平台上的中国模型 Kimi K2,因为该模型的性能显著 更优,且比 OpenAI 和 Anthropic 都要便宜得多。 Kimi K2 是由月之暗面团队开发的混合专家(MoE)大型语言模型,总参数量达 1 万亿,激活参数量为 320 亿。此前,知名云端开发平台 Vercel、AI 编码助手 Cline 和 Cursor、Perplexity 和 GensparkAI 应用 也都接连宣布接入 Kimi K2 模型。 "最终决定切换到开源模型,核心就是成本考量。"Palihapitiya 透露,其使用的编程工具仍然通过 Anthropic 的系统运行,Anthropic 的技术很棒但成本太高。而 DeepSeek 模型一推出就便宜很多,但要 切换过去得花费几周甚至几个月时间。"AI 模型迭代这么快,要突然把所有提示词切换 ...
硅谷今夜学中文,Cursor被曝「套壳」国产,AI顶级人才全是华人
36氪· 2025-11-03 11:36
行业人才结构变化 - 硅谷AI顶尖人才中华人比例显著提升,例如Meta新成立的超级智能实验室44人团队中近一半为华人[27] - OpenAI等重要AI公司的核心贡献者名单和会议现场也出现大量华人身影[3][37] - 华人科学家在关键项目中担任重要角色,如Meta首席科学家赵晟佳是ChatGPT初始团队成员和GPT-4核心贡献者[31],研究负责人宋飏是扩散模型技术奠基者[35] 中国开源模型技术实力 - 在Artificial Analysis Intelligence指数榜单上,中国开源模型如MiniMax-M2、DeepSeek-V3.1、Qwen3-235B-A22B、GLM-4-6、Kimi K2等稳居第一梯队,超越Meta的Llama系列[15] - DeepSeek V3-1在Coding指数榜单上表现优于谷歌Gemini 2-5 Pro[17] - 在智能体榜单上,Kimi、GLM和Qwen也排名前列[19] 海外公司对中国模型的应用 - 知名投资人Chamath Palihapitiya团队将大量工作负载从Bedrock迁移到Kimi K2,因为性能更优且成本更低[11] - Cursor发布的Composer模型在思考过程中频繁使用中文,被质疑是基于中国开源模型微调[4][8] - Windsurf直接承认使用GLM-4-6的定制版本进行微调和强化学习[8][55] - Vercel提供GLM-4-6的API服务,因其在nextjs-org/evals中排名第三且是前五名中唯一的开源模型[47] - Airbnb的客服AI由13个模型组成,很大程度上依赖Qwen来支持,认为其比OpenAI产品更好更便宜[49] 成本与性能优势 - 中国开源模型能以20%的成本提供80%的性能,在某些领域如编码甚至能提供100%-110%的性能而成本依然低廉[57] - 自研模型难度与成本过高,使得海外公司更倾向于在开源SOTA模型上进行二次训练[14] - 模型量大管饱、性能好且价格便宜成为海外公司选择中国模型的主要原因[11]
最新外国「自研」大模型,都是套壳国产?
36氪· 2025-11-01 13:02
Cursor公司Composer模型发布 - Cursor发布2.0版重大更新,推出首个自家代码模型Composer以及用于并行协作多个智能体的新界面[4] - Composer是使用强化学习训练的大型MoE模型,能够出色处理实际代码且速度非常快[4] - 在内部基准测试中,该模型在编码任务上达到行业前沿水准,生成速度比同类模型快四倍[7] 模型技术来源推测 - 新模型Composer在思考时大量输出中文,行为与国产模型极其相似,引发对其基于中国AI模型开发的猜测[4][9] - 有分析认为Cognition的SWE 1.5模型是基于智谱AI的GLM大模型进行开发和改进的[11] - 网友对SWE 1.5进行“越狱”后,模型直接回答自己是智谱AI开发的GLM大模型[11] - 业界观点认为Cursor的Composer模型和Cognition的SWE-1.5都是基于中国公司智谱的GLM 4.6模型进行定制精调[16] 模型开发策略分析 - 分析指出WindSurf和Cursor的新模型都是经过微调而非从零训练,这对于开源社区是胜利[17] - 从头训练基础模型成本极其高昂,许多资源更雄厚的公司都未能成功,因此后期投资强化学习是合逻辑的选择[17] - Cursor和WindSurf团队被认为没有足够资金建设庞大训练集群,也没有足够数据和团队支持从零建立大模型[18] 中国开源模型市场地位 - 英伟达CEO黄仁勋指出开源模型已变得非常强大,大大加速AI应用进程[21] - 2025年以来,阿里的通义千问模型已占据开源模型大部分市场份额,领先优势持续扩大,衍生模型数量全球第一[21] - 在AI社区HuggingFace趋势榜上,排行前列的模型都出自中国公司,包括MiniMax、DeepSeek、Kimi、百度等[23] - 在第三方基准平台ArtificialAnalysis上,排行前列的也大多数是国产模型[24] 行业格局影响 - 中国开源基础模型已具备足够能力支持西方产品开发,全球AI正进入多极化竞争新格局[20] - 不论在模型技术水平还是全球开发者接受度上,国内开源大模型都已确立领先地位,正在改变全球AI竞争格局[26] - 开源模型推理能力、多模态能力、专业领域能力的提升,使其不仅帮助开发者,甚至已成为初创公司的命脉[23]
最新外国「自研」大模型,都是套壳国产?
机器之心· 2025-11-01 12:22
机器之心报道 编辑:泽南、杨文 外国开发者:我们该开始学习中文了吗? 绷不住了,美国科技公司最新发布的大模型,思考时怎么一直在说中文? 本周,知名 AI 代码工具 Cursor 发布了 2.0 版重大更新,推出了首个自家的代码模型 Composer,以及用于并 行协作多个智能体的新界面。 新模型一发布,大家在祝贺 Cursor 终于「扬眉吐气」、用上自家模型的同时,也发现 这个大模型在思考的 时候一直讲中文,而且行为和国产模型极其相似 。 Composer 是 Cursor 使用强化学习训练的一个大型 MoE 模型,能够出色地处理实际代码,并且速度非常 快。 内部基准测试中该模型在编码任务上达到行业前沿水准, 生成速度比同类模型快四倍 。 据官方博客介绍,在研发过程中,他们试验了一个代号为 Cheetah 的原型智能体模型,以更好地理解更高速 智能体模型的影响。Composer 是该模型的更智能升级版,凭借足够的速度支撑交互式体验,让编码始终丝 滑。 不过在看到模型输出了这么多中文之后,人们纷纷开始猜测它背后的「基础」是哪家大模型,难道是 Qwen Code? 无独有偶。 智谱的官推也来转推祝贺。 AI 编程 ...
中国AI的性价比,已成全球杀器
凤凰网· 2025-10-31 14:47
中国AI模型的全球市场竞争力 - 中国AI模型凭借高性价比和开源策略正快速获得全球市场认可,爱彼迎CEO表示在实际生产中大量使用阿里巴巴的Qwen模型,因为它比OpenAI模型更快、更经济[1] - 硅谷传奇投资人查马斯·帕里哈皮蒂亚已将核心业务负载从美国AI模型转向中国的Kimi K2模型,理由是性能足够强且比OpenAI和Anthropic便宜太多[2] - 海外研究团队与企业选择中国AI模型被视为开源策略与性价比的双重胜利[3] 中国AI模型的开源生态与市场渗透 - 阿里巴巴通义已开源200余个模型,全球下载量超3亿次,千问系列衍生模型突破10万个,成为全球最大的开源模型家族[4] - MiniMax发布的新模型M2在智能代理任务上接近GPT-5水平,并主打限时免费策略,已登顶HuggingFace Trending榜单[4] - 据《经济学人》报道,在硅谷路演的AI初创公司中有80%可能在使用中国开源模型,而三年前OpenAI还垄断市场话语权[4] 全球企业对性价比的追求 - 塞浦路斯的AI工具平台Latenode表示DeepSeek整体质量相同但价格便宜17倍,使其在智利和巴西等资金和计算能力不充裕地区特别有吸引力[4] - 汇丰银行、渣打银行等国际金融机构已开始内部测试DeepSeek模型,全球最大石油公司沙特阿美将DeepSeek系统直接部署在其数据中心[4] - 亚马逊AWS、微软和谷歌等美国云服务巨头也在向客户提供DeepSeek服务[4] 海外科技巨头的算力焦虑与成本压力 - 微软继今年5月裁员6000人后又宣布削减9000个岗位,此次调整为两年来最大规模,裁员涉及不同部门、地区及各经验层级员工[5] - 高端AI芯片价格高昂,一枚英伟达H100芯片售价可达数万美元,在营收增长放缓下,裁员成为平衡成本与算力需求的必选项[6] - 全球电子商务巨头亚马逊宣布计划裁减约1.4万名公司职员,旨在通过将资源重新分配到优先领域让公司更加强大[6] AI芯片市场格局与资本集中 - 英伟达股价上涨3.2%,市值首次站上5万亿美元,成为史上第一家市值跨越这一里程碑的上市公司,从4万亿美元到5万亿美元仅用时113天[6] - OpenAI正在筹备上市,最快于2026年提交IPO申请,或将成为人类资本史上最大一次融资事件,但每赚1美元就要花费2.25美元[7] - OpenAI开始向重度用户出售Sora生成式AI视频工具的额外使用积分,否则GPU资源将无法支撑用户增长[7] 中国AI模型的技术创新 - DeepSeek发布的全新多模态模型DeepSeek-OCR提出利用视觉模态压缩长文本上下文的新方法,为光计算和量子计算在LLM领域的引入提供了技术路径[8] - Kimi提出新的混合线性注意力架构Kimi Linear,能将KV缓存减少75%同时将吞吐量提升6倍,是一个即插即用替代方案[8] - 英伟达CEO黄仁勋表示Qwen是世界级的语言模型,DeepSeek在推理架构上的突破是革命性的[5]
Wan2.2-Animate又火了,5分钟让抠脚大汉秒变高冷女神。
数字生命卡兹克· 2025-10-30 09:33
最近,一个视频在推上传疯了。 一张美女照片,加上一条自己录制的视频,就能生成一张极其自然的换脸视频,表情和动作复刻的都很好。 而它用到的,就是阿里家的开源模型,Wan2.2 Animate。 其实Wan2.2 Animate一个月前杠发布的时候就火过一波,不知道你们对这个宅男变身女主播的视频眼熟不,当时我刷到了n次。 然后你会发现,这次再火起来,流量密码依然没变。 搞颜色还是第一生产力。。。 但你们都知道,一个模型,它能搞颜色,不代表它只能搞颜色。 相反,很可能意味着它上限很高。。。 毕竟在座的各位都是老司机,阅历惊人,出来的效果如果哪里不自然,大概率一眼就看得出来。 至于效果,直接给大家看看,我用我自己的视频加上不同角色的图片,做出来的效果。 由于我自己确实是个不爱拍照的I人,表情没那么丰富,这里借用听泉老师代为出镜一下。 再加上一个美女。 更复杂的表情,它也能复刻。 出来的效果是这样的。表情模仿确实很到位,就是感觉高冷美女一下子变成东北银了。 想得到更逼真的效果呢,还可以变声线。 直接做一条声音来替换就行,海螺+剪映就可以实现。 这样就能同时替换形象和声音了。 我用海螺做了声音,出来的效果是这样的。 你也 ...
288亿独角兽!复旦女学霸创业3年,被黄仁勋和苏妈同时押注
深思SenseAI· 2025-10-30 09:04
3年时间,年收入达2.8亿美元,估值40亿美元。这是AI推理赛道跑出的最快独角兽。 2025年10月28日,Fireworks AI宣布完成2.54亿美元C轮融资 ,由Lightspeed、Index Ventures和Evantic领投,英伟达、AMD、红杉资本、Databricks等跟投。 创始人乔琳是PyTorch框架的核心创建者、复旦大 学计算机系校友。 她的核心洞察是,训练是科研的浪漫,推理才是产业的现金流。Fireworks 定位很清晰, 目前已服务超过10,000家企业客户,每 天处理超10万亿tokens。Cursor、Notion、Uber、Samsung、Shopify等明星产品背后的AI推理引擎,都是Fireworks。 当AI进入工业化阶段,推 理层正在从成本中心变成利润中心。 Fireworks AI 公司概要 01. 从PyTorc h到Fire works,训练与推理的分岔口 #PyTorc h的哲学 :简单性是可扩展的 Fireworks的故事,起点在Meta的PyTorch团队。乔琳在复旦毕业后,远赴加州大学圣巴巴拉分校攻读计算机博士学位。她的职业生涯始于IBM研究 职位,随 ...
黄仁勋演讲揭露,全球开源模型阿里通义市占率第一
经济观察网· 2025-10-29 18:51
黄仁勋进一步表示,开源模型极其重要,初创公司需要开源模型,国家同样依赖开源模型。他提醒,美 国有很厉害的闭源模型,但也必须要在开源领域领先。黄仁勋称英伟达为此做出贡献,在他展示的全球 开源模型数量中,英伟达与阿里通义千问断层领先。 近期,以阿里通义为代表的中国开源模型再度在全球掀起热浪:爱彼迎Airbnb布莱恩·切斯基 Brian Chesky称大量依赖阿里通义千问,认为阿里通义比OpenAI更好更便宜,硅谷都在用;OpenAI前CTO Mira Murati创业公司Thinking Machines 在最近披露的首篇研究博客中称,受到通义千问的极大启发,新 研究成果38处提及Qwen;Apple机器学习科学家Awni Hannun奥维尼·汉农第一时间在苹果处理器芯片上 完成千问3全系列模型测试,表示苹果机器学习框架与千问3是最佳搭档,开发者可以在苹果多终端上适 配部署千问3,包括Mac、 iPhone等;亚马逊也在使用阿里通义千问布局人形机器人。美国AI专家 Nathan Lambert甚至表示,硅谷建立在阿里千问Qwen之上。 北京时间10月29日凌晨,英伟达CEO黄仁勋在华盛顿举行的2025 GTC 大 ...
硅谷大佬带头弃用OpenAI、“倒戈”Kimi K2,直呼“太便宜了”,白宫首位AI主管也劝不住
36氪· 2025-10-28 18:39
刚刚,这样一个消息在 Reddit 上引发热议:硅谷似乎正在从昂贵的闭源模型转向更便宜的开放源替代 方案。 被称为"SPAC 之王"的知名美国企业家和投资人 Chamath Palihapitiya 公开表示,其团队是 Bedrock 的前 20 大用户,但现在已将大量工作负载迁移至 Groq 平台上的中国模型 Kimi K2,因为该模型的性能显著 更优,且比 OpenAI 和 Anthropic 都要便宜得多。 Kimi K2 是由月之暗面团队开发的混合专家(MoE)大型语言模型,总参数量达 1 万亿,激活参数量为 320 亿。此前,知名云端开发平台 Vercel、AI 编码助手 Cline 和 Cursor、Perplexity 和 GensparkAI 应用 也都接连宣布接入 Kimi K2 模型。 另外要说明的是,这个模型是开源的,大家要清楚,它已经可以在亚马逊云科技和 GCP(谷歌云)上 使用了,至少 3.1 版本是这样。我不知道 3.2 版本现在是否也能在这些平台上用,但我从很多初创公司 那里听说,他们正在测试、试用这个模型,有些甚至已经投入使用,原因就是它太便宜了。 Kimi 模型是由月之暗面开 ...