开源模型
搜索文档
美国焦虑中国AI开源模型领先,英伟达看中的 Reflection AI是啥由头?
傅里叶的猫· 2025-10-21 23:34
中国开源AI模型的进展 - DeepSeek新推出的开源视觉语言模型并非普通OCR工具,而是实现了“光学上下文压缩”领域的突破,将图像作为编码和处理海量文本数据的载体,成功解决了大型语言模型在处理长上下文时内存、延迟或令牌成本激增的核心痛点 [2] - 在2025年10月的Alpha Arena实盘加密货币交易竞赛中,DeepSeek-V3.1以1万美元本金参赛,三天内斩获40.4%的回报率登顶排行榜,超越了Grok 4的33.4%和Claude的23.8%,并大幅领先Gemini的-25.4%和GPT-5的-26.8% [5] - 中国开源模型在海外逐渐占据越来越大的市场份额,相关讨论日益增多 [2] Reflection AI的融资与估值 - Reflection AI月初完成20亿美元融资,投资方中最引人注目的是英伟达,融资后公司估值达到80亿美元,较3月约5.45亿美元的估值实现大幅跃升 [7] - 公司在3月完成1.3亿美元融资后,仅过7个月便再次筹集20亿美元,近几个月来与潜在投资方展开洽谈并在数周内迅速完成本轮融资 [9] - 英伟达此次出资最多达8亿美元,同时还派遣了多名工程师与Reflection AI合作优化其最新一代AI芯片 [9] 开源AI领域的竞争格局 - 英伟达投资Reflection AI表明美国投资者不仅投向OpenAI、谷歌等公司的专有软件,也开始青睐可自由共享和修改的开源模型,Reflection AI的目标是打造美国的“DeepSeek” [7] - 西方目前仍专注于开源领域的企业已不多,主要包括Meta、法国的Mistral AI,或一定程度上包括OpenAI [9] - AI模型的研发需要大量算力和科研人才投入,这是Reflection AI快速连续融资的核心原因 [9] 行业趋势与创始人观点 - Reflection AI创始人兼CEO Misha Laskin具有理论物理学背景,出生于俄罗斯,曾就读于耶鲁大学和芝加哥大学物理系,并于2024年联合创办Reflection AI [7] - Laskin承认公司要持续保持竞争力还需要更多资金支持,尤其是在竞争对手也在加紧融资的背景下,例如OpenAI上月从英伟达获得了高达1000亿美元的投资承诺 [10] - Laskin强调市场对开源模型的需求最终将催生可持续的商业模式,并展望未来小型AI公司有望成长为下一个亚马逊或Meta级别的巨头 [10]
张亚勤院士:AI五大新趋势,物理智能快速演进,2035年机器人数量或比人多
机器人圈· 2025-10-20 17:16
AI产业规模与代际演进 - 人工智能时代产业规模预计将比前一代(移动互联时代)至少大100倍[5] - 移动互联时代产业规模比PC互联时代至少大10倍[5] AI技术发展的五大新趋势 - 趋势一:AI技术从鉴别式、生成式走向智能体AI,过去7个月智能体AI任务长度翻倍且准确度超过50%[7] - 趋势二:预训练阶段规模定律放缓,更多工作转移至训练后阶段如推理和智能体应用,前沿模型智力上限仍在提升但迭代速度放缓[7] - 趋势三:物理智能和生物智能快速发展,VLA模型推动智能驾驶规模化落地,预计2030年10%车辆将具备L4功能[7] - 趋势四:AI风险快速上升,智能体出现使AI风险至少增加一倍[8] - 趋势五:AI产业新格局形成,呈现基础大模型+垂直模型+边缘模型架构,后两者未来发展空间更大[8] 大模型发展格局预测 - 预计2026年全球基础大模型约8-10个,中国占3-4个,美国占3-4个[8] - 中国大模型发展具独特性,表现为更快算法、更高效率、更低价格[8] - 未来开源模型将成为主流,开源与闭源模型比例预计为4:1[8] 成本与算力动态 - 过去一年推理成本降低10倍,但智能体复杂性使算力需求上涨10倍,形成乘数效应[7] 长期产业机遇 - 新一代人工智能是原子、分子和比特融合,是信息智能、物理智能和生物智能融合[3] - 具身智能快速爆发,预计2035年机器人数量有望超过人类[8]
当着白宫AI主管的面,硅谷百亿投资人“倒戈”中国模型
环球时报· 2025-10-15 11:24
行业格局转变 - 全球AI行业格局正从美国主导的不计成本追求极限参数的上半场,转向由性价比、商业效率和生态价值主导的新阶段[3] - 中国AI的地位从过去的追赶者提升为与美国并驾齐驱的竞争者,两者形成两种价值机制在同一舞台上并行的比拼[5][7] - 制胜关键不再仅体现为参数更多、模型更大,更在于能以更低的成本、更快的速度稳定服务用户[7] 中国AI模型表现 - 以DeepSeek、Kimi和Qwen为代表的中国开源模型矩阵,在多项关键性能指标上实现了对Meta的Llama系列的全面反超[5] - Kimi K2版本K2-0905在全球知名AI编程评测平台Roo Code上获得超过94%的评分,成为首个在该平台突破90%评分的开源模型[4] - Kimi K2在全球公认的LMSys Chatbot Arena上登顶开源第一,被誉为全网领先的开源文本模型[7] - DeepSeek在复杂的推理任务上超越了OpenAI的o1-preview版本,并成功将高端技术推向商业场景[7] 市场应用与生态突破 - 中国模型在Anthropic限制API服务后迅速填补市场空白,在高价值领域抢占用户市场[3][4] - 硅谷知名投资人查马斯将其公司的大量工作需求从亚马逊旗下AI平台转向中国模型Kimi K2,理由是性能强且比OpenAI和Anthropic便宜太多[1][3] - Cursor、Perplexity、Vercel等全球知名开发平台及应用相继宣布接入中国模型[4] - 中国在开源能力、成本效率与生态落地上实现弯道超车,展现出巨大的市场应用潜力[4][7]
蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌
机器之心· 2025-10-14 14:33
模型发布与市场反响 - 蚂蚁集团在短短十余天内连续开源三款大模型,最新发布的是全球首个开源万亿参数思考模型Ring-1T [3][6] - Ring-1T上线HuggingFace仅四天下载量便突破千次,显示出较高的市场关注度 [3] - 此次正式发布的Ring-1T完成了完整的训练流程,包括通过大规模可验证奖励强化学习和人类反馈强化学习进一步增强能力 [7] 技术性能表现 - 在IMO 2025测试中,Ring-1T首次尝试便解出4题全对,达到IMO银牌水平,成为首个在国际奥数赛题上取得获奖级成绩的开源系统 [7] - 在八个重要基准测试中,Ring-1T性能几乎全面超越其Preview版本,在ARC-AGI-v1、Arena-Hard-v2.0等高难度测试中表现尤为突出 [12][14] - 在逻辑推理任务ARC-AGI-v1上,Ring-1T刷新开源SOTA,显著领先Gemini-2.5-Pro,非常接近GPT-5-Thinking (High) [16] - 在ICPC World Finals 2025中,Ring-1T成功解出5题,表现超越Gemini-2.5-Pro (3题),逼近GPT-5-Thinking (6题) [19] 实际应用演示 - 在代码生成方面,Ring-1T能够快速生成功能完整的游戏代码,如Flappy Bird和贪吃蛇小游戏,实现交互功能与平滑动画 [20][23] - 模型在逻辑推理测试中表现出色,能够准确分析复杂情境并给出合理解答,如三只兔子赛跑问题和俱乐部成员身份推理题 [29][33] - 在创意写作领域,Ring-1T能够生成符合播客口语化风格的历史文案,语言生动且具吸引力 [40] 技术创新与工程突破 - 团队开发了强化学习算法IcePop,通过"双向截断+Masked Clipping"机制解决MoE模型训推不一致问题,显著提升训练稳定性 [45][46] - IcePop让模型在AIME25等复杂推理任务上成绩更优,输出更稳、更具多样性 [48] - 蚂蚁自研了强化学习基础框架ASystem,采用SingleController + SPMD架构,解决万亿规模训练的硬件资源调度与效率瓶颈 [50] - ASystem通过显存透明卸载与跨节点显存池化技术降低OOM风险,并实现权重秒级交换 [51] - 系统集成大规模Serverless Sandbox,支持毫秒级冷启动和10K/s吞吐量的奖励评估 [51] 开源战略与行业影响 - 蚂蚁集团在9-10月密集上线多款新品,平均每4天发布一个新模型,展现出快速迭代能力 [52] - 公司开源的不只是模型,还包括底层能力如强化学习框架AReaL,让社区能复用其在RL工程上的积累 [52] - 蚂蚁将开源视为AI普惠落地的现实路径,旨在让AI能力像电力与支付那样无处不在 [52]
深度|硅谷百亿大佬弃用美国AI,带头“倒戈”中国模型
Z Potentials· 2025-10-12 14:32
文章核心观点 - 硅谷顶级投资人查马斯·帕里哈皮蒂亚公开将其公司部分AI工作负载从亚马逊Bedrock转向中国模型Kimi K2,标志着全球AI应用进入商业理性主导阶段 [1][4] - 中国AI产业在2025年完成从"追赶者"到"平行竞争者"的转变,以Kimi和DeepSeek为代表的中国模型在开源能力和商业化部署方面设定新节奏 [13][23] - 全球AI格局正形成"技术攻顶"与"应用共荣"双轨并行的发展范式,中国在应用生态构建方面展现出独特优势 [16][23] 硅谷大佬的行业信号 - 查马斯·帕里哈皮蒂亚作为身价超百亿美元的投资人,其职业经历包括将Facebook用户从4500万增长至7亿,对产品增长和商业本质有深刻理解 [3] - 他选择Kimi K2的原因是"性能足够强"且比OpenAI和Anthropic"便宜太多了",体现其务实投资哲学 [1] - 这一选择被视为强烈的市场领先指标,预示AI行业从不计成本探索转向商业理性主导 [4] 全球开发者生态采纳 - 估值93亿美元的云端开发平台Vercel已集成Kimi K2 API,使全球数百万开发者可直接调用其能力 [4] - AI原生代码编辑器Cursor、AI搜索应用Perplexity等关键开发者工具均已集成Kimi,证明其已从关注对象转变为实际生产工具 [12][5] - 开发者用代码进行的"投票"是比任何排行榜都更有力的市场证明 [5] 市场转折点与竞争格局 - 2025年9月5日Anthropic调整API服务政策限制部分地区访问,意外创造市场真空 [7] - 月之暗面在同一天发布K2-0905更新版本,专注代码和智能体能力,在Roo Code平台取得超过94%的评分,成为首个突破90%的开源模型 [8] - 这次精准卡位将Kimi从"长文本专家"推向"全球编程高手"的新高度 [9] 权威报告佐证行业变革 - 《State of AI Report 2025》首次将中国AI体系提升为"平行竞争者",指出中国在开源AI和商业化部署方面设定节奏 [13] - 报告在年度最重要技术进展中仅列出三个大语言模型:OpenAI的o1、中国的DeepSeek-v3系列和Kimi-K2系列,中国模型占据三分之二席位 [14] - 报告评价DeepSeek在复杂推理任务上超越o1-preview,Kimi K2被誉为"全网最强的开源文本模型"并在LMSys Chatbot Arena登顶开源第一 [21] 中美AI发展范式对比 - 美国采用"技术攻顶"范式:以OpenAI、Anthropic为代表,追求AGI终极目标,走精英技术路线 [16] - 中国采用"应用共荣"范式:以字节跳动、月之暗面等为代表,通过高性价比开源模型构建繁荣应用生态 [16] - Kimi战略聚焦AI编程这一高价值企业级赛道,提供性能、成本与可靠性的最佳结合,类似Anthropic的成功路径但更开放和具性价比 [20][22] 中国AI产业里程碑 - DeepSeek的技术突破代表中国AI的第一次"技术破局",证明核心模型能力达到世界水平 [23] - Kimi在全球的商业渗透代表第二次"生态突围",展示引领潮流的价值创造路径 [23] - 中国AI已走完追赶阶段,开始自信探索并引领自己的发展范式 [23]
阿里通义7大模型霸榜全球开源前十;滴滴App海外中文打车服务已上线12个国家|36氪出海·要闻回顾
36氪· 2025-10-05 21:06
人工智能与开源模型 - 阿里通义7款模型入选全球前十开源模型榜单,其全模态大模型Qwen3-Omni登顶,可处理文本、图片、语音和视频,音视频能力狂揽32项开源最佳性能SOTA [4] - 阿里通义共开源300多个模型,全球下载量突破6亿次,衍生模型超17万个,位居全球第一 [4] - 百型智能完成数千万人民币Pre-A轮融资,其AI外贸员工能为出海企业自动化执行寻找买家、精准营销等任务,客户已累计近千家,中小企业占比超八成 [9][10] - 未名拾光获数千万元B+轮融资,资金将用于深化AI技术平台建设及加速业务全球化布局 [9] 新能源汽车与出行服务 - 比亚迪9月乘用车及皮卡海外销量达70851辆,同比增长107%,公司已进入欧洲、东南亚、南美等多个全球市场 [5] - 小米SU7 Ultra高端纯电动汽车首次在日本亮相,未来在日本将采取在智能手机门店同步销售EV的策略 [4][6] - 滴滴App海外中文打车服务新上线澳大利亚、新西兰、埃及,目前已覆盖全球12个国家,超1000个城市 [5][7] - 文远知行自动驾驶科技公司在阿联酋哈伊马角启动Robotaxi与Robobus试运营,预计2026年初正式商业化运营 [7] 自动驾驶与智慧交通 - 千里科技目标在未来18个月完成Robotaxi全链路产业布局,计划在全球10座城市实现规模化运营,在单一城市部署超1000辆Robotaxi [8] - 文远知行与阿联酋哈伊马角交通局合作,其自动驾驶车辆被正式纳入当地公共交通体系 [7] - 吉利集团旗下时空道宇以“一箭12星”方式成功发射,完成吉利星座一期组网部署,在轨卫星增至64颗,实现除南北极外全球实时通信覆盖 [5] 储能与清洁能源 - 亿纬锂能与TSL Assembly达成战略合作,计划于2026–2030年期间在中东欧地区部署总规模达1GWh的储能系统项目 [8] 生物科技与制药 - 天境生物完成近6亿元人民币C2轮融资,资金将用于推动产品三期临床试验与上市申报,加速创新药管线国际化 [10] - 辐联科技完成7700万美元融资,资金将用于推进全球放射性药物管线研发及比利时生产设施建设 [11] - 未名拾光是一家生物基创新原料研发商,已与欧莱雅、宝洁等品牌建立联合开发合作 [9] 消费品牌与全球化布局 - 口腔护理品牌参半在全球的经销商数量已接近千家,实现了超市、便利店、酒店、美妆店等多元化零售场景的全球覆盖 [9] - 园林电动工具研发商劳尼克斯完成数千万元天使轮融资,聚焦德、法、英等欧美高端市场 [10] 游戏与文娱产业 - 超170家中国企业参加2025东京电玩展,腾讯控股在展会期间公开了与卡普空共同开发的《怪物猎人》系列最新作品 [12] - 英雄游戏公司预定于10月发布RPG游戏《二重螺旋》,将上线多语言版本并持续推进本地化 [12]
专家:2035年机器人数量或比人多
21世纪经济报道· 2025-10-04 13:41
AI产业规模与代际演进 - 新一代人工智能是原子、分子和比特的融合,是信息智能、物理智能和生物智能的融合 [1] - 移动互联时代产业规模比PC互联时代至少大10倍,人工智能时代产业规模将比前一代至少大100倍 [1] AI产业发展五大新趋势 - 第一大趋势是从鉴别式AI到生成式AI,并走向智能体AI,过去7个月智能体AI的任务长度翻倍、准确度超过50% [3] - 第二大趋势是预训练阶段的规模定律(Scaling Law)放缓,更多工作转移至训练后阶段如推理和智能体应用,推理成本降低10倍,但智能体复杂性使算力上涨10倍 [3] - 第三大趋势是物理智能和生物智能快速发展,如VLA模型规模化落地智能驾驶,预计2030年10%的车辆将具备L4功能 [3] - 第四大趋势是AI风险快速上升,智能体出现后让AI风险至少增加一倍 [4] - 第五大趋势是AI呈现新的产业格局,形成基础大模型+垂直模型+边缘模型局面,未来更大发展在于垂直模型和边缘模型 [4] AI模型产业格局与预测 - 预计2026年全球基础大模型约有8至10个,其中中国有3至4个,美国有3至4个 [4] - 中国在发展大模型方面呈现独特性,表现为更快的算法、更高效率、更低的价格 [4] - 未来开源模型将成为主流,开源与闭源模型之间的比例预计约为4:1 [4] 具身智能发展预测 - 具身智能将快速爆发,预计到2035年机器人数量有望超过人类数量 [4]
DeepSeek与国产芯片的“双向奔赴”
21世纪经济报道· 2025-10-01 07:14
模型发布与技术更新 - 深度求索公司于9月29日晚间发布DeepSeek-V3.2-Exp模型,实验性引入DeepSeek Sparse Attention稀疏注意力机制,显著降低计算资源消耗并提升推理效率 [1] - 新模型发布后,公司同步更新官方App、网页端及小程序,并全面下调API价格,降幅在50%到75%不等 [1] - V3.2-Exp版本在V3.1-Terminus基础上引入稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证 [7] 国产芯片生态协同 - 新模型发布后4分钟内,寒武纪率先宣布适配DeepSeek-V3.2-Exp,并开源大模型推理引擎vLLM-MLU源代码 [2] - 华为昇腾基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp的0day支持,并向开发者开源所有推理代码和算子实现 [2] - 海光信息表示其DCU已实现对DeepSeek-V3.2-Exp的无缝适配和深度调优,新模型在海光DCU上展现出优异性能 [2] 行业标准与生态建设 - 深度求索公司通过发布DeepSeek-V3.1版本,明确模型将适配下一代“UE8M0”浮点格式的国产芯片,为国产芯片发展指明方向 [6] - 业内高管认为,应由DeepSeek定义国产芯片标准,让芯片厂商跟进,而非让模型去适配芯片,DeepSeek已成为国产开源模型的标杆 [2][5] - 中国本土AI行业对DeepSeek模型的高度共识,使深度求索公司敢于先行先试,组建国产芯片生态 [7] 技术创新与工具链 - DeepSeek-V3.2-Exp采用的稀疏注意力机制,疑似基于深度求索公司今年2月发表论文中的原创机制,公司CEO梁文锋位列作者名单 [7] - 模型在兼容CUDA基础上,使用专为AI算子开发设计的编程语言TileLang进行快速原型开发,该语言由北京大学团队主导开发并于2025年1月开源 [7][8] 云计算厂商的生态参与 - 腾讯云于9月16日宣布已全面适配主流国产芯片,并积极参与开源社区建设 [8] - 阿里云在云栖大会表示推动“一云多芯”战略,验证并深度适配多家国产AI芯片,将其纳入自身算力底座 [8] - 相比英伟达用二十年建立生态,DeepSeek用了不到一年时间飞速完成初步生态追赶 [8]
DeepSeek V3.2要来了?
观察者网· 2025-09-29 17:58
公司产品发布动态 - 开源社区平台Hugging Face上出现DeepSeek-V3 2页面引发关注 [1] - DeepSeek最新一次更新在一周前的9月22日发布DeepSeek-V3 1-Terminus模型并宣布开源 [3] - 目前Hugging Face相关界面显示报错公司官方尚未对此回应 [4] 公司产品发布历史规律 - DeepSeek有在节前一天发布新版本和更新的历史 [2] - 2024年12月27日(元旦前)发布DeepSeek V3 [3] - 2025年5月28日(端午节前)发布DeepSeek-R1-0528称为端午节特别献礼 [3]
乌克兰多地遭空袭,已致4死80余伤;连锁餐饮企业监管新规出台;万达知情人士回应王健林被限高;受贿2.68亿!唐仁健一审被判死缓丨每经早参
每日经济新闻· 2025-09-29 06:03
有色金属行业政策 - 八部门印发《有色金属行业稳增长工作方案(2025—2026年)》,目标为2025-2026年行业增加值年均增长5%左右,十种有色金属产量年均增长1.5%左右 [5] - 方案提出铜、铝、锂等国内资源开发需取得积极进展,再生金属产量突破2000万吨,并提升高端产品供给能力及绿色低碳、数字化发展水平 [5] 民营经济发展 - 国家发展改革委主任郑栅洁主持召开民营企业座谈会,就“十五五”时期扩大有效投资听取意见建议 [6] - 国家发展改革委计划在扩大准入、打通堵点、强化保障等方面实施举措,加强产业、投资、财政、金融政策协同以激发民间投资活力 [6] 汽车行业动态 - 东风汽车正联手华为针对猛士品牌进行建店探索,双方合作有望形成更强战力的渠道体系 [14] - 华为智能汽车解决方案BU CEO靳玉志表示,L3级自动驾驶将在2027年规模放量,汽车产业正经历电动化、智能化到自动化的三波浪潮变革 [15] - 商务部办公厅发布关于做好2026年度汽车和摩托车出口许可申报工作的通知,线上申报系统将于2025年9月29日开通 [7] 企业融资与投资 - 星河动力航天完成D轮融资,融资总额共计24亿元,资金将用于加快可重复使用液体运载火箭及中型固体运载火箭的研制与能力建设 [22] - 万达集团及其法定代表人王健林被限制高消费,执行标的为1.86亿元,据称系下属项目公司经济纠纷导致 [18][19] 企业合作与产品发布 - 腾讯开源原生多模态生图模型“混元图像3.0”,参数规模达80B,为首个开源工业级原生多模态生图模型 [20] - 首个国产四价HPV疫苗(爱薇佳)正式获国家药监局批准上市,由国药集团中国生物所属研究所联合研发 [21] - 零跑汽车董事长朱江明回应被“限高”事件,表示已解除并称将提升团队能力 [17] 企业资本运作 - 多家公司发布资本运作相关公告,包括道生天台发行价格5.98元 [24],以及武汉控股、国星光电、博融等公司的定增、H股上市申请获接收、发行可转债等计划 [25] - 多家公司披露减持计划,包括博股份中标国家电网项目 [26],以及威腾电气、长江通信、科力尔等公司的股东拟减持信息 [26][27] - 部分公司进行收购及资产交易,如新大正拟收购嘉信立恒75.1%股权 [28],冠中生态拟收购杭州精算家股权 [29],光明乳业下属子公司处理新西兰北岛资产 [30]