开源人工智能
搜索文档
第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!
华尔街见闻· 2025-11-28 12:35
模型性能突破 - 最新开源数学模型DeepSeekMath-V2在模拟2025年国际数学奥林匹克竞赛中解决6个问题中的5个,达到金牌水平[1] - 该模型成为首个在IMO级别竞赛中获得金牌的开源模型,其表现直接对标谷歌DeepMind的Gemini高级版本和OpenAI的实验性推理模型[2] - 在中国数学奥林匹克竞赛中达到金牌水平,在普特南数学竞赛中12道题完全解决11道,最终得分118/120,超过人类参赛者90分的最高分记录[4] 技术创新优势 - 采用创新的自我验证训练框架,核心是训练专门"验证器"评估证明过程质量而非最终答案对错[3][10] - 通过验证-生成闭环机制,激励模型在最终确定答案前尽可能多地发现和解决自身推理链条中的问题[10][12] - 采用动态进化策略防止模型过度拟合自身检查机制,通过增加计算量和自动标记难以验证的证明来提升验证难度[3][13] 开源战略意义 - 模型权重根据Apache 2.0许可证公开发布,可供公众下载,被视为人工智能民主化的重要一步[3][5] - 开源社区有能力在尖端AI研究领域追赶甚至比肩顶级闭源实验室,可能引发市场对开源模型是否会侵蚀闭源产品商业护城河的讨论[3] - Hugging Face联合创始人盛赞用户可免费拥有IMO金牌水平模型能力,不受限制地探索、微调和优化模型[5] 行业影响评价 - 社区评价此次发布为"了不起的发布",认为技术堆叠方式更偏向工程创新而非单纯研究[7][9] - 模型解决了AI模型在数学任务中缺乏严谨推理过程的问题,专注于逐步推导而不仅仅是数值答案[10] - 自我验证框架在解决没有已知解决方案的开放性问题时尤为重要,特别是在扩展测试时计算方面[12]
外媒再议中国 AI:开源破局硅谷,成全球开发者新选择
环球网资讯· 2025-11-14 14:44
全球AI格局变化 - 中国AI大模型凭借开源优势在硅谷更受欢迎,例如Airbnb首席执行官表示非常依赖阿里巴巴旗下的Qwen产品线,因其好、速度快且成本低[1] - 全球知名AI基准测试机构Artificial Analysis数据显示,中国初创公司MiniMax的开源推理模型MiniMax M2在全球开源AI综合性能评估中荣登榜首[1] - 在AI模型全球前十排名中,包括DeepSeek和阿里巴巴旗下Qwen在内的八款中国公司开发的模型跻身榜单,仅有两款来自OpenAI的模型进入[2] 中国AI模型性能与成本优势 - MiniMax M2模型采用专家混合模型技术,显著提升计算效率和响应速度,其速度超越谷歌旗下Claude Sonnet 4.5近一倍,而价格仅为其8%[1] - MiniMax平台提供对旗舰模型MiniMax M1和M2的即时访问,核心亮点在于业界领先的百万级Token上下文窗口,可无缝处理海量文档和复杂数据集[3] - 中国AI模型凭借卓越的性能和经济的成本保持领先地位,对美国AI行业现状构成巨大挑战[4] 开源策略与行业影响 - 中国公司公开分享其AI产品,允许任何人下载和使用,此策略旨在广泛传播中国AI模型并主导AI生态系统[2] - 人工智能领域影响力巨大的纽约大学教授颜乐存表示,如今大多数开源AI都是中国制造的,并警告美国科技公司的封闭式开发模式可能面临长远风险[2] - MiniMax平台提供符合主流AI接口的API集成方案,开发团队只需极少代码改动即可将模型集成到现有工作流程中,这种对开发者友好的设计理念降低了使用门槛[3] 市场认知与评价 - 人工智能专家格雷格•斯莱博格教授认为中国的人工智能发展被低估,中国在AI领域申请的专利数量已位于世界首位[4] - MiniMax被视为一个颠覆性平台,它将最前沿的语言模型直接带给开发者和普通用户,无需注册、付费或面对技术障碍[3]
彭博:硅谷有多少技术是建立在中国人工智能基础上的
36氪· 2025-11-11 21:35
中国开源AI模型的全球吸引力 - 低成本、开源的中国人工智能模型正在吸引全球用户,并赢得硅谷公司的青睐[4][6] - Airbnb公司的新客服代理非常依赖阿里巴巴的Qwen产品线,因其性能好、速度快且成本低[5] - 风险投资家查马斯·帕里哈皮蒂亚合作的公司已将大量工作负载转移到北京登月人工智能公司的Kimi K2平台,认为其比OpenAI和Anthropic便宜得多[4] 硅谷公司对中国AI模型的应用 - AI编程公司Cursor(估值约100亿美元)发布的新版助手,被科技投资者发现其内部独白切换至中文,引发其基于类似DeepSeek的中国AI工具开发的猜测[7] - 热门美国公司Cognition AI Inc(估值约100亿美元)似乎基于智普人工智能的基础模型开发了其新型编码代理[7] - 由OpenAI前首席技术官创立的Thinking Machines Lab表示其最新研究受到了阿里巴巴Qwen3团队的启发[5] 中国AI模型下载量的增长态势 - 阿里巴巴Qwen的累计下载量从2024年初的50万次,增长至上个月的3.853亿次,超过了Meta的Llama模型(3.462亿次)[8][9] - 基于Qwen构建的衍生系统占Hugging Face平台上新发布语言模型的40%以上,而Meta的份额已降至15%[8] - 就开发者累计下载量而言,中国模型已经超过了美国模型[6][8] 中国AI模型的竞争优势 - 中国人工智能模型的许可机制较为宽松,企业可以免费在其基础上开发产品[7] - 开放模型可以下载、微调并在本地运行,从而降低用户对内容和数据隐私的担忧[11] - 中国推行的低成本和开源策略正在吸引开发者,而开发者是人工智能创新的中坚力量[11]
印媒:印度应与中国携手向前
环球网资讯· 2025-09-16 07:10
文章核心观点 - 印度应在能源、交通和人工智能等关键领域与中国合作,以加速其自身发展目标 [1][2][3] 能源行业 - 中国发电量达到美国发电量的2.5倍,并计划每年新增相当于整个德国的发电量 [1] - 中国通过清洁电力赢得电力竞赛,并在彭博新能源财经全球供应链排名中重新夺回第一,得益于较低的商业电价和雄厚的制造实力 [1] - 印度应大力发展国内太阳能发电和储能产业,并与中国进行资本支出合作以实现上游产品生产本地化,缩短走向大规模生产的时间 [2] 交通行业 - 在电动汽车领域,中国占据主导地位,2024年占全球电动汽车销量的近2/3 [1] - 电动汽车占据中国国内汽车月销量的半壁江山,全球最畅销的10个电动汽车品牌中有6个为中国品牌 [1] - 中国的电动汽车和电池巨头纷纷在海外建厂,印度需通过本地化和知识产权护栏参与承接这些产能的竞争 [2] 人工智能行业 - 美国在尖端前沿模型方面领先,但人工智能大规模应用的天平倾斜将取决于计算所需的能源、数据、监管和需求,而不仅取决于模型基准 [1] - 中国已解决为人工智能运行提供能源的问题,并在机器人技术领域处于全面领先地位 [2] - 中国的人工智能发展路径是通过清洁能源为开源人工智能提供动力并聚焦于各种应用场景,人工智能应用将在计算成本低、数据充足且监管支持快速部署的地方流行 [2] 印度合作策略 - 印度的增长策略依赖于大规模能源、出口市场以及获得前沿技术,而中国在这三项领域处于主导地位 [2] - 印度应继续以“多边结盟”为战略特色,但在推进自身实现目标的领域应与中国携手前行 [3]
当中国开源AI领跑,美国科技圈和政界坐不住了
搜狐财经· 2025-08-15 02:58
中国开源AI模型发展 - 中国正加快将开源人工智能模型打造成全球标准 此举震动美国科技巨头与政策制定者 担心美国优势被取代并筹划应对策略 [2] - 中国AI领域2024年突破不断 DeepSeek推出R1推理模型引发轰动 阿里巴巴密集推进Qwen系列开源 几乎每个季度都有新动作 持续巩固开源AI地位 [2] - 开源模型提供免费下载和自由修改 推动中国AI技术迅速在全球落地应用 美国专有模型公司感受到压力 OpenAI于8月初推出首个开源模型gpt-oss应对挑战 [2] 中美AI竞争格局 - 中国出现反超美国的可能性 凭借开放权重模型生态和半导体设计制造积极布局积蓄势能 [5] - 美国特朗普政府7月发布"美国人工智能行动计划" 明确指出开源模型可能在部分领域成为全球标准 呼吁打造基于美国价值观的领先开源模型 [5] - 中国高度竞争的商业环境和知识快速扩散 在AI竞赛中积累惊人动能 中美在不同AI领域各有优势 美国在大规模云端AI部署领先 中国长期在安防技术占优 [5] 开源模型性能与应用 - 研究机构Artificial Analysis评测显示 自2023年11月起中国最好开放权重模型整体性能已超越美国开源冠军 [7] - 在数学和编程等能力方面 阿里巴巴Qwen3某一版本击败OpenAI的gpt-oss [7] - 华侨银行利用开源模型开发约30款内部工具 使用Google Gemma总结文件 Qwen协助写代码 DeepSeek分析市场趋势 同时使用约10个开源模型 [7] 开源生态商业模式 - 开源AI领先者难以立即获得可观回报 研发成本动辄上亿美元 但可通过锁定用户后在生态内其他服务盈利 类似谷歌在安卓系统捆绑搜索和YouTube [6] - 企业偏好开源模式 可自由定制并部署在内部系统 将敏感数据留在自家服务器 [6] - 科研界长期将开源视为加速新兴技术发展的方式 中国鼓励AI、操作系统、半导体架构和工程软件领域的开源研发 [6] 中美AI生态差异 - 美国公司基础模型研发采取相对封闭策略 需要投入巨额资金挖角竞争对手核心成员 知识流动缓慢且代价高昂 [9] - 中国开源AI生态呈现高度竞争态势 领先基础模型公司相互压低价格 高调宣传 在人才与客户上互相挖角 [9] - 这种达尔文式竞争会淘汰部分现有玩家 但孕育出更强大的公司 DeepSeek和阿里巴巴等免费模型赢得全球用户青睐 [9]
这才是美国惧怕、打压中国AI的真正原因
虎嗅· 2025-08-10 19:37
开源人工智能的核心争议 - GPT5 0发布未公开模型参数 OpenAI闭源策略引发AI技术公平性讨论 开源被视为反垄断和民主化的重要路径[1] - 开源内涵超越传统软件开发 包含"可获得""可接触""可应用"三重开放机制 当前争议聚焦技术滥用与科技公司控制问题[1] - 哈佛大学2024年报告显示开源软件创造8 8万亿美元社会价值 相当于日本GDP两倍 开源理念已成为数字从业者共识[2] 开源决策的行业动态 - OpenAI 2023年GPT-4转向闭源 2025年受DeepSeek开源模型激励重新拥抱开源 反映技术演化中生产关系的不确定性[3] - DeepSeek V3和R1开源模型证明有限资源下可实现高性能大语言模型 OpenAI CEO承认在开源问题上"站在历史错误一方"[10] - IBM 2024年调研显示使用开源AI的企业51%实现投资回报 未使用企业仅41% 体现开源对生产力赋能的实际效果[12] 开源模式的技术差异 - AI开源包含计算框架 模型权重 训练资源三维度开放 厂商通常仅开放前两者 限制资源开放影响技术复现[4] - Llama 4开源协议限制商业主体月活用户不超过7亿 与传统开源软件"四大自由"理念形成鲜明对比[5] - 开源促进会2024年提出AI开源定义 要求数据 代码 权重全面开放 但数据版权争议使该定义面临实施难题[6] 开源价值的性能争议 - 质疑者认为开源AI性能弱于闭源 规模定律下仅厂商能支撑海量资源投入 OpenAI称此为GPT-4闭源主因[10] - 开源通过暴露技术漏洞反哺模型改进 但高门槛限制分布式创新效果 基础模型性能仍依赖规模定律[11] - 开源打开多重技术路线探索空间 可能突破规模定律范式 哥伦比亚大学教授指出开源更满足消费者效率需求[12] 开源与地缘政治互动 - DeepSeek开源模型削弱美国算力芯片出口管制效果 显示开源对技术流动的促进作用[17] - 特朗普政府废除拜登时期出口限制 转向推动本国AI技术全球扩散 开源可能激化而非缓解大国竞争[18] - 历史上开源加密软件打破政府管制 但AI开源未促成全球合作 反而成为大国竞争新战场[17][18]
“这才是美国惧怕、打压中国AI的真正原因”
新浪财经· 2025-08-10 18:23
开源软件的价值与现状 - 开源软件构成数字技术基础并支撑社会数字化转型 哈佛大学2024年报告显示其创造价值达8.8万亿美元 相当于日本GDP两倍以上 [1] - 开源理念(四大自由)已成为数字从业者共识 被视为持续创新的核心动力 [1] 人工智能开源争议背景 - OpenAI在2023年发布GPT-4时转向闭源 但2025年4月因DeepSeek开源模型成功重新拥抱开源 反映技术演化中生产关系的不确定性 [2] - 开源争议已超越技术治理范畴 成为影响AI技术革命方向的关键议题 [2] 开源人工智能的复杂性 - 开放维度包括计算框架工具(如TensorFlow)、模型权重(如Llama)、训练数据/算力资源 厂商通常仅开放前两者导致技术复现困难 [4] - 许可协议存在限制性条款(如Llama 4限定非商业主体及月活<7亿企业) 与传统开源软件"四大自由"形成对比 [4] - 被批评为"公开洗地"(openwashing) 即企业为声誉或法律规避的投机行为 非实质践行开源精神 [5] 开源定义与法律影响 - 开放源代码促进会2024年提出首个开源AI定义 要求数据/代码/权重全面开放 但数据版权争议使该要求面临现实挑战 [5] - 欧盟《人工智能法案》为开源AI提供豁免保护 但未明确定义边界 导致概念争议直接影响司法实践利益分配 [6] 开源对AI发展的价值争议 - 质疑观点认为闭源模型在"规模定律"下性能更优 如GPT-4因数据/算力投入转为商业秘密而闭源 [8] - DeepSeek V3/R1开源模型2025年证明资源约束下仍可实现高性能 促使OpenAI承认策略失误 [9] - IBM 2024年调研显示使用开源AI的企业51%实现投资回报 高于闭源企业的41% [10] 开源与AI安全风险 - 反对观点认为开源会放大失控风险(如模型安全性不足、研究资源结构性偏差、能力误用) [12] - 支持观点反驳称开源促进安全系统设计 且无证据表明AI比汽车/计算机更具武器属性 [12][13] - 美国政策存在分歧:拜登政府2023年行政令加重开源合规负担 特朗普政府采用"增量风险"评估后取消限制 [14] 地缘政治影响 - 开源AI削弱美国算力芯片出口管制效果(如DeepSeek案例) 但未终结技术竞争 反而激发更复杂生态扩散策略 [17] - 历史对比:开源加密软件曾打破政府管制 但开源AI可能强化而非缓解大国竞争格局 [16][17] 未来演化关键矛盾 - 争议本质涉及公共利益与私人利益平衡、国家与市场关系重构、国际权力结构变迁 [18] - 技术范式变迁可能性存在 开源已打开多重路线探索空间 可能创造"后福特主义"产业格局 [10][18]
美国启动“ATOM计划”,对抗中国“千问”开源领先地位
观察者网· 2025-08-06 17:14
中国开源AI发展现状 - 阿里巴巴通义千问系列大模型成为全球开发者偏好的免费模型 因其是当前性能最强大的免费开源模型[1] - 全球性能最强的15个AI大模型中仅有5个开源模型且全部由中国AI企业开发[1] - 中国企业在开源AI领域取得显著突破 仅2023年7月阿里巴巴就发布四个领先的开源AI模型[1] 美国开源AI竞争态势 - 美国同期未发布任何具有全球影响力的新一代开源大模型 凸显其在开源生态建设上的明显短板[1][2] - Meta公司自4月发布Llama 3后更新令人失望 且首席执行官宣布未来在开源问题上将更加谨慎[2] - 美国科技界和政策制定者对中国开源AI发展保持高度警觉[1] 美国ATOM计划战略部署 - 计划建立总部位于美国的非营利性AI实验室 专注于开发真正开放的AI模型[2] - 核心算力配置将超过10,000块最先进GPU芯片 相当于大型科技公司AI项目的算力规模[2] - 需要至少1亿美元资金投入用于获取顶级GPU算力支持[3] 行业支持与影响 - 获得十余位行业领袖联署支持 包括Hugging Face首席执行官、斯坦福大学教授、英伟达总监及OpenAI高管等[2] - 分析人士警告若计划失败 美国可能丧失对全球AI技术发展方向的影响力[3] - 开源AI竞争已超越技术层面 成为生态、理念与全球话语权的博弈[3]
小扎改口不开源,Meta股价暴涨12%
量子位· 2025-07-31 12:23
Meta财报表现 - 第二季度营收475.2亿美元,同比增长22%,超出预期的448亿美元 [2][10] - 净收入183亿美元,同比增长36% [2][10] - 广告收入仍是主要来源,应用内广告展示量同比增长11% [11] - Reality Labs部门运营亏损45.3亿美元,2020年以来累计亏损近700亿美元 [12] - 资本支出达170.1亿美元,员工人数同比增7%至75945人 [13][14] - 股价盘后大涨12%,市场对AI投入持乐观态度 [16] AI战略调整 - 资本支出预算从640亿美元上调至660亿美元,2025年总支出预计1140-1180亿美元 [17][18] - 重点投资AI基础设施和技术人才招聘,薪酬支出将显著增加 [18] - 计划以初创公司模式运营超级智能部门,脱离现有体系约束 [35] - 从开源转向闭源策略,强调"谨慎选择开源内容" [26][27] 超级智能愿景 - 提出"个人超级智能"概念,目标是为个体赋能而非集中化自动化 [22][44] - 智能眼镜被视为核心载体,因其能实时感知用户环境并交互 [24][25] - 技术路径尚不清晰,未定义具体实现方式及安全措施 [38][39] - 公开信强调未来十年是技术路线关键决策期 [27][46] 行业动态 - 中国模型已主导开源榜单,与Meta策略转向形成对比 [4][6] - 开源争议持续,Llama系列曾被质疑未完全开源 [31] - 市场对Meta的AI投入保持信心,但对其战略可行性存疑 [9][37]
近八成受访者对开源AI收益持乐观态度,但存安全风险担忧
南方都市报· 2025-07-29 16:32
开源与闭源AI选择动因 - 选择开源AI主要因为具有更低成本56%和更容易部署47% [1] - 选择闭源AI最大理由是能更好控制安全风险43% [1] - 开源模型核心吸引力指向经济性与实用性 闭源模型聚焦风险控制 [1] 中国开源AI发展现状 - 中国AI开源项目数量全球排名第四 仅次于美国、欧洲和印度 [4] - 以Qwen、DeepSeek为代表的开源模型带动国内AI迭代创新与普惠应用 [3] - 已形成较完善社区生态系统 涵盖数据、算力、模型等多个维度 [5] 开源AI生态建设经验 - 支撑生态发展四点经验:可及性为目标、公共性为准则、包容性为方向、安全性为底色 [5] - 通过平台赋能提升公众模型使用能力 实现普惠可及 [5] - 开源成为人工智能利益相关方基本共识 形成多维度多层次技术体系 [5] 开发者调研核心发现 - 70%受访者进入开源社区因认同开源理念认为AI技术应该开源开放 [7] - 近80%参与者认为至少在短期内会有实际收益 34%认为略有收益 15%认为有重大收益 [8][9] - 六点开源价值全部得到超60%参与者支持 包括促进创新效率42%和满足多元需求41% [7][8] 开源发展阻碍因素 - 主要阻碍包括开源AI存在未知安全风险37%和开源程度范围不够36% [9] - 其他担忧包括不能得到长期支持26%和存在合规风险23% [9] - 对开源实质性降低成本存在更现实考量 模型工程化最后一公里成本挑战突出 [8] 未来发展趋势 - 开源与闭源是互补关系而非竞争 共同构成AI技术创新和产业应用生态 [13] - 开源将打开新的合作空间和机遇 更需要突出发展与治理研究 [14] - 安全性水平将越来越高和将成为行业标准两个预测获得30%中立态度 [10]