Workflow
Artificial Intelligence(人工智能)
icon
搜索文档
彭博:人工智能竞赛:美国还是中国领先?
彭博· 2025-08-07 13:18
行业投资评级 - 报告未明确给出行业投资评级 [1][2][3][4] 核心观点 - 中美两国在人工智能领域形成双雄争霸格局 美国在关键技术突破和顶尖模型性能上保持领先 中国通过开源策略和政府支持快速追赶 [1][2][3][4] - 生成式AI专利申请被中美企业垄断 中国采用开源战略加速全球渗透 美国企业则通过闭源商业模型获取收益 [8][9][10] - 两国都将AI上升为国家战略 美国强调技术霸权 中国倡导AI普惠发展 [12][13][14] - 基础设施方面 中国拥有政府主导的数据资源和可再生能源供电优势 美国受限于电网老化但企业资本支出强劲 [34][37][41][42] 技术对比 - 美国企业在生成式AI基础技术(芯片/大模型)保持原创优势 OpenAI和谷歌率先推出多模态AI系统 [6][7] - 中国企业在算力受限下开发高效能模型 并通过开源策略实现技术扩散 深度求索R1模型开发成本仅为美国头部平台的几分之一 [8][11] - 截至2025年中 美国模型在Humanity's Last Exam测试中领先(OpenAI/Google/xAI准确率超20%) 中国最佳模型深度求索为14% [48][49] 国家战略 - 美国发布《AI行动计划》 简化数据中心建设流程 计划投入5000亿美元基建 并强化技术标准输出 [3][12][39] - 中国实施"启明计划"吸引海外人才 成立国际AI治理机构 地方政府通过补贴争夺AI初创企业 [17][28][32] 资金投入 - 2025年上半年美国AI初创企业融资超1000亿美元 四大科技巨头年度资本支出预计达3440亿美元 [26][27] - 中国AI资本支出2025年预计达980亿美元(同比+48%) 其中政府拨款占560亿美元 阿里/腾讯等企业投入240亿美元 [27][28] 人才竞争 - 美国60%顶尖AI企业有移民创始人 70%AI研究生为国际学生 但签证政策收紧威胁人才供给 [30][31] - 中国通过国家计划吸引7000多名科学家回国 华为等企业提供顶级研究环境而非高薪 [32][33] 基础设施 - 中国2024年新增429吉瓦发电容量 重点建设沙漠AI集群 美国呼吁发展核能解决电力短缺 [34][41][42] - 英伟达芯片禁运迫使中国转向国产替代 华为/中芯国际芯片已能满足多数应用场景 [37][38] 主要参与者 - 美国阵营以OpenAI为龙头 包括Google/Anthropic/xAI Meta通过高薪挖角追赶 [44][45] - 中国由BAT+字节跳动主导 深度求索/智谱AI/月之暗面等新锐在细分领域实现突破 [46][47]
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus
量子位· 2025-08-07 08:56
核心观点 - Qwen团队最新发布两款4B端侧模型Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507,在性能上实现显著突破,尤其在小模型尺寸下超越部分大模型表现 [2][3][5][7] - 两款模型分别针对通用任务和专家级推理任务优化,支持256K长上下文并具备端侧部署优势 [7][8][16][17][24] - Qwen3-4B-Thinking-2507在AIME25数学测评中得分81.3,超越Gemini 2.5 Pro和Claude 4 Opus [4][5][23] 模型性能突破 Qwen3-4B-Instruct-2507 - 通用能力超越闭源模型GPT-4.1-nano,与30B MoE模型Qwen3-30B-A3B性能接近但参数量仅其1/7.5 [13][14][15] - 关键指标:MMLU-Redux得分84.2(vs GPT-4.1-nano 80.2),GPQA得分62.0(vs 50.3),LiveBench 20241125得分63.0(vs 41.5) [18] - 增强多语言覆盖和长文本理解能力,支持扩展至1M上下文 [17] Qwen3-4B-Thinking-2507 - 专攻复杂推理任务,AIME25得分81.3超越前代65.6分及Qwen3-30B-A3B的70.9分 [23][25] - 推理性能提升显著:HMMT25得分55.5(vs 前代42.1),ZebraLogic得分80.2(vs 35.2) [18][25] - 在Agent任务中全面碾压前代,如TAU1-Retail得分66.1(vs 33.9),TAU2-Airline得分58.0(vs 28.0) [25] 技术特性与行业影响 - 端侧适配性:支持树莓派等设备,提供GGUF量化版本和llama.cpp部署方案 [2][8][27][28] - 模型效率:4B密集模型性能接近30B MoE模型,重新定义小模型能力边界 [11][15][23] - 开源策略:通过抱抱脸和魔搭社区提供模型下载,与OpenAI同期开源形成竞争 [26][34][35] 开发者支持 - 部署工具链完整:支持Ollama、LMStudio、MLX-LM等主流框架 [27] - 优化建议:针对内存限制设备推荐缩短上下文长度,复杂推理任务建议使用>131K词元 [28][29] - Prompt设计规范:提供数学题逐步推理和选择题JSON结构化回答模板 [31] 行业动态 - 发布时间点卡位OpenAI开源窗口,引发开发者社区高度关注 [34][35] - 性能对比:Qwen3-4B系列在多项基准测试中优于GPT-4.1-nano和Claude 4 Opus [18][25] - 市场期待:用户呼吁Qwen团队加速发布Qwen3-8B系列模型 [31][33]