Workflow
全网都在等梁文锋
凤凰网财经·2025-04-29 20:39

中美科技巨头AI模型竞争 - 4月中旬OpenAI发布GPT-4.1 o3、o4 mini系列模型 [3] - 谷歌同期推出Gemini 2.5 Flash Preview混合推理模型 [3] - 豆包发布1.5·深度思考模型,多模态能力显著提升 [3] - 阿里下一代大模型Qwen3预计本月发布 [3] DeepSeek R2模型发布传闻 - Hugging Face CEO发布神秘动态暗示DeepSeek R2即将发布 [4][7] - 传闻称R2模型拥有1.2万亿参数,活跃参数780亿,采用混合MoE架构 [12] - 成本比GPT-4o低97.3%(输入0.07美元/百万次,输出0.27美元/百万次) [12] - 使用5.2PB训练数据,C-Eval2.0测试得分89.7%,COCO视觉测试92.4% [12] - 公司对传闻不予置评,但知情人士称真实性较低 [14] DeepSeek技术迭代与市场影响 - 公司保持季度重大更新节奏:2024年9月V2.5,12月V3,2025年3月V3-0324 [14] - V3-0324版本在基准测试中超越Google Gemini 2.0 Pro等顶尖模型 [17] - R2预计提升代码生成和多语种推理能力 [17] - 3月发布的V3-0324采用6850亿参数MoE架构,代码能力显著增强 [20] 国产芯片与AI发展 - 美国对英伟达H20芯片禁令促使华为昇腾910C、寒武纪MLUarch04等国产芯片加速发展 [21] - 公司已与部分国产芯片头部企业展开合作 [26] - 创始人梁文锋表示真正挑战是高端芯片出口禁令而非资金 [22] - 公司曾推出针对英伟达H卡的算力优化方案 [21] 公司战略与行业定位 - 创始人梁文锋致力于探索通用人工智能(AGI)本质 [18][20] - 公司早期主要依托自有资金,排除有退出顾虑的投资机构 [20] - 创始人认为技术实力比产品黏性更重要,可通过技术优势获取用户 [20] - 公司目标是通过技术创新改变全球AI格局而非仅服务用户 [20]