Workflow
DeepSeek
icon
搜索文档
DeepSeek使用率暴跌至3%,新模型未推出或成主因
犀牛财经· 2025-07-15 10:09
DeepSeek使用率下滑 - 公司官网流量从年初峰值下滑近三成,使用率由7 5%降至3% [2] - Poe平台数据显示DeepSeek R1使用率从2月7%降至4月底3% [2] - 第三方平台Token流量占比从3月42%骤降至5月16% [2] 使用率下滑原因 - 新模型R2多次推迟发布,原计划5月上线但CEO对性能仍不满意 [2] - 英伟达H20芯片短缺影响新模型开发和现有模型部署 [2] 竞争对手动态 - ChatGPT官网流量同期增长40 6%,谷歌Gemini增长85 8% [3] 数据局限性争议 - Semianalysis承认中国数据监测存在覆盖规模统计不全问题 [3] - Poe数据仅基于订阅者且未包含腾讯元宝等第三方接入渠道 [3]
Nvidia's Jensen Huang: China Doesn't Need US Chips
Benzinga· 2025-07-15 00:15
核心观点 - 英伟达CEO黄仁勋表示中国军方未使用该公司芯片 原因是美国出口管制和中美紧张关系 [1] - 黄仁勋认为中国无法依赖美国技术满足军事需求 因随时可能受限 且中国已有足够计算能力 [1] - 黄仁勋批评美国出口限制 称其不利于维持技术领导地位 美国技术需向全球开发者开放才能成为标准 [3] 出口管制影响 - 美国限制半导体公司向中国客户出售最先进AI芯片 [2] - 中国AI公司深度求索被指控通过东南亚空壳公司获取大量受管制的英伟达H100芯片 [6] - 黄仁勋正筹备今年第二次访华 公司正在开发符合最新出口规则的新芯片 [6] 地缘政治平衡 - 行业分析师指出黄仁勋在中美关系间谨慎平衡 既保持中国市场机会又避免激怒美国政策制定者 [4] - 黄仁勋上周会见特朗普总统 并被警告不得与涉中国军方或情报机构的企业接触 [7] 市场动态 - 英伟达股价周一微涨0.12%至165.12美元 [7]
21评论|Manus迁徙,大模型走到生死时刻
21世纪经济报道· 2025-07-14 19:05
行业竞争格局 - 头部模型性能差距从2023年初的9 26%缩小至2025年2月的1 70% [1] - 大模型调用成本从2022年20美元/百万token降至2024年0 07美元/百万token 降幅达99 65% [1] - 2024年全球生成式AI投资逾八成流向美国 xAI估值达2000亿美元超过中国所有大模型初创企业总和 [2] 技术发展路径 - 行业呈现成本效率革命趋势 DeepSeek通过工程优化实现崛起 [1] - 小模型+精调路线受青睐 DeepSeek-V2以性价比优势席卷开发者社区 [4] - 零一万物转型小参数行业模型后收入快速增长 预计2024年收入增长数倍 [4] 商业化应用方向 - 政策推动在城市管理 交通治理 医疗健康等六大领域挖掘AI应用场景 [3] - 垂直深潜战略在医疗 酒旅 物流等领域展开 百川智能聚焦医疗AI赛道 [4] - 行业竞争激烈 华为 阿里 京东等巨头均在布局垂直领域 [4] 企业战略选择 - Manus将总部迁至新加坡 面临芯片资源获取和商业模式验证挑战 [1][6] - 百川智能核心高管变动 仅剩王小川坚持医疗AI战略 [1][6] - 初创企业需在细分赛道快速实现商业闭环 技术护城河=场景知识×行业理解×闭环速度 [5][6] 行业发展阶段 - 行业经历从兴奋到冷静再到煎熬的典型新兴行业发展曲线 [4] - 当前阶段生存成为第一要务 企业需在融资和收入增长间取得平衡 [4] - 中国大模型需扎根产业土壤 医疗AI等垂直领域或成突破口 [6]
当Meta开始重新定义AI军备竞赛:一个巨头的失败、觉醒与产业震荡 | Jinqiu Select
锦秋集· 2025-07-14 16:23
Meta的AI战略转型 - Meta在Llama 4项目失败后启动激进转型,核心策略包括人才争夺、数据收购和基础设施重建,目标是不计成本进入AI领先行列 [1][5][6] - 转型动因源于技术决策失误(训练中途更换核心架构)、评估体系缺陷(缺乏测试框架)和组织管理混乱(资源分散)[4] - 公司以300亿美元收购Scale AI 49%股份,解决数据质量痛点,同时获得评估能力补充 [6][72] 人才争夺战 - 扎克伯格亲自挂帅招聘,标准配置为4年2亿美元,向OpenAI团队开出10亿美元天价报价 [5][10] - 新策略聚焦"创始人模式",已从OpenAI、Anthropic等挖来顶尖人才,形成飞轮效应 [71] - 人才缺口集中在评估能力领域,通过收购Scale AI引入SEAL实验室及HLE评估基准 [72] 基础设施革命 - 颠覆传统数据中心设计,采用"帐篷速建"模式,放弃冗余设计以追求部署速度 [11][24][26] - 推进Prometheus(1GW)和Hyperion(2GW)两大超级集群,后者将成为2027年全球最大单体园区 [27][37] - 配套现场天然气发电方案,包含Solar Turbines和西门子能源设备,解决电网供应瓶颈 [32][34] 技术失败复盘 - Llama 4主要败因包括分块注意力机制导致推理盲点、专家选择路由切换失误及数据质量缺陷 [45][51][67][69] - 数据策略从公共爬虫转向自建体系,但缺乏YouTube等多模态数据源,规模扩展时清理流程不完善 [69] - 模型蒸馏出较小版本Maverick和Scout,但性能仍受原始架构限制 [70] 行业竞争格局 - Meta当前DAU 1亿,日均查询2亿次,远低于ChatGPT的7.5次/用户/日,但基础设施投资增速将匹敌OpenAI [13][20] - 2026年预测显示Prometheus集群算力达3.17亿TFLOPS,超越Anthropic和OpenAI同期项目 [16] - 税收优惠(OBBB法案)使2026年税单或减少50%,加速资本开支回收 [75][78][80] 商业化路径 - 核心广告业务持续增长,生成式AI技术可反哺广告精准度提升 [81][84] - 潜在变现模式包括社交平台订阅服务、Reality Labs集成及多模态广告工具 [85][86] - 超级智能项目短期财务表现或类似Reality Labs,但长期协同效应显著 [83][87]
Kimi K2发布两天即“封神”?80%成本优势追平Claude 4、打趴“全球最强AI”,架构与DeepSeek相似!
AI前线· 2025-07-14 15:42
模型性能与市场表现 - Kimi K2在OpenRouter平台的token使用量两天内超越xAI的Grok 4 [1] - 总参数量达1万亿(1T),激活参数32B,支持非英伟达硬件流畅运行 [3] - 在代码、Agent、工具调用基准测试中取得开源模型SOTA成绩 [3] - 开发者实测显示其编码能力与Claude 4相当但成本仅20% [7][8] 技术架构创新 - 采用MuonClip优化器实现万亿参数模型高效训练,Token利用率显著提升 [16][19] - 架构与DeepSeek-V3相似但减少注意力头数量并增加MoE稀疏性 [17][19] - 引入qk-clip技术解决训练不稳定性问题 [19] - 通过大规模Agentic Tool Use数据合成和通用强化学习增强智能体能力 [20] 实际应用表现 - 前端开发中可生成兼具设计感的代码并自主完成组件库开发 [13] - Python数据分析任务可一次性完成且成本仅几分钱 [11] - 在创意写作和角色扮演评测中超越o3和R1模型 [14][15] - 工具调用能力获前Anthropic工程师认可,支持并行可靠调用多工具 [14] 行业竞争动态 - 与DeepSeek在技术路线三次"撞车",包括注意力机制改进和数学证明模型 [20] - 公司战略重心转向基础模型研发,暂停广告投放并布局AI医疗产品 [21] - 联合创始人公开表态将Kimi K2视为应对DeepSeek竞争的关键成果 [21] 开发者反馈 - API兼容OpenAI和Anthropic格式,可驱动Claude Code实现85%原版能力 [7][8] - 用户实测显示其生成网站和前端代码效果超预期且提示词简单 [11][13] - 被评价为"Claude 3.5 Sonnet后首个可在生产环境放心使用的非Anthropic模型" [14]
2025年下半年宏观经济展望:经济新叙事,久久为功之
平安证券· 2025-07-14 13:23
中国经济新叙事 - 贸易摩擦应对得力,中美经贸达成共识,对外合作开启新局,上半年出口有韧性[2][8][9] - 激活消费成效显著,以旧换新、“618”促销和假日消费带动消费回暖,5月社零同比增6.4%[2][20][23] - 财政惠民生促消费,1 - 5月广义财政支出同比从2.7%升至6.6%,设备更新带动投资[2][29][37] - 新质生产力亮点凸显,中国AI与美国差距缩小,科技竞争影响经济与市场走向[2][40][43] - 国际货币体系重塑,特朗普政策冲击美资产信心,资金寻求再配置,美元储备占比下降[2][44][49] 稳中向好添机遇 - 贸易合作开新局,下半年出口有总量和份额挑战,中国应拓展外贸“朋友圈”[2][58][72] - 财政支持持续加码,全年“稳增长”增量资金充裕,新型政策性金融工具首批5000亿或落地,专项债剩4105亿额度[2][80] - 推动物价合理回升,上半年PPI下行源于大宗商品价格下跌,下半年物价抬升促进经济增长[2][84][92] 政策如何再加码 - 财政夯实“促消费”,发展服务消费,加大民生投资,推进社保改革[2] - 推动房地产市场止跌回稳,城市更新项目或成扩大投资重点,关注政策性金融工具和项目清单规模[2][114] - 货币政策“择机”降息、降准,兼顾稳利差、稳息差、稳汇率[2][119][124][128] - 推进中长期改革,聚焦民生保障,解决群众急难愁盼,夯实经济良性循环基础[2][135]
Nvidia CEO downplays U.S. fears that China's military will use his firm's chips
CNBC· 2025-07-14 12:54
中美科技关系与Nvidia立场 - Nvidia CEO Jensen Huang淡化美国对中国军方使用其芯片的担忧 认为中国已有足够计算能力且不依赖美国技术栈[1] - Huang指出中国AI开发者占全球半数 美国技术需覆盖中国市场才能维持全球AI领导地位[3] - 公司正开发符合最新出口管制的新芯片 以应对4月实施的对华销售限制[4] 美国政策影响 - 美国两党长期限制半导体公司向中国出售最先进AI芯片 Huang批评出口管制政策损害美国技术领导目标[2] - 5月数据显示芯片限制已使Nvidia在华市场份额下降近50% 预计将造成数十亿美元损失[4] - 美国议员警告Nvidia不得与中国军方或情报机构关联企业接触[5] 技术应用争议 - 中国初创公司DeepSeek使用Nvidia芯片训练大语言模型 被美方指控支持军事和情报活动[7] - Huang承认对DeepSeek开源R1推理模型存在担忧 但强调无证据显示其构成威胁[7] - R1模型被评价为"革命性" 其开源特性助力初创企业及新兴国家参与AI发展[8] 地缘政治平衡 - Huang在中美间采取谨慎策略 既避免激怒美国政府 又保持中国市场准入机会[5][6] - 行业分析师认为Nvidia技术可能被任何国家用于AI军事应用 包括先进武器开发[6] - Huang强调中美竞争与相互依存并存 主张在尊重竞争对手基础上开展竞争[8]
K2开源大模型,会是Kimi的DeepSeek时刻吗?
虎嗅· 2025-07-14 11:20
中国AI开源模型发展 - MoonShot最新开源大模型K2总参数规模达到万亿级别(1T),是目前开源模型中最大的,激活参数320亿 [2] - K2在基准测试SWE Bench Verified(编程)、Tau2(智能体)中仅次于Claude 4 Opus,在AceBench(工具调用)中仅次于GPT-4.1 [2] - K2官方API服务与DeepSeek的R1相当,但最大支持上下文长度(128K)高于R1(64K) [2] - K2发布后成为HuggingFace上热度第一的开源模型,新兴云厂商NovitaAI与Parasail已将其托管上线 [4] - Perplexity首席执行官Aravind Srinivas在内部测试后决定尽快对K2展开后训练 [4] 中国AI公司竞争格局 - 中国本土AI公司竞争激烈,MiniMax与MoonShot相互竞争,先后发布多款开源模型 [5] - MoonShot已披露融资总额约15亿美元,远低于硅谷同行 [6] - MoonShot比DeepSeek更早推动"执行"以更低成本落地,冲击AI应用的消费市场和企业市场 [7] - K2兼容OpenAI和Anthropic的API格式,凭借更高性价比可能赢得硅谷AI应用开发者市场 [7] MoonShot技术创新 - K2架构采用更少注意力头、更多专家,提高长上下文效率和每个token处理效率 [8] - MoonShot自研MuonClip优化器计算效率是AdamW优化器的2倍 [8] - MoonShot在MuonClip优化器中融入自研QK-Clip技术解决MaxLogit爆炸问题 [10][11] - MoonShot重视底层创新,曾提出MoBA(混合块注意力)架构 [11] MoonShot产品布局 - MoonShot拥有形式推理模式Kimina-Prover-72B、编程模型Kimi-Dev-72B、深度研究智能体Kimi-Researcher等多款产品 [12] - K2的智能体能力得益于大量Agentic合成数据和通用强化学习手段 [12] - MoonShot团队具有文艺特质,公司名来源于平克·弗洛伊德的专辑 [13]
快速结构化深度了解李想指导手册
理想TOP2· 2025-07-13 20:41
李想个人成长主线 - 核心主线是挑战成长极限,由"关注人而非事"和"不断学习"两条根基支线组成 [2] - 学习方式包括学众人之长做差异化创新,以及通过惨痛教训反思(如泡泡网时期90%编辑离职事件)[2][3] - 汽车之家时期经历融资不顺导致控制权丧失,学会接纳自身优缺点并放弃死扛问题(2024年自述为最大成长转折点)[3] - 秦致加入后学会使命愿景价值观的实际应用,推动汽车之家取得行业90%利润份额 [3][4] 公司发展历程 泡泡网阶段 - 因沟通不善导致团队崩盘,后修正为关注用户需求而非竞争对手,但错失时机维持行业第三 [3] - 关键教训:沟通管理、战略时机选择、差异化竞争 [3] 汽车之家阶段 - 花3年实现市场份额第一,后期贡献行业90%利润 [4] - 三次萌生离职念头反映对成长空间的极致追求 [4] - 核心经验:股权结构设计、困难提前预警机制、用户导向战略 [4] 理想汽车阶段 产品迭代 - 理想ONE坚持增程路线拒绝纯电妥协,基于用户需求判断 [5] - L9通过全面升级带动L8/L7产品线进阶 [5] - MEGA失利后推迟纯电产品线1年,调整沟通与商业策略 [5] 战略选择逻辑 - 选择造车因相信自动驾驶变革潜力,2014年入场时未意识到这是AI问题 [6] - 2022年9月团队共识自动驾驶本质是AI问题,需转型为AI公司 [6] - 2024年确立人形机器人作为第二增长曲线,预期规模超自动驾驶 [6] AI战略演进 - 2022年初步认知阶段:理解Transformer机制但未系统掌握预训练/微调等概念 [7] - 2024年深度转型: - 全盘接受OpenAI五阶段理论,确立基座模型为超级入口 [7] - 每周4-5次AI会议跟踪前沿论文(如DeepSeek的MLA与MoE架构)[8] - 主导技术路线选择(如端到端架构、后训练侧重)[7][8] - 当前能力:具备AI训练架构判断力,但未达DeepSeek级底层计算重构水平 [8] 经营方法论 - 产品哲学:重新发明增程技术,VLA架构类比DeepSeek的MoE [11] - 决策机制:XCU自研等重大选择体现技术自主倾向 [12] - 组织管理:每周仅9次会议的极简管理风格,AI会议占比超50% [7][8] - 危机应对:MEGA失利后调整用户沟通策略(改用"您"称谓),学习雷军发布会技巧 [10] 行业定位 - 筛选标准:只进入市场规模超汽车之家10倍且能成为第一的领域 [5] - 终极目标:通过AI+智能车+人形机器人实现最后一次创业 [9] - 竞争认知:OpenAI不会留创业机会,AI能力将吞噬一切功能 [12]
OpenAI首个开源大模型再延期、收购Windsurf失败;Manus “删号跑路”?百川联创离职,创始团队仅剩2人|AI周报
AI前线· 2025-07-13 12:12
Manus AI业务调整 - Manus北京办公区仅剩十余名员工在岗,门口已无公司logo,明确表示"不再招聘",招聘平台显示岗位与实际不符[1] - 官方微博和小红书账号内容清空,与阿里通义千问合作开发中文版项目已停止推进[2] - 中国区员工总数约120人,40多名核心技术人员迁往新加坡总部,其余员工将获N+3或2N赔偿[2] - 新加坡招聘岗位包括AI工程师等,月薪8000-16000美元(约11万元人民币/月)[2] - 因无法及时获取英伟达最新AI芯片,智能体迭代升级进度延缓[3] - 计划将B轮融资用于开拓美国、日本和中东市场[3] 智谱IPO进展 - 同时准备港股和A股上市,A股上市概率较高[6] - 近期获得多地国资注资,包括浦东创投集团和张江集团参投的10亿元战略融资[6] - 3月获得杭州城投产业基金及上城资本超10亿元融资,珠海华发集团5亿元投资,成都高新区3亿元投资[6] 百川智能高管变动 - 技术联合创始人谢剑将离职,其曾参与百度凤巢广告等核心AI业务[7] - 2023年以来已有商业化负责人洪涛、医疗业务负责人李施政、金融业务负责人邓江、联合创始人焦可相继离职[7] - 创始团队仅剩王小川与茹立云仍在职[7] OpenAI动态 - 首个开源AI模型再次延期发布,未公布新时间点[8][9] - 以30亿美元收购AI编码初创公司Windsurf交易失败[10] - 谷歌DeepMind招聘Windsurf部分顶尖研究人员,获得其部分技术非独家许可[10][11] - 计划推出浏览器产品,集成Operator等AI智能体[29] - ChatGPT测试"一起学习"功能,通过提问引导用户思考[29][30] 阿里巴巴人事变动 - 副总裁、前钉钉CEO叶军(不穷)即将离职,已走完审批流程[12] - 曾带队研发全国第一张健康码和浙政钉[12] 英特尔困境 - CEO陈立武承认公司已跌出全球十大半导体公司[13] - 市值仅为52周高点的64%,约1039.03亿美元[13] - 近期在加州裁员271人,亚利桑那州107人,俄勒冈州529人(含300名工程师)[13] AI模型发布 - 月之暗面发布并开源Kimi K2模型,总参数1T,激活参数32B[24] - 定价为每百万输入tokens/4元,输出tokens/16元[24] - 在编程、智能体、工具调用等基准测试中取得开源模型SOTA成绩[24] - xAI推出Grok-4系列模型,马斯克称其几乎所有学科都比人类研究生聪明[26] - 支持256K tokens上下文窗口,对话速度比Grok-3快2倍[27] 行业其他动态 - 清华系具身智能企业星动纪元完成近5亿元A轮融资,已交付超200台产品[21] - 字节上线首款AI医疗助手App"小荷AI医生",提供健康咨询和报告解读服务[32] - 阿里通义开源网络智能体WebSailor,评测表现超越DeepSeek R1等闭源模型[31] - 飞书发布业界首个AI应用成熟度模型,知识问答达M3标准,会议达M4标准[33] - 飞渡科技推出"峥嵘大模型",建模精度与语义理解能力位居全球前列[34]