Workflow
DeepSeek R1
icon
搜索文档
美国发布《人工智能行动计划》90项行动纲领、三项行政令:如何击败中国?
36氪· 2025-07-28 12:12
政策转向与监管环境 - 特朗普政府发布《人工智能行动计划》,提出90多项政策建议,核心目标是加速美国AI发展并击败中国,政策方向从监管转向宽松治理,撤销拜登政府的AI风险管控措施 [1][2] - 计划废除各州对AI的"繁重"监管,限制联邦资金流向有严格AI监管法规的州,引导资金至政策相符的州 [3] - 要求修改AI风险管理框架,删除涉及错误信息、多样性、公平性、包容性及气候变化的内容 [2] 开放模型与全球竞争 - 计划强调开源AI模型和公共研究基础设施,支持中小企业采用开放模型以降低实验门槛 [4] - 中国开放模型(如DeepSeek R1、Kimi K2)因成本低、可定制化,在发展中国家具备软实力优势,美国计划通过出口AI技术栈对抗中国影响力 [5][6] - 美国商务部将设立新项目收集行业联盟提案,推动AI技术出口,并动员联邦融资工具支持 [6] 出口管制与地缘战略 - 特朗普政府恢复英伟达H20芯片出口,但强调出口管制仍是长期战略,未来将制定基于性能的芯片出口指南 [7] - 计划加强AI计算出口管制执法,堵塞半导体制造出口漏洞,研究AI驱动的国家安全风险(如网络攻击、生物武器) [7] - 抨击国际组织现有AI治理框架,认为其监管繁琐且受中国企业影响 [8] 实施与资源分配 - 计划缺乏实施细节,约三分之一建议未明确牵头机构,无时间表或新增资源分配 [8] - 短期行动聚焦于配套行政命令,包括促进AI技术出口、加速数据中心许可、防止"觉醒"AI [1][8]
Kimi K2拿到了世界第一,也杀死了过去的自己
新财富· 2025-07-28 10:58
月之暗面Kimi K2大模型发布 - 7月12日月之暗面发布最新大模型Kimi K2 模型权重和代码全部开源 在LMArena排行榜中综合排名全球第五 开源大模型中位居全球第一 超越Claude 4和DeepSeek-R1-0528 [2] - Kimi K2提出"模型即Agent"新概念 原生具有调用各种工具的能力 在LiveCodeBench测试中取得53.7%的成绩 超越GPT-4.1的44.7%和Claude 3.5 Opus的47.4% [23][35][44] - Kimi K2参数量扩展至1T量级 放弃自研架构转向DeepSeek V3 通过减少Attention Heads数量增加Experts数量 突破智能上限 [24][28][29] Kimi发展历程与战略转型 - 月之暗面曾是Scaling Law忠实信徒 采取激进买量策略 2024年营销预算接近9亿人民币 但6月月活降至2352万 同比下降2.19% [8][11][17] - 2024年底全球高质量公开数据耗尽 深度求索通过DeepSeek R1开辟新范式 依靠后训练强化学习突破智能上限 月活暴涨至6181万 [13][16][17] - 2025年初公司停掉所有市场营销 集中资源研发K2 转向技术驱动 加入开源阵营 战略重心回归大模型性能提升 [55] Kimi K2技术创新 - 开发MuonClip优化器 解决15.5T tokens预训练稳定性问题 实现零崩溃表现 被海外AI圈称为"完美的Loss曲线" [32][33] - 提出Agent训练新路径 通过AI生成模拟场景合成数百个垂直领域工具调用轨迹 建立自动化Agent数据生产工厂 [38][39][41] - 模型架构上减少DeepSeek V3的Attention Heads 增加Experts数量 在算力有限情况下最大化模型潜力 [28][29] 行业影响与竞争格局 - DeepSeek R1引发AI创业公司存在主义危机 其不花营销预算单靠产品实力月活达6181万 促使行业重新思考发展路径 [17][54] - Kimi K2开源后迅速被阿里Qwen反超 但公司战略转型意义重大 体现从产品驱动转向技术驱动的决心 [55] - 行业验证"模型能力决定市场认可"逻辑 AI公司价值创造核心转向付费用户关注的效率和结果 [53][54]
深度好文 | 聊聊 MoE 模型的量化
自动驾驶之心· 2025-07-26 21:30
MoE模型量化技术研究进展 - MoE模型面临高显存需求挑战 传统量化方法在4位/3位时会出现显著精度损失 主要由于稀疏动态计算模式和专家异常值问题[4] - 当前解决方案分为两类:GPU-CPU协同卸载方法和量化压缩技术 后者通过降低内存和计算需求成为主流方向[4] 核心量化方法 QMoE框架 - 针对1.6万亿参数SwitchTransformer-c2048模型 实现20倍压缩至160GB 每个参数占比小于1位[8] - 采用动态稀疏量化框架 专家层使用2bit三进制(-1,0,1) 非专家层保留bf16 结合90%自然稀疏性实现<1bit/参数[8][10] - 需定制CUDA kernel支持稀疏矩阵乘法 实现端到端压缩推理[10] MoQa方法 - 提出多阶段数据-模型分布感知量化 解决不同输入分布下专家重要性差异问题[12] - 构建联合数据分布 按专家重要性实施INT2/4/6/8混合精度量化[14][16] - 动态调整1%最敏感通道为fp16计算 平衡精度与开销[17] MxMoE方案 - 基于Roofline模型分析 对不同MoE块(Gate/Proj_Up/Proj_Down)实施差异化量化[18][21] - 高激活专家用W8A8 低激活专家用W4A16 配套开发专用GEMM算子提升吞吐量[21][22] 新兴优化技术 MoEQuant - 通过专家平衡自采样(EBSS)构建校准数据集 解决PTQ中专家激活不平衡问题[25][26] - 引入亲和度引导量化 将门控系数纳入逐层校准过程[27] EAQuant - 针对W3A4极端量化场景 构建统一通道级平滑向量抑制激活异常值[29][30] - 采用KL散度最小化专家选择分布差异 同步校准专家与非专家参数[30][31] MiLo补偿器 - 针对INT3量化 通过SVD分解残差矩阵获取低秩补偿矩阵[34][35] - 实测显示可有效恢复中等权重值的信息损失[35] 边缘计算优化 Fate系统 - 为边缘设备设计 结合跨层门控预测实现专家预取[36] - 分级存储策略:CPU MEM缓存用int4 运算阶段按专家受欢迎程度动态切换int2/int4[38] MoQAE创新 - 借用MoE门控机制 为长上下文选择最优KVCache量化位宽[39]
关于人形机器人,摩根士丹利预测
天天基金网· 2025-07-24 13:14
人形机器人行业现状与市场情绪 - 人形机器人行业正在进入商业落地关键期,下游应用落地和技术突破是推动市场情绪的两大核心驱动力[1] - 2025年下半年中国极有可能出现一轮应用推广潮,将显著提振市场情绪[1] - 2025年1月1日至3月18日,人形机器人概念股一度迎来强势上涨,中国相关股票在今年一季度大涨37%,跑赢MSCI中国指数23个百分点[3] 市场动能切换与驱动因素 - 市场动能从"概念炒作"切换到"落地验证"阶段[2] - 上涨热潮由以下因素推动: - 华为、英伟达、Meta、OpenAI等多家科技巨头高调入局,依托AI与云计算优势加速模型开发[3] - 企业抛出激进生产目标:特斯拉计划2025年生产5000-10000台Optimus,2027年达50万至100万台;FigureAI宣布未来四年交付10万台[3] - 技术突破频现,如DeepSeek R1、Figure Helix、智元GO-1等VLA模型亮相,标志着机器人智能水平大幅跃升[4] 市场回调与商业化挑战 - 3月至7月,人形机器人相关概念股出现回调,板块整体回调幅度约6%[4] - 特斯拉将2025年Optimus产量目标由5000-10000台下调至"数千台",国内优必选、引擎动力等也下调2025年出货指引[5] - 市场需要看到真实的应用落地来验证投资逻辑,否则高估值难以维系[4] - 目前应用仍局限于结构化场景,距离"通用任务"能力仍有相当距离[4] 中国市场的未来展望 - 2025年下半年中国将推动人形机器人应用落地,工业和商业服务等场景将率先渗透[6][7] - 政策端持续支持,预期未来会从供给侧延伸至需求侧补贴,以加速落地并形成数据闭环[7] - 预计2025年下半年将出现首批人形机器人订单与应用落地,包括商业化订单[7] - 多家集成商目标年内交付数百至数千台,竞相构建生态[7] - 持续的产品迭代、硬件与软件创新将影响市场表现,头部集成商的新机型若超预期将成为行情催化剂[8]
全球AI应用产品梳理:模型能力持续迭代,智能体推动商业化进程-20250723
国信证券· 2025-07-23 21:20
报告行业投资评级 - 优于大市(维持评级) [1] 报告的核心观点 - 全球AI发展迅速,模型能力提升、开源推动成本降低,智能体技术完善且新产品密集发布,商业化用量增长,国产模型表现亮眼,C端应用重塑流量入口,B端应用推动企业上云 [2] 根据相关目录分别进行总结 模型层:能力迅速提升,开源推动成本降低 - 模型能力提升,主流架构转向MoE,多模态能力增强,采用思维链技术,其他技术发展推动可用性进步 [8] - 模型训练竞赛趋缓,Scaling Law向推理侧迁移,模型推理能力提升,商业化前景打开 [15] - 模型推理成本显著下滑,API调用价格下降利好应用端成本下降 [20] - 开源与闭源模型差距缩小,推动AI应用落地,开源模型降低使用门槛和成本 [25] 智能体:技术逐步完善,新产品密集发布 - AI Agent与传统人工智能不同,能改变人机协同模式,打开垂直行业应用入口 [30] - 模型Agent能力快速提升,在GAIA测试中表现不断刷新 [33] - MCP扩展AI能力边界,海内外大厂纷纷布局,推动Agent加速落地 [38] - 谷歌发布A2A协议,与MCP互补,加速Agent生态完善,推动AI应用向复杂工作流落地 [45] - 海内外智能体快速发展,测评成绩不断刷新,应用效果快速提高 [46] 商业化:用量持续增长,国产模型表现亮眼 - 中国AI发展走出自身路径,形成生态闭环,芯片产业本土化加速,数据成为核心资源 [55] - 中美模型差距缩小,中国依靠开源模型走出自身生态,在开源模型排行榜上表现优异 [65] - 全球AI模型流量持续上涨,为应用侧发展提供基础,推理需求提升,芯片价格上升,API调用量迅速提升,国产模型表现亮眼 [66][73][79] C端应用:借助AI赋能业务,重塑流量入口 - AI应用有望重塑C端流量入口,互联网巨头具备先发优势,可利用专有数据和用户参与度集成AI功能 [85] - 编程成为人机协同主要领域,办公类任务AI占比较低,人机深度协同存在较大空间 [92] - 以Reddit、Robinhood、多邻国为例,展示AI在社区平台、金融、教育等C端领域的应用及价值创造 [94][99][105] B端应用:开源提升投入意愿,推动企业上云 - 开源模型提升企业投入意愿,刺激国内上云需求,AI技术深入多行业,推动智能化转型,提升企业上云意愿 [112] - 以赛富时、ServiceNow、Snowflake为例,展示AI在CRM、工作流管理、数据库等B端领域的应用及功能升级 [118][124][131] - 汇总海外和中国AI应用厂商在各领域的主营业务及AI应用情况 [132][133]
计算机2025Q2基金持仓分析:持仓占比低位,加仓港股IT与金融
申万宏源证券· 2025-07-23 15:40
报告行业投资评级 报告未提及行业投资评级相关内容 报告的核心观点 - 2025Q2计算机行业公募基金配置占比2.6%,较上季度下降0.6pcts,处于2010年来10%分位;25Q2计算机行业配置系数0.56,较25Q1下降0.11;计算机行业持仓占比排名第十三,处于中游水平 [4][6] - 2025年AI仍为计算机板块全年主线,看好计算机演绎有三大逻辑:国产算力推出超节点方案,性价比提升且与海外差距缩小;多款基础大模型推出推动AI应用商业化;稳定币、3D打印等多领域创新不断 [4][7] - 计算机行业PE(TTM)估值处于高位,但PS(TTM)和PCF(TTM)估值有提升空间,后续随着宏观经济复苏和AI技术迭代,行业估值有望消化、市值进一步提升 [20][21] 根据相关目录分别进行总结 持仓占比低位,加仓港股IT - 计算机2025Q2基金持仓分析 - 国产超节点方案性价比提升、算力差距缩小:全球AI芯片核心玩家推进大规模节点产品,华为CloudMatrix384验证超节点技术路径可行性;市场对国产算力关注度下降,存在两大预期差,国产方案推理性价比被低估,CM384在DeepseekR1推理中Prefill阶段单FLOPS效率超英伟达H100方案18%,且忽视算力网络架构变革对产业链的重构 [5][7][8] - 多款基础大模型的推出推动AI应用商业化:25年年初至今,国内大模型发布与海外一线并驾齐驱,国产大模型在推理能力和推理性价比上提升显著;字节Agent平台Coze、Kimi K2等推动国产Agent能力,智能平权推动AI应用商业化 [5][8] - 稳定币、3D打印等多领域创新不断:稳定币向合规化、支付基础设施方向发展,预计3 - 5年内快速扩张,规模将达2 - 3.7万亿美元,带动全产业链增长;3D打印从工业级转向消费级,需求快速释放,拓竹等厂商降低产品价格和使用门槛,带动核心产业链相关公司 [5][9][10] 25Q2计算机行业主动公募基金持仓情况 - 前十大重仓股相对稳定,华大九天登上第一大重仓股,美图公司新进入前十大,用友网络退出;前十大中加仓3家(金蝶国际、广联达、美图公司),减仓7家 [13][15] - 加仓AI应用相关标的,行业IT、AI应用是加仓幅度最大的领域,AI算力相关的拓维信息也获加仓,四方精创、拓维信息为新进标的 [17] - 持仓市值超过1亿元的公司中,大市值公司减持比例较大,市场向下游应用、弹性标的调仓 [18] 估值 - 2025年7月22日,计算机行业PE(TTM)为85.4x,处于历史93.40%分位数,PS(TTM)为3.4x,处于历史48.90%水平,PCF(TTM)为45.7x,处于历史13.00%水平;行业PE估值与PS、PCF估值分位数存在背离 [20][22] - 当前估值水平超过2020年、2023年估值高点,反映市场对潜在盈利空间的乐观预期,后续随着宏观经济复苏和AI技术迭代,行业估值有望消化、市值进一步提升 [21] 风险偏好判断以及重点标的 - 报告给出数字经济领军、AIGC应用、AIGC算力、数据要素、信创弹性、港股核心、智联汽车、新型工业化、医疗信息化等领域的重点标的 [26] 计算机重点公司估值 - 报告给出计算机重点公司的总市值、归母净利润、PE等估值数据,盈利预测取Wind一致预期,港股标的市值及财务数据均换算为人民币 [29][30]
用户都去哪了?DeepSeek使用率断崖式下跌?
菜鸟教程· 2025-07-23 10:10
DeepSeek R1市场表现与行业影响 - DeepSeek R1推出后迅速成为全球现象级AI应用,上线20天日活跃用户(DAU)达2215万,登顶140多个国家IOS下载榜并超越ChatGPT成为美区免费应用榜首[2] - 其崛起对美股科技股造成冲击:纳斯达克100指数期货单日跌幅达5%,英伟达股价暴跌17%,科技板块单日市值蒸发近万亿美元[4][6] - 但近期网页访问量出现显著下滑:2月至5月访问量从614M降至436M(-29%),同期ChatGPT增长40.6%,Gemini增长85.8%,Grok增长247.1%[9] 用户流失核心原因 - 第三方平台分流:R1和V3模型在第三方部署使用量增长近20倍,导致官方token消耗份额持续下降[14][16] - 用户体验痛点:首token延迟高、输出速度慢(因采用批量处理请求机制),上下文窗口仅64K(第三方平台普遍达2.5倍以上)[21][23][24] - 竞争环境加剧:半年内GPT-4.5/Gemini 2.5/Claude 4等竞品密集发布,R2版本延迟推出削弱市场竞争力[38] 公司战略选择 - 主动牺牲用户体验:通过高批量处理降低算力消耗,将资源集中于AGI研发而非商业变现,被描述为"算力实验室"模式[26] - 开源策略扩大影响力:官方平台流量下滑但通过第三方部署实现模型广泛渗透[14][43] - 与Anthropic形成对比:后者通过优化代码工具(如Claude Code)和云服务合作(获亚马逊50万Trainium芯片)提升效率[29][30][31] 行业竞争格局 - 技术路线分化:DeepSeek选择研发优先,Anthropic侧重效率优化,反映商业模式差异[46] - 资源争夺白热化:算力成为核心竞争力,头部公司通过云合作(如Anthropic与AWS/Google)或战略取舍应对限制[28][30] - 迭代速度加快:Grok4已推出,GPT5/Gemini3等新品传闻频出,行业进入高强度技术竞赛阶段[47] 用户反馈 - 负面评价集中于速度慢/幻觉问题/服务器拥堵/内容过滤等体验缺陷[35] - 部分用户转向竞品,但仍有群体坚定支持,认为开源模型数据对比方式不公平[40][43] - 行业共识在于技术突破与商业平衡的挑战,价格战背后是资源分配与战略定位的深层较量[45][48]
现在全世界最好的开源模型,是 Kimi、DeepSeek 和 Qwen
Founder Park· 2025-07-21 21:26
中国开源模型全球竞争力 - Kimi K2成为全球最强开源模型 在LMArena开发者盲测榜单中占据榜首 中国开源模型包揽前三名 包括Kimi K2、DeepSeek R1和Qwen 3 [1] - Hugging Face平台数据显示 Kimi K2发布后迅速登顶热门模型榜首 并持续超过一周 [5] - 发布仅3天 Kimi K2的第三方token调用量已飙升至开源模型第二 仅次于DeepSeek [4] 技术性能与社区反响 - Kimi K2是1T参数的MoE模型 发布后一周内基于其fine-tune和量化的衍生模型达20个 下载量超14万 超越Llama-4-Maverick-17B等竞品 [7] - 在Imarena竞技场排名中 Kimi K2位列第五 是评分最高的开源模型 超越DeepSeek R1 前四均为闭源旗舰模型如Gemini 2.5和GPT-4.5 [9] - Perplexity CEO宣布基于K2进行post-train 成为继Llama 3.3后第二个获此待遇的非推理模型 [9] 行业生态应用 - VS Code、Cline、Cursor等主流AI Coding软件已官方接入K2模型 在Claude和Gemini被封锁的大陆市场成为关键替代方案 [10] - OpenRouter平台数据显示 K2发布后周调用量迅速超越Grok 4 位列第十 [10] - 硅谷科技媒体将K2发布比作"下一个DeepSeek时刻" 认为其编程和工具使用得分亮眼 具备实际应用潜力 [11][13] 国际行业评价 - Anthropic联创Jack Clark评价K2为"目前全球最佳开源权重模型" 性能接近西方顶级闭源模型 [12][13] - Exponential View认为K2标志着中国AI技术的"东方红一号时刻" 其MuonClip优化器实现算法突破 训练效率达AdamW的两倍 [14] - 艾伦研究所指出 美国开源模型已落后 中国形成DeepSeek、Qwen和Kimi三驾马车引领格局 [16][17] 开源战略价值 - 开源成为国内基模公司的必选模式 通过社区协作加速迭代 同时获得技术认可和资源支持 [19][21] - 模型公司通过开源建立技术标杆 吸引开发者生态 形成不同于DAU/ARR的新价值评估体系 [20][22] - 月之暗面团队认为开源能降低研发成本 使公司更专注于下一代模型开发 形成正向循环 [22]
OpenAI将启动5000万美元基金,支持非营利组织和社区组织;Kimi K2登顶全球开源模型冠军丨AIGC日报
创业邦· 2025-07-20 09:15
Manus联合创始人总结经验教训 - Manus联合创始人季逸超发布技术解析长文 复盘公司从年初爆火至今的开发思路与教训 [1] - 公司近期被曝裁员、清空国内多平台账号等消息 [1] 中国开源模型全球领先 - 全球开源模型排行榜中 Kimi K2、DeepSeek R1、Qwen3等3个中国模型排名前三 [2] - Kimi K2成为全球最强开源模型 领先谷歌Gemma3和Meta旗下Llama4 [2] - 榜单由数千位开发者通过动态盲测进行投票 [2] OpenAI启动5000万美元基金 - OpenAI宣布启动5000万美元初始基金 支持非营利组织和社区组织 [3] - 基金将用于教育、经济机遇、社区组织和医疗保健等领域 扩大AI影响力并促进创新 [3] - 公司还将支持社区主导的研究和创新 利用AI促进公共福祉 [3] Perplexity挑战谷歌移动市场地位 - Perplexity正与移动设备制造商洽谈 希望在智能手机上预装Comet AI移动浏览器 [4] - 公司CEO表示说服OEM将默认浏览器从Chrome改为Comet并不容易 [4] - 强调了移动平台上用户惯性带来的挑战 [4]
浙江5部门通告追溯娃哈哈20年资金流向?官方辟谣;农夫山泉、祖名股份:与余杭异味自来水无关联;演唱会出轨门CEO宣布辞职丨邦早报
创业邦· 2025-07-20 09:15
娃哈哈相关事件 - 网传"浙江省纪委国资公安等5部门通告追溯娃哈哈20年资金流向"被杭州市有关部门证实为假消息 [2] - 律师分析宗庆后可能通过企业设立、间接设立或第三方设立等路径设立信托,关键需看信托契约委托人身份及信托结构 [7] 农夫山泉与祖名股份 - 网传农夫山泉良渚生产基地受自来水事件影响,公司澄清无此基地且从未使用自来水生产 [4][5] - 祖名股份声明其生产基地位于滨江区,与余杭水污染事件无关联 [5] 外卖行业动态 - 外卖平台优惠力度明显减弱,市场监管总局约谈美团、饿了么、京东要求规范促销行为 [7] - 西贝创始人贾国龙批评外卖平台强行推低价单导致商家丧失定价权,透露曾一日涌入1.1万低价单影响运营 [7][8] 白酒行业渠道调整 - 茅台酱香酒清退24家线上店铺包括歌德盈香旗下6家店铺,新增4家店铺 [10] - 此次调整是继五粮液后又一白酒巨头收紧渠道管控的举措 [10] 新能源汽车与换电 - 蔚来换电次数突破8000万次,累计布局3405座换电站 [10] - 特斯拉Model Y L测试车谍照曝光,预计9月交付,预估售价40万元 [12] 消费电子与科技 - 格力质疑"消费保"投诉平台数据公信力,指出其运营主体已被吊销营业执照 [10] - 大疆DJI Neo 2无人机现身FCC数据库,现款机型售价1299元起 [20] - 全球最快电动滑板车The Turbo发布,极速超160公里/时,售价2.95万美元 [22] 企业融资与扩张 - 立讯机器人总部基地在常熟开工,总投资50亿元,预计年产值100亿元 [17] - 航天工程装备完成数亿元战略融资,由国家级产业基金领投 [20] - 远景常现完成超千万元天使轮融资,专注集成芯片设计自动化工具链研发 [20] 影视与娱乐 - 《侏罗纪世界:重生》票房突破5亿,成为春节档后首部达此成绩的影片 [27] PC市场数据 - 2025Q2全球PC出货量同比增长8.4%,联想以25%份额居首,苹果因M4设备热销增长13% [30][31] 人工智能与开源模型 - 中国开源模型Kimi K2、DeepSeek R1、Qwen3包揽全球前三,Kimi K2登顶冠军 [33] - 中国独角兽企业达372家,总估值超1.2万亿美元,集成电路行业以56家企业领跑 [33]