Workflow
DeepSeek
icon
搜索文档
AI周报|华为盘古团队否认开源模型抄袭;英伟达市值逼近4万亿美元
第一财经· 2025-07-06 09:52
苹果AI战略转向 - 苹果可能放弃自研大语言模型 转而采用OpenAI的ChatGPT或Anthropic的Claude模型为Siri提供技术支持 [5] - 苹果自研模型在多轮对话、复杂逻辑推理等核心指标上与GPT-4o、Gemini存在代际差距 [5] - 原计划2026年推出的"Apple Foundation Models"驱动版Siri因技术瓶颈多次延期 [5] 华为盘古模型争议 - 华为否认盘古Pro MoE开源模型抄袭 声明称是基于昇腾硬件平台开发的基础大模型 [2] - 盘古团队承认部分基础组件代码参考了业界开源实践 但严格遵守开源许可证要求 [2] - 研究显示盘古大模型与阿里通义千问Qwen-2.5 14B模型在参数结构上存在0.927的高相关性 [2] 英伟达市值创新高 - 英伟达市值一度突破3.92万亿美元 超过苹果创下的3.915万亿美元纪录 [3] - 6月以来英伟达股价累计上涨17.92% 年初至7月3日累计上涨18.67% [3] - AI推理需求激增 tokens生成在过去一年增长50-100倍 [3] Meta人工智能布局 - Meta成立"超级智能实验室" 整合基础AI研究、大语言模型开发和AI产品团队 [4] - 新部门引入Scale AI前CEO等11位行业重量级人物 包括6名OpenAI华人员工 [4] - 扎克伯格已在人工智能领域投资143亿美元 [4] 大模型开源趋势 - 百度开源文心大模型4.5系列10款模型 包括47B、3B MoE模型和0.3B稠密型模型 [7] - 华为开源盘古70B稠密模型和720B MoE模型 [7] - 阿里、腾讯等也已通过开源大模型布局AI生态 [7] xAI融资进展 - xAI完成100亿美元新一轮融资 包括50亿美元债务和50亿美元股权 [8] - 资金将用于开发全球最大数据中心之一和旗舰平台Grok [8] - xAI目前每月烧钱高达10亿美元 今年营收预计仅5亿美元 [8] AI人才争夺战 - Meta挖角OpenAI顶级研究员 开出1亿美元签约奖金 [9] - OpenAI CEO批评Meta招聘方式 称可能导致企业文化问题 [9] - 人才争夺导致研究人员薪资上涨 [9] 存储行业动态 - DDR4内存条价格近一个月上涨近一倍 16G 3200现货价涨幅超200% [13] - 原厂减产DDR4 将产能转向DDR5和HBM [13] - HBM成为SK海力士、美光、三星等存储原厂的竞争重点 [13] 英伟达GB300部署 - CoreWeave成为首家部署GB300 NVL72系统的AI云服务提供商 [14] - GB300 NVL72系统AI性能超过每秒百亿亿次浮点运算 每个机架提供40TB快速内存 [14] - Blackwell架构芯片占英伟达数据中心收入近70% [14]
罗马仕深夜正式发布停工停产通知,将停工6个月;《爱情公寓》女演员自曝被合伙人欺骗,加盟商每月都在赔钱;上海乐高乐园开园丨邦早报
创业邦· 2025-07-06 09:03
华为盘古大模型 - 华为诺亚方舟实验室声明盘古Pro MoE开源模型基于昇腾硬件平台自主开发,非其他厂商模型增量训练[3] - 模型部分基础组件代码参考业界开源实践,已严格遵循开源许可证要求标注版权声明[3] DeepSeek AI争议 - 网传DeepSeek因AI模型违规关联王一博道歉系虚假信息,公司未发布任何声明[5] - 所谓道歉声明截图被证实为AI生成,带有AI水印,相关法律文书在裁判文书网无记录[5] 商业纠纷事件 - 演员赵文琪指控商业合伙人侵占公司公章及资金,其持股50%的羽墨美学品牌公司账户被擅自清空[5][6] - 罗马仕宣布自2025年7月7日起停工6个月,首月按约定工资支付,次月起按当地最低工资80%发放[6] 零售与消费数据 - 美团即时零售日订单突破1.2亿单,其中餐饮订单超1亿单,2小时内新增2000万订单[6] - 上海乐高乐园度假区正式开园,占地31.8万平方米,含8大主题区和超8500万块积木搭建的模型[8] 新能源汽车动态 - 比亚迪海豹06DM-i上市,售价10.98-12.98万元,标配智能辅助驾驶方案[11] - 保时捷纯电卡宴内饰曝光,配备4块大屏,起售价约64.5万元,高配版或超93万元[15][17] - 领克10 EM-P全球首秀,标配四驱和激光雷达,搭载1600W哈曼卡顿音响系统[17] 科技与融资进展 - 智元机器人展示灵犀X2-N全地形移动能力,具备轮足形态1秒切换特性[13] - 创步科技完成3200万元A轮融资,资金用于数字缴费平台扩张[10] - 竞想科技获数千万元Pre-A轮融资,聚焦电竞线下空间AI技术研发[10] 市场表现 - 中国品牌电动车占以色列上半年电动车总销量81.2%,小鹏G6以3164辆成最畅销车型[10] - 特斯拉6月在英销量同比增长14%至7719辆,英国电动车整体销量增长39%[19] 产品认证与销售 - 3C认证充电宝销量激增,电商平台已全面下架无认证产品,部分商家库存告急[8]
近200亿融资、万亿市场,全球人形机器人市场格局剖析!
Robot猎场备忘录· 2025-07-05 23:09
人形机器人行业趋势 - CES2025大会期间,英伟达和特斯拉创始人黄仁勋、马斯克宣布人形机器人时代即将到来,奠定2025年具身智能赛道主旋律 [3] - 摩根士丹利和高盛发布研报,肯定人形机器人万亿赛道前景,但指出核心技术壁垒和商业化模式短期内难以批量化落地,上游核心供应链公司将率先获利 [3] 融资与市场格局 - 2025年上半年全球具身智能领域已公开融资金额近200亿元,呈现两级分化局面,国外单轮融资规模较高(如The Bot Company 1.5亿美元、Neura Robotics 1.2亿欧元、Apptronik 4.03亿美元)[4] - 国内创企分为“硬件派”(如宇树科技)和“软件派”(如智元机器人、银河通用),后者更受资本青睐 [4][5] - 头部企业估值:智元机器人约150亿元,宇树科技120亿元,傅利叶智能80亿元,银河通用超10亿美元,其余创企估值多在30亿元以内 [7] 商业化进展与挑战 - 宇树科技年度营收突破10亿元,但商业化场景以教育、科研为主,工业场景落地有限,实际可持续性存疑 [9][10] - “软件派”创企商业化进展多处于POC阶段,鲜有公布订单或交付数据,侧重战略合作宣发 [10] - 特斯拉Optimus机器人因软硬件不匹配暂停量产计划,反映行业软硬件技术路线未收敛的问题 [12] 技术路线与竞争格局 - 头部创企进入自研机器人“大脑”时代,双系统架构VLA模型成为主流(VLM+动作执行模型) [12] - 车企(如小鹏)和科技大厂(如谷歌、OpenAI)加码人形机器人赛道,竞争加剧,创企面临冲击 [13][14] - DeepSeek开源推理大模型DeepSeek-R1,有望打破科技大厂对基础大模型的垄断,但目前影响有限 [15] 上游供应链机会 - 上游核心零部件厂商(如灵巧手、触觉传感器、一体化关节)率先获利,相关上市公司股价数倍涨幅 [16][17] - 配备触觉与力反馈传感器的灵巧手成为商业化关键,被称作“最后一厘米” [17]
9点1氪:DeepSeek给王一博道歉是假的;雷军回应纸巾盒定价169元;格力高管回应董明珠海归派言论
36氪· 2025-07-05 09:00
DeepSeek虚假道歉事件 - 网络疯传DeepSeek因AI模型违规关联王一博与"李爱庆腐败案"而道歉,但公司官方从未发表过道歉声明 [1] - 部分媒体发布的所谓声明截图为AI生成,带有AI生成水印,提及的法律判决书在中国裁判文书网无法检测到 [1] 小米产品定价与知识产权 - 小米YU7配套磁吸纸巾盒售价169元,雷军解释称采用耐极端温度材料,成本较高但正努力降低成本 [1] - 小米已申请多枚"XIAOMI LIFE"商标,部分已注册成功,并登记了SU7系列周边产品的美术作品著作权 [10] 格力人才策略 - 董明珠强调格力重视国内高校培养的人才,不以年龄资历衡量,注重创新能力和责任心 [2] - 格力高管回应称公司价值观强调忠诚勤奋,不分海归派或名校派,只认苦干派和实干派 [2] 罗马仕产品召回与公司变动 - 罗马仕因充电宝电芯缺陷召回部分产品,但淘宝店铺因账户余额不足无法及时处理消费者退款 [3][4] - 罗马仕关联公司近期频繁变更法定代表人,7月3日雷杏容卸任由雷社杏接任,此前6月30日刚完成反向变更 [4] 科技行业动态 - 微信优化聊天记录备份功能,支持将记录备份至U盘等外部存储设备 [5] - 苹果客服回应iPhone发热问题,称网友提议的"制冷模式"并无实际作用 [5][6] - 抖音禁止未满16周岁未成年人出镜直播,16-18岁需监护人书面同意 [6] 游戏与电子产品 - Switch 2定价较初代上涨超50%,起售价达449.99美元,任天堂社长称定价与提供的游戏体验相符 [8] - 特斯拉香港下调Model 3售价,部分车型税后折扣最高达18%,入门版售价降至24.9万港元 [13] 品牌与知识产权 - "大嘴猴"品牌仲裁结果出炉,宏联公司获数千万美元赔偿并保持中国区独占许可权 [9] - 路易威登韩国公司遭网络攻击导致部分客户数据泄露,但不含财务信息 [9] 手机市场 - iPhone中国销量两年来首增,第二季度同比增长8%,市占率排第三,华为以12%增速居首 [12] AI与智库 - 国声智库发布"智库界AI智能体",基于先进大模型与私有化模型混合部署,推出"智库AI共生计划" [13]
时报观察丨政策红利收实效 创投市场添暖意
证券时报· 2025-07-05 08:02
创投市场复苏趋势 - 上半年机构LP出资规模同比激增50%,投融资规模降幅显著收窄,IPO退出项目数量增幅超20%,多项核心指标集体反弹[1][2] - 政策组合拳持续发力,包括2024年新"国九条""创投十七条"、2025年初国办1号文及5月七部门设立"国家创业投资引导基金",旨在畅通募投管退全链条并强化对科技创新的支持[2] 市场回暖的多维度表现 - 投资端活跃度提升,AI与人形机器人企业(如DeepSeek、宇树科技)崛起形成硬科技投资新风口,机构尽调频次增加[2] - 资金端呈现"长钱入市"特征:国家大基金三期设立三只股权基金(规模近2000亿元),银行AIC基金集中备案,保险与社保基金加速布局[2] - 退出端结构性改善,港股IPO市场活跃度高涨,并购重组案例量增质升,S基金交易规模扩大[2] 市场回暖的核心逻辑与挑战 - 二级市场估值修复与退出预期改善是募资、投资回暖的核心逻辑,创投机构普遍将提升DPI作为核心目标[3] - 市场化资金投资情绪待激活,长线资金入市规模需扩大,IPO退出通道需进一步畅通以实现全链条良性循环[3] 行业未来展望 - 政策红利释放叠加市场机制自我修复,创投行业将向更具韧性、更富效率的新发展阶段迈进[3]
政策红利收实效 创投市场添暖意
证券时报· 2025-07-05 01:13
市场整体表现 - 上半年机构LP出资规模同比激增50% [1] - 投融资规模降幅显著收窄 [1] - IPO退出项目数量增幅超20% [1] - 多项核心指标集体反弹 标志创投市场走向复苏周期 [1] 政策驱动因素 - 2024年新"国九条""创投十七条"及2025年初国办1号文等政策组合拳持续发力 [1] - 5月七部门提出设立"国家创业投资引导基金" 直指畅通"募投管退"全链条 [1] - 政策强化创业投资对科技创新的支持作用 红利逐步转化为市场实效 [1] 投资端动态 - AI与人形机器人企业崛起 催生硬科技投资新风口 [2] - 优质项目竞争加剧 机构尽调频次明显增加 [2] - 市场信心修复态势明确 [2] 资金端特征 - 国家大基金三期斥资近2000亿元设立三只股权基金 [2] - 银行AIC基金集中备案出资 保险与社保基金等长期资金加速布局 [2] - 国资/产业资本主导基金及垂直领域专业基金募资进程显著提速 [2] 退出端改善 - 港股IPO市场活跃度高涨 [2] - 并购重组案例量增质升 [2] - S基金交易规模持续扩大 [2] - 二级市场估值修复与退出预期改善是募资投资回暖的核心逻辑 [2] 行业未来挑战 - 市场化资金投资情绪有待进一步激活 [3] - 长线资金入市规模需持续扩大 [3] - IPO退出通道有待进一步畅通 [3] - 需实现"募投管退"全链条良性循环才能释放投资动能 [3]
DeepSeek与Anthropic的生存策略 | Jinqiu Select
锦秋集· 2025-07-04 23:35
文章核心观点 - AI行业的核心瓶颈是计算资源的稀缺,这制约了各家公司的发展 [1] - AI服务的定价本质上是延迟、吞吐量和上下文窗口三个性能指标的权衡游戏 [2][3] - DeepSeek和Anthropic采取了不同的策略来应对计算资源限制,反映了行业面临的共同挑战 [4][5] - 随着推理云服务的崛起,如何在有限计算资源下实现技术突破和商业成功的平衡成为关键 [5] AI服务定价机制 - AI服务的定价由三个关键性能指标决定:延迟(用户等待时间)、吞吐量(每秒生成token数)和上下文窗口(模型记忆容量) [3][22][23] - 通过调整这三个参数,服务商可以实现任何价格水平 [24] - 单纯比较每百万token价格意义不大,需结合实际应用场景和用户需求 [24] DeepSeek的策略分析 - DeepSeek选择极端配置:数秒延迟、每秒25个token输出速度、64K上下文窗口,换取极低价格和最大化研发资源 [4][26][28] - 官方平台用户流失29%(从614.7M降至436.2M),但第三方托管模型使用量暴增20倍 [15][16] - 公司主动牺牲用户体验,通过高batch率降低推理资源消耗,保留最大计算资源用于内部研发 [33] - 采用开源策略扩大全球影响力,让其他云服务商托管模型 [33] Anthropic的困境与应对 - Claude在编程领域成功导致计算资源紧张,API输出速度下降30%至每秒55个token [36] - 编程应用消耗更多计算资源,迫使提高batch处理规模 [36] - 与亚马逊达成合作获取50万片Trainium芯片,并向Google租用TPU资源 [37] - 通过提升"智能密度"优化资源利用,模型回答问题所需token数量远少于竞争对手 [40][42] 行业竞争格局变化 - OpenAI将旗舰模型降价80%,价格战加剧 [8][49] - 推理云服务崛起,更多公司将token作为服务直接销售而非打包订阅 [43] - DeepSeek R1编程能力显著提升,成本效益优势明显 [45][47] - Google凭借TPU计算优势提供免费大配额服务 [34] 技术发展趋势 - 强化学习持续迭代改进模型能力,DeepSeek R1-0528版本编程性能显著提升 [10][52] - 出口管制限制中国大规模部署推理服务能力,但未同等阻碍训练优秀模型的能力 [33] - 计算资源优化方式包括:提高batch规模、优化硬件使用(AMD/NVIDIA芯片)、提升token智能密度 [31][32][42]
Deepseek爆火之后的现状如何?
傅里叶的猫· 2025-07-04 20:41
DeepSeek R1发布与市场影响 - DeepSeek R1于2025年1月20日推出,性能与OpenAI推理模型相当,但定价极具颠覆性,输入/输出token价格仅为10美元,引发全球AI市场震动 [3] - 低价策略导致行业价格战,OpenAI输出token价格下降8美元以上,迫使旗舰模型价格调整 [3] - 据Reuters报道,DeepSeek低成本策略导致美国科技股市值蒸发数十亿美元,投资者重新评估AI巨头估值 [4] 技术进步与强化学习 - 模型通过强化学习(RL)显著升级,编码领域表现突出,SWE-Bench显示性能提升同时成本降低 [5] - 2025年5月29日发布的R1-0528升级版通过增加计算资源和算法优化,AIME 2025测试准确率从70%提升至87.5%,每题平均token使用量从12K增至23K [5] - 性能提升伴随延迟增加和吞吐量降低,牺牲部分用户体验以实现低成本 [5] 用户使用趋势 - 第三方托管平台使用量激增,自发布以来增长近20倍,但自托管模型用户增长乏力 [6] - 移动应用曾短暂超越ChatGPT成为Apple App Store榜首,但直接用户增长随后放缓,更多用户转向第三方托管服务 [6] - 2025年2月至5月,月活跃用户从6.147亿降至4.362亿(-29%),而ChatGPT同期增长40.6%至54.92亿 [14] token经济学与性能对比 - 通过高批量处理降低每token成本,但导致高延迟和低吞吐量,自托管模型用户体验较差 [7] - 关键性能指标对比显示DeepSeek R1延迟高、吞吐量低(64K上下文窗口),每token成本0.01美元,与Parsail相当但性能落后 [9] - Microsoft Azure提供中等性能,每token成本0.015美元,平衡价格与体验 [9] 硬件与计算限制 - 低成本策略依赖高批量处理,减少推理资源使用,目标为扩大全球影响力而非盈利 [10] - 中国推理模型规模化受出口管制限制,R2延误传闻与管制相关,但训练能力未受显著影响 [10][16] - R1-0528在编码领域进步显著,显示中国AI训练技术仍强,推理规模化需克服硬件和政策障碍 [10] 竞争格局与行业动态 - 用户转向腾讯元宝、字节豆包等第三方平台,导致DeepSeek官方工具使用量下降 [15] - 出口管制对训练影响有限,R2延迟可能涉及审查要求等非硬件因素 [16] - 行业数据显示2025年本地GPU产能预计从2kwpm增至10kwpm,2027年达26kwpm,晶圆良率逐步提升 [21]
冲上热搜!“DeepSeek对王一博道歉”竟是AI编的?
第一财经· 2025-07-04 20:27
AI幻觉事件 - 一则关于DeepSeek向演员王一博道歉的新闻被广泛传播,但经查证公司官方渠道未发布任何相关声明 [1][2] - 新闻中提及的法院判决书在中国裁判文书网上无数据,且道歉主体实为"AI聊天助手DeepSeek"而非公司 [3][5] - 该假新闻源头可能来自社交媒体帖子,但传播过程中被误认为公司官方声明 [3][5] AI幻觉技术问题 - 大模型幻觉源于技术局限和训练机制,模型基于统计概率生成文本而非理解事实,数据缺失时会自行填补内容 [7] - 训练数据中的错误信息会导致"垃圾进,垃圾出"效应,加剧幻觉问题 [7] - DeepSeek将大模型比喻为"戴着碎镜片的先知",镜片破损处会生成幻觉 [7] 行业现状与改进 - DeepSeek在5月底发布新版DeepSeek R1,官方称其幻觉率比旧版降低45%-50% [7] - 5月SuperCLUE测评显示旧版DeepSeek-R1模型幻觉率为21%,在国内模型中排名第五 [8] - 当前AI仍会捏造人物、事件或法律条文,需用户和媒体加强信息甄别 [7][8] 事件后续影响 - DeepSeek否认向王一博道歉,但其生成内容仍包含幻觉,例如虚构法务团队行动和举报邮箱 [8] - 该事件反映AI时代信息生态的脆弱性,凸显媒体作为信息"把关人"的责任重要性 [8]
“DeepSeek对王一博道歉”竟是AI编的?大模型幻觉引发热搜假案
第一财经· 2025-07-04 19:27
AI幻觉引发的虚假新闻事件 - 网络流传DeepSeek向演员王一博道歉的新闻系AI生成内容,经核查公司官方渠道未发布任何相关声明,且中国裁判文书网无对应判决记录 [1][2][3] - 虚假信息源头为社交媒体帖子,其中AI生成的道歉声明主体实为"AI聊天助手DeepSeek",但传播中被误认为公司行为 [4][5] - 经纪公司已澄清王一博相关消息为谣言,所谓DeepSeek道歉声明中提及的刑事判决书编号(2025)京03刑终174号经查无关联记录 [3][5] AI技术局限性分析 - 大模型存在"幻觉"缺陷,会基于统计概率生成看似合理但虚构的内容,根源在于技术局限和训练机制 [6][7] - 训练数据质量直接影响输出结果,错误信息输入可能导致"垃圾进垃圾出"效应 [7] - DeepSeek R1新版模型通过优化使幻觉率降低45%-50%,但此前SuperCLUE测评显示其旧版模型幻觉率达21%,国内排名第五 [7] 行业影响与反思 - AI生成内容被媒体误报为事实,反映出信息传播链条中验证环节的缺失 [1][8] - 当前AI仍难以避免伪造法律条文、人物事件等幻觉内容,需用户和机构加强甄别 [7][8] - 公司回应否认发布道歉声明,但AI生成内容中仍包含不实信息如虚构的法务团队行动和官方邮箱(official@deepseek.com与真实service前缀不符) [11]