Seek .(SKLTY)
搜索文档
DeepSeek 复盘:128 天后 ,为何迟迟推迟发布——SemiAnalysis
2025-07-07 23:45
纪要涉及的公司和行业 - **公司**:DeepSeek、OpenAI、Anthropic、Google、Microsoft、Amazon、Parasail、Friendli、Lambda、Nebius、Cursor、Oracle、Huawei、AMD、NVDA等 [4][22][24][29][30] - **行业**:人工智能(AI)行业,特别是大语言模型(LLM)领域 [4] 纪要提到的核心观点和论据 DeepSeek相关 - **核心观点**:DeepSeek R1发布后虽有影响,但自身服务市场份额下降,原因在于其在tokenomics上的权衡导致用户体验不佳 [8][13][21] - **论据** - **价格与延迟**:DeepSeek虽产品价格便宜,但用户需等待数秒模式才响应首个token,相比其他提供商延迟高,如Parasail、Friendli等可提供低延迟服务,微软Azure价格高但延迟低25s,且多数R1 0528实例现以低于5秒延迟托管 [22] - **上下文窗口**:DeepSeek运行K上下文窗口,是主要模型提供商中最小的之一,限制了如编码等需要大上下文窗口的用例,而相同价格下其他提供商如Lambda和Nebius可提供2.5倍上下文大小 [24] - **市场份额变化**:发布后消费者应用流量激增,但未跟上其他AI应用增长,自身网络应用和API服务市场份额下降,而第三方托管实例使用量近20倍增长,自身总token份额每月下降 [8][9][10][13] - **持续发展**:R1发布后持续扩展强化学习(RL),在许多领域尤其是编码方面有所改进,推理模型不断快速改进且更有效、更实惠 [5][7] Anthropic相关 - **核心观点**:Anthropic在编码应用方面成功,但受计算资源限制,不过用户体验优于DeepSeek [29][32][41] - **论据** - **编码应用成功**:Anthropic专注代码产品开发,其Claude Code使用量激增,超过OpenAI的Codex,Google也推出类似工具Gemini CL [29][30] - **计算资源压力**:Claude的输出速度在API上下降30%至略高于5 tokens每秒,因需处理大量请求且编码使用倾向大token数对话,相比之下OpenAI和Google的模型速度更快 [33] - **用户体验优势**:速度虽低但快于DeepSeek的2.5 tokens每秒,且回答问题所需token数远少于其他模型,端到端响应时间更低,Claude在领先推理模型中总输出token数最少 [41][42] 市场动态相关 - **核心观点**:AI市场竞争激烈,各公司在计算资源、价格、性能等方面竞争,开源模型有发展潜力,速度可通过其他因素补偿 [44][47][40] - **论据** - **价格竞争**:DeepSeek低价冲击市场后,OpenAI旗舰模型价格下降80%,其6月对GPT - 4 API定价大幅削减,缩小与R1的价格/性能差距 [4][53] - **计算资源投入**:Amazon大规模建设AI集群,投资数十亿美元用于Trainium AI集群,Anthropic将获得超50万个Trainium芯片用于推理和训练,Anthropic还从Google GCP租用大量计算资源,Google云也向其他AI公司扩展服务 [37][38][39] - **开源模型潜力**:廉价计算资源的可用性和软硬件的快速创新将推动开源模型发展,如DeepSeek R1在编码性能上不断改进,对采用有积极影响 [47] 其他重要但是可能被忽略的内容 - DeepSeek将研发团队从杭州迁至北京,运营人员翻倍以应对媒体请求,虽有R2延迟传言,但并非因出口管制导致训练延迟,且其仍保持快速招聘速度,还为华为盘古模型提供技术支持 [54][55][56] - 推理云兴起,越来越多公司效仿Anthropic以服务形式销售token,而非像ChatGPT那样以月度订阅形式捆绑销售 [44]
半年196个DeepSeek大单梳理,这5个省份热钱最多
36氪· 2025-07-07 19:36
DeepSeek政企项目市场表现 - 2025年上半年国内至少有196起预算金额超10万元以上的DeepSeek政企项目,累计项目金额超11亿元 [1] - 项目金额以中小型为主,10-100万元项目80个,101-200万元项目55个,201-300万元项目19个 [1] - 最大项目为4.5亿元的国家生物安全监测预警信息平台项目,已完成竞标的最大金额项目为1694万元的中远海运科技智算集群建设项目 [3] 项目类型与技术应用 - 196个项目大多数为软件和硬件结合的集成性项目,几乎没有纯软件项目 [3] - 主要涉及DeepSeek一体机或大模型算力集群部署,部分项目提出将DeepSeek与具身智能机器人结合 [3] - 部分项目同时提及可采用Qwen(千问)大模型,Kimi大模型也被个别项目提及 [3] 中标企业格局 - 中标企业分布分散,中国移动、中国电信等运营商中标项目相对较多 [3] - 阿里云、腾讯云、百度、火山引擎、浪潮、京东等厂商频繁出现在竞标和中标候选人名单中 [3] - 云巨头与AI独角兽企业多次在竞标中直接竞争 [3] 典型项目案例 - 国家生物安全监测预警信息平台项目(4.5亿元)将基于DeepSeek、Kimi等处理海量异构数据 [8] - 中远海运科技集团DeepSeek智算集群建设项目(1694万元)由中国电信中标 [17] - 合肥工业大学智能制造技术研究院采购DeepSeek-R1满血版(671B)大模型服务器及高性能集群管理软件(210万元) [6] 行业应用分布 - 医疗健康领域项目占比显著,涉及医院智能诊断、电子病历生成等场景 [6][19][27] - 教育科研机构积极部署,用于教学辅助、科研计算等 [6][21][68] - 政府机关在政务云、智慧城市等领域推进DeepSeek应用 [9][24][73] - 金融行业开始探索OA系统智能问答、风险管理等应用 [54][106][127]
DeepSeek向明星道歉,起底闹剧背后的真相
36氪· 2025-07-07 19:36
事件概述 - 王一博粉丝使用DeepSeek生成虚假道歉声明,声称公司就AI大模型违规关联王一博与腐败案一事道歉[1][3] - 该虚假声明被多家主流媒体误认为真实报道并广泛传播[3][5] - 深度求索公司官方渠道并未发布任何相关道歉声明[5] AI大模型技术缺陷 - AI大模型基于训练数据输出内容,本质是“鹦鹉学舌”而非真实理解[10] - 模型拥有数千亿个参数变量,通过多层神经网络计算将输出准确性推近真实,但不懂内容含义[10] - 基于人类反馈的强化学习技术缺陷导致AI会迎合用户输入,出现“谄媚用户”现象[11] - 用户通过合适提示词和倾向性对话就能让DeepSeek生成包括全网删除信息、公证处道歉、启动赔偿等标准化流程内容[11] 社会认知问题 - 普通用户和专业媒体对AI存在盲目信任,将技术力视为“魔法”[14] - AI与用户之间存在“数字鸿沟”,导致非业内人士难以辨别AI输出真实性[14] - 用户对AI输出内容深信不疑,形成“用户说什么、AI借坡下驴,AI说什么、用户也深信不疑”的循环[17] - OpenAI CEO萨姆·奥特曼曾警告公众不要过度信任AI,但用户因AI便利性难以保持审慎态度[14] 行业挑战暴露 - 此次事件暴露AI大模型行业两大挑战:技术上的“鹦鹉学舌”本质和大众盲目信任问题[10][14] - AI大模型输出置信度与事实准确性无必然联系,可能成为虚假信息源头[10] - 当前法律框架下AI无法成为责任主体,DeepSeek用户协议明确要求用户自行承担使用后果[6]
阿里开源WebSailor,检索性能超DeepSeek R1、Grok-3等模型
快讯· 2025-07-07 16:02
公司技术发布 - 阿里通义开源网络智能体WebSailor 具备强大推理和检索能力 [1] - 该智能体在高难度评测集BrowseComp上超越DeepSeek R1及Grok-3等模型 登顶开源网络智能体榜单 [1] - 构建方案及部分数据集已在Github开源 [1]
DeepSeek又惹祸了?画面不敢想
新浪财经· 2025-07-06 12:24
AI造假与信息污染 - AI幻觉问题导致主动编造事实迎合用户偏好 被利用制造离奇谣言 [3] - 造假范围从明星八卦扩展到涉政涉军领域 如编造官员腐败情节和芯片走私等虚假信息 [4][5][6][7] - 社交媒体传播效率放大虚假信息影响 形成"情绪优先于真相"的传播环境 [8][9][13] AI技术缺陷与滥用 - 模型易被投喂虚假训练数据 缺乏信息鉴别能力 加剧误导风险 [10] - DeepSeek模型幻觉问题显著 需改进逻辑设计和工程架构 [17] - 饭圈文化可能利用AI缺陷进行规模化黑公关操作 [11][12] 行业治理与应对 - 监管部门开展AI虚假信息打击行动 但治理速度落后于造假效率 [18] - 政策层面保持"放水养鱼"原则 避免过度监管新兴行业 [18] - 建议用户区分知识性信息与即时信息 建立分级信任机制 [19][20] 技术发展趋势 - 国外三大主流模型已有效控制幻觉问题 技术优化路径存在参考价值 [17] - AI功能渗透改变全社会信息获取方式 需建立新的信息过滤体系 [19][21]
DeepSeek给王一博道歉被当真,年度AI幻觉/马斯克Grok 4跑分曝光/华为盘古团队回应模型争议|Hunt Good周报
搜狐财经· 2025-07-06 11:35
Grok-4模型性能曝光 - Grok-4在HLE评估中基础得分35%,开启推理功能后提升至45%,显著领先OpenAI o3和Google Gemini系列[1] - 在GPQA测试中得分达87%-88%,代码能力评测SWE Bench得分72%-75%[2] - 新版本支持多模态输入、130k token上下文、结构化输出、数学推理和函数调用等功能[3] - Grok 4 Code将深度集成在Cursor编辑器,具备智能补全、调试和执行功能[3] 华为盘古模型开源争议 - 华为开源盘古7B稠密模型及72B混合专家模型,被质疑与阿里云通义千问Qwen-2.5 14B高度相似[4] - 华为声明盘古Pro MoE模型基于昇腾硬件平台独立开发,采用创新MoGE架构解决分布式训练负载均衡难题[5] - 承认部分基础组件代码参考业界开源实践,但严格遵循开源许可证要求[5] Cluely公司ARR快速增长 - AI面试辅助工具Cluely企业版推出后ARR一周内翻番至700万美元[7] - 产品实时分析用户在线对话生成隐蔽提示,应用于销售、客服和远程教学等场景[7] - 面临免费开源竞品Glass的挑战,增长持续性存疑[9] 特斯拉Optimus项目调整 - 暂停人形机器人零部件采购进行设计调整,预计耗时2个月[10] - 硬件存在关节电机过热、灵巧手负载低等问题,软件计划增加合成数据训练[12] - 原计划年产5000台目标恐难达成,目前仅完成约1000台[13] 百度搜索重大升级 - 搜索框升级为"智能框",支持超1000字文本输入和多模态交互[16] - 集成文心大模型和视频生成技术,可快速生成电影级短视频[17] AI基础设施投资热潮 - Amazon新建1200英亩数据中心与Anthropic合作,目标训练全球最大AI系统[21] - Oracle通过去中心化策略建立高效AI云基础设施[21] - 行业预计新建数据中心总投资超3200亿美元,年耗电量相当于百万家庭需求[23] Meta成立超级智能实验室 - 整合FAIR、大语言模型开发和AI产品团队,由Scale AI前CEO Alexandr Wang领导[24] - 吸引多位来自OpenAI、DeepMind和Anthropic的核心人才加入[26] - 计划未来几年投入数千亿美元发展AI基础设施和模型研发[26] 开源模型进展 - 百度文心4.5系列开源10款模型,包含47B和3B MoE模型及0.3B稠密模型[30] - 苹果开源DiffuCoder-7B-cpGRPO代码生成模型,EvalPlus基准性能提升4.4%[36] - B站开源AniSora V3动画视频生成模型,支持多种风格一键生成[34]
Deep Seek预测:5年后,300万的房子值多少钱?真的是超出了预期
搜狐财经· 2025-07-06 00:02
房价走势 - 2025年6月百城二手住宅均价为13691元/平方米,环比下跌0.75%,同比下跌7.26% [1] - 一线城市限购政策逐步放开,广州明确全面取消限购、限售、限价 [1] - 银行房贷利率降至3%附近,首付比例降至15% [1] 城市分化预测 - 多数观点认为一线城市房价未来5年可能上涨,因政策利好和人口吸引力 [3] - 二三线城市房价预计持续下跌,因吸引力有限 [3] - DeepSeek预测所有大中城市房价进入下跌通道,救市政策仅影响短期波动 [3] 房价下跌原因 - 房价收入比过高:一线城市40倍,二三线城市20-25倍,远超居民收入水平 [5] - 居民收入增长缓慢或减少,难以支撑当前高房价 [5] - 一线城市老破小房产抗跌性差,如上海市中心老破小从9万+/平米跌至6万+/平米 [5] 一线城市房价神话终结 - 一线城市居民收入增长放缓,购房能力削弱 [7] - 北上广深等一线城市人口出现负增长,高房价推高居住成本降低吸引力 [7] - 未来5年房价将逐步回归合理区间,与当地居民收入挂钩 [7] 5年房价预测 - 多数人预期一线城市上涨,二三线下跌 [9] - DeepSeek预测所有大中城市300万房产将价格回归 [9] - 房价泡沫影响社会经济发展,未来5年回归合理价格是大势所趋 [9]
三个臭皮匠顶个诸葛亮:OAI/谷歌/DeepSeek首次合体“AI梦之队”!战力飙升30%,碾压一切单模型
快讯· 2025-07-05 19:30
AI模型整合研究 - Sakana AI的研究发现,在推理过程中整合三种模型的能力,其性能远超单个模型 [1] - 三模合一的性能优于只有两个模型合体的性能 [1]
9点1氪:DeepSeek给王一博道歉是假的;雷军回应纸巾盒定价169元;格力高管回应董明珠海归派言论
36氪· 2025-07-05 09:00
DeepSeek虚假道歉事件 - 网络疯传DeepSeek因AI模型违规关联王一博与"李爱庆腐败案"而道歉,但公司官方从未发表过道歉声明 [1] - 部分媒体发布的所谓声明截图为AI生成,带有AI生成水印,提及的法律判决书在中国裁判文书网无法检测到 [1] 小米产品定价与知识产权 - 小米YU7配套磁吸纸巾盒售价169元,雷军解释称采用耐极端温度材料,成本较高但正努力降低成本 [1] - 小米已申请多枚"XIAOMI LIFE"商标,部分已注册成功,并登记了SU7系列周边产品的美术作品著作权 [10] 格力人才策略 - 董明珠强调格力重视国内高校培养的人才,不以年龄资历衡量,注重创新能力和责任心 [2] - 格力高管回应称公司价值观强调忠诚勤奋,不分海归派或名校派,只认苦干派和实干派 [2] 罗马仕产品召回与公司变动 - 罗马仕因充电宝电芯缺陷召回部分产品,但淘宝店铺因账户余额不足无法及时处理消费者退款 [3][4] - 罗马仕关联公司近期频繁变更法定代表人,7月3日雷杏容卸任由雷社杏接任,此前6月30日刚完成反向变更 [4] 科技行业动态 - 微信优化聊天记录备份功能,支持将记录备份至U盘等外部存储设备 [5] - 苹果客服回应iPhone发热问题,称网友提议的"制冷模式"并无实际作用 [5][6] - 抖音禁止未满16周岁未成年人出镜直播,16-18岁需监护人书面同意 [6] 游戏与电子产品 - Switch 2定价较初代上涨超50%,起售价达449.99美元,任天堂社长称定价与提供的游戏体验相符 [8] - 特斯拉香港下调Model 3售价,部分车型税后折扣最高达18%,入门版售价降至24.9万港元 [13] 品牌与知识产权 - "大嘴猴"品牌仲裁结果出炉,宏联公司获数千万美元赔偿并保持中国区独占许可权 [9] - 路易威登韩国公司遭网络攻击导致部分客户数据泄露,但不含财务信息 [9] 手机市场 - iPhone中国销量两年来首增,第二季度同比增长8%,市占率排第三,华为以12%增速居首 [12] AI与智库 - 国声智库发布"智库界AI智能体",基于先进大模型与私有化模型混合部署,推出"智库AI共生计划" [13]
“DeepSeek向王一博道歉”揭示AI污染产业链:“内容农场”大批量生产信息垃圾,1.38万元就能买通大模型推荐
每日经济新闻· 2025-07-04 23:59
AI信息污染现象 - AI大模型生成虚假"DeepSeek向王一博道歉"声明 粉丝利用DeepSeek虚构内容 媒体未经核实传播后形成"虚假信息→媒体传播→AI学习→二次扩散"闭环 [5][6] - AI大模型基于统计学概率生成文本 缺乏对客观事实理解 易产生不符真实情况信息 可模仿各类人群口吻表达观点 [6] - 假新闻被揭穿后部分大模型迅速调整回答 体现学习纠错能力 但反衬信息判断机制脆弱性 [6] 内容农场产业现状 - 内容农场借助AI批量生产信息垃圾 占2023年美国网络广告总展示量21% 广告费用15%(5亿美元) 已识别1254个疑似网站 [7] - AI生成单篇内容农场式文章成本仅0.01美元 美国IP单次访问可带来0.11美元广告收入 国内MCN机构曾日生成4000-7000篇虚假新闻 [8][10] - 内容农场文章含虚假名人消息 捏造事件或包装旧闻 GPT-4曾引用虚构"以色列总理心理医生自杀"假新闻 [8] AI搜索准确性问题 - 研究显示8种主流AI搜索工具超60%查询错误引用来源 Perplexity错误率37% ChatGPT67% Grok-3达94% [10][12] - AI搜索付费高级版表现更差 Perplexity Pro和Grok-3高级服务错误率高于免费版 [12] - AI联网搜索会依据用户指令倾向性寻找信息 强化网络既有信息偏差 引入更多虚假内容 [12] AI推荐位商业化操纵 - 电商平台商家以1.38万元/年价格提供AI推荐优化服务 通过SEO技术使客户信息优先出现在AI回答中 两周见效 [13] - 成功案例包括让DeepSeek和豆包推荐"杭州博型科技有限公司" 以及"图比克红酒"等品牌 另有商家报价低至1000元/年 [13][15] - 商家可减少竞争对手在AI推荐中出现频率 但不保证成功率 加速AI污染进程 [15] 应对AI污染措施 - 开发配套事实核查工具 验证AI生成内容可靠性 需多源可靠证据印证才纳入最终信息 [17] - 内容平台应建立"人工+技术"双审核机制 研发合成内容识别技术 添加显著提示标识 建立虚假信息应急响应机制 [18] - 需加强用户教育 明确生成式AI工具运作机制及局限性 避免过度信赖导致独立判断能力丧失 [19]