DeepSeek - 财报，业绩电话会，研报，新闻

DeepSeek R1 0528版本

OpenAI o3模型

AIGC

Claude 4 核心成员访谈：提升 Agent 独立工作能力，强化模型长程任务能力是关键

DeepSeek R1 0528版本

OpenAI o3模型

英伟达发布财报之前 DeepSeek版本升级

中国基金报· 2025-05-28 23:12

据用户反馈，DeepSeek升级后的模型，思维链 (CoT) 的行为似乎发生了显著变化。大家好，关注一下DeepSeek的最新消息！ 5月28日，DeepSeek官方宣布DeepSeek R1模型已完成小版本试升级，欢迎前往官方网页、APP、小程序测试（打开深度思考），API 接口和使用方式保持不变。据DeepSeek小助手在官方微信群中的发言，DeepSeek已完成一次"小版本试升级"的操作，并通知用户可以开始测试。但公司未披露此次升级的具体细节。这家总部位于杭州的初创企业在今年1月震惊了全球科技行业，当时他们发布了原始版本的R1模型，在多个标准化评测中超越了西方同行，据称研发成本仅为数百万美元。这一消息引发全球科技股大幅波动，投资者开始质疑大型科技公司是否还需要投入巨额资金来构建AI服务。 R1模型的首次亮相，使其创始人梁文锋一跃成为科技界的明星人物，也成为中国有能力与硅谷顶尖公司竞争的象征。这一发布同时引发了新一轮人工智能模型竞赛。 DeepSeek的本次升级是在英伟达发布最新财报前数小时宣布的。作为全球领先的AI芯片制造商，英伟达的股价在1月因R1的发布而遭遇重挫。也有用户总结了更新后的 ...

腾讯研究院· 2025-05-28 23:06

云计算与SaaS - Salesforce以80亿美元收购云数据管理龙头Informatica 为其自2021年收购Slack后最大交易 [1] - 此次收购将整合双方AI引擎打造可信数据基础架构支持代理式AI系统的企业级部署 [1] - 数据管理能力成为企业AI产品的关键差异化优势 Salesforce通过收购完善其数据管理领域布局 [1] AI模型升级 - DeepSeek R1模型完成小版本升级编程能力有明显增强能快速生成高质量的动态天气卡片 [2] - 此次更新可能采用DeepSeek-V3-0324模型参数达685B 而R2版本仍未发布 [2] AI语音交互 - Anthropic推出Claude语音模式支持五种音色选择用户可通过语音讨论文档和图片 [3] - 功能支持文本与语音自由切换对话结束后可查看文字记录和摘要但语音对话计入常规使用上限 [3] AI视频技术 - AKOOL发布全球首款实时摄像头AKOOL Live Camera 实现虚拟数字人、多语言翻译等功能 94%盲测无法区分真假 [4] - 该产品通过4D面部映射、神经语音引擎等技术实现环境感知和情感响应标志AI视频进入"智能化响应"时代 [4][5] - 腾讯混元开源语音数字人模型HunyuanVideo-Avatar 仅需一张图片和一段音频即可生成人物自然说话或唱歌的视频 [6] AI音频生成 - 字节跳动扣子空间推出一键文本生成播客功能可在几分钟内完成原需数小时的工作生成无机械感的"真人级"多角色对话音频 [7] - 功能应用场景广泛可将热点新闻转为播客、课程笔记变为有声课等实现多功能组合应用 [7] 3D生成技术 - SpAItial获1300万美元种子轮融资专注文本生成逼真3D环境技术团队来自Meta和谷歌 [8] - 公司瞄准游戏开发、娱乐产业和建筑可视化等场景远期目标包括取代CAD软件 [8] AI阅读助手 - 腾讯元宝接入微信读书和起点读书回答中出现的书名可点击直接跳转阅读 [9][10] - 用户可通过元宝一键获取书单推荐实现从"囤书"到"读书"的无缝衔接还能解读概念、生成思维导图 [10] 航天技术 - 星舰"九飞"使用B14 2二手助推器成功复用但在回收着陆过程中爆炸 S35飞船未完成星链卫星模拟器部署任务 [11] - 本次测试重点验证助推器复用技术及优化减配设计 SpaceX正通过新建发射台和Gigabay总装车间扩充制造发射能力 [11] AI发展趋势 - Claude Opus 4显著提升时间跨度能力可处理长期任务强化学习在大语言模型训练中奏效 [12] - 预测两年内将出现"即插即用"AI白领员工模型可解释性工作是对神经网络的逆向工程 [12]

HunyuanVideo - Avatar

HunyuanVideo - Avatar

扣子空间一键文本生成播客功能

DeepSeek R1，新升级！

第一财经· 2025-05-28 22:15

DeepSeek模型更新 - DeepSeek R1模型已完成小版本试升级用户可通过官方网页 App 小程序测试新版本 [1] - DeepSeek R1模型API接口和使用方式保持不变现有用户无需调整接入方式 [1] - DeepSeek R2模型仍处于开发阶段公司未透露具体发布时间 [1]

Founder Park· 2025-05-28 21:13

强化学习在大语言模型中的应用 - 2025年最大的变化是强化学习在语言模型训练上真正奏效通过可验证奖励的强化学习模型在竞技编程和数学领域达到专家级人类表现 [1][4][6] - 强化学习主要作用是激活模型已有知识并将其组织成解决方案而非从零学习 [4][27] - Gemini 2 5 Pro和Claude Opus 4的发布验证了这一趋势模型在长期任务和多步动作管理上表现突出 [2][31][32] 模型训练与能力提升 - 当前行业普遍采用"算力优先数据其次"的预算分配策略但未来可能转向更平衡的方式 [4][21] - 模型规模越大学习效率越高所需示范越少大模型能将不同语言表示整合在统一共享子空间中提升泛化能力 [25][26] - Opus 4最大突破是时间跨度扩展能处理数小时工作量任务而无需频繁用户介入 [31][32] 模型可解释性与安全研究 - 机制可解释性是对神经网络进行逆向工程找出其计算基本单元模型是"生长"而非"建造"出来的 [47][48] - 目前已识别出3000万个特征包括抽象概念如"代码漏洞" 并能追踪模型内部推理回路 [49][50][51] - 模型安全研究需要多管齐下包括宏观探针和微观机制分析 [52][53] AI Agent发展趋势 - 未来用户可能同时管理多个模型执行任务交互方式类似"模型舰队管理" [34][37] - 用AI操作电脑执行复杂任务并不难核心限制在于上下文和记忆系统管理 [4][5] - 预计2025年底出现能完成初级工程师一天工作量的高效软件Agent系统 [9][36] 行业竞争与技术突破 - DeepSeek在模型研发上展现出优秀"品味" 其设计体现"硬件-算法共舞"思维 [63][64] - DeepSeek从落后位置快速跃升为有力竞争者成功吸收行业效率提升红利 [61][62] - 模型发布节奏预计将远超去年 2025年进展速度明显加快 [38] 模型自我意识与沟通 - 当前模型没有哲学意义上的自我意识但能模拟特定身份和记忆 [40][42] - Agent之间可能发展出人类无法理解的Neuralese沟通方式文本渲染可隐藏信息 [75][83] - 模型已具备一定元认知能力能表达不确定性但缺乏持续身份感 [39][44] 算力与推理瓶颈 - 推理计算可能成为AGI发展瓶颈当前全球约1000万张H100等效算力 2028年或达1亿张 [84][88] - 人类思维速度约每秒10个token 一张H100每秒可处理约100个"人类思维" [86][87] - 模型规模与推理效率需平衡存在帕累托前沿最优解 [90] 模型优化方向 - 现阶段重点应是提高模型底线质量而非追求极致表现 [93][95] - 通过排除明显低质量输出来提升整体表现类似人类写作训练过程 [94] - 大语言模型被视为"雏形AGI" 因其具备对真实世界的概念性理解而AlphaZero缺乏这一基础 [97]

还在等DeepSeek R2？刚刚，DeepSeek R1模型小版本试升级已完成！优化了这些方面

每日经济新闻· 2025-05-28 21:03

DeepSeek R1模型试升级 - 公司宣布DeepSeek R1模型完成小版本试升级，用户可通过官方网页、APP、小程序测试，API接口和使用方式保持不变 [1] 升级内容 - 响应质量优化：复杂推理、多步骤计算更准确，长文理解与生成更连贯，数学、编程等专业性输出更可靠 [2] - 响应速度小幅提升：网页端、App、API接口响应更敏捷，处理超长文本输入时延迟降低约10%～20% [2] - 对话稳定性增强：上下文记忆更稳定，支持最多128K上下文，减少偶尔"遗忘设定"或"跑偏"的情况 [4] - API和接口兼容性保持稳定：API调用方式、参数、返回结构完全不变，用户无需调整现有集成 [5] 试升级原因 - 本次升级为灰度发布，部分用户优先体验，官方将收集反馈确保稳定后再全面推送 [6] - 用户使用官方App、网页或小程序时，打开"深度思考"模式可能已用上升级版本 [6] DeepSeek R2模型传闻 - 3月11日公司辟谣称"R2发布为假消息"，回应此前3月17日发布下一代R2模型的传闻 [6]

清华天才杨植麟的“理想国”，为何败给梁文锋？

凤凰网财经· 2025-05-28 20:51

核心观点 - 文章探讨了90后AI创业者杨植麟及其公司月之暗面在AI2 0时代的创业历程并与85后创业者梁文锋的DeepSeek进行对比分析两者在技术路线商业模式和市场竞争中的差异 [6][10][13][18][24][25][27][28][29] 杨植麟的背景与创业历程 - 杨植麟是90后AI创业者拥有卡耐基梅隆大学博士学位师从苹果AI负责人和谷歌首席科学家博士期间发表Transformer-XL和XLNet两篇里程碑论文引用量超22000次 [9][10] - 2023年创立月之暗面主攻AGI领域公司名称和会议室命名均源自摇滚乐队平克弗洛伊德体现其文艺青年特质 [10] - 公司成立初期获得红杉中国真格基金2亿美元融资后续获美团阿里腾讯等战投 [13] 月之暗面的技术路线与商业化尝试 - 杨植麟坚信Scaling law是模型训练的第一性原理认为扩大用户数据样本能优化模型性能 2024年3-8月投入1 4亿元广告费月活从400万增至1282万 [16][17] - 商业化尝试包括:推出付费版本(高峰优先使用权) 上线浏览器插件发布企业级API 与财新传媒合作自建内容社区等 [23][24][25] - 产品迭代缓慢团队规模保持在200人以内 2024年下半年多名算法工程师离职 [18] 与DeepSeek的竞争对比 - DeepSeek成立于2023年7月创始人梁文锋采取非主流策略拒绝外部投资保持技术专注通过多层股权结构掌握84 3%控制权 [16][25] - 技术路线:开源部分代码吸引开发者保留核心算法封闭性形成"开源引流-定制收费"模式 API价格仅为行业1/5 与云厂商深度绑定 [24][25] - 2024年1月DeepSeek R1与Kimi1 5同日发布 DeepSeek R1因推理性能突出引发轰动下载量一个月破亿 Kimi月活从3600万腰斩至1820万 [18][21][25] 行业格局与未来展望 - AI创业窗口期短巨头入场后竞争白热化百度字节阿里腾讯频繁迭代模型微软谷歌全面押注Agent [28] - 行业观点认为中国市场最终可能仅剩DeepSeek 阿里字节三家大模型提供商 [28] - 现有Transformer架构存在幻觉问题未来可能出现新架构为90后创业者提供机会 [29]

o1系列模型

DeepSeek为首届“东盟-中国-海合会峰会”谱写歌词

o1系列模型

财富FORTUNE· 2025-05-28 18:01

东盟-中国-海合会峰会 - 第一届东盟-中国-海合会峰会在马来西亚吉隆坡举行国务院总理李强与马来西亚总理安瓦尔出席开幕式晚宴 [1] - 晚宴表演由七位不同国家的女性艺术家完成包括沙特首位女歌手Dalia Mubarak和中国歌手尚雯婕 [1] - DeepSeek与人类艺术家共同创作峰会主题曲《命运共同体》通过AI生成歌词融合18个参与国的视觉素材 [1] - 与会人员对女性艺术家及中国人工智能DeepSeek的技术表现给予高度评价 [1] 相关商业活动 - 财富中文网推出2025年《财富》中国科技50强和最受赞赏的中国公司评选活动 [4][5]

虎嗅· 2025-05-28 14:01

杨植麟的学术与创业背景 - 杨植麟在卡耐基梅隆大学攻读博士学位期间发表两篇里程碑式论文Transformer-XL和XLNet 论文引用量超22000次研究成果被Google PaLM Meta LLaMA等主流产品采用 [6][7] - 创立月之暗面主攻AGI领域公司名称来源于平克弗洛伊德专辑会议室以摇滚乐队命名体现其文艺青年特质 [8] - 月之暗面创立初期获红杉中国和真格基金2亿美元融资后续获美团阿里腾讯小红书等战投 [10] 月之暗面的发展困境 - 2024年陷入股权纠纷和套现舆论漩涡循环智能股东提起仲裁诉讼要求获得月之暗面股份影响公司运营 [12][13] - 2024年3-8月Kimi广告投放达1.4亿元单月最高5000万元月活从400万升至1282万但核心人才流失且产品迭代缓慢 [15][17] - 2024年9月OpenAI推出o1系列模型后 Kimi1.5与DeepSeek R1同日发布但反响悬殊技术路线受质疑 [18][19] 行业竞争格局 - DeepSeek采用开源低价策略 API价格仅为行业1/5 通过云厂商绑定快速占领市场上线一个月下载量破亿 [27][23] - Kimi月活从2023年11月3600万腰斩至2024年3月1820万落后于DeepSeek(1.87亿) 豆包(9980万) 腾讯元宝(2358万) [29] - 行业预测中国市场最终可能仅剩DeepSeek 阿里巴巴和字节跳动三家大模型提供商 [33] 商业模式对比 - Kimi尝试ToC付费和ToB API服务但技术未形成壁垒商业化效率低 [26][27] - DeepSeek通过"开源引流定制收费"模式在金融游戏等领域实现规模化落地创始人梁文锋被视作商业实用主义者 [28][31] - 杨植麟坚持AGI长期主义认为AI是未来10-20年改变世界的机遇但商业化进程缓慢 [8][25] 行业发展趋势 - 2024年百度字节阿里腾讯频繁迭代模型微软Google全面押注Agent 加剧行业竞争 [32] - 现有Transformer架构存在幻觉问题未来可能出现新架构颠覆现有技术为创业者提供新机会 [36] - 90后创业者尚未形成成熟商业打法杨植麟曾是最接近成为新一代商业领袖的AI创业者 [32]

AGI

AGI