Workflow
DeepSeek
icon
搜索文档
DeepSeek开源新版R1,媲美OpenAI o3模型;英伟达Q1营收441亿美元,超预期 丨全球科技早参
每日经济新闻· 2025-05-29 07:57
DeepSeek开源新版R1 - DeepSeek开源R1最新0528版本 性能可媲美OpenAI o3模型高版本 [2] - 著名代码测试平台Live CodeBench验证其性能 预计很快会放出模型卡介绍更多功能 [2] - 该版本表明DeepSeek在技术上取得显著进步 未来有望在AI领域占据更重要的地位 [2] OpenAI重组计划 - OpenAI首席财务官表示重组计划为未来可能的IPO奠定基础 [3] - 是否推进IPO取决于公开市场状况及公司自身准备程度 [3] - 去年12月公布重组计划 拟转型为公益企业以吸引更多投资并摆脱非营利架构限制 [3] 特斯拉Robotaxi服务 - 特斯拉或于6月12日在得克萨斯州奥斯汀推出无人驾驶出租车服务 [4] - 该服务是马斯克围绕无人驾驶汽车和人工智能重塑公司业务的重要里程碑 [4] - 推出日期已在内部讨论过 但仍可能发生变动 [4] 苹果操作系统重命名 - 苹果计划从今年开始所有操作系统统一采用年份标识 [5] - 当前iOS 18将直接跳跃至"iOS 26" 其他操作系统版本也将同步更新 [5] - 预计在6月9日全球开发者大会上正式宣布这一变革 [5] 英伟达Q1业绩 - 英伟达2026财年Q1营收441亿美元 同比增长69% 超出分析师预期的4329亿美元 [6] - 业绩表现受到美国政府出口限制压力 但整体好于预期 [6] - CEO黄仁勋强调中国是全球最大人工智能市场之一 赢得中国平台将引领全球 [6]
DeepSeek开源新版R1,媲美OpenAI最高o3模型
快讯· 2025-05-29 05:41
开源大模型性能比较 - DeepSeek开源了R1最新0528版本,未提供详细说明但已开放模型 [1] - 在Live CodeBench测试中,DeepSeek-R1-0528的Pass@1得分为73.1,接近OpenAI的o3高版本(75.8)[1] - DeepSeek-R1-0528在Easy-Pass@1测试中得分为98.7,略低于04-Mini高版本的99.1 [1] 模型性能排名 - 04-Mini高版本以80.2的Pass@1得分排名第一,03高版本以75.8排名第二 [1] - DeepSeek-R1-0528以73.1的Pass@1得分排名第四,高于Grok-3-Mini高版本(66.7)[1] - Qwen3-235B-A22B和Gemini-2.5-Flash-Preview分别以65.9和60.6的Pass@1得分排名第八和第十 [1]
英伟达发布财报之前 DeepSeek版本升级
中国基金报· 2025-05-28 23:12
据用户反馈,DeepSeek升级后的模型,思维链 (CoT) 的行为似乎发生了显著变化。 大家好,关注一下DeepSeek的最新消息! 5月28日,DeepSeek官方宣布DeepSeek R1模型已完成小版本试升级,欢迎前往官方网页、APP、小程序测试(打开深度思考),API 接口和使用方式保持 不变。 据DeepSeek小助手在官方微信群中的发言,DeepSeek已完成一次"小版本试升级"的操作,并通知用户可以开始测试。但公司未披露此次升级的具体细节。 这家总部位于杭州的初创企业在今年1月震惊了全球科技行业,当时他们发布了原始版本的R1模型,在多个标准化评测中超越了西方同行,据称研发成本 仅为数百万美元。这一消息引发全球科技股大幅波动,投资者开始质疑大型科技公司是否还需要投入巨额资金来构建AI服务。 R1模型的首次亮相,使其创始人梁文锋一跃成为科技界的明星人物,也成为中国有能力与硅谷顶尖公司竞争的象征。这一发布同时引发了新一轮人工智 能模型竞赛。 DeepSeek的本次升级是在英伟达发布最新财报前数小时宣布的。作为全球领先的AI芯片制造商,英伟达的股价在1月因R1的发布而遭遇重挫。 也有用户总结了更新后的 ...
腾讯研究院AI速递 20250529
腾讯研究院· 2025-05-28 23:06
云计算与SaaS - Salesforce以80亿美元收购云数据管理龙头Informatica 为其自2021年收购Slack后最大交易 [1] - 此次收购将整合双方AI引擎 打造可信数据基础架构 支持代理式AI系统的企业级部署 [1] - 数据管理能力成为企业AI产品的关键差异化优势 Salesforce通过收购完善其数据管理领域布局 [1] AI模型升级 - DeepSeek R1模型完成小版本升级 编程能力有明显增强 能快速生成高质量的动态天气卡片 [2] - 此次更新可能采用DeepSeek-V3-0324模型 参数达685B 而R2版本仍未发布 [2] AI语音交互 - Anthropic推出Claude语音模式 支持五种音色选择 用户可通过语音讨论文档和图片 [3] - 功能支持文本与语音自由切换 对话结束后可查看文字记录和摘要 但语音对话计入常规使用上限 [3] AI视频技术 - AKOOL发布全球首款实时摄像头AKOOL Live Camera 实现虚拟数字人、多语言翻译等功能 94%盲测无法区分真假 [4] - 该产品通过4D面部映射、神经语音引擎等技术实现环境感知和情感响应 标志AI视频进入"智能化响应"时代 [4][5] - 腾讯混元开源语音数字人模型HunyuanVideo-Avatar 仅需一张图片和一段音频即可生成人物自然说话或唱歌的视频 [6] AI音频生成 - 字节跳动扣子空间推出一键文本生成播客功能 可在几分钟内完成原需数小时的工作 生成无机械感的"真人级"多角色对话音频 [7] - 功能应用场景广泛 可将热点新闻转为播客、课程笔记变为有声课等 实现多功能组合应用 [7] 3D生成技术 - SpAItial获1300万美元种子轮融资 专注文本生成逼真3D环境技术 团队来自Meta和谷歌 [8] - 公司瞄准游戏开发、娱乐产业和建筑可视化等场景 远期目标包括取代CAD软件 [8] AI阅读助手 - 腾讯元宝接入微信读书和起点读书 回答中出现的书名可点击直接跳转阅读 [9][10] - 用户可通过元宝一键获取书单推荐 实现从"囤书"到"读书"的无缝衔接 还能解读概念、生成思维导图 [10] 航天技术 - 星舰"九飞"使用B14 2二手助推器成功复用 但在回收着陆过程中爆炸 S35飞船未完成星链卫星模拟器部署任务 [11] - 本次测试重点验证助推器复用技术及优化减配设计 SpaceX正通过新建发射台和Gigabay总装车间扩充制造发射能力 [11] AI发展趋势 - Claude Opus 4显著提升时间跨度能力 可处理长期任务 强化学习在大语言模型训练中奏效 [12] - 预测两年内将出现"即插即用"AI白领员工 模型可解释性工作是对神经网络的逆向工程 [12]
DeepSeek R1,新升级!
第一财经· 2025-05-28 22:15
DeepSeek模型更新 - DeepSeek R1模型已完成小版本试升级 用户可通过官方网页 App 小程序测试新版本 [1] - DeepSeek R1模型API接口和使用方式保持不变 现有用户无需调整接入方式 [1] - DeepSeek R2模型仍处于开发阶段 公司未透露具体发布时间 [1]
Claude 4 核心成员访谈:提升 Agent 独立工作能力,强化模型长程任务能力是关键
Founder Park· 2025-05-28 21:13
强化学习在大语言模型中的应用 - 2025年最大的变化是强化学习在语言模型训练上真正奏效 通过可验证奖励的强化学习 模型在竞技编程和数学领域达到专家级人类表现 [1][4][6] - 强化学习主要作用是激活模型已有知识并将其组织成解决方案 而非从零学习 [4][27] - Gemini 2 5 Pro和Claude Opus 4的发布验证了这一趋势 模型在长期任务和多步动作管理上表现突出 [2][31][32] 模型训练与能力提升 - 当前行业普遍采用"算力优先 数据其次"的预算分配策略 但未来可能转向更平衡的方式 [4][21] - 模型规模越大学习效率越高 所需示范越少 大模型能将不同语言表示整合在统一共享子空间中提升泛化能力 [25][26] - Opus 4最大突破是时间跨度扩展 能处理数小时工作量任务而无需频繁用户介入 [31][32] 模型可解释性与安全研究 - 机制可解释性是对神经网络进行逆向工程 找出其计算基本单元 模型是"生长"而非"建造"出来的 [47][48] - 目前已识别出3000万个特征 包括抽象概念如"代码漏洞" 并能追踪模型内部推理回路 [49][50][51] - 模型安全研究需要多管齐下 包括宏观探针和微观机制分析 [52][53] AI Agent发展趋势 - 未来用户可能同时管理多个模型执行任务 交互方式类似"模型舰队管理" [34][37] - 用AI操作电脑执行复杂任务并不难 核心限制在于上下文和记忆系统管理 [4][5] - 预计2025年底出现能完成初级工程师一天工作量的高效软件Agent系统 [9][36] 行业竞争与技术突破 - DeepSeek在模型研发上展现出优秀"品味" 其设计体现"硬件-算法共舞"思维 [63][64] - DeepSeek从落后位置快速跃升为有力竞争者 成功吸收行业效率提升红利 [61][62] - 模型发布节奏预计将远超去年 2025年进展速度明显加快 [38] 模型自我意识与沟通 - 当前模型没有哲学意义上的自我意识 但能模拟特定身份和记忆 [40][42] - Agent之间可能发展出人类无法理解的Neuralese沟通方式 文本渲染可隐藏信息 [75][83] - 模型已具备一定元认知能力 能表达不确定性 但缺乏持续身份感 [39][44] 算力与推理瓶颈 - 推理计算可能成为AGI发展瓶颈 当前全球约1000万张H100等效算力 2028年或达1亿张 [84][88] - 人类思维速度约每秒10个token 一张H100每秒可处理约100个"人类思维" [86][87] - 模型规模与推理效率需平衡 存在帕累托前沿最优解 [90] 模型优化方向 - 现阶段重点应是提高模型底线质量 而非追求极致表现 [93][95] - 通过排除明显低质量输出来提升整体表现 类似人类写作训练过程 [94] - 大语言模型被视为"雏形AGI" 因其具备对真实世界的概念性理解 而AlphaZero缺乏这一基础 [97]
还在等DeepSeek R2?刚刚,DeepSeek R1模型小版本试升级已完成!优化了这些方面
每日经济新闻· 2025-05-28 21:03
DeepSeek R1模型试升级 - 公司宣布DeepSeek R1模型完成小版本试升级,用户可通过官方网页、APP、小程序测试,API接口和使用方式保持不变 [1] 升级内容 - 响应质量优化:复杂推理、多步骤计算更准确,长文理解与生成更连贯,数学、编程等专业性输出更可靠 [2] - 响应速度小幅提升:网页端、App、API接口响应更敏捷,处理超长文本输入时延迟降低约10%~20% [2] - 对话稳定性增强:上下文记忆更稳定,支持最多128K上下文,减少偶尔"遗忘设定"或"跑偏"的情况 [4] - API和接口兼容性保持稳定:API调用方式、参数、返回结构完全不变,用户无需调整现有集成 [5] 试升级原因 - 本次升级为灰度发布,部分用户优先体验,官方将收集反馈确保稳定后再全面推送 [6] - 用户使用官方App、网页或小程序时,打开"深度思考"模式可能已用上升级版本 [6] DeepSeek R2模型传闻 - 3月11日公司辟谣称"R2发布为假消息",回应此前3月17日发布下一代R2模型的传闻 [6]
清华天才杨植麟的“理想国”,为何败给梁文锋?
凤凰网财经· 2025-05-28 20:51
核心观点 - 文章探讨了90后AI创业者杨植麟及其公司月之暗面在AI2 0时代的创业历程 并与85后创业者梁文锋的DeepSeek进行对比 分析两者在技术路线 商业模式和市场竞争中的差异 [6][10][13][18][24][25][27][28][29] 杨植麟的背景与创业历程 - 杨植麟是90后AI创业者 拥有卡耐基梅隆大学博士学位 师从苹果AI负责人和谷歌首席科学家 博士期间发表Transformer-XL和XLNet两篇里程碑论文 引用量超22000次 [9][10] - 2023年创立月之暗面 主攻AGI领域 公司名称和会议室命名均源自摇滚乐队平克弗洛伊德 体现其文艺青年特质 [10] - 公司成立初期获得红杉中国 真格基金2亿美元融资 后续获美团 阿里 腾讯等战投 [13] 月之暗面的技术路线与商业化尝试 - 杨植麟坚信Scaling law是模型训练的第一性原理 认为扩大用户数据样本能优化模型性能 2024年3-8月投入1 4亿元广告费 月活从400万增至1282万 [16][17] - 商业化尝试包括:推出付费版本(高峰优先使用权) 上线浏览器插件 发布企业级API 与财新传媒合作 自建内容社区等 [23][24][25] - 产品迭代缓慢 团队规模保持在200人以内 2024年下半年多名算法工程师离职 [18] 与DeepSeek的竞争对比 - DeepSeek成立于2023年7月 创始人梁文锋采取非主流策略 拒绝外部投资 保持技术专注 通过多层股权结构掌握84 3%控制权 [16][25] - 技术路线:开源部分代码吸引开发者 保留核心算法封闭性 形成"开源引流-定制收费"模式 API价格仅为行业1/5 与云厂商深度绑定 [24][25] - 2024年1月DeepSeek R1与Kimi1 5同日发布 DeepSeek R1因推理性能突出引发轰动 下载量一个月破亿 Kimi月活从3600万腰斩至1820万 [18][21][25] 行业格局与未来展望 - AI创业窗口期短 巨头入场后竞争白热化 百度 字节 阿里 腾讯频繁迭代模型 微软 谷歌全面押注Agent [28] - 行业观点认为中国市场最终可能仅剩DeepSeek 阿里 字节三家大模型提供商 [28] - 现有Transformer架构存在幻觉问题 未来可能出现新架构 为90后创业者提供机会 [29]
DeepSeek为首届“东盟-中国-海合会峰会”谱写歌词
财富FORTUNE· 2025-05-28 18:01
东盟-中国-海合会峰会 - 第一届东盟-中国-海合会峰会在马来西亚吉隆坡举行 国务院总理李强与马来西亚总理安瓦尔出席开幕式晚宴 [1] - 晚宴表演由七位不同国家的女性艺术家完成 包括沙特首位女歌手Dalia Mubarak和中国歌手尚雯婕 [1] - DeepSeek与人类艺术家共同创作峰会主题曲《命运共同体》 通过AI生成歌词 融合18个参与国的视觉素材 [1] - 与会人员对女性艺术家及中国人工智能DeepSeek的技术表现给予高度评价 [1] 相关商业活动 - 财富中文网推出2025年《财富》中国科技50强和最受赞赏的中国公司评选活动 [4][5]
杨植麟,一个90后理想主义者的悬浮
虎嗅· 2025-05-28 14:01
杨植麟的学术与创业背景 - 杨植麟在卡耐基梅隆大学攻读博士学位期间发表两篇里程碑式论文Transformer-XL和XLNet 论文引用量超22000次 研究成果被Google PaLM Meta LLaMA等主流产品采用 [6][7] - 创立月之暗面主攻AGI领域 公司名称来源于平克弗洛伊德专辑 会议室以摇滚乐队命名 体现其文艺青年特质 [8] - 月之暗面创立初期获红杉中国和真格基金2亿美元融资 后续获美团阿里腾讯小红书等战投 [10] 月之暗面的发展困境 - 2024年陷入股权纠纷和套现舆论漩涡 循环智能股东提起仲裁诉讼要求获得月之暗面股份 影响公司运营 [12][13] - 2024年3-8月Kimi广告投放达1.4亿元 单月最高5000万元 月活从400万升至1282万 但核心人才流失且产品迭代缓慢 [15][17] - 2024年9月OpenAI推出o1系列模型后 Kimi1.5与DeepSeek R1同日发布但反响悬殊 技术路线受质疑 [18][19] 行业竞争格局 - DeepSeek采用开源低价策略 API价格仅为行业1/5 通过云厂商绑定快速占领市场 上线一个月下载量破亿 [27][23] - Kimi月活从2023年11月3600万腰斩至2024年3月1820万 落后于DeepSeek(1.87亿) 豆包(9980万) 腾讯元宝(2358万) [29] - 行业预测中国市场最终可能仅剩DeepSeek 阿里巴巴和字节跳动三家大模型提供商 [33] 商业模式对比 - Kimi尝试ToC付费和ToB API服务 但技术未形成壁垒 商业化效率低 [26][27] - DeepSeek通过"开源引流 定制收费"模式 在金融游戏等领域实现规模化落地 创始人梁文锋被视作商业实用主义者 [28][31] - 杨植麟坚持AGI长期主义 认为AI是未来10-20年改变世界的机遇 但商业化进程缓慢 [8][25] 行业发展趋势 - 2024年百度字节阿里腾讯频繁迭代模型 微软Google全面押注Agent 加剧行业竞争 [32] - 现有Transformer架构存在幻觉问题 未来可能出现新架构颠覆现有技术 为创业者提供新机会 [36] - 90后创业者尚未形成成熟商业打法 杨植麟曾是最接近成为新一代商业领袖的AI创业者 [32]