DeepSeek

搜索文档
重磅!华为发布准万亿大模型
每日经济新闻· 2025-05-30 19:41
华为盘古Ultra MoE模型突破 - 公司推出参数规模高达7180亿的全新模型盘古Ultra MoE,实现全流程在昇腾AI计算平台训练的准万亿MoE模型 [1] - 披露模型架构和训练方法技术报告,体现昇腾在超大规模MoE训练性能上的跨越 [1] - 针对训练稳定性难题,团队创新设计Depth-Scaled Sandwich-Norm架构和TinyInit小初始化方法,实现18TB数据长期稳定训练 [4] - 采用EP loss负载优化方法保证专家间负载均衡并提升领域特化能力,结合MLA/MTP架构及Dropless策略实现效果与效率平衡 [4] 昇腾平台技术进展 - 在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习后训练框架关键技术,使RL后训练进入超节点集群时代 [5] - 通过自适应流水掩盖策略、算子优化、内存管理等技术迭代,万卡集群预训练MFU从30%提升至41% [5] - 盘古Pro MoE模型以720亿参数量实现媲美千亿级模型的性能,在SuperCLUE榜单中位列千亿级以内国内并列第一 [5] 国产AI全栈自主可控意义 - 实现国产算力+国产模型全流程自主可控训练实践,集群训练系统性能达业界领先水平 [3] - 证明昇腾平台可高效稳定训练国际顶尖水平超大规模稀疏模型,完成从硬件到软件的全栈国产化闭环 [6] 其他国产大模型动态 - DeepSeek-R1-0528模型开源,代码能力媲美OpenAI o3高版本,上下文长度扩展至128k且文本理解能力显著提升 [7] - 腾讯在AI产业应用峰会展示混元大模型矩阵升级,涵盖云基础设施、开发工具及场景应用,推动企业AI化转型 [7][8]
张宇昕:华为云加速行业智能化,繁荣欧洲市场AI生态
新浪财经· 2025-05-30 19:15
华为云全球战略 - 公司以AI助力工业升级为重点,支持各行各业数字化转型和智能化升级 [1][3] - 全球策略聚焦服务于工业企业,帮助制造业提升竞争力 [3] - 海外战略与中国市场发展相辅相成,支持中资制造型企业海外拓展 [3] 欧洲市场布局 - 在欧洲构建AI生态系统,开展学术协同、云生态布局和客户拓展三方面合作 [4][8] - 与欧洲高校及科研机构在人工智能、数据交换、数据安全领域开展学术合作 [4][8] - 通过华为云拓展开发者生态,吸引开发者使用AI技术 [4][8] - 技术应用于欧洲各行各业,通过落地完善生态体系 [4][8] AI技术应用案例 - 盘古气象大模型与欧洲气象局合作,实现台风预测效率提升 [5][11] - 传统预测需3000台HPC服务器计算3-5小时,AI技术仅需1张AI卡10秒完成 [5][11] - 预测精确度显著提升,与实际台风路径几乎完全吻合 [5][11] - 研究成果发表于《自然》正刊,成为首个登上该刊的中国科技公司 [5] - 技术已在国内外气象局商用 [5] 制药行业应用 - AI技术用于分子分析和筛选,大幅缩短药物研发周期 [13][14] - 传统研发需10年,AI技术可缩短至1-2年甚至几个月 [13][14] - 与国内外生物科技企业和研究机构开展合作 [15] 欧洲市场机会 - 欧洲多语言文化环境需要定制化大模型解决方案 [10] - 传统工业行业(生物制药、交通运输、航空航天等)数据经验可转化为AI价值 [10] - 企业有强烈诉求通过AI发挥历史数据价值 [10] 绿色能源布局 - 在可再生能源和清洁能源领域早有布局 [16] - 数字能源技术应用于欧洲数据中心,提升绿色节能效果 [16] - 提供新能源技术和设备解决方案 [16]
DeepSeek再出手!R1升级版性能大提升,美国对手慌了?
金十数据· 2025-05-30 11:52
模型升级内容 - 公司完成DeepSeek R1模型小版本升级 主要强化语义理解精准性 复杂逻辑推理能力 长文本处理稳定性 [1] - 网友测评显示模型理解能力显著提升 激活参数部分可制作交互动画展示 关键信息逻辑更清晰 [1] - 编程能力大幅提升 可一次性生成1000多行无错误代码 性能接近Claude 4 [1] - Hugging Face研究员指出升级后模型在减少幻觉方面有重大改进 显示与顶级模型竞争实力 [1] 模型性能对比 - DeepSeek-V3-0324模型在数学 代码类评测集上超越GPT-4 5和Claude-3 7-Sonnet [1] - V3模型性价比极高 输入价格为Claude-3 7-Sonnet的1/11 GPT-4 5的1/277 且开源可免费商用 [1] - R1-0528版本在LiveCodeBench代码生成排行榜中略低于OpenAI o4 mini和o3推理模型 但超过xAI Grok 3 mini和阿里巴巴Qwen 3 [2] 市场影响 - R1模型1月发布时因多项指标优于西方竞争对手引发全球关注 导致科技股暴跌 [2] - V3模型发布后市场热度下降 焦点转向未发布的R2模型 [2] - R1-0528版本发布再次引发全球媒体关注 被指加剧与OpenAI等美国竞争对手的竞争 [2] - 低成本高性能R1模型推动中国科技股上涨 显示市场对中国AI能力的乐观预期 [2] 未来产品规划 - R2模型预计采用混合专家模型(MoE) 参数量达1 2万亿 单位推理成本较GPT-4大幅降低 [2] - 公司尚未正式确认R2模型发布时间 [2]
对话傅盛:Agent杀死了传统图形界面
创业邦· 2025-05-30 11:34
大模型竞争格局 - DeepSeek-R1模型上线彻底改变国内大模型竞争格局,开源、低成本特性迫使"大模型六小虎"调整策略甚至放弃基础模型研发[5] - 基础大模型已如水电般普及,未来领域将只剩少数玩家,应用公司将成为主流[5][11] - 顶级大模型能力差别在3~6个月之间,模型更新速度极快导致技术优势难以持续[15] 创业策略与商业模式 - 创业公司应聚焦场景优先和数据为王,而非迷信通用大模型[4] - 大模型本身缺乏商业模式,初创公司难以长期坚持,除非像OpenAI获得特殊支持[13] - DeepSeek并非典型创业公司,其母公司幻方具备充足资金、数据和算力支持[14] 应用开发趋势 - 用户体验成为最核心指标,应用开发者应更关注用户需求而非底层技术[16] - 开发范式转向以大模型为核心,Agent框架让应用更贴近用户需求[25] - 应用开发思路类似互联网早期,强调快速实现和小步快跑[25][26] 机器人产业发展 - 人形机器人短期内难以产业化,实验室探索可行但落地需聚焦实用场景[5] - 机器人发展分三阶段:基础移动能力(3-5年)、加装手臂(再3-5年)、双足结构(遥遥无期)[34][35] - 机器人产品需跨越从Demo到稳定可复制产品的三大鸿沟,每个阶段可能耗时数年[36] AI技术应用实践 - 全员AI转型成为趋势,组织需调整考核体系和岗位设置以适应新技术[40][42] - AI特种兵模式兴起,非技术人员可通过AI工具快速完成编程等复杂任务[40] - 技术最内核部分往往变成公用基础设施,商业价值体现在应用层面[13] 全球化视野 - 中国科技企业国际声望提升,应用开发能力在全球具备明显优势[8][9] - 创业者应多关注硅谷生态和GitHub创新,结合中国执行力实现软件出海[44][46] - 硬件出海是中国公司的重要机会,需重视合作伙伴关系[47]
AI浪潮录丨王晟:谋求窗口期,AI初创公司不要跟巨头抢地盘
贝壳财经· 2025-05-30 10:59
北京AI产业发展 - 北京正成为AI大模型领域的战略高地,汇聚了智源研究院的"悟道"大模型、月之暗面、智谱等人工智能独角兽 [1] - 北京积极打造"全球开源之都",开源技术已深入汽车、机器人等行业 [1] - 在北京市科委和中关村管委会支持下,新京报AI研究院推出"AI浪潮录"专栏,深度访谈AI浪潮亲历者 [1] 投资人视角 - 天使投资人是AI初创企业迈出"第一步"的关键支持者,英诺基金较早关注生成式模型潜力,2022年6月投资了深言科技 [4][5][6] - 投资人更青睐有经验的创始人,如深言科技的岂凡超团队虽有技术实力,但融资竞争力不如王小川、王慧文等有创业经历者 [12] - 过半投资项目为"水下"项目,不投资完全市场化、公开化的路演项目 [14] AI大模型发展历程 - 2013年以CV和自动驾驶为主导的第一波AI浪潮,2018-2019年"AI四小龙"经历高峰与低谷 [7] - 2018年BERT出现,大幅提升NLP能力,Transformer架构提供多元化能力 [7] - 2020年OpenAI发布GPT3和Diffusion模型,显示AI多维爆发潜力,新时代到来 [8] - 2021年底国内除百度和阿里外,仅智源研究院关注大模型方向 [8] 创业者特点 - 当前AI大模型创业者多为科学家或"技术大牛",圈子收敛,属于科学共同体 [18] - 学术能力和科研能力是基本保障,高技术壁垒要求创业者是学界或行业翘楚 [16] - 高校技术基因影响创业,清华和浙大创业文化最踊跃,哈工大技术强但创业者较少 [16] 投资策略 - 天使基金偏向长期主义,关注公司创新力度和生产力提升,接受企业长期亏损 [21] - 体系化布局产业链上下游,如机器人领域投资机器人公司、供应链公司和场景化公司 [22] - 2024年投资重点是Agent(智能体),DeepSeek验证了推理模型前景 [23] 行业趋势 - Llama开源缩短了大模型研发差距,使创造新模型不再困难 [13] - 大模型训练从"暴力美学"转向细致工程化,"用钱换能力"路径失效 [26] - 初创公司应避免在超级共识形成后做无窗口期的事,不要试图占领巨头地盘 [27][28] - 产业在推动AI技术范式上的作用增强,论文数量和质量超过学界 [20]
曝追觅管理层质疑员工工作时长:员工价值需达雇佣成本15倍;Labubu暂停在英销售;百度回应支付李彦宏私人飞机费用丨邦早报
创业邦· 2025-05-30 07:57
哪吒汽车 - 哪吒汽车上海总部大楼logo被拆,公司回应因场地到期即将搬家 [3] - 此前传闻logo花费高达5亿元,前CEO张勇澄清LOGO设计费不超过100万元,5亿元包含公章、logo及国内外渠道改造费用 [3] - 哪吒汽车欠供应商总款项约60亿元,"债转股"方案仅化解20亿出头债务,剩余几亿元未解决 [3] - 有投资方提出保住哪吒的条件是罢免创始人方运舟 [3] 泡泡玛特 - 泡泡玛特旗下IP"Labubu"因需求火爆在英国引发斗殴事件,公司已暂停Labubu在英销售并计划6月前全面下架 [5] 宇树科技 - 宇树科技更名为"股份有限公司",公司称系常规运营变更 [6] 特斯拉 - 马斯克宣布将于6月交付Model Y自动驾驶车型,已在奥斯汀公共道路完成无驾驶员测试 [6] 创投行业 - 2025福布斯Midas List发布,红杉中国沈南鹏位列全球第四,是前十名中唯一中国投资人 [8] - 沈南鹏曾4度登顶Midas List榜首,其中2018-2020年蝉联 [8] - 五源资本刘芹排名第12位,源码资本曹毅排名第29位 [8] 追觅科技 - 追觅管理层质疑深圳员工工作时长,称行业标准是员工创造价值需达雇佣成本15倍以上 [9] 影石创新 - 影石创新员工年龄结构:40岁以上占3.92%,30-39岁占40.63%,18-29岁占55.44% [9] 英伟达 - 英伟达CEO黄仁勋计划出售至多600万股股票,按当前股价计算价值约8.09亿美元 [9] 百度 - 百度回应支付李彦宏私人飞机费用,称2019-2024年费用经董事会批准且按市场标准计算 [10] 抖音集团 - 抖音集团调整短剧相关BD团队,成立短剧版权中心统一管理内容供给 [10] 小米汽车 - 前一汽南京CTO陈光加入小米汽车任辅助驾驶感知负责人 [11] DeepSeek - DeepSeek开源新版R1 0528版本,性能媲美OpenAI最高o3模型 [11] OpenAI - OpenAI将加大对亚洲投资,正在开发一系列开源模型 [11] 理想汽车 - 理想汽车2025年Q1营收259亿元,同比增长1.1%,经调净利润10亿元 [11] 英伟达财报 - 英伟达第一财季营收441亿美元同比增长69%,净利润187.8亿美元同比增长26% [16] - 英伟达预计第二财季收入450亿美元上下浮动2% [16] Meta - Meta计划增设实体零售店销售智能眼镜等硬件产品 [16] Humain - 沙特AI公司Humain寻求美国科技公司投资,其风投基金初始资金100亿美元 [16] xAI - xAI与Telegram达成3亿美元合作协议,部署Grok聊天机器人 [16] Anthropic - Netflix联合创始人哈斯廷斯加入Anthropic董事会 [20] 融资动态 - 浩博医药完成5000万美元B+轮融资 [20] - 坦途科技完成数亿元B轮融资 [20] - Chalk完成5000万美元A轮融资,估值5亿美元 [20] 快手 - 快手可灵AI上线2.1系列模型,1080p视频生成时间不到1分钟 [20] 机器人 - 零次方发布轮式人形机器人Zerith-H1,搭载垂直场景操作基础模型 [22] - 傲意科技推出第二代灵巧手ROH-AP001和小型机器人专用灵巧手ROH-LiteS [24][25] 大疆 - 大疆计划7月发布首款消费级全景相机DJI Osmo 360 [24] 政策支持 - 北京支持制造业企业部署具身智能机器人,最高支持3000万元 [27] 新能源汽车 - 2025年1-4月中国占世界新能源车份额68%,自主海外新能源份额12% [27] 智能手机 - 2025年Q1中东非洲智能手机出货量增长7%,传音、三星、小米分列前三 [27][28]
OpenAI称将加大对亚洲的投资;DeepSeek开源新版R1,媲美OpenAI最高o3模型丨AIGC日报
创业邦· 2025-05-30 07:57
人工智能行业动态 - OpenAI牵头一批美国科技巨头在阿布扎比建设全球最大人工智能数据中心之一 马斯克试图阻止该交易 除非其人工智能初创公司参与[1] - 英伟达CEO黄仁勋表示中国500亿美元人工智能市场对美国产业关闭 中国拥有全球一半人工智能研究人员 是全球最大市场之一 也是全球成功的跳板[2] - DeepSeek开源新版R1 0528版本 性能媲美OpenAI最新o3模型高版本 风格与o3相似[3] - Netflix联合创始人哈斯廷斯加入AI创企Anthropic董事会 并向鲍登学院捐赠5000万美元用于AI与人类研究项目 探讨AI对工作、人际关系和教育的影响[4] - OpenAI首席战略官表示将加大对亚洲投资 继韩国和日本后对亚洲增长前景乐观 正在开发市场领先的开源模型 视DeepSeek等竞争为提升实力的机遇[5] 行业资源与会员服务 - 提供人形机器人、商业航天、AGI等热门赛道行业图谱和报告 活动期间加入会员可免费获赠产业日报[2]
宇树科技从有限公司变更为股份公司;DeepSeek开源新版R1模型丨数智早参
每日经济新闻· 2025-05-30 07:24
宇树科技公司变更 - 宇树科技从有限公司变更为股份有限公司 公司名称由"杭州宇树科技有限公司"变更为"杭州宇树科技股份有限公司" 原业务和合同继续有效 [1] - 股份制架构有望提升资本实力和运营效率 新架构可能带来更灵活的运营机制和更高效的治理结构 为科技领域发展提供新动力 [1] DeepSeek开源R1模型 - DeepSeek开源R1最新0528版本 新版本性能媲美OpenAI o3高版本 风格测试结果与o3相似 [2] - 开源促进技术交流与生态发展 为开发者提供更多选择和创新机会 但需平衡开源与商业利益 [2] 英伟达第一财季业绩 - 英伟达第一财季营收441亿美元 同比增长69% 超出市场预期的432 9亿美元 数据中心收入391亿美元 同比增长73% [3] - 第一财季净利润187 8亿美元 同比增长26% 公司预计第二财季收入在450亿美元上下浮动2% 略低于分析师预期的455亿美元 [3]
DeepSeek-R1 重磅更新:幻觉降低近 50%,深度思考、推理能力提升
Founder Park· 2025-05-29 22:53
DeepSeek-R1-0528 模型升级 - 最新版本 DeepSeek-R1-0528 参数量高达 6850 亿,思维深度和推理能力显著提升 [1] - 模型在数学、编程与通用逻辑等多个基准测评中表现亮眼,整体表现接近 OpenAI o3 与 Gemini-2.5-Pro [1][6] - 在 AIME 2024 数学竞赛 pass@1 中得分 91.4,接近 OpenAI o3 的 91.6 和 Gemini-2.5-Pro 的 90.8 [2][7] 基准测试表现 - AIME 2025 数学竞赛 pass@1 得分 87.5,较旧版提升 17.5 个百分点(旧版 70.0)[8] - GPQA Diamond 科学测试 pass@1 得分 81.0,与 Gemini-2.5-Pro 的 83.0 接近 [2][7] - LiveCodeBench 代码生成 pass@1 得分 73.3,优于 Gemini-2.5-Pro 的 71.8 [2][7] - Humanity's Last Exam 推理与百科知识 pass@1 得分 17.7,优于 Qwen3-235B 的 11.75 [2][7] 模型优化与能力提升 - 幻觉率降低 45~50%,在改写润色、总结摘要、阅读理解等场景表现更可靠 [3][13] - 在 AIME 2025 测试中,新版模型每题使用 23K tokens(旧版 12K),思维深度显著增强 [8] - 创意写作能力优化,可输出更长篇幅、结构更完整的议论文、小说、散文 [13] - 支持工具调用,Tau-Bench 测评成绩为 airline 53.5% / retail 63.9%,与 OpenAI o1-high 相当 [12] 模型开源与 API 更新 - 开源 DeepSeek-R1-0528 模型权重,提供 Model Scope 和 Huggingface 下载链接 [16][17] - API 同步更新,支持 Function Calling 和 JsonOutput,调用方式不变 [17] - 蒸馏 DeepSeek-R1-0528 的思维链训练出 8B 模型,AIME 2024 测试表现超越 Qwen3-8B(+10.0%)[8][10] 应用与生态 - 模型已在网页端、APP 和小程序上线,用户可通过「深度思考」功能体验 [4] - 在前端代码生成、角色扮演等领域能力均有更新和提升 [15]
DeepSeekR1幻觉率最高降低50%,用户喊话想要R2模型
第一财经· 2025-05-29 22:10
模型性能提升 - 更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得国内领先成绩,接近国际顶尖模型如o3与Gemini-2 5-Pro [4] - 新版模型在AIME 2025数学测试中准确率从旧版70%提升至87 5% [18] - 代码能力显著提升,在Live CodeBench平台性能媲美OpenAI的o3-high模型 [18] 幻觉问题优化 - 新版R1模型在改写润色、总结摘要、阅读理解等场景中幻觉率降低45%-50%,此前旧版幻觉率为21% [4][18] - SuperCLUE测评显示推理模型平均幻觉率为22 95%,非推理模型为13 52% [18] 文本生成能力 - 针对议论文、小说、散文等文体优化,能输出篇幅更长、结构更完整的长篇作品,写作风格更贴近人类偏好 [18] - 深度思考能力与创意写作能力得到强化 [1] 技术细节与开源策略 - 新模型参数为685B,开源版本上下文长度128K(网页端/App/API提供64K),仍采用MIT License允许商用与二次训练 [19] - 基于DeepSeek V3 Base模型基座,后训练投入更多算力提升思维深度与推理能力 [18] 行业动态与用户反馈 - 用户对下一代R2模型期待强烈,X平台评论区出现"We want R2"呼声 [19] - 业界猜测R1更新可能延迟R2发布,或与基准测试未超越OpenAI o3有关 [19] - 海内外基座模型竞争持续,DeepSeek更新后行业关注下一家突破者 [19]