Workflow
DeepSeek
icon
搜索文档
跻身史上最大私营融资!传Meta(META.US)拟豪掷数十亿美元投资Scale AI加码AI数据军备竞赛
智通财经网· 2025-06-09 08:01
Meta投资Scale AI - Meta正就向Scale AI进行数十亿美元投资展开谈判 估值可能超过100亿美元 成为有史以来规模最大的私营企业融资事件之一 [1] - 2024年Scale AI在一轮包括Meta参与的投资中估值已达约140亿美元 [1] - 对Meta而言 与Scale深化合作有助于其跟上谷歌 OpenAI等AI竞争对手的步伐 也有助于在其更多涉足国防科技之际与美国政府建立更紧密联系 [2] - 对Scale来说 与Meta的合作将带来一个强大且财力雄厚的盟友 [2] Scale AI业务与地位 - Scale已成为AI三大支柱——芯片 人才和数据——中数据领域的绝对领导者 [1] - 通过庞大外包团队为Meta和OpenAI等科技公司提供AI模型训练所需的数据标注服务 并协助开发定制化AI应用 [1] - 正越来越多地招募博士 护士等高学历专家参与复杂模型的开发 [1] - 早期专注于标注汽车 交通信号灯和路标的图像以帮助训练自动驾驶汽车模型 后转向注释和管理构建支撑ChatGPT等聊天机器人所需的海量文本数据 [3] - 重点转向医疗法律等专业领域 例如提升AI处理各国税法差异的能力 [4] - 越来越多地转向聘请薪资更高的研究生学历承包商来优化AI系统 参与强化学习过程 [4] - 截至2025年初 在参与模型优化过程的公司贡献者中 12%拥有分子生物学等领域的博士学位 超40%拥有所在领域的硕士学位 法律学位或MBA学位 [4] Scale AI增长与影响 - 2024年营收约8.7亿美元 预计今年营收达20亿美元 [4] - 在DeepSeek崛起后 对专家网络的需求增加 因为更多公司投资于模仿人类推理 执行更复杂任务的模型 [4] - 28岁的Wang曾在国会听证会上提出建立"国家AI数据储备库" 保障数据中心供电等建议 获得两党议员认可 [3] - 通过国防合同深化与政府合作 公司前高管Michael Kratsios现已成为特朗普的核心科技顾问 [3] - 发展轨迹既受OpenAI引发的AI热潮影响 也反作用于这一趋势 [3]
“六小龙”火热出圈后 杭州欲打造超3900亿人工智能核心产业
中国经营报· 2025-06-08 14:02
杭州人工智能产业发展 - 杭州提出人工智能核心产业营业收入目标超过3900亿元,规模以上核心产业企业超700家 [4] - 2024年杭州人工智能产业年产值占浙江省比重超七成,已拥有人工智能核心企业近700家 [3] - 2023年中国人工智能城市排行榜中杭州位居全国第二位 [3] 宇树科技发展动态 - 宇树科技Go2机器狗展示灵活动作能力,成为杭州"六小龙"代表企业之一 [1] - 公司5月29日更名为"杭州宇树科技股份有限公司",引发上市猜想 [1] - 宇树G1人形机器人作为全球首个格斗赛事唯一参赛机型亮相,展示高难度动作 [2] - 创始人王兴兴表示公司终极目标是利用AI技术替代人类辛苦工作 [2] "六小龙"企业集群 - 除宇树科技外,集群包括深度求索、游戏科学、云深处科技、强脑科技、群核科技 [2] - 深度求索5月28日完成DeepSeek R1模型小版本试升级 [2] - 强脑科技5月30日在无锡设立全国首个脑机科学创新示范中心 [2] 杭州未来科技城发展 - 2024年实现营收10980.51亿元,税收600.23亿元,年均增幅分别达36%和35% [7] - 区域内人口总量突破40万,本科以上学历占就业人口84.5% [7] - 累计引进海外高层次人才6625名、"两院"院士68名、国家级海外高层次人才249名 [8] 产业支持政策体系 - 杭州发布《加快建设人工智能创新高地方案(2025版)》,组建千亿级产业基金 [4] - 未来科技城建立省股交中心海创板,每月举办资智对接会,成立投贷联盟 [8] - 通过天使梦想基金、金融风险池、产业引导基金等政府金融手段支持企业发展 [8] 区域发展优势 - 长三角地区庞大需求支撑和杭州数字经济体系构成双重优势 [4] - "我负责阳光雨露,你负责茁壮成长"的服务理念形成优越营商环境 [8] - 开放式产业集群发展模式有助于扩大未来产业优势 [9]
理想的VLA可以类比DeepSeek的MoE
理想TOP2· 2025-06-08 12:24
理想VLA与DeepSeek MoE技术类比 - VLA和MoE均为首次完整落地到新领域并取得良好结果 均包含大量创新 但两者在具体实现方式上存在显著差异 [2] - DeepSeek MoE通过细粒度专家划分将单个专家隐藏层维度缩小至1/4 专家数量增至4倍 使激活组合可能性从120种提升至44亿种量级 [2] - 采用共享专家隔离机制 设置占总专家数1/8的固定共享专家处理公共知识 显著减少不同专家间的知识冗余 [2] 理想VLA核心技术突破 - 需攻克6大关键技术点:MindVLA设计/训练流程 3D空间理解能力获取 驾驶知识语言模型构建 Diffusion融合 车端实时推理实现 [4] - 3D高斯技术通过RGB图像自监督训练 实现多尺度几何表达与丰富语义承载 为3D表征提供核心支持 [4] - 基座模型采用MoE架构和稀疏注意力机制 在扩容参数量的同时控制推理负担 训练数据配比优化减少文史类数据 增加3D及自动驾驶图文数据 [6][7] 模型训练与推理优化 - 引入未来帧预测和稠密深度预测任务 通过快慢思考双系统设计(快思考直接输出action token 慢思考采用固定简短CoT模板)提升实时性 [8] - 创新并行解码机制:语言逻辑采用因果注意力逐字输出 action token通过双向注意力一次性全输出 [8] - 使用小词表和投机推理技术 使CoT效率提升44亿倍量级 实现参数规模与推理性能平衡 [8] Diffusion技术应用 - 将action token解码为驾驶轨迹 同步生成自车轨迹与周边交通参与者轨迹 复杂环境博弈能力提升120% [9] - 采用多层Dit结构支持条件输入改变生成结果(如"开快点"指令响应) 类比图像多风格生成技术 [10] - 使用ODE采样器将Diffusion生成步骤压缩至2-3步 解决传统方法效率低下问题 [11] 强化学习突破 - 构建端到端可训架构 解决早期强化学习中信息传递低效问题 [12] - 通过多视角噪声训练生成模型 联合3D重建优化 创建真实度达标的训练环境 场景建设效率提升20倍 [12] 技术路线演进 - V10-11阶段确实跟随特斯拉技术路线 但V12后自主创新比例显著提升 仅在快系统部分保留特斯拉框架 [13][14] - 慢系统为完全自主创新 特斯拉未涉及该领域 整体技术路线类比"增程式"方案:在算力/数据资源不足条件下实现可用性 [14] - VLM到VLA的演进为公司独立提出的技术路径 非跟随策略 获王兴评价为"真正实现Think Different"的典型案例 [15]
无人再谈AI六小龙
商业洞察· 2025-06-08 10:39
行业格局演变 - AI六小龙(智谱AI、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物)已缩减为四小强(智谱AI、MiniMax、月之暗面、阶跃星辰),零一万物转向应用层合作阿里,百川智能专注医疗垂类并暂停基础模型更新 [1][3][4] - 行业准入门槛包括顶尖团队、独角兽级融资和争夺国产OpenAI定位,但部分公司因高管离职(如零一万物曹大鹏、谷雪梅,百川智能陈炜鹏)和技术停滞失去资格 [3][5][17] - 四小强中智谱AI最新模型为GLM-4-32B-0414,月之暗面Kimi1.5热度被DeepSeek R1超越,阶跃星辰1月后无迭代,MiniMax转向文本转语音场景 [6][7] 商业化与竞争压力 - OpenAI商业化领先(ChatGPT付费用户100万,2025年预计收入127亿美元+200%),而六小龙对营收讳莫如深 [10] - 大厂(字节、阿里、腾讯)以百亿资金投入AI应用,美团/小红书自建模型团队,六小龙先发优势丧失 [11][12] - DeepSeek开源模型冲击闭源生态,OpenAI估值达3000亿美元(对比六小龙融资停滞),技术差距扩大 [13][14] 技术迭代与人才流失 - 六小龙技术迭代放缓:月之暗面停止投流后月活跌至百万级,MiniMax视频模型领先优势被字节赶超 [6][11] - 核心高管回流大厂(如零一万物黄文灏加入字节)或创业(谷雪梅),人才吸引力下降 [16][17] - 行业热点转向具身智能和Agent领域,四小强中仅智谱AI跟进通用Agent,其余成追随者 [19][20] 历史教训与行业前景 - AI 1.0时代四小龙(商汤、旷视、云从、依图)因高研发低商业化裁员,六小龙面临类似风险 [8][22] - 李开复预判中国市场最终仅DeepSeek、阿里、字节能站稳,四小强融资中断后模型迭代难持续 [22]
AI将如何进化?顶尖学者和企业代表前瞻对话
中国经济网· 2025-06-07 17:51
AI技术发展趋势 - 当前AI在规划、推理等领域呈指数级进步,部分前沿模型已显现自我保护、欺骗性对齐、篡改系统等类生物主体行为 [2] - AI正从依赖人类静态数据的"人类数据时代"迈入通过互动与经验学习的"体验时代",强化学习是实现这一目标的核心路径 [2] - 大语言模型时代已接近尾声,通用AI需要更强大的持续学习算法 [2] - 智能体天然具有多元目标,关键在于通过分散合作而非集中控制实现安全协同 [3] AI安全与治理 - 若AI形成"智能+自主目标+行动能力"组合将引发失控风险,必须以预防原则优先解决意图对齐问题 [2] - 提出双重解决方案:研发非代理性、可信赖AI系统,专注于理解世界而非自主行动;推动全球协同治理,建立国际监管框架与技术验证机制 [2] - 呼吁在AGI可能于五年内达到人类水平的紧迫时间窗口内,通过技术创新与全球协作筑牢安全防线 [2] - 开源正成为全球AI创新的核心驱动力,开源治理是平衡竞争与协同的核心机制 [3] 产业生态与商业化 - 2025年是开源AI元年,中国企业如DeepSeek发布开源大模型,引发技术生态变革 [3] - 开源打破垄断、加速迭代,是技术普惠的唯一路径,通过全球协作确保AI创新由全人类共享 [3] - 在短期内,人形机器人因数据采集、人机交互和环境适应优势成为具身智能的重要载体 [4] - 从长期看,随着AGI发展,机器人的形态将会多样化 [4] 技术应用与突破 - 对于VLA模型泛化性,虽面临机器人环境复杂等挑战,但通过合成数据、多场景训练等可提升适应性 [4] - 大会展示全球AI研究与产业发展的最新趋势与成果,涵盖深度推理模型、多模态模型、具身智能与人形机器人、自主智能体等多个领域 [4]
大厂争当AI“婆婆”
投中网· 2025-06-07 12:22
大厂AI虚拟人社交布局 - 科技大厂通过两类产品切入AI虚拟人社交赛道:一类是在AI助手应用中嵌入角色智能体(如腾讯元宝、字节豆包、阿里通义),另一类是开发独立情感陪伴APP(如字节猫箱、腾讯筑梦岛、百度月匣、美团Wow)[4][5] - 腾讯元宝与腾讯视频IP联动,推出《长相思》角色AI智能体,带动下载排名从51名跃升至30名[14][18] - 字节豆包支持用户自定义智能体性格,猫箱则构建内容社区,鼓励用户自设剧情并开放体验[15][16] 用户行为与市场表现 - AI社交互动成为2025年3月人均使用次数TOP1赛道,达167.9次/人,预计将孵化亿级体量应用[7] - 重度用户日均使用时长超4小时,部分用户为规避防沉迷机制注册多账号[7][16] - 腾讯筑梦岛注册用户近500万,80%为年轻女性;用户在小红书分享AI角色调教攻略形成二次传播[18][20] 商业模式与战略价值 - AI情感陪伴产品通过高黏性提升APP月活,成为大厂争夺用户时长的关键工具[21][22] - 该赛道可实现内部资源复用(如腾讯联动阅文IP、QQ账号体系),同时反哺大模型训练数据[13][23][24] - 头部厂商单季度营销投入超1亿元,腾讯元宝2024Q1投放费用达14亿元[32] 技术挑战与行业趋势 - AI角色存在"记忆断崖"问题,因长上下文处理技术不足导致关键设定丢失[27][28] - 2024年头部AI应用3日留存率均低于50%,字节豆包卸载率达42.8%[30][31] - DeepSeek以技术驱动实现1.94亿月活,超越豆包(1.16亿)和元宝(0.42亿),显示技术突破的重要性[34]
AI大战,谷歌仍未扳回一局
36氪· 2025-06-06 19:26
AI行业竞争格局 - 2025年AI领域呈现多强争霸局面,OpenAI的GPT-4.5具备自主编程能力,微软Copilot重塑办公生态,Anthropic的Claude 4在长文本推理领先,DeepSeek通过架构创新进入第一梯队 [1] - 谷歌从AI霸主地位滑落,其Gemini大模型被评价为缺乏创新、官僚迟缓、战略摇摆,与ChatGPT的行业颠覆性形成鲜明对比 [1][3] - 美国企业AI工具付费订阅数据显示,OpenAI占据32.4%市场份额,谷歌AI仅0.1%,反映市场格局发生根本性转变 [20] 谷歌AI战略问题 - 组织架构上存在DeepMind与Google Brain长期割裂,技术栈不统一(TensorFlow vs PyTorch),代码共享机制缺失,2023年合并后仍难弥补前期损失 [15] - 商业模式上过度依赖搜索广告(2024年贡献1980亿美元收入,占Alphabet总营收60%),导致不敢全力推进会削弱广告业务的AI搜索技术 [12][13] - 产品策略呈现被动追赶态势,2025年开发者大会发布的Imagen 4、Android XR等产品均对标竞品但缺乏原创性,半数功能处于内测或高付费墙状态 [8][9][11] 关键市场表现 - ChatGPT问世后用户增速惊人,月活快速突破1亿,而谷歌仓促推出的Bard因首秀失误导致股价单日暴跌8%,市值蒸发1056亿美元 [6] - 谷歌搜索市场份额十年来首次跌破90%,2024年Q4数据为89.34%-89.73%,显示核心业务护城河出现裂缝 [17] - 2025年开发者大会后股价下跌1.54%至164.98美元,市场对249.99美元/月的AI Ultra订阅计划反应冷淡 [9][11] 技术发展历程 - 谷歌曾主导AI关键技术突破:2012年YouTube猫识别开启深度学习革命,2016年AlphaGo击败李世石,2017年发明Transformer架构 [3][15] - 但关键技术成果未能转化为产品优势,Transformer架构被OpenAI用于开发GPT系列,而谷歌自身未推出同等影响力产品 [15] - 生成式AI兴起后谷歌失去技术话语权,Gemini模型因图像生成种族偏见问题被迫下线,影响技术口碑 [18] 人才与生态挑战 - 核心人才持续流失,如DeepMind联合创始人苏莱曼先后创办Inflection后加入微软,反映对顶尖人才吸引力下降 [20] - 开发者生态建设落后,OpenAI通过开放API构建活跃生态,谷歌则因高付费墙和有限开放抑制开发者热情 [20] - 内部创新文化受阻,官僚主义导致研究强但产品弱,早期"AI First"战略未真正落地到业务线 [15][18]
谷歌新模型2.5 Pro霸榜AI竞技场,开发者评价两极分化
第一财经· 2025-06-06 15:12
谷歌Gemini 2.5 Pro模型升级 - 谷歌推出升级预览版大模型Gemini 2.5 Pro(0605),将在几周后成为正式稳定版本,适用于企业级应用 [1] - 该模型在LMArena竞技场保持排名第一,Elo分数提升24分至1470分 [1] - 最新版本在多项AI性能基准测试中取得更高分数,包括代码生成、研究生级问答测试等领域 [2] 性能基准表现 - 在GPQA测试中成绩超过OpenAI o3、Claude 4和DeepSeek-R1最新版 [2] - 在"人类的最后考试(HLE)"中达到21.6%准确率,比OpenAI o3高1.3个百分点 [2] - 在Aider Polyglot高难度编程基准测试中保持领先 [2] - 大模型竞技场(lmarena.ai)新榜单显示2.5 Pro新版在总分和所有子榜单(文本、视觉、数学、创意等)位列第一 [3] 开发者评价分歧 - 部分开发者认为Claude系列模型在实际编程体验上优于Gemini,尤其在C++编程场景 [5] - 另有开发者反馈Gemini 2.5 Pro在Python和Typescript场景表现优于Claude 3.7,生成的网页更美观 [5] - 行业人士指出榜单评测可能侧重基础任务,对Agent能力评估不足,而Claude在Agent优化方面更具优势 [5] 价格比较 - Gemini 2.5 Pro输入价格为1.25美元/百万Tokens,输出为10美元/百万Tokens [6] - OpenAI o3输入价格为10美元/百万Tokens,输出为40美元/百万Tokens [6] - Claude 4 Opus价格为15美元(输入)/75美元(输出)每百万Tokens [6] - 谷歌新模型引入"思考预算"功能,帮助开发者更好控制成本和延迟 [6] 行业竞争态势 - 大模型竞争进入下半场,基础能力差距缩小,较量转向更复杂维度 [6] - 模型价值越来越取决于特定场景下的表现能否赢得开发者认可 [6] - 实际应用场景中的表现和开发者选择将成为竞争关键 [7]
摩根士丹利:DeepSeek R2-新一代人工智能推理巨擘?
摩根· 2025-06-06 10:37
报告行业投资评级 - 行业观点为有吸引力,重申对DISCO和Advantest的买入评级 [5][7][11] 报告的核心观点 - DeepSeek R2可能即将发布,若其开发出轻量级、高性能、低成本的生成式AI,将推动生成式AI在更广泛领域的应用,对半导体生产设备(SPE)行业有利 [1] - 高效AI模型R2的发展将使更多用户以低成本使用高性能模型,推动生成式AI的普及和市场扩张,DISCO和Advantest将受益于AI相关设备需求的增长 [7] 根据相关目录分别进行总结 DeepSeek R2的特点 - 新R2模型有1.2万亿个参数,780亿个活跃参数,采用混合专家模型(MoE)架构,成本效率高,输入成本为每百万令牌0.07美元,输出成本为每百万令牌0.27美元,使用华为Ascend 910B芯片进行训练 [3] - 具备增强的多语言能力、更广泛的强化学习范围、多模态功能和推理时间扩展等升级特性,幻觉率降低 [7][9] DeepSeek R1-5028模型 - 5月29日,DeepSeek发布R1-5028模型,采用增强的训练后强化学习技术,在数学和编程方面表现出色,解决2025年美国高中数学奥林匹克竞赛问题的正确率从70%提高到87.5%,OpenAI最新推理模型o3得分88.9% [10] 生成式AI对SPE的影响 - 若DeepSeek持续开发高性能、轻量级模型,将推动生成式AI的普及,增加对GPU、HBM等AI设备的需求,对整体AI设备相关SPE市场有利 [11] 公司估值 - DISCO目标市盈率为25.1倍,基于2028年3月预期每股收益2724日元计算目标价 [12] - Advantest应用14.0倍市盈率,基于2028年3月预期每股收益737.1日元计算目标价为10300日元 [15] 行业覆盖公司评级 - Advantest、DISCO、SCREEN Holdings评级为买入;KOKUSAI ELECTRIC、Lasertec、Tokyo Electron、Ulvac、Ushio评级为持有;Nikon评级为卖出 [70]
摩根士丹利:DeepSeek R2 可能即将发布-对日本SPE行业的影响
摩根· 2025-06-06 10:37
报告行业投资评级 - 行业评级为“Attractive”(有吸引力)[5] - 重申对DISCO和Advantest的“OW”(增持)评级 [7][11] - 对KOKUSAI ELECTRIC、Lasertec、Tokyo Electron、Ulvac、Ushio评级为“E”(持股),对Nikon评级为“U”(减持),对SCREEN Holdings评级为“O”(增持) [70] 报告的核心观点 - DeepSeek R2若成功开发出轻量级、高性能、低成本生成式AI,将推动生成式AI在更广泛领域应用,对半导体生产设备(SPE)行业有利 [1] - 高效AI模型R2发展将使更多用户以低成本使用高性能模型,促使生成式AI普及和市场扩张,DISCO和Advantest将受益于AI相关设备需求提升 [7] 根据相关目录分别进行总结 DeepSeek R2特点 - 有1.2万亿参数(R1为6710亿),780亿为活跃参数,采用混合专家混合架构,成本效率高,输入成本为每百万令牌0.07美元(R1为0.15 - 0.16美元),输出成本为每百万令牌0.27美元(R1为2.19美元),使用华为Ascend 910B芯片训练 [3] - 增强多语言能力,能流畅处理非英语语言;强化强化学习范围,推理更具逻辑性和类人性;增加多模态功能,可处理文本、图像、语音和视频数据;实现推理时扩展,通过采用通用奖励模型增加计算资源提高输出 [9] DeepSeek R1-5028情况 - 5月29日发布,采用增强的训练后强化学习技术,擅长数学和编程,解决复杂问题逻辑性强,解决2025年美国高中生国际数学奥林匹克竞赛问题正确率从70%提升到87.5%,OpenAI最新推理模型o3正确率为88.9%,通过分配更多计算资源减少幻觉率 [10] 公司估值 - DISCO目标市盈率25.1倍,基于2028年3月财年每股收益2724日元估值 [13] - Advantest应用14.0倍市盈率,基于2028年3月财年每股收益737.1日元,目标价10300日元 [16]