Workflow
DeepSeek
icon
搜索文档
ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题
机器之心· 2025-05-15 14:04
核心观点 - 提出新型深度思考范式PENCIL,通过交替执行「生成-擦除」机制显著提升大模型复杂推理能力 [1][3] - PENCIL在理论上实现图灵完备性,能以最优空间O(S)和时间O(T)复杂度解决所有可计算问题,传统CoT需O(T)空间导致指数爆炸 [23][24] - 实验显示PENCIL在3-SAT、QBF等NP完全问题上准确率保持≥99%,Einstein's Puzzle任务中25M小模型准确率达97%远超CoT的25% [15][21][22] 交替生成-擦除范式 - 动态擦除机制:引入[CALL][SEP][RETURN]特殊标记,按规则丢弃无用中间结果,上下文长度从数万token压缩至千级 [5][8][9] - 支持递归结构:擦除后的上下文可包含其他特殊标记,实现类似函数调用的多层嵌套 [9] - 三大应用模式:任务分解(子问题处理)、搜索回溯(无效路径清理)、摘要总结(冗长思考压缩) [13] 性能优势 - **准确率**:在n=10的SAT任务中PENCIL准确率99% vs CoT 50%,QBF任务100% vs 73% [15][16] - **计算效率**:相同FLOPs下PENCIL训练收敛速度更快,上下文长度控制在问题规模n的线性增长(O(n))而非CoT的指数级(O(exp(n))) [12][17] - **资源节省**:KV缓存复用机制使自注意力计算量减少,25M参数模型在Einstein's Puzzle上准确率提升3.88倍 [21][22] 理论突破 - 空间最优性:将图灵机模拟的上下文长度从O(T)降至O(S),尤其适合S<<T的NP完全问题(如旅行商问题) [24][25] - 实现路径:通过FASP编程语言构造「思考-总结」循环,证明固定大小Transformer可达成最优复杂度 [28] - 本质差异:传统CoT需保留完整计算历史,PENCIL通过状态摘要实现内存回收 [27]
华尔街见闻早餐FM-Radio | 2025年5月15日
华尔街见闻· 2025-05-15 07:20
市场概述 - 美股涨势疲态显现 标普惊险三连阳 道指两连跌 科技股表现强劲 英伟达涨近4% 特斯拉 AMD收涨超4% 超微电脑涨近16% [2] - 中概指数反弹超1% 腾讯财报后涨超3% 京东回落逾4% [2] - 美债收益率创一个月新高 美元两连跌后V形反弹 离岸人民币盘中跌超200点失守7.21 [2] - 原油跌落三周高位盘中跌超1% 黄金回落至一个月低位盘中跌超2% [2] - A股集体收涨 沪指重返3400点 恒科指涨超2% 国债普跌 [2] 中国宏观经济 - 4月社融增量1.16万亿元 新增人民币贷款2800亿元 M2-M1剪刀差扩大 前四个月人民币存款增加12.55万亿元 [3][9] - 七部门设立"国家创业投资引导基金" 引导资本投早投小投长期投硬科技 推动科技创新公司债券发展 [3][9] - 对美关税调整 125%→10% 24%税率暂停90天 美国撤销加征91%关税 下调小额包裹关税 [14] - 4月企业新发放贷款利率处于历史低位 部分银行消费贷款利率低于保本点 [15] 科技与互联网 - 腾讯Q1营收同比增13%达1800亿元 王者荣耀流水创新高 AI对广告游戏云业务产生实质性贡献 GPU储备充足 [3][11][12] - 鸿海Q1销售额同比增24% 净利润421亿新台币超预期 受益于关税前囤货潮及AI服务器需求 [11] - Poe报告显示DeepSeek使用率下降50% OpenAI因GPT-4o暴涨 快手Kling占据文生视频21%份额 [11] - 阿里巴巴被称中国最佳AI赋能者 动态PE仅12倍 摩根士丹利预计阿里云收入增速2026财年加速至25% [17] 新能源与高端制造 - 宁德时代赴港IPO获机构超额认购30倍 募资额或达410亿港元 成2021年后香港最大IPO [16] - 多晶硅龙头企业计划成立700亿元基金 整合过剩产能 目标将价格从3.6万元/吨提至4.5-6万元/吨 [18] - 中国企业发射12颗太空计算卫星 组成全球首个太空计算星座 节约数据中心能源成本 [17] 海外市场与公司 - 波音获卡塔尔航空210架飞机订单 总价值960亿美元 创史上最大单 波音股价涨超3%创15个月新高 [10] - 超微电脑与沙特DataVolt签200亿美元AI协议 股价盘中涨约20% [21] - 桥水Q1大买黄金ETF超3亿美元 新进京东超1亿美元 增持阿里百度 减持谷歌英伟达Meta [21] 行业趋势 - 传感器行业受益于人形机器人发展 力矩传感器存在高壁垒 国内厂商市场空间扩大 [22] - 船舶行业供需缺口明显 手持订单覆盖率3.8年 头部船厂排产至2028年后 利润迎向上拐点 [23] - 有色金属价格强势 特朗普关税政策推升通胀预期 金价中枢抬升 铜铝持续去库 [23] - 外骨骼机器人应用拓展至消费级 传感系统 控制系统 驱动系统为核心 [23] 资本市场动态 - 价值投资巨头Baillie Gifford看好字节跳动 预计有五倍回报率 警惕"填鸭式投资"危害 [16] - 小米短期订单量下降引担忧 德银指21万台电动车积压显示需求强劲 四大催化剂或推动股价反弹 [17] - 小马智行传闻赴港二次上市 创始人锁定期延长540天 股价盘前飙涨16%后收跌超4% [18]
机构密集调研50多家人形机器人产业链公司
中国证券报· 2025-05-15 05:31
机构调研人形机器人产业链 - 二季度以来390家机构调研中控技术 公司投资浙江人形机器人创新中心并发布"领航者1号"和"领航者2号NAVIAI"整机 第三代将接入DeepSeek多模态模型Janus Pro 计划在石化企业高风险场景落地应用 [1] - 208家机构调研蓝思科技 公司自2016年布局智能机器人领域 工业机器人已应用于产线 正拓展人形机器人核心部件研发 [2] - 160家机构调研富临精工 公司加快布局机器人电关节模组及零部件 智能电关节产品已小批量生产并适配主流客户 [2][3] - 37家机构调研领益智造 公司掌握伺服电机/减速器等执行层技术 已提供头部/灵巧手/四肢总成等核心硬件 [3] 商业化进展与技术突破 - 中控技术人形机器人将实现自然环境感知与人机交互 石化实验室场景成为首批落地应用方向 [1] - 领益智造具备联合开发与整机组装经验 提供从结构件到高功率充电/散热的全栈解决方案 [3] - 创世纪升级钻铣/五轴加工中心等设备 定制化产品满足关节/骨架等精密加工需求 相关收入快速增长 [4] - 安培龙完成MEMS力传感器开发 已向多家机器人客户送样 [4] 行业趋势与公司布局 - 华为/特斯拉等企业加速具身智能布局 行业确定性趋势为工业场景应用 [3] - 蓝思科技结合AI眼镜/XR头显等新领域 深化产业链合作推动场景协同 [2] - 富临精工预研智能电关节 技术人员储备与研发投入已完成前期准备 [3] - 上市公司普遍通过技术升级(创世纪)或硬件创新(安培龙)切入人形机器人赛道 [4]
梁文锋倒逼OpenAI重新Open
虎嗅APP· 2025-05-14 22:26
核心观点 - OpenAI宣布放弃完全转为营利性机构的计划,回归非营利组织控制模式,并取消对投资者的财务回报上限 [1] - 公司CEO阿尔特曼强调未来要成为"历史上规模最大、效果最佳的非营利组织" [1] - 微软作为最大投资者(注资137.5亿美元)持反对态度,但OpenAI表示将继续保持合作 [1] - 此次转型被视为对DeepSeek等竞争对手崛起的应对策略 [2][3] - 公司面临核心团队流失(初创14人中仅剩2人)和市场竞争加剧的双重挑战 [4] 公司架构转型 - 未来架构特点:非营利组织保持控制权、营利实体转为公益性公司、非营利组织作为主要股东、保持共同使命 [6] - 这是继2025年2月开放ChatGPT免注册使用、3月宣布开源推理模型后的又一非营利化举措 [6] - 转型本质是回归2015年成立时的非营利研究实验室定位 [7] - 阿尔特曼解释转型原因:当前无法满足全球AI需求,需设置使用上限 [7] 竞争格局变化 - DeepSeek-R1模型爆发引发行业震动,国内外厂商(包括亚马逊、谷歌)纷纷接入 [2] - 竞争对手动作:谷歌推出Gemini 2.5 Pro Preview(编码榜第一)、Meta发布独立AI应用 [15] - OpenAI以30亿美元收购AI编程工具商Windsurf(公司史上最大收购)应对技术短板 [15] - 行业研发投入对比:百度累计1800亿元、阿里超3000亿元、亚马逊2025年计划1000亿美元 [16] 发展历程与挑战 - 2015年成立时定位为非营利研究实验室,初始资金10亿美元迅速耗尽 [9][11] - 2019年关键转折:发布GPT-2(未开源)并接受微软投资,转向商业化 [2] - 目前估值超1500亿美元,2024年收入达37亿美元 [11] - 核心团队流失严重,与马斯克的法律纠纷持续(46页诉讼文件指控) [12] - 面临"诺基亚时刻"的转型压力,需突破大企业创新瓶颈 [13][15] 资本与行业趋势 - 软银承诺推进300亿美元投资计划支持转型 [17] - 资本行业显现对长期投入的包容态度,认可暂停商业化以保持技术领先的策略 [16] - 行业共识:AGI研发需要持续大规模投入,短期商业化可能前功尽弃 [16]
东北证券:银行或为下游最先崛起的AI应用场景
智通财经网· 2025-05-14 11:58
银行AI应用前景 - 银行有望成为国内AI落地先锋,得益于充裕的IT预算资金、市场化系统和高整合度的内部数据 [1] - 大行已在投研、客服、信贷审批等领域实现AI技术规模化应用 [1][3] - IDC预测2024-2028年全球AI解决方案支出最多的行业是银行业的金融服务,占所有AI支出的20%以上 [3] DeepSeek-R1技术突破 - DeepSeek-R1推理成本仅为对标OpenAI o1系列的1/30,推动行业进入"AI普惠化"新阶段 [1] - DeepSeek-R1在数学、代码和推理任务方面达到与OpenAI-o1相当的性能 [1] - 成本优化归功于混合专家模型(MoE)架构、多头潜在注意力(MLA)机制及数据蒸馏与强化学习的结合 [1] 2025年AI Agent发展 - 2025年为AI Agent元年,Agent成为海内外大厂竞争焦点 [2] - AI Agent有望在办公助手、客户服务、内容推荐、制造和供应链管理、个人助手等领域率先落地 [2] - 模型、数据和场景是构建AI产品竞争力的三个关键要素,其中数据最为重要 [2] 银行AI应用场景 - AI技术提升金融服务智能化程度,应用于运维、代码开发、知识库管理、监管&风控等领域 [3] - 自2023年2月开始,大行积极布局大模型业务,落地场景包括投研、客服、员工助手、辅助编码、信贷审批等 [3] 具体标的公司AI布局 - 宇信科技:产品体系全面接入DeepSeek模型,涵盖信贷、数据和营销渠道等领域,推出星辰ChatBI与知识库融合 [4] - 京北方:发布AI大模型服务平台及4个重量级产品,助力客户在智能反欺诈、智能投顾等方面实现突破 [4] - 高伟达:实现DeepSeek与信贷业务深度融合,提升授信效率&财报分析智能化,应用于智能运维等多个环节 [4] - 天阳科技:发布智能测试分析系统、监管合规大模型(400+智能模型)及智能问数平台 [4] - 神州信息:升级金融知识问答和代码助手两大Agent,推出5个新Agent,金融智能编码平台提升开发效率20% [5]
先全球禁用华为芯片,后召集美国系的AI大侠们齐聚沙特,意欲何为?
是说芯语· 2025-05-14 07:16
美国BIS新规对AI芯片的管制措施 - 美国商务部工业与安全事务副部长杰弗里·凯斯勒指示BIS停止执行拜登政府的《人工智能扩散规则》,并强调特朗普政府将与盟友推进AI技术的包容性战略[3] - BIS宣布加强针对海外AI芯片的出口管制措施,包括明确禁止全球范围内使用华为昇腾芯片,警告使用美国AI芯片训练中国AI模型的潜在后果,指导美国企业防范供应链转移风险[3] - 特朗普政府此次行动被视为贸易战和科技战的延续,可能对阿里、腾讯、字节或DeepSeek等中国科技公司采取进一步限制措施[3] 华为及国产芯片厂商的机遇 - 华为昇腾芯片在国内市场仍可正常使用,主要客户并不担心美国管制措施的影响[3] - 寒武纪、海光信息等国产芯片厂商可能迎来市场情绪利好,国内客户应把握机会提升产业地位[5] - 建议国内三大运营商等企业公开宣布采购华为芯片,明确支持国产芯片产业发展[5] 中美科技博弈态势 - 美国此次管制措施被视为针对中国制定的政治手段,实际执行难度较大[5] - 阿联酋被允许进口100万个英伟达芯片,这些芯片可能最终流向中国市场[3] - 特朗普政府采取更激进的科技限制措施,中国企业需做好被制裁准备,坚定支持国产芯片发展[5] 国际动态 - 美国总统特朗普开启第二任期首次重大国际访问,抵达沙特阿拉伯[5] - 美国主要AI企业高层集体出现在沙特,可能涉及AI领域的国际合作或竞争[5]
怎么看港股AI
2025-05-13 23:19
纪要涉及的行业和公司 - **行业**:港股AI行业 - **公司**:OpenAI、Readcloud、DeepSeek、比特硅芯、阿里巴巴、字节跳动、腾讯、小米、金山云、谷歌、三星 [7][10][13] 纪要提到的核心观点和论据 - **关注港股AI的原因**:利率政策调整使外资对港股确定性有新变化,关税落地体现中国核心资产安全边际高及经济韧性,外资关注度上升是短期资金层面关注港股AI的核心原因 [3] - **港股AI产业趋势**:行业进入拐点发展阶段,大模型逐步取代浏览器引擎成新流量入口,如苹果Siri在浏览器中搜索比例下降,搜索行为多由AI完成 [4] - **国内AI产品趋势和竞争情况**:竞争分代码能力和运行平台能力两维度,Agent需提高基础代码准确性和有良好运行平台修复代码,预计五六月份中国Agent市场爆发,关注DeepSeek模型能力突破 [6] - **大模型公司发展方向及影响**:大模型赛道全面开放,OpenAI综合发展,Readcloud专注代码生成领先Agent,DeepSeek主攻AGI,若2025年底发布R2模型,有望追赶Readcloud并推动中国AI发展 [7] - **AGI与AIGC公司逻辑框架**:AGI公司逻辑框架含规划和执行能力,Readcloud提升执行能力,比特硅芯重视规划能力,DeepSeek的R2模型若开源,将加速中国互联网公司在AI领域进步 [8] - **未来中国AI行业关注发展**:六月底或迎DeepSeek时刻,R2模型开源推动中国Agent领域发展,关注五六月份国内公司是否推出大规模AI产品或面向C端产品,推动行业整体布局和技术创新 [9] - **国内主要科技公司C端AI产品发展趋势**:阿里通义千问海外版或加MIP,字节跳动云空间有弯道超车潜力,腾讯凭技术和小程序生态系统展现强劲发展潜力 [5][10] - **港股市场AI发展潜力公司**:阿里巴巴和腾讯在AI代理领域优势明显,小米和金山云具长期竞争力,小米终端设备预装大模型能力强,金山云是重要平台入口 [5][11][12] - **谷歌硬件终端策略及影响**:谷歌重视硬件终端发展,推广Java并与三星合作预装,小米和金山云作为硬件终端参与者将受益 [13] - **外资流入对港股AI公司影响**:关税落地带来良好风险偏好或外资流入增加,阿里巴巴、腾讯、小米、金山云将成重点关注对象,在AI领域占据重要位置 [14] 其他重要但可能被忽略的内容 无
日心说-2025年中国AI类App流量分析报告
艾瑞咨询· 2025-05-13 17:22
AI应用流量增长逻辑 - DeepSeek月用户设备数从1月1885.9万台激增至3月超1亿,豆包从4819.1万台升至7409.4万台,反映技术能力跃升直接驱动用户规模扩张 [2] - DeepSeek月总使用次数从1月3亿次跃升至3月22.8亿次(涨幅660%),豆包从18.4亿次增至32.9亿次(涨幅78.8%),技术突破带来使用频次非线性增长 [3] - 技术路线多元性导致行业尚未收敛,任何技术跃迁都可能重构市场格局,企业需持续投入研发以维持竞争力 [3] 用户分层与行为特征 - AI深度用户(月使用≥10天)占比达30%,但头部App(用户设备>2000万)深度用户占比普遍低于30%,显示流量效应导致用户优先选择热门应用 [8][9] - 核心忠实用户占比反映深度用户对App的青睐程度,是衡量市场地位的关键非流量指标 [11] - 不稳定客群(单App使用天数占比<50%)占比持续降低可验证用户运维能力,这类用户易受市场热度或营销影响 [13] 市场格局与技术突破影响 - 纯试水新客(使用≤2天且无其他App使用)占比反映App吸引新客能力,当前AI热潮具有普惠性市场启蒙作用 [15] - DeepSeek技术突破导致竞品用户跨月分流(2月偏爱度>50%的用户在3月降低),直接瓦解竞品商业化基础 [22] - 爆款App如DeepSeek对AI产业启蒙贡献显著,技术突破可快速吸引新客并重塑行业竞争壁垒 [19][22] 行业竞争动态 - 头部App用户设备数跨越2000万阈值后,深度用户占比与流量呈反向关系,反映规模化与用户质量需平衡 [9] - 技术未收敛特性使企业需同时应对研发不确定性与市场快速迭代双重挑战 [2][3] - 用户运维能力(留存/转化)成为技术之外的第二竞争维度,需结合战略定位与商业模式设计 [15][13]
泰勒・斯威夫特这次输给了AI
36氪· 2025-05-13 15:51
人工智能行业造富现象 - 人工智能行业正在快速创造白手起家的亿万富豪,2025年《福布斯》首次发布"全球最年轻的白手起家女性亿万富豪"排名,Scale AI联合创始人Lucy Guo以30岁年龄、12.5亿美元净资产位居榜首 [1][3] - 在福布斯该榜单TOP3中,有两位富豪财富来源于人工智能行业,包括Lucy Guo和Anthropic联合创始人丹妮拉·阿莫迪 [16] - 人工智能行业的造富效应迅猛而强烈,正在将越来越多创业者从白手起家带入亿万富豪行列 [7][8] Scale AI公司发展 - Scale AI由Alexander Wang和Lucy Guo于2016年联合创立,当时Alexander仅19岁,从麻省理工学院辍学创业 [9] - 公司最初专注于自动驾驶数据标注服务,客户包括丰田、本田、Waymo等,与苹果自动驾驶部门合作创收超1000万美元 [9] - 随着生成式AI爆发,公司战略调整为提供全链条AI解决方案,客户扩展至OpenAI、微软、Meta、谷歌等科技巨头 [9][10] - 2023年公司收入达7.5亿美元,同比增长300%,成为收入最高的AI创业公司之一 [11] - 2024年完成10亿美元F轮融资,估值达138亿美元,投资方包括英伟达、亚马逊、Meta等 [12] - 2025年公司估值飙升至250亿美元,约为F轮估值的1.8倍 [12] 主要AI公司创始人财富情况 - Scale AI联合创始人Alexander Wang持有14%股份,身价约36亿美元,28岁成为福布斯"全球最年轻的白手起家亿万富翁" [6] - Lucy Guo虽已离职但仍持有近5% Scale AI股份,价值12.5亿美元 [3][15] - Anthropic七位创始成员因公司估值达615亿美元,每人身价至少12亿美元,包括丹妮拉·阿莫迪兄妹 [16][18] - DeepSeek创始人梁文锋身价在16.8亿到252亿美元之间,持有公司84%股份 [23] - 英伟达创始人黄仁勋2024年个人财富激增620亿美元,净资产达1060亿美元 [25] AI行业发展趋势 - 人工智能技术发展一日千里,正在将人类带入全新阶段 [7] - AI产业链关键基础设施提供商如Scale AI商业价值发生巨变 [10] - 大模型技术爆发推动AI公司估值飙升,如Anthropic估值达615亿美元,DeepSeek估值范围10亿至1500亿美元 [18][23] - 全球对人工智能芯片需求井喷式增长,英伟达2024年6月市值突破3万亿美元,成为全球市值最高公司 [24] 成功创业者背景特征 - AI时代成功创业者普遍在相关领域有深厚积累,如梁文锋此前创办幻方量化并管理千亿级别资金 [29] - Alexander Wang父母为核物理学家,自小展现数学天赋,就读麻省理工学院计算机科学专业 [30] - Lucy Guo父母为电子工程师,中学时期自学编程并在大学积极参与科技项目 [30] - 硬核创新是实现财富梦想的核心密码,时代会奖励技术创新者 [23][30]
来觅研究院:人工智能行业:2025年一季度投融市场报告
搜狐财经· 2025-05-13 13:39
行业概要 - 2025年《政府工作报告》明确提出持续推进"人工智能+"行动,强调数字技术与制造优势、市场优势结合,支持大模型广泛应用及发展新一代智能终端 [10] - 深圳提出到2026年人工智能企业数量超3000家,独角兽企业超10家,产业规模年均增长超20% [10][14] - 中国与美国在人工智能领域差距显著缩小,DeepSeek R1模型性能比肩OpenAI o1模型但训练成本更低,中美顶尖模型性能差距从2024年1月的9.26%缩小至2025年2月的1.7% [11][13] 投融动态 - 2025年一季度人工智能领域融资案例241起,环比上升10.6%,融资金额181.4亿元,环比下降20.4%,主要因2024年四季度大额融资案例较多 [21] - 机器人领域融资案例101起(人形机器人25起),融资金额69.0亿元;AI软件平台融资50起(AIGC 17起),金额37.2亿元 [21][22] - 早期融资(种子轮至A轮)占比67.2%,融资金额占比45.1%,国资参与度提升,如智谱获杭州城投等超10亿元战略融资 [22][24] 区域分布 - 北京、广东、上海、浙江、江苏融资案例合计205起(占比85.1%),融资金额168.5亿元(占比92.9%),北京以58.5亿元居首 [32] - 广东出台政策支持人工智能与机器人产业创新,对国家级/省级制造业创新中心最高给予5000万元/1000万元资金支持 [14][33] 行业趋势(AI玩具) - AI玩具具备语音交互、个性化体验和情感陪伴功能,通过硬件销售和订阅服务盈利,全球市场规模预计快速上升 [2] - 代表企业萌友智能2025年推出AI宠物Ropet,面向职场年轻女性,计划拓展国内外市场 [2][8] 关键融资事件 - 它石智航获1.2亿美元天使轮融资(人形机器人),智谱获华发集团5亿元战略融资(AI大模型) [39] - 新石器无人车获10亿元C+轮融资(自动驾驶),傅利叶智能获近8亿元E轮融资(人形机器人) [39]