Workflow
大型语言模型
icon
搜索文档
美股异动丨IBM涨4%创新高 引入Anthropic旗下Claude模型
格隆汇· 2025-10-07 22:44
股价表现 - 公司股价盘中上涨4% 报收300.79美元 创下历史新高 [1] 战略合作 - 公司与Anthropic达成深度合作 将大型语言模型Claude系列集成至精选内部及外部开发工具与企业产品中 [1] - 合作旨在为客户提升生产力 [1] 产品与技术扩展 - 公司计划通过即将推出的watsonx Assistant for Z将人工智能功能扩展至大型机 [1] - 专用Z代理将理解对话上下文与自动化流程 在保障安全合规的前提下推动系统管理从被动故障排除向主动模式转型 [1]
田渊栋与Russell团队联手,证明Transformer能在训练中自然学会叠加推理
机器之心· 2025-10-07 11:57
连续思维链(Coconut)核心创新 - 提出将模型推理轨迹保存在连续隐空间中,而非离散的token空间,以解决长思维链带来的高计算成本难题 [1][2] - 关键优势在于模型能在“叠加”状态下进行推理,即可并行保留所有可能的推理路径,而非必须选择单一路径 [3] - 将一类推理任务抽象为有向图可达性问题,并证明一个两层Transformer经O(n)次连续思维解码即可有效解决该问题 [4][5] 叠加态涌现的训练动态 - 理论分析表明,在连续思维训练下,索引匹配logit在温和假设下保持有界,这与传统Transformer分析中logit呈对数增长无界的情况截然不同 [9] - 有界的索引匹配logit能在“探索”与“利用”之间维持动态平衡,使模型能为多条合理路径分配相近权重,自然形成叠加式推理 [10][34] - 实验观察到,一旦叠加态在早期训练阶段涌现,后续阶段能快速复用该机制,展现出长度泛化能力,即使模型未显式训练生成超过两个思维 [22] 实验设置与结果 - 实验使用GPT-2式解码器(两层Transformer,d_model=768, n_heads=8),从零开始训练,优化器为AdamW,学习率固定为1×10⁻⁴,全局batch size为256 [13] - 采用多阶段训练策略共350个epoch,最终模型在测试集上的准确度达到96.2% [14][15] - 在思维生成阶段,模型学会关注“前沿边”,logit差值在约125个epoch后稳定于60附近,与理论预测一致 [19] - 在答案预测阶段,残差信号和候选提升信号均迅速上升并在约5个epoch后趋于稳定,确保正确候选的logit最高 [27][29]
需求致行业价格普涨,AI端侧存储解决方案加速迭代 | 投研报告
中国能源网· 2025-09-25 11:35
行业整体趋势 - 2025年以来,生成式人工智能和大型语言模型商业模式日趋成熟,核心硬件需求持续提振,半导体存储行业稳步上行,有望迎来价量齐升 [1][2] - 维持行业强于大市的评级 [1][2] 需求驱动因素 - 国内互联网企业大力增加资本支出加码AI投入,阿里25Q2“AI+云”资本支出达386亿元,未来三年将在云和AI硬件基础设施上投入超3800亿元 [3] - 百度25Q2资本开支达38亿元,同比增速近80%,腾讯25Q2资本开支同比增长翻倍至191.07亿元 [3] - AI应用加速渗透,基础设施建设持续扩张,海量数据对存储需求与日俱增,企业级存储应用具备较高潜力 [3] DRAM市场动态 - 受DRAM原厂停产旧制程产品(EOL通知)影响,DDR4、LPDDR4X价格大幅上涨 [1][4] - 25H2 DRAM市场或迎来全面涨价,行业25Q4有望实现20%-50%季度环比涨幅 [1][4] - 南亚科25Q3合约价环比大涨70%,25Q4环比上涨50%,华邦电25Q3环比上涨60%,25Q4再涨20% [4] - 华邦电25Q4合约价相较于25Q2低谷,涨幅高达80%-90% [4] NAND与整体存储市场 - 企业级备货叠加手机新品需求,NAND涨价情绪日益高涨 [3] - CFM闪存市场预计25Q4存储市场或将迎来价格普涨行情,主要聚焦企业级和手机市场 [3] - 25Q4企业级存储价格或将实现个位数涨幅,手机嵌入式存储价格亦有望小幅上扬 [3] 利基与细分存储市场 - 2025年以来,台股三大利基存储厂商旺宏、华邦电、南亚科合计营收大体呈现逐月攀升 [5] - NOR Flash方面,AI数据中心需求增加及车用市场回暖使供需趋于健康,25Q4价格有望调升至双位数百分比,或延续至2026年 [5] - 利基DRAM方面,海外大厂淡出导致市场供不应求,产品价格持续上涨,紧缺预计持续全年 [5] - 定制化存储随着初代产品推出和落地正逐步发力,堆叠方案在端侧应用有望规模化 [5] 投资关注方向 - 建议关注利基存储相关公司:兆易创新、普冉股份、聚辰股份、东芯股份 [6] - 建议关注模组厂相关公司:开普云、江波龙、德明利、佰维存储、香农芯创 [6] - 建议关注存储配套芯片相关公司:澜起科技、联芸科技 [6]
中银晨会聚焦-20250924
中银国际· 2025-09-24 09:00
核心观点 - 半导体存储行业在生成式人工智能和大型语言模型发展的推动下稳步上行,预计迎来价量齐升行情,其中NAND和DRAM价格普涨,利基存储和定制化存储需求显著增长 [2][5] - 利尔化学2025年上半年业绩大幅改善,营收同比增长35.36%,归母净利润同比增长191.21%,主要受益于部分农药产品价格回暖和销量提升,外销收入表现亮眼 [2][9] 存储行业分析 - 企业级存储需求旺盛,国内互联网公司加大AI基础设施投入:阿里25Q2"AI+云"资本支出达386亿元,未来三年计划投入超3800亿元;百度25Q2资本开支同比增近80%至38亿元;腾讯25Q2资本开支同比翻倍至191.07亿元 [5] - NAND存储价格预计25Q4普涨,主要受企业级备货和手机新品需求推动,企业级存储价格预计个位数涨幅,手机嵌入式存储价格小幅上扬 [5] - DRAM市场景气度持续提升,DDR4和LPDDR4X价格因原厂停产旧制程产品大幅上涨,25Q4预计环比涨幅20%-50%:南亚科25Q3合约价环比涨70%,25Q4环比涨50%;华邦电25Q3环比涨60%,25Q4再涨20%,较25Q2低谷涨幅达80%-90% [6] - 利基存储市场供需格局改善:NOR Flash因AI数据中心和车用市场需求回暖,25Q4价格预计调涨双位数百分比并延续至2026年;利基DRAM因海外大厂淡出导致供不应求,涨价趋势预计持续全年 [7] - 端侧定制化存储需求崛起,堆叠方案在端侧应用逐步规模化,具备先发优势的公司有望受益 [7] 利尔化学业绩表现 - 2025年上半年营业总收入45.07亿元,同比增长35.36%;归母净利润2.71亿元,同比增长191.21%;扣非归母净利润2.72亿元,同比增长241.02% [9] - 第二季度营收24.21亿元,同比增长24.87%,环比增长16.05%;归母净利润1.18亿元,同比增长160.75%,环比下降23.22% [9] - 中期分红方案为每10股派现2元(含税),分红比率59.17% [9] - 农药原药业务收入同比增62.67%至27.57亿元,毛利率提升0.45个百分点至17.57%;农药制剂业务收入同比增12.49%至9.60亿元,毛利率提升3.17个百分点至20.54% [10] - 外销收入同比增69.43%至23.45亿元,内销收入同比增11.12%至21.62亿元 [10] - 整体毛利率18.53%,同比提升1.43个百分点;期间费用率优化,销售/管理/研发费用率分别下降0.21/1.79/1.37个百分点,财务费用率因汇兑收益减少上升0.40个百分点 [11] - 精草铵膦产能持续扩张,湖北利拓10000吨/年精草铵膦原药及配套工程项目稳步推进 [12] 市场指数表现 - 上证综指收盘3821.83点,跌0.18%;深证成指收盘13119.82点,跌0.29%;沪深300收盘4519.78点,跌0.06%;创业板指收盘3114.55点,涨0.21% [3] - 行业表现分化:银行涨1.52%、煤炭涨1.11%、电力设备涨0.43%;社会服务跌3.11%、商贸零售跌2.90%、计算机跌2.39% [4] 月度金股组合 - 9月金股组合包括京沪高铁、桐昆股份、雅克科技、宁德时代、恒瑞医药、三友医疗、北京人力、菲利华、兆易创新、鹏鼎控股 [4]
存储行业更新报告:需求致行业价格普涨,AI端侧存储解决方案加速迭代
中银国际· 2025-09-23 16:02
行业投资评级 - 存储行业评级为强于大市 行业在需求推动下有望迎来价量齐升 [1] 核心观点 - 生成式人工智能和大型语言模型发展推动半导体存储行业稳步上行 需求致行业价格普涨 [1] - AI端侧存储解决方案加速迭代 定制化存储逐步发力 [1][27] - 企业级存储和手机嵌入式存储价格预计上涨 25Q4企业级存储价格或实现个位数涨幅 手机嵌入式存储价格小幅上扬 [5][14] - DRAM市场迎来全面涨价 25Q4行业有望实现20%-50%季度环比涨幅 [5][18] - 利基存储市场供需格局变化 海外大厂淡出导致供不应求 产品价格持续上涨 [24] 需求与价格趋势 - 国内互联网企业加大AI投入 阿里25Q2"AI+云"资本支出达386亿元 未来三年投入超3800亿元 百度25Q2资本开支38亿元同比增近80% 腾讯25Q2资本开支191.07亿元同比增长翻倍 [5][10] - 25Q4存储市场或迎价格普涨 企业级存储价格个位数涨幅 手机嵌入式存储小幅上扬 [5][14] - DRAM价格指数上涨约72% NAND价格指数处于低位 两大指数差拉大 [15] - 服务器eSSD需求显著增长 25Q2前五大品牌厂营收合计51亿美元季增12.7% [10] - 手机存储容量提升 iPhone 17全系列以256GB起步 Pro Max新增2TB版本 [13] 细分市场动态 - NOR Flash价格25Q4有望调涨双位数百分比 或延续至2026年 25Q3中国市场已调涨5%-10% [23][24] - 利基DRAM价格持续上涨 兆易创新预计紧缺持续全年 [24] - 台股利基存储厂商旺宏、华邦电、南亚科合计营收逐月攀升 2025年8月合计163.32亿新台币同比增30.70% 南亚科8月营收67.63亿新台币同比增141.32% [20] - 存储厂商报价上涨 南亚科25Q3合约价环比涨70% 25Q4环比涨50% 华邦电25Q3环比涨60% 25Q4再涨20% 25Q4合约价较25Q2低谷涨幅达80%-90% [5][18] 技术发展与投资机会 - 定制化存储在端侧应用逐步规模化 堆叠方案有望深度受益AI浪潮 [27] - 美光退出移动NAND市场 停止UFS 5.0开发 为国产厂商带来机遇 [13] - HBM和3D DRAM成为下一代内存技术方向 突破带宽瓶颈 [26] - 投资建议关注利基存储(兆易创新、普冉股份、聚辰股份、东芯股份)、模组厂(开普云、江波龙、德明利、佰维存储、香农芯创)、存储配套芯片(澜起科技、联芸科技) [3][28]
Meta(META.US)就AI内容授权事宜与媒体机构展开谈判
智通财经· 2025-09-18 21:17
Meta与媒体公司的AI内容授权谈判 - Meta正与Axel Springer、福克斯公司及新闻集团等多家媒体企业磋商 计划获得文章授权用于其人工智能产品开发 [1] - 谈判核心是为Meta旗下的聊天机器人等多款AI驱动产品获取新闻及其他内容的使用授权 [1] - 部分谈判仍处于初步阶段 最终未必能达成新协议 [1] Meta与媒体出版商的合作历史 - 公司多年前曾斥资数千万美元达成多项合作 将《华尔街日报》《纽约时报》《华盛顿邮报》等媒体内容纳入其"新闻"板块 [1] - 2022年Meta宣布将停止向出版商支付内容费用 [1] - 由于Meta降低了新闻内容在平台的优先级 许多出版商从Facebook获得的流量大幅下滑 不过近几个月部分出版商表示来自Facebook的流量出现回升 [2] AI技术对出版行业的冲击 - 科技公司通过"网络爬虫"抓取网站内容 并被指利用这些内容训练其大型语言模型 [2] - 出版商纷纷采取措施限制未付费的AI爬虫访问自家网站 [2] - 今年7月网络安全公司Cloudflare已更新默认设置 对未支付内容费用的AI爬虫实施拦截 [2] 行业内的竞争态势 - Meta在去年10月就与路透社达成AI内容授权协议 但直至近几个月才开始更广泛地与各类出版商展开相关谈判 [2] - Meta的竞争对手已在新闻行业敲定多项AI内容授权合作 例如OpenAI已与新闻集团、Axel Springer及Dotdash Meredith等出版商签署授权协议 [2] - 亚马逊则与《纽约时报》达成了类似合作 [2]
苦战七年卷了三代!关于BEV的演进之路:哈工大&清华最新综述
自动驾驶之心· 2025-09-18 07:33
BEV感知技术演进 - BEV感知已成为自动驾驶领域的基础范式,提供统一的空间表征,支持鲁棒的多传感器融合和多智能体协作[2] - 随着自动驾驶车辆从受控环境向现实世界部署过渡,复杂场景(如遮挡、恶劣天气和动态交通)中的安全性和可靠性仍是关键挑战[2] - 本文首次从安全关键视角对BEV感知进行全面综述,系统分析当前主流框架及实现策略,并将其划分为三个渐进阶段:单模态车载感知、多模态车载感知和多智能体协作感知[2] BEV感知的本质(What) - BEV感知是一种高效的空间表征范式,能够将来自多种传感器模态(如相机、激光雷达、毫米波雷达)的异构数据投影到统一的BEV坐标系中[6] - 通过这种投影,系统可构建周围环境的一致性结构化空间语义地图,消除传感器特有的视角差异[6] - 自上而下的视角能够帮助系统准确感知和理解物体间的空间关系,大幅降低多视角与多模态数据融合的复杂度[6] BEV感知的重要性(Why) - 凭借统一且可解释的空间表征,BEV感知成为自动驾驶中多模态融合与多智能体协作感知的理想基础[8] - 统一坐标系不仅简化了车载与路侧传感器的融合过程,还能支持多车辆与基础设施间的高效信息共享,突破单车辆感知的局限性[8] - BEV表征具备结构化、一致性的语义信息,能够为路径规划、车辆控制等下游任务提供支持,成为复杂协作驾驶场景中"感知-决策"环节的关键桥梁[8] BEV感知的实现方式(How) - 安全导向的BEV感知(SafeBEV)演进划分为三个主要阶段:SafeBEV 1.0(单模态车载感知)、SafeBEV 2.0(多模态车载感知)和SafeBEV 3.0(多智能体协作感知)[12] - 各阶段的特征与技术进展在后续章节详细阐述,包括单模态感知的局限性、多模态融合策略以及多智能体协作的优势[12] SafeBEV 1.0:单模态车载感知 - 该阶段采用单一传感器(如相机或LiDAR)实现基于BEV的场景理解,具有系统复杂度低、计算成本低的优势[13][20] - 基于相机的方法依赖单应性变换或数据驱动的BEV建模,分为稀疏范式与密集范式两类[13] - 基于激光雷达的方法通过点云体素化、稀疏卷积或PointNet等技术提取BEV特征,在空间分辨率与计算效率间取得平衡[13] - 但在恶劣条件下鲁棒性有限:相机方法对光照变化、遮挡和深度估计误差敏感,激光雷达方法面临点云稀疏性和天气导致的性能衰减问题[20][41] SafeBEV 2.0:多模态车载感知 - 该阶段通过集成相机、LiDAR、雷达等异构传感器提升BEV感知性能,突破单模态系统的局限性,增强遮挡与恶劣天气下的鲁棒性[14][42] - 融合策略分为五类:相机-雷达融合、相机-LiDAR融合、雷达-LiDAR融合、相机-LiDAR-雷达三模态融合及时间融合[14][42] - 根据融合阶段的不同,每类策略又可进一步分为单阶段融合(SSF)和多阶段融合(MSF)[42] - 这些策略共同增强了现实自动驾驶场景中BEV感知的安全性、适应性与可靠性[14] SafeBEV 3.0:多智能体协作感知 - 随着车联网(V2X)技术的发展,自动驾驶车辆可通过车-车、车-基础设施间的信息交互与联合推理,突破单智能体感知的局限性[15][72] - 通过在统一BEV空间中聚合多源传感器数据,协作感知能够实现全局环境建模,为动态交通中的安全导航提供关键支持[15][72] - V2VNet、DiscoNet、CoBEVT等代表性框架通过特征压缩、带宽高效协议及分布式推理技术,在降低通信成本的同时实现实时、可扩展的协作[15] - 多智能体观测的时空融合技术能够增强全局态势感知,提升对遮挡或远距离目标的感知能力[15] BEV感知数据集 - 高质量数据集是感知算法研发与评估的核心基础,设计完善的数据集对于提升BEV感知的鲁棒性与安全性至关重要[98] - 车载BEV数据集分为单模态与多模态两类,单模态数据集支持专项研究,多模态数据集支持传感器融合策略的研发[99][102] - 多智能体协作感知数据集在传感器多样性、协作能力及复杂交通场景表征方面取得显著进展,为基于BEV的协作感知研究提供了关键基础[104][105] - 路侧感知数据集利用固定路侧单元实现高精度、广范围的环境感知,具有稳定、抗遮挡的视角及广阔的时空覆盖范围[107] 挑战与未来方向 - BEV感知在开放世界场景下面临关键安全挑战,包括开放集识别、大规模未标注数据、传感器性能退化及智能体间通信延迟[2][16] - 未来研究方向包括与端到端自动驾驶系统的融合、具身智能及大型语言模型的应用[2][16] - 多模态融合仍面临标定与同步、环境干扰、实时性约束和视野局限等挑战[66][70] - 多智能体协作感知需解决通信可靠性、时空对齐及系统可扩展性三大关键挑战[97]
报道:OpenAI正在组建人形机器人算法团队
华尔街见闻· 2025-09-16 11:40
公司战略转向 - OpenAI正加速机器人技术领域投入 通过组建专注于人形机器人的新团队 押注物理世界交互是实现通用人工智能的关键一步 [1] - 公司近期已聘请多位人形机器人控制算法专家 招聘目标明确指向人形机器人项目 [1] - 所有机器人相关职位均强调"专注于解锁通用机器人技术并在真实世界环境中推动AGI级别智能" 表明公司将机器人技术与AGI终极目标直接挂钩 [2] 人才招聘进展 - 斯坦福大学研究人员Chengshu Li已于2025年6月加入 其研究涉及为处理家务的人形机器人设计能力基准 [2] - 另有两名来自其他机器人实验室的研究人员也已入职 招聘行动正在提速 [2] - 公司寻找具备遥操作和模拟(如Nvidia Isaac平台)经验的专家 这些是训练人形机器人的关键技术 [1] 硬件发展路径 - 机械工程师职位要求具备原型设计和制造带触觉及运动传感器的机器人系统专业知识 [3] - 职位要求拥有"为大批量(100万台以上)生产设计的机械系统经验" 暗示未来可能进行大规模生产甚至制造业部署 [3] - 公司可能自研机器人硬件 或为机器人训练开发遥操作系统 具体路径尚未明确 [3] 行业竞争格局 - 人形机器人赛道竞争激烈 包括特斯拉、谷歌以及Figure、Agility、Apptronik等明星初创公司 [4] - 自2024年初以来 风险投资已向人形机器人初创公司投入超过50亿美元 [4] - 摩根士丹利预测到2050年该产业市场价值可能达到5万亿美元 [4] 技术发展背景 - 公司战略转向正值业界反思大型语言模型发展路径之际 在GPT-5研发达到平台期后 AI需要"走向物理世界"寻求突破 [1][4] - 虽然目前人形机器人仍难以应对复杂不可预测的环境 但资本和顶尖人才涌入有望加快技术突破步伐 [4]
苹果四位 AI 大将出走,其中三位是华人
36氪· 2025-09-04 10:13
苹果AI人才流失事件 - 苹果公司近期损失四位AI领域关键研究人员,包括机器人首席AI研究员Jian Zhang以及基础模型团队的三名研究员Nan Du、Zhao Meng和John Peebles [1] - 此次人才流失集中在基础模型团队,四名离职人员中有三名来自该团队 [3] - 离职人员中华人占比高,四名中有三名是华人 [3] 人才流向分布 - 仅Jian Zhang一人加入Meta,Nan Du和John Peebles加入OpenAI,Zhao Meng则加入Anthropic [3] - 此次人才流动与Meta此前的高薪抢人行动关联不大,仅一人流向Meta [24] 离职人员专业背景与贡献 - Jian Zhang在苹果人工智能与机器学习部门担任机器人研究负责人长达十年,专注于机器人技术底层研究,特别是在仿生扑翼飞行器领域 [5][8] - 其学术影响力显著,论文总被引次数达1353次,h指数为18,2020年以来被引1182次 [9] - 代表性论文《Uncertainty weighted actor-critic for offline reinforcement learning》被引用241次,专注于利用固定历史数据训练决策模型 [10] - Nan Du在谷歌效力超过7年,参与开发拥有1万亿参数的稀疏专家模型GLAM及第二代Pathways Language Model PaLM 2,2023年加入苹果担任首席研究员 [17][20] - Zhao Meng专注于多模态AI和生成式模型,论文总引用数超过770次,h指数为12,其2016年论文《How Transferable are Neural Networks in NLP Applications?》被引381次 [21][22] - John Peebles专注于生成式AI和大型语言模型,参与改进模型推理能力及隐私保护AI系统,是深度学习训练系统AXLearn论文共同作者 [16] 公司战略与行业动态 - 苹果机器人技术专注于未来产品线开发,包括带屏幕的桌面机器人以及零售店和制造业的机械臂 [5] - Meta机器人工作室Robotics Studio部门正开发人形机器人硬件和软件,最初针对家务场景,并与Unitree Robotics和Figure AI等公司讨论合作计划 [12] - Anthropic在Zhao Meng加入同时完成130亿美元F轮融资,估值达1830亿美元 [23] - 行业顶尖人才薪酬水平高,OpenAI技术人员年薪最高达53万美元,Anthropic研究工程师年薪可达69万美元,顶尖OpenAI研究人员年薪酬可超1000万美元,谷歌DeepMind为顶尖研究人员提供每年2000万美元薪酬方案 [26] AI人才流动趋势 - AI人才流动不仅受高薪驱动,公司战略、资源分配、理想主义及职场环境等因素均影响决策 [25] - 近期出现Meta新员工迅速回流现象,两名新加入Meta的研究员在入职不到30天内返回OpenAI [28] - OpenAICEO曾称"传教士将击败雇佣兵",强调使命感对吸引人才的作用 [27] - 即便无高薪抢人行动,AI人才流动仍持续发生,反映人才对平台战略方向及文化契合度的重视 [31]
狮腾控股推出突破性的多模型大型语言模型平台Geene M2
智通财经· 2025-09-04 08:11
产品发布 - 公司推出多模型大型语言模型平台Geene M2 整合Geene R1 Geene TurboGPT OpenAI ChatGPT 阿里巴巴Qwen 字节跳动SkyLark等领先模型[1] - 平台采用专有神经智能路由引擎 根据对话类型 复杂程度和用户意图动态选择最佳模型[1] - 引入多响应比较功能和智能应答融合技术 可并列检视不同模型输出并整合为更丰富答案[1] 技术功能 - AI编程模组可将自然语言提示转换为功能性代码 实现自动修复错误 优化系统效能和现代化旧有系统[2] - 通过降低技术开发依赖和整合维护成本 有效缩短开发周期并加快产品推出速度[2] - 具备生成响应式前端应用程式 创建可重用元件及桥接不同系统的能力[2] 数据管理 - AI Vault云端储存平台结合检索增强生成技术 将档案储存转化为智能资源中心[3] - 平台能自动整理分类并关联内容 用户可通过自然语言提问获取即时答案和深度洞察[3] - 资料可实时导入模型成为"AI-ready"内容 提供具脉络且准确度更高的回应[3] 商业模式 - 平台设免费方案提供10GB智能云端储存空间与标准使用限制[4] - 专业方案每月18美元提供20GB储存空间及进阶使用权限[4] - 企业方案每月36美元提供60GB储存空间及完整高阶功能与最高使用权限[4] 市场前景 - 全球AI解决方案市场规模预计从2024年1500亿美元增长至2029年超5000亿美元[4] - 平台将聚焦金融 商业与数字资产等领域的关键应用场景[4] - 分层定价模式使不同规模企业能以远低于传统企业软体的成本应用先进AI技术[4]