Workflow
大语言模型(LLM)
icon
搜索文档
Nature Medicine + Nature Health:韩莎莎团队证实,AI聊天机器人让看病更高效、更贴心
生物世界· 2026-01-21 12:28
行业背景与挑战 - 全球医疗系统面临人口老龄化和慢性病负担加重的压力,在资源有限地区,患者面临漫长等待和碎片化护理流程[2] - 在中国,许多患者习惯绕过初级护理直接前往大医院,导致专科医生负担过重,咨询时间被压缩,医患沟通质量下降[2] 研究突破与核心观点 - 2026年1月19日,两项来自中国团队的随机对照试验研究证明,基于大语言模型的AI聊天机器人能显著优化护理流程并提升患者参与度[3] - 研究显示,AI聊天机器人不仅能大幅提升就诊效率,还能让患者体验更温暖、更个性化[3] - 两项研究共同表明,AI聊天机器人是能够切实提升医疗可及性和质量的有力工具,让医疗朝着更高效、更温暖的方向迈进[19] 研究一:PreA聊天机器人(优化初级到专科护理过渡) - 研究发表于《Nature Medicine》,开发了基于GPT-4o mini的PreA聊天机器人,模拟初级护理医生角色,进行病史采集、初步诊断和检查建议,并生成转诊报告[4][6] - 研究在两家中国西部地区三甲医院的24个科室开展,涉及2069名患者,随机分为独立使用PreA组、工作人员辅助使用PreA组及对照组[6] - 关键发现:独立使用PreA的患者平均咨询时间比对照组减少28.7%,从4.41分钟降至3.14分钟[7] - 关键发现:专科医生认为PreA生成的转诊报告帮助程度提升了113.1%[7] - 关键发现:患者报告沟通便捷度提高了16.0%,且对医生关注度、满意度和未来使用意愿均有显著改善[7] - PreA的成功源于与当地利益相关者的共同设计,能更好地避免系统性偏见,确保工具贴合真实临床需求[10] - PreA在无人辅助情况下表现与有人辅助组相当,证明了其自主运行能力,在资源有限地区尤为重要[10] 研究二:P&P Care聊天机器人(重塑初级护理体验) - 研究发表于《Nature Health》,开发了基于GPT-4o mini的P&P Care聊天机器人,采用双轨角色扮演共同设计框架,整合e-learning模块以提升患者“AI健康素养”[12][13] - 研究在11个中国省份的城乡社区开展随机对照试验,涉及2113名参与者,分为咨询前接受e-learning培训组和直接咨询组[13] - 创新点在于社区成员直接参与设计,确保了聊天机器人兼顾文化适应性和低识字率用户需求,例如增加了语音接口和离线功能以应对农村网络限制[15] - 与传统初级护理和远程医疗相比,P&P Care在病史采集、诊断精确性、检查建议和慢性病管理方面均评分更高[15] - 关键发现:咨询质量在注意力、可倾听性、简洁性、完整性和同理心等维度均优于对照组[21] - 关键发现:中老年患者(≥40岁)和需要多学科护理的患者改善尤为明显,e-learning有效缩小了健康知识差距[22] 共同启示与行业影响 - 两项研究都凸显了共同设计在部署医疗AI中的核心价值,能避免传统AI模型可能复制的现有护理缺陷和文化偏见,防止“技术脱节”[16][17] - AI工具并非取代医生,而是通过处理常规任务让医生更专注于复杂决策和人文关怀,实现效率与人性化兼得[18] - PreA和P&P Care在资源有限环境中表现稳健,为全球医疗公平性提供了样板,展示了可扩展性[19]
AI4S电池创新价值兑现,三个痛点:真实、规律、效率
高工锂电· 2026-01-13 23:57
文章核心观点 - 当前主流AI(如大语言模型)在理解真实物理世界方面存在根本性局限,而AI for Science (AI4S) 是让AI进入并理解由物理、化学和数学规律构成的真实科学世界的关键方向 [1] - AI4S正从概念走向产业实践,其核心价值在于回归真实科学问题,通过理解微观世界的规律来驱动高效的研发创新,并已在电池、医药等领域创造出真实的经济价值 [2][3][5] - 以SES AI的“分子宇宙”平台为例,AI4S的成功路径在于:先长期深耕垂直科学领域以积累对现实的理解(“科学品味”),再运用AI工具放大这种判断力,最终实现研发效率的质变和产业突破 [4][6][20][21] AI4S的产业价值与市场验证 - **产业突破实例**:基于SES AI的“分子宇宙”平台,已有6款突破性新型电解质材料完成开发验证,并与全球超过40家电池及材料企业推进测试与量产导入 [3] - **资本市场关注**:AI4S领域已出现多笔大额融资,例如SandboxAQ完成3亿美元融资后估值达56亿美元,Periodic Labs以13亿美元估值完成3亿美元种子轮融资 [3] - **独立估值参考**:如果“分子宇宙”平台是一个独立公司,其价值也将达到数十亿美元量级 [3] - **成功上市案例**:晶泰科技作为AI4S赛道公司,于2024年成功在港股上市,其成长源于在医药研发垂直领域的长期深耕,获得了国际药企与资本市场的认可 [4] AI4S在电池领域的具体应用与成果 (以SES为例) - **平台演进逻辑**:“分子宇宙”平台的核心逻辑是先锚定真实的微观世界,提炼科学规律,再叠加AI捕捉数据背后的数学规律,最终释放科研效率 [10] - **六大关键场景解决方案**:平台已催生覆盖低硅负极、高硅负极、锂金属、高电压LCO、LFP储能以及凝胶电解质等场景的突破性电解液方案 [7] - **低硅负极电解液**:在60°C高温存储测试中,性能较行业基准提升26% [7] - **高硅负极电解液**:目标在1C/1C和4C/1C条件下,实现比商业标杆超过20%的循环寿命提升 [8] - **极致快充电解液**:在4C-4C极速充放电循环条件下,已展现出比传统基线配方更优的循环寿命 [9] - **高电压电解液**:在4.58V超高电压、45°C高温下循环200周后,容量保持率稳定超越行业头部客户的现有基线配方 [9] - **LFP体系电解液**:在多项关键性能上达到或超越了全球动力电池龙头的产品 [9] - **凝胶电解质**:在多项测试中,性能均优于主流商用液态电解液 [9] - **性能突破**:借助平台发现的新电解液配方,公司将锂金属电池能量密度推至500Wh/kg,并将硅碳电池提升至接近400Wh/kg水平 [18] “分子宇宙”平台的核心能力框架 - **真实:构建可计算的电池分子世界** - **数据规模与真实性**:平台构建了映射真实微观理化性质的可计算世界,其MU-1版本基于超过2亿分子的DFT计算与混合精度建模 [11] - **数据源**:分子数据不仅包括结构,更附着了由高精度计算校准的物化性质,以及来自实际电芯测试的性能与失效数据(包含“失败样本”) [12] - **验证闭环**:平台工作流强调“预测-验证”的强制闭环,迫使AI推理建立在与物理世界一致的约束之上 [12] - **持续深化**:MU-1.5版本新增对12%硅碳负极和100%硅碳负极搭配高镍正极的专项支持,并利用前沿研发的独家数据使虚拟筛选更贴近真实高端应用工况 [12] - **规律:从统计关联到因果洞察** - **引入领域智慧**:MU-1.5引入了“Flavor”(风味标签)系统,将人类科学家数十年积累的领域智慧进行系统化编码,包含7种结果导向标签和9种机制导向标签 [14][15] - **搜索逻辑升级**:AI搜索从基于分子结构相似性,升级到基于功能与机理的相似性,相当于将顶级科学家的经验与直觉转化为可被AI复制和拓展的数字化规律 [15] - **自主发现规律**:平台的Predict模块能通过分析海量电芯循环时序数据,学习退化模式并预测长期寿命,捕捉可能连科学家都未清晰阐明的高阶数理关联规律 [15] - **效率:从流程工具到可私有进化的研发大脑** - **智能工作流**:平台构建了Ask → Search → Formulate → Design → Predict的智能工作流,系统性地将灵感生成、方向筛选、时间验证成本“坍缩”进计算循环 [16] - **私有化部署**:“MU in a Box”是一套可实现完全离线、数据不出厂的本地化部署一体机,解决了顶级企业对数据安全的顾虑 [17] - **个性化与自进化**:企业可利用自身专有数据训练专属的“私人宇宙”,让AI工具迅速适配自身最紧迫的研发战线,使效率竞争升级为企业间“私有智能体”进化速度的竞争 [17] - **能力产品化**:平台淬炼出的效率能力开始以软硬结合形式产品化,例如通过收购获取海量LFP数据训练预测模型,并将其封装为硬件提供“电池健康预测即服务” [18] AI4S的成功路径与护城河 - **发展路径**:真正有价值的AI4S公司往往成长于具体科学领域的长期实践之中,先在微观世界具备“理解现实”的能力,再在AI4S领域大展拳脚 [4][6] - **核心护城河**:在AI时代,“品味”(Taste)是唯一的护城河,对于AI4S而言,“科学品味”源于在真实研发中长期深耕、反复校准后形成的判断力 [21] - **平台定位**:“分子宇宙”平台旨在成为AI时代电池研发的工作台,帮助研发工作者将其“研发品味”转化为现实中可验证的性能提升与产业成果 [21]
从大模型、机器人到约会APP:2026年市场给AI定价的标准,全面转向回报率!
华尔街见闻· 2026-01-13 21:06
市场定价逻辑转变 - 华尔街对AI技术的定价标准已从技术突破预期,全面转向对资本回报率的严苛考核,能否将算力转化为营收与利润成为科技股估值的唯一标尺 [1] - 资金将向能够证明生成式AI或GPU驱动技术带来实质性回报的公司集中,只有展现出更快营收增长、更高用户参与度以及扩大每股收益和自由现金流的企业才能获得市场溢价 [1] - 市场看好亚马逊、META和Doordash等能通过AI实现效率提升和业务扩张的巨头,并预计云服务商将迎来强劲增长 [1] 大语言模型与AI应用 - 前沿模型的参数竞赛不再是市场兴奋点,投资者关注点彻底转向产品化和货币化 [3] - 谷歌的关键在于将Gemini模型深度整合进搜索、YouTube和云服务以驱动收入增长 [3] - Meta的关键在于其“超级智能实验室”能否产出当前最佳模型,并将其转化为广告收入和用户粘性 [3] - 亚马逊在零售端的AI应用能否带来销售增量是重要看点 [3] 生成式AI的资本回报与扩散 - 市场要求看到生成式AI的资本回报,预计2026年将出现企业端采用率的阶梯式跳跃 [4] - 亚马逊AWS、谷歌云和微软Azure将迎来比预期更强劲的增长,积压订单激增预示企业正大规模迁移工作负载以适应AI需求 [4] - 随着电力和算力瓶颈缓解,AI技术将从科技巨头向更广泛经济领域扩散 [4] AI驱动的效率提升与成本控制 - 2026年可能是科技巨头利用生成式AI大幅提升内部效率,从而显著放缓招聘甚至持续裁员的第一年 [5] - 模型假设Meta、亚马逊和谷歌的非折旧/非广告运营支出增速将显著下降 [5] - 若公司能在收入增长的同时控制人力成本,每股收益和自由现金流将有巨大上修空间 [6] 代理商贸与电商变革 - AI智能代理将彻底改变消费者购物方式,拥有特定垂直领域数据和交易闭环的玩家将率先受益 [7] - 在线旅游代理面临巨大风险,如果谷歌或OpenAI推出能直接规划行程并预订的代理,其流量入口地位将被削弱 [7] - 评估框架关注库存、基础设施、创新、增量和损益表 [7] 自动驾驶技术演进 - 2026年将是自动驾驶可用性的拐点,服务覆盖范围将从2025年底的15%城市人口跃升至32% [8] - 自动驾驶不仅不会颠覆网约车,反而会通过降低每英里成本来扩大整个出行市场 [8] - 关注Waymo和Tesla在恶劣天气和机场场景的落地情况,这是技术成熟的标志 [8] 具身智能与物理AI - 巨头开始布局AI与机器人、硬件的结合 [9] - 亚马逊计划到2027年增加约40个下一代机器人仓库,据测算能带来20亿至40亿美元以上的经常性成本节约 [9] - Uber和DoorDash正在构建无人机和自动配送机器人生态以削减人力配送成本 [9] 在线杂货市场的AI机遇 - 美国线下杂货市场规模高达1.4万亿美元,是AI智能代理最大的潜在金矿 [10] - 杂货购物繁琐且个性化,非常适合AI代理介入 [10] - 亚马逊、Instacart和DoorDash处于有利位置,亚马逊在生鲜领域的加速推进可能成为下一个盈利增长点 [10] 搜索市场格局演变 - AI搜索引擎的出现扩大了整个查询市场,预测2023-2026年搜索量复合增速将达14% [11] - 在商业类查询上,谷歌的Gemini相比ChatGPT仍略占优势 [11] - ChatGPT引入广告将首先冲击效果不明显、实验性质的广告预算,而非谷歌核心搜索广告 [11] 游戏行业的AI变革 - AI生成视频和互动内容将大幅降低游戏制作门槛和成本 [12] - 趋势长期利好拥有云算力和AI工具的巨头,对于工具提供商既是机遇也是颠覆风险 [12] - 游戏行业AI变革尚在早期,应关注能够提供底层算力和生成式工具的“卖铲人” [12] 在线约会软件的复苏 - 在线约会行业经历数年用户增长停滞,2026年或是转机 [13] - 约会软件正在利用生成式AI改进匹配算法以减少用户“刷屏疲劳” [13] - 若AI能成功改善用户体验并重启增长,相关公司将迎来巨大的估值修复 [13]
消息称马斯克下月将推xAI首款AI氛围编程工具Grok Build
搜狐财经· 2026-01-09 09:01
公司动态与产品发布 - xAI公司计划于下月升级其AI编程助手Grok Code,新版本将支持用户通过单次提示一次性完成复杂的编程任务 [1] - 本次升级的核心功能是“单次提示”,用户无需多轮对话或反复调试,仅需输入一次详细指令,AI即可生成完整可用的复杂代码方案,旨在大幅提升开发者工作效率 [3] - xAI极有可能借此机会推出一款名为“Grok Build”的新工具,这被视为该公司首款“Vibe Coding”解决方案 [3] - 该工具预计最早将于下月向用户开放,可能包含命令行界面,旨在让编程过程更加流畅和直观 [4] 行业趋势与竞争格局 - “Vibe Coding”是近期流行的科技圈俚语,指利用大语言模型进行编程的一种流畅状态,开发者更侧重于与AI协作和凭感觉指挥,而非死磕语法细节 [3] - Google AI Studio已提供了这种沉浸式的交互体验,而xAI正试图复刻Google AI Studio的交互模式 [3][4] - 埃隆·马斯克此前曾对谷歌的AI成果表示赞赏,外界普遍认为xAI的此次升级是对标行业领先交互模式的举措 [4]
3家公司全部大涨,还有3家暗盘大涨!2026年港股IPO迎开门红
证券时报· 2026-01-08 21:35
2026年港股IPO市场开门红 - 2026年1月8日,智谱、天数智芯、精锋医疗-B三家公司在港交所上市,首日分别上涨13.17%、8.44%和30.90% [2] - 1月9日上市的MINIMAX-WP、金浔资源、瑞博生物三家公司暗盘阶段全部大涨,涨幅分别为25.94%、31.96%和30.67%,这意味着2026年以来上市的7家公司或将全部大涨 [5][16][20] - 港股在2025年末至2026年初迎来上市高峰,2025年12月30日有6家公司上市,2026年1月8日至13日期间还有多家公司计划上市 [14] 三家公司业务概况与市场地位 - **智谱 (2513.HK)**:全球首家以通用人工智能(AGI)基座模型为核心业务的上市公司,按2024年收入计,在中国独立通用大模型开发商中排名第一,市场份额为6.6% [7] - **天数智芯 (9903.HK)**:提供针对不同行业的通用GPU产品及AI算力解决方案,截至2025年6月30日,已向超过290名客户交付超过52,000片通用GPU产品 [8] - **精锋医疗-B (2675.HK)**:中国首家、全球第二家同时取得多孔、单孔及自然腔道手术机器人注册审批的公司,2024年在中国售出20台多孔腔镜手术机器人,国内制造商中排名第一 [9] 新股认购与机构投资者情况 - 公开发售环节,智谱和精锋医疗-B获得超千倍超额认购,倍数分别为1,159.46倍和1,091.94倍,天数智芯为414.24倍 [9][10] - 国际配售环节,精锋医疗-B认购倍数超过25倍,智谱超过15倍,天数智芯超过10倍,显示机构投资者青睐 [11] - 三家公司基石投资者阵容强大,智谱吸引11家基石投资者合计认购29.8亿港元,精锋医疗-B和天数智芯的基石投资者包括瑞银、阿布达比投资局、腾讯等知名机构 [11][12] 近期及后续港股IPO市场动态 - 2026年1月9日至13日,计划上市的公司包括MINIMAX-WP、金浔资源、瑞博生物、豪威集团、兆易创新、BBSB INTL、红星冷链等 [14][15] - 已通过港交所聆讯、等待上市的公司包括湖南鸣鸣很忙、澜起科技、龙旗科技、白鸽在线、卓正医疗等 [21][22] - 2025年12月有32家公司向港交所递表,2026年1月前8天已有16家公司递表,排队公司涵盖宠物医疗、印制电路板、消费电子、新能源换电等多个领域龙头 [22][23]
【太平洋科技-每日观点&资讯】(2026-01-09)
远峰电子· 2026-01-08 21:08
大盘与板块表现 - 1月8日,主要股指涨跌互现,科创50指数上涨0.82%,北证50指数上涨0.81%,上证指数微跌0.07%,深证成指下跌0.51%,创业板指下跌0.82% [1] - TMT板块内部分化,领涨板块包括SW其他通信设备(+4.62%)、SW军工电子Ⅲ(+3.59%)和SW营销代理(+3.45%) [1] - TMT领跌板块包括SW通信网络设备及器件(-2.12%)、SW印制电路板(-1.97%)和SW半导体设备(-0.92%) [1] 国内科技新闻 - **显示技术**:辰显光电成功点亮0.12英寸Micro-LED微显示屏体,采用基于8英寸的半导体级混合键合技术,在像素级互连精度、结构稳定性及良率控制等方面满足规模化量产核心要求 [1] - **芯片设计**:极海半导体发布G32M3101系列电机控制SoC,集成“MCU+LDO+栅极驱动器”三合一单芯片方案,降低了系统成本和PCB面积,可应用于低压吊扇、空气净化器等多种场景 [1] - **物联网与传感**:乐鑫科技与Bosch Sensortec合作推出AI智能交互方案,博世提供MEMS传感器及算法,乐鑫提供双频Wi-Fi 6物联网芯片ESP32-C5作为核心主控 [1] - **医疗科技应用**:北京朝阳医院引入VR技术缓解患者术前焦虑,已应用于超过100例患者,临床观察显示体验者焦虑评分显著下降,生命体征更平稳,术后满意度提升 [1] 海外科技新闻 - **AR设备**:PetaRay与广达电脑合作发布商用AR头戴式显示器,核心采用PetaRay的LiFiD光场技术,可重建物理光线生成任意焦距视觉体验,使虚拟内容能在任何观看距离下与真实物体自然对齐 [2] - **存储技术**:英伟达于2025年第三季调整Rubin平台的HBM4规格,将Speed per Pin要求上修至高于11Gbps,导致三大HBM供应商需修正设计,叠加Blackwell产品需求优于预期,HBM4放量时间点延后,预期最快于2026年第一季末进入量产 [2] - **自动驾驶与机器人**:Mobileye宣布与人形机器人公司Mentee Robotics达成最终收购协议,Mentee在视觉-语言-动作技术和Sim2Real迁移方面的进展将补充Mobileye的自动驾驶系统,提升对长尾场景的泛化能力 [2] - **显示技术**:三星显示与英特尔共同研发名为SmartPower HDR™的新技术,主要应用于笔记本电脑,能够将OLED面板在HDR模式下的发光功耗降低高达22% [2] AI资讯 - **AI模型**:中国科学院自动化研究所与CreateAI团队构建4D世界模型NeoVerse,该模型无需相机姿态先验,可直接从野外单目视频中高效重建4D高斯泼溅,并通过模拟真实世界成像退化训练生成模型,实现从重建到生成的全链路闭环 [3] - **仿真平台**:智元机器人在CES发布业内首个大语言模型(LLM)驱动的开源仿真平台Genie Sim 3.0,利用LLM技术将仿真场景构建效率提升至“分钟级”,用户仅需提供环拍视频即可生成仿真模型 [3] - **语音合成**:西工大开源VoiceSculptor模型,通过自然语言指令和细粒度属性Token实现对音色、语速、基频及情感的高自由度控制,解决了传统TTS仅能基于参考音频克隆而无法灵活设计音色的技术瓶颈 [3] - **AI代理**:联想发布Qira个人AI超级代理,具备通知总结、实时转录翻译功能,能协调其他AI代理完成任务,支持本地离线运行并可随时间推移高度个性化 [3] “十五五”行业追踪 - **深空经济**:吉天星舟自主研发的遥感光学载荷已实现0.5米高分辨率,计划于今年发射搭载该载荷的卫星,并逐步构建自主星座体系,一期计划发射22颗卫星,未来扩展至220颗 [4] - **具身智能**:征和工业推出全球首创链式灵巧手,拥有17个自由度(7主动+10被动),指尖重复定位精度达±0.1mm,单手承重突破40Kg,动作循环寿命超100万次,传动效率高达95%-98% [4] - **脑机接口**:云南省第一人民医院神经外科团队成功开展西南地区首二例“脑机接口”脑起搏器手术,为两位帕金森病患者植入全球首款可充电、可感知闭环脑起搏器 [4] - **人工智能+制造**:工信部等八部门印发《“人工智能+制造”专项行动实施意见》,提出到2027年,推动3—5个通用大模型在制造业深度应用,形成特色化、全覆盖的行业大模型,打造100个工业领域高质量数据集,推广500个典型应用场景 [4] 半导体市场价格数据 - **DRAM颗粒现货价格(1月8日)**:DDR5 16G (2G×8) 4800/5600盘均价为31.656美元,日涨跌幅+0.58%;DDR4 16Gb (2G×8) 3200盘均价为70.195美元,日涨跌幅+2.20%;DDR4 8Gb (1G×8) 3200盘均价为26.214美元,日涨跌幅+3.18% [7] - **半导体材料价格(1月8日)**:部分高纯金属价格出现上涨,6N高纯锌市场均价为1775元/千克,日上涨5元;7N高纯锌市场均价为1902元/千克,日上涨5元;7N高纯锌粒市场均价为1975元/千克,日上涨5元 [8] - **晶片衬底价格(1月8日)**:导电N型6寸D级单晶碳化硅衬底市场均价为2150元/片;导电N型8寸P级单晶碳化硅衬底市场均价为59000元/片;半绝缘6寸P级单晶碳化硅衬底市场均价为10800元/片 [8]
专访迈克尔·乔丹:不要把像我这样的人视为“特例”
新浪财经· 2026-01-08 09:25
迈克尔·欧文·乔丹的学术与产业背景 - 迈克尔·欧文·乔丹是机器学习领域的先驱,现任加州大学伯克利分校电子工程与计算机科学系、统计学系杰出冠名教授,同时是北京大学、清华大学名誉教授 [1][17] - 他拥有多项顶级荣誉,包括首届世界顶尖科学家协会奖、约翰·冯·诺依曼奖,并当选美国国家科学院、工程院、艺术与科学学院三院院士,于2025年11月当选中国科学院外籍院士 [1][17] - 深耕机器学习与统计推理领域40余年,本科学习心理学,对大脑工作的思考引导其转向算法探索 [1][17] 产业合作与商业成就 - 在过去30年里,参与了三家公司的工作,其中两家是估值超过十亿美元的独角兽企业 [9][24] - 在中国担任蚂蚁集团科学顾问委员会主席,其想法影响了支付宝从支付系统发展为包含商家和消费者的市场建设系统 [9][24] - 曾担任支付宝、亚马逊的科学顾问,与产业界建立了广泛的合作 [1][17] 学术研究与实际应用 - 强调在纯理论研究与实际应用之间“横跳”,始终致力于寻找新问题并以简洁有趣的方式解决 [6][21] - 认为机器学习与统计学密不可分,“学习”本质上是基于统计方法进行分析的统计学问题 [7][21] - 指出大多数大语言模型背后的机制由学术研究人员开发,产业发展来源于学术研究,两者不存在脱节 [10][25] 对中国人工智能领域的观察 - 认为中国在最新一波大语言模型浪潮中更注重开源模式,这与20年前相比是彻底的转变,填补了空白 [11][27] - 指出中国有时更关注奖项、分数、文章数量,而非影响力、创造力和新想法,年轻教授面临发表文章等多重压力 [11][27] - 建议中国需要进一步培养解决真正问题的技能,并肯定了中国学生的创业精神、创造力和雄心壮志 [11][27][29] 对教育与人才培养的观点 - 鼓励青年带着好奇心,运用数学思想去做全新的事情,而非仅仅追求赢得奖项或解决历史难题 [12][14][28] - 建议在扎实的数学教育基础上,增加跨学科内容,例如其在伯克利开设融合统计学、计算机科学和微观经济学的新课 [14][28] - 强调合作与互动的重要性,鼓励多尝试并经历失败,认为通过持续努力(如花10年时间)任何人都能取得成就 [3][15][18][29]
杨立昆自曝离开Meta内幕:与扎克伯格不合,对29岁新上司不满,力挺“世界模型”遭冷落
搜狐财经· 2026-01-05 17:02
核心观点 - 杨立昆因技术路线分歧、公司战略转型及管理文化冲突离开Meta,并创立AMI Labs以继续其基础研究愿景 [1][12] Meta AI战略转型与内部动荡 - 2025年4月,Meta发布的Llama 4系列中代号“Maverick”的模型在Chatbot Arena排行榜以1417分位列第二,一度超越GPT-4o的1410分 [2][4] - 开源社区发现提交测试的模型是经过特殊微调的“针对对话场景优化的实验性版本”,该版本通过生成冗长回答和使用表情符号在当时的评分算法中获取高分 [4][5] - 在平台引入“风格控制”机制后,Llama 4 Maverick的真实排名从第二跌至第五 [5] - 杨立昆承认Llama 4的测试结果“确实被修饰了一点”,团队采用了用不同模型应对不同测试的策略以博取更好账面成绩 [5] Meta高层人事与权力更迭 - 2025年6月,Meta首席执行官扎克伯格决定斥资约143亿美元收购数据标注巨头Scale AI 49%的股份,目标直指其当时28岁的创始人Alexandr Wang [6] - 作为交易的一部分,Alexandr Wang空降Meta,出任公司首位“首席AI官”,全面接管包括FAIR在内的所有AI研究与产品部门 [8] - Meta成立了新的“超级智能实验室”,将分散的研究力量统一收归Alexandr Wang麾下 [8] - 此次调整后,65岁的杨立昆需要向比自己年轻37岁的Alexandr Wang汇报工作 [8] 技术路线与管理文化冲突 - Alexandr Wang上任后将Meta的AI战略锁定在“大语言模型驱动的超级智能”这一单一路径上,扎克伯格提出“为每个人构建个人超级智能”的激进目标,要求全公司资源向LLM倾斜 [8] - 杨立昆对主流LLM技术路径持怀疑态度,认为其本质是“自回归的预测机”,缺乏对物理世界的真正理解,无法通向真正的超级智能,并将其比作“通向超级智能路上的死胡同” [9] - 在一次高层会议上,当杨立昆阐述长期基础研究的重要性时,Alexandr Wang粗鲁地打断并称“我们是在开发超级智能,不是在辩论哲学”,标志着“学术派”与“工程落地派”的决裂 [10] - 杨立昆表示Meta管理层和新团队已经完全“被大语言模型洗脑了”,只顾在基准测试分数上追赶竞争对手 [10] Meta内部科研文化的剧变 - 在Alexandr Wang主导下,FAIR实验室的学术自由受到限制,研究人员在发表学术论文前需先提交给Wang领导的核心产品部门TBD Lab审查 [10] - 只有被认定具有“重大商业价值”的研究才被允许发表,且研究人员需先协助将成果转化到产品中才能回归日常研究 [10] - 2025年10月,Meta启动针对AI部门的裁员,约600名员工被解雇,受影响最严重的是FAIR及相关基础设施团队,而Alexandr Wang亲自组建的TBD Lab则毫发无损并继续扩招 [11] - 杨立昆形容其在Meta的最后日子里感到“政治上越来越困难”,尽管扎克伯格个人仍支持其研究,但在公司急功近利的氛围下支持显得苍白无力 [11] 杨立昆的离职与创业 - 杨立昆因不愿为保住职位而改变科学观点,最终选择离开Meta [11][12] - 杨立昆在巴黎创办了初创公司AMI Labs,致力于“增加这个世界的智能”,探索在科技巨头商业化竞争中被搁置的科学路径 [12] - AMI Labs预计首轮融资5亿欧元,估值高达30亿欧元 [12] - 杨立昆在新公司担任执行主席,将管理运营交给法国AI创业老兵Alex LeBrun,自己回归纯粹的科学家角色 [12][14]
AI"教父"放狠话,大语言模型走不通
文章核心观点 - 人工智能领域先驱杨立昆因与Meta在技术路线和公司战略上存在根本分歧而离职 其认为大语言模型无法实现超级智能 并计划创办新公司推进其“世界模型”架构以实现高级机器智能 [8][9][18][21][95][96][98] - ChatGPT的发布打乱了Meta的阵脚 公司转向全力开发大语言模型Llama 但后续版本表现不佳及数据操纵丑闻导致内部重组 并引入年轻高管 这加剧了与坚持开放研究路线的LeCun之间的冲突 [70][72][73][82][84][86][89][90] - 杨立昆倡导的“世界模型”技术路线旨在让AI通过视频学习理解物理世界 具备规划、推理和记忆能力 他认为这是实现超级智能的正确路径 并预计相关技术将在短期内取得可见进展 [22][23][24][25][102][104][105] 杨立昆的职业轨迹与成就 - 作为深度学习奠基人之一 与Geoffrey Hinton和Yoshua Bengio共同获得2018年图灵奖 [44][45] - 在AT&T贝尔实验室期间开发了卷积神经网络 该技术后被广泛应用于图像识别和银行支票读取系统 [51][52] - 2013年应扎克伯格邀请加入Facebook 主导创建了Facebook人工智能研究院 并保留了在纽约大学的职位且无需搬迁 其研究成果坚持公开 [63][65][66][67] Meta内部AI战略的演变与动荡 - ChatGPT发布后 Meta决定全力开发大语言模型Llama 并通过发布开放权重的Llama 2试图改变行业格局 [73][74][75][76] - 2025年4月发布的Llama 4被指控操纵测试数据以美化结果 导致扎克伯格对团队失去信心 生成式AI部门被边缘化 人员流失严重 [82][83][84] - 2024年6月 Meta投资150亿美元于数据标注公司Scale AI 并聘请其28岁的联合创始人Alexandr Wang来领导新的AI研究部门TBD实验室 [85][86] - 公司试图以1亿美元签约费从竞争对手处挖角顶尖研究员 这一激进策略的效果存疑 [87][88] 技术路线分歧:大语言模型 vs 世界模型 - 杨立昆认为大语言模型本质受限于语言 无法达到理解物理世界的人类水平智能 因而不是实现超级智能的路径 [21][22] - 他提出的替代方案是V-JEPA“世界模型”架构 通过视频和空间数据学习 使AI具备理解物理世界、规划、推理和持久记忆的能力 即高级机器智能 [23][24][25] - 他认为Meta新招募的专注于超级智能的团队“完全被大语言模型洗脑了” 这导致他在公司内部政治上处境困难 [96][97] 杨立昆的离职与新事业规划 - 离职的直接原因包括与公司新战略和管理层(如年轻且无研究经验的新上司)的不合 以及其研究兴趣与Meta商业重点的错位 [89][90][95][99] - 他计划创办新公司并担任执行主席 以推进其世界模型和高级机器智能的研究 并已获得投资人关注 [9][14][100] - 他认为由OpenAI前高管创立的“Thinking Machines”和“Safe Superintelligence”等新型基础研究创业公司代表了行业新趋势 [101] - 预计其世界模型技术的“婴儿版”将在12个月内面世 更大规模版本则在几年内 [104]
2025年硅谷给华人AI精英开出上亿年薪!Agent、Infra人才被抢疯了
搜狐财经· 2026-01-04 16:12
行业重心转向:从模型研究到工程兑现 - 2025年硅谷AI行业的核心叙事从追求“更大的模型、更高的分数”转向关注“将模型纳入产品与系统核心,并在真实业务场景中持续创造价值”的能力[2] - 行业认知发生转向,通用人工智能的愿景褪色,特定领域、可落地的超级智能成为新共识,AI发展从“技术突破期”快速切换到“工程兑现期”[6][7] - 大语言模型迈入平台期,“更大参数、更多数据、更高算力”的线性增长逻辑边际收益明显下降,企业关注重心转向“能不能用、能不能卖、能不能规模化”[7][8] 巨头战略调整与人才价值重估 - 科技巨头的AI研发重心整体迁移,从基础研究转向以产品为核心的集权化研发体系,基础研究需直接服务产品主线才能保留战略优先级[4][10] - 企业战略重心变化直接改变了AI人才的价值排序,工程兑现期更看重将模型能力转化为稳定系统、可落地产品和持续现金流的能力,导致“被需要的AI能力类型变了”[9] - OpenAI年营收约130亿美元,但需烧掉90亿美元维持运营,2028年亏损可能膨胀至营收的四分之三,算力成本压力倒逼企业转向商业价值兑现[8] 关键人才流动:研究高层的离开 - Meta是2025年人才流动潮中的关键变量,一边以天价薪酬全球争抢工程与产品型人才,一边持续流失AI体系核心的研究型高层,如田渊栋被裁、Yann LeCun话语权旁落[10] - FAIR实验室衰落标志着Meta战略转向,生成式AI浪潮后组织价值评判标准转向“可转化性”,负责产品落地的GenAI团队成为主线,FAIR退为“技术后方”[11] - 离开的顶尖研究者分流至不同创业赛道:Yann LeCun创办AMI实验室押注“世界模型”路线;Joelle Pineau加盟Cohere聚焦“可控、可部署的企业AI”;Soumith Chintala加入Thinking Machines Lab探索下一代AI系统形态[12][13][14][15] 人才争夺焦点:三类核心能力 - 人才争夺主要围绕三类核心能力展开:Agent与可执行系统、多模态与实时交互、推理和AI基础设施[16] - 在Agent方向,企业争抢能将模型嵌入可执行系统、具备多步任务规划、工具调用和应用操作能力的人才[16] - 在多模态方向,争夺焦点从静态功能转向实时感知、持续交互和环境理解,Meta斥资约140亿美元投资并收编Scale AI,将其华人创始人亚历山大·王招致麾下领导新成立的“超级智能实验室”[16][17] 天价薪酬与华人工程师崛起 - Meta采用“爆炸式offer”战术抢人,签约金最高达1亿美元,决策窗口短至几小时,OpenAI CEO称今年是职业生涯中“最残酷的人才市场”[3] - Meta新成立的超级智能实验室为新员工提供的签字奖金可达1亿美元,该团队首发成员中至少有6名华人,其中多人来自OpenAI并曾担任关键模型或团队的负责人[17] - 大量华人工程师在2025年站上了硅谷科技巨头AI业务的关键岗位[5] 推理与基础设施成为竞争要地 - 推理和AI基础设施人才极度抢手,这类人才需兼具深度学习与系统工程、服务架构、调度策略的知识,目标是让模型“跑得起、跑得稳、跑得便宜”[19][22] - 英伟达通过引入AI芯片初创公司Groq的联合创始人及团队,获取高性能、低延迟的AI推理芯片架构设计能力[19] - 谷歌新增的AI软件工程师招聘中高达20%是“回流员工”,岗位聚焦于将内部AI研发转写入产品系统层,包括推理效率提升、API服务化框架和企业级部署架构[19]