Workflow
通用人工智能(AGI)
icon
搜索文档
清华大学翟季冬:从“算得出”到“送得到”,“智能路由”打开 AI 基础设施新赛道
环球网· 2026-01-30 19:06
AI基础设施(AI Infra)的发展阶段与使命升级 - 人工智能基础设施是支撑AI技术演进与产业落地的核心底座,其发展始终与行业需求同频共振 [1] - 在大模型爆发初期,AI Infra通过高性能算子、优化训练框架、高效推理引擎等关键技术,集中支撑了“智能的生产”,助力大模型迭代升级与规模化推理部署 [1] - 当前,随着大模型生态繁荣、智能体加速涌现,AI正从技术研发迈向“赋能千行百业”的深度融合期,AI Infra的使命也随之升级,需更聚焦“智能的流通”,为AI技术精准触达最终业务场景扫清障碍 [1] “人工智能+”国家战略与行业核心课题 - 中央经济工作会议在重点任务中明确“深化拓展‘人工智能+’”,推动人工智能同产业发展、文化建设、民生保障、社会治理广泛深度融合,全方位赋能千行百业 [3] - 在此背景下,打通大模型从技术研发到产业应用的“最后一公里”,让智能服务精准匹配场景需求,已成为行业亟待破解的核心课题 [3] - 工信部等八部门联合印发的《“人工智能+制造”专项行动实施意见》指出,到2027年,将推动3至5个通用大模型在制造业深度应用,形成特色化、全覆盖的行业大模型,打造100个工业领域高质量数据集,推广500个典型应用场景 [5] AI Infra下一站:从“堆算力”到“修管道”的智能路由 - 行业观点认为,AI Infra的下一站不再是单纯的“堆算力”,而是要着力“修管道”,即通过“智能路由”技术,将合适的模型、优质的服务精准调度至千行百业的各类应用场景 [3] - 智能路由的核心是攻克两大关键挑战:一是“模型路由”,即在差异化大模型中筛选出适配特定任务的最优模型;二是“服务路由”,即在同一模型的多元API服务提供者中,匹配到满足安全、效率、成本等需求的最佳服务 [3] - 实现路径之一,是把“算得出”的智能,通过高效、安全、低成本的“路由器”精准配送到工厂车间、医院诊室等具体场景 [6] 模型路由:实现模型资源的高效调度与成本优化 - 未来通用人工智能(AGI)的格局将是多个AGI和更多的弱AI共同为人类服务,而非单一AGI一统天下 [7] - 模型路由通过智能调度,可将简单任务分配给成本低、速度快的较小模型(如百亿参数模型),将复杂难题分配给能力更强但成本高的大模型(如万亿参数模型),从而实现整体性能与成本的最优平衡 [7] - 举例说明,通过智能调度,整体任务分数仍可保持99分(满分100),但平均成本可下降八成,响应速度提升五倍 [7] - 模型路由将给行业带来巨大的性价比提升空间,是未来一段时期的重要研究课题 [8] 服务路由:解决API服务选择难题并建立评估标准 - 即使是同一个模型,不同供应商提供的API服务在速度、价格、稳定性方面也存在显著差异 [9] - 以中国境内提供deepseek-v3.2模型API服务的数十家厂商为例,其API服务的吞吐量相差10倍(15~200 token/s),支持的输入输出长度相差20倍(8k~160k),服务定价、流量限制、服务稳定性各异 [9] - 用户选择API服务时最关心安全、能力、速度、稳定、价格五个维度,但市场缺乏统一的评估“尺子” [9] - 完善可靠的测试系统是实现高质量服务路由的基础前提 [9] 智能路由为国产算力“换道超车”提供新机遇 - 避免算力卡脖子,把国产算力用起来,已成为中国AI行业的共识 [10] - 大模型API服务具有标准接口,可以规避开发者直接使用国产算力设备面临的生态不兼容问题 [10] - 服务路由可根据用户要求将任务调度至基于国产算力(如海光、昇腾、寒武纪)的服务上,用户无需自行移植适配,即可轻松满足算力国产化需求 [10] - 目前国产算力的硬件指标已足够承载大部分场景的智能服务需求,只需进一步提升部署智能服务的性能,就能在部分条件下取得相比海外算力的性价比优势 [10] - 提升性能的关键在于面向国产算力架构原生设计并深度优化的推理引擎,直接移植海外推理引擎会制约国产算力的发挥空间 [10] - 以清华团队开源的推理引擎“赤兔Chitu”为例,其在国产平台上优势显著,正是因为进行了大量面向国产平台的原生开发与优化 [11] 智能路由的战略意义与未来展望 - 智能路由的探索与实践,不仅是AI Infra技术边界的拓展,更是对“人工智能赋能千行百业”的有力支撑 [12] - 它通过优化模型选择与服务配置,实现了智能服务的高效、廉价、稳定、安全流通,契合国家“降本增效”的发展要求,也为算力国产化、数据要素价值释放提供了可行路径 [12] - 未来,随着智能路由成为AI Infra的标准配置,人工智能服务将更便捷地融入生产生活各领域,为数字中国建设注入强劲动力,推动中国人工智能产业在全球竞争中占据有利地位 [12]
顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代
机器之心· 2026-01-30 18:43
当前,科学智能(AI for Science)被称之为人工智能的 "皇冠",以 AlphaFold 为代表的 AI for Science(AI4S)技术在蛋白质折叠、气象预测等特定领 域取得了里程碑式成就,但近期《Nature》发表的研究指出,过度依赖现有深度学习模型可能局限新知识的探索边界,甚至在某种程度上阻碍创新。 一项来自上海人工智能实验室(上海 AI Lab)的系统性评估①进一步揭示了当前前沿模型的短板。来自 10 个不同科学领域的 100 位科学家为模型构建了 评测题目,结果显示:前沿模型在通用科学推理任务中得分可达 50 分(满分 100),但在各类专业推理任务(如专项文献检索、具体实验方案设计)中, 得分骤降至 15-30 分。 "我们已身处 "通用人工智能"(AGI)前夕,但仍面临重要环节的缺失 —— 通专融合的智能。 我们亟需推动科学智能从 1.0 向 2.0 迭代,即从 AI4S 迈向 AGI4S。 " 日前,上海人工智能实验室主任、首席科学家周伯文在第四十届人工智能协会年会(AAAI 2026)发表特邀报告时提出,科学发现是 AI 的下一 个前沿阵地 —— 它既是推理智能的终极试炼场, ...
2026前沿科技趋势:塑造自己的下一个版本
36氪· 2026-01-30 17:58
人类生命的第三次转型 - 核心观点:人类生命正经历从单纯追求延长寿命(Lifespan)转向追求延长健康寿命(Healthspan)的“第三次转型”,目标是提升无严重慢性病、残疾或认知衰退的高质量生活年限 [5] - 现状与挑战:20世纪人类预期寿命几乎翻倍,但自20世纪以来,预期寿命增长速度已出现断崖式下跌,从平均每十年增长约3年降至过去三十年的年均增长不足0.25年,某些地区(如美国)甚至出现停滞或倒退 [3][4] - 经济价值:若不对人类寿命质量加以干预,到2030年非传染性疾病预计将给全球经济带来高达47万亿美元的累积成本;而将人类健康寿命仅延长1年,产生的全球经济价值将高达38万亿美元 [5] - 实现路径:通过免疫早筛与预防、重症疾病的有效控制/治愈、以及延缓人体衰老三大“第一性原理”来延长健康寿命,基因疗法和人工智能被视为关键前沿科技 [7] 基因疗法的进展与突破 - 核心观点:基因疗法正从“化学小分子修补”进入“生命代码优化”时代,随着CRISPR 2.0、体内递送系统和表观遗传重编程的突破,有望在2030年前后实现阶段成熟 [9] - 预防性治疗:在心血管疾病领域,碱基编辑技术展示了一次性治愈的可能性,例如Verve Therapeutics的Heart-2期1b临床试验数据显示,单次注射后患者LDL-C平均降低53%,部分患者降幅高达69%,PCSK9蛋白水平平均降低60% [10] - RNA疗法:在高血压领域,RNA干扰技术实现了长效控制,仅需每六个月一次的皮下注射即可使血压持续稳定在健康水平;在血液癌症治疗中,mRNA CAR-T技术在小鼠淋巴瘤模型中清除了肿瘤,使75%的小鼠实现了长期无瘤生存 [12] - 逆转衰老:表观遗传重编程技术取得突破,能够将细胞的表观遗传时钟“拨回”年轻状态,Life Biosciences公司计划于2026年初启动全球首个针对“逆转衰老”机制的基因疗法人体临床试验 [15] 人工智能在医疗健康领域的应用 - 核心观点:人工智能正成为医疗服务的“操作系统”,预计到2030年将在药物研发、疾病筛查和个人健康管理等环节产生切实成效 [17] - 药物研发:人工智能大幅压缩药物研发周期和成本,例如剂泰科技的AI优化候选药物MTS-004已完成III期临床,成为国内首款完成III期临床的AI赋能制剂新药;Insilico Medicine的新药成为全球首款完全由AI发现靶点并设计分子结构的抗特发性肺纤维化药物,已在二期临床试验中取得积极结果 [18] - 疾病早筛:AI与多组学技术结合提升早筛能力,例如Gene Solutions利用AI分析循环肿瘤DNA,仅需单次抽血即可筛查75种癌症,灵敏度达78%,特异性高达99%;DeepGEM大模型通过常规病理图像,1分钟即可精准预测多种常见肺癌驱动基因突变,精准度达78%~99% [19] - 衰老监测:衰老时钟技术迭代迅速,例如日本团队开发了基于尿液细胞的非侵入性衰老检测方法,结合机器学习后预测误差仅为4到5年;中国科学院开发了单细胞精度的衰老时钟,能分辨不同组织中特定细胞类型的衰老速度 [22] 外骨骼技术的发展与应用 - 核心观点:在材料、电子信息和AI技术融合下,外骨骼技术正实现对人类体力的增强,在医疗、工业和个人消费领域应用齐头并进 [24] - 医疗康复:外骨骼从代步工具进化为促进神经康复的智能设备,例如傅利叶智能的ExoMotus M4下肢外骨骼机器人集成了动态减重和力反馈技术;美国Medicare在2024-2025年间对外骨骼设备报销政策的突破,大幅降低了患者使用门槛 [25] - 工业安全:外骨骼演变为提升工人力量和安全性的设备,例如German Bionic的Cray X和Exia外骨骼提供高达30kg助力增强,并能通过“智能安全伴侣”系统减少职业损伤;福特汽车引入外骨骼技术后,其全球工厂的损工工伤事故率下降了75% [25] - 消费普及:千元级外骨骼产品进入户外运动市场,例如极壳于2025年推出的Hypershell X Ultra外骨骼,集成功率1000瓦电机,重量仅为1.8公斤,单块电池续航可达30公里,标准配置售价仅几千元 [26] - 技术演进:通过Transformer模型实现主动适应用户需求,使使用者肌肉激活程度显著降低;通过生理分层传感架构实现精确控制辅助动作;软体外骨骼和形状记忆合金等新型致动器使设备更轻薄、静音 [28][29][30] 低空与个人飞行技术演进 - 核心观点:电动垂直起降飞行器正处在商业化前夜的技术攻坚期,而无人机和个人飞行装备也在各自路径上快速发展 [31] - eVTOL发展:预计到2040年,中国eVTOL市场规模将达410亿美元,年销量约16万台;美国目标在2027年实现初步运营,2030年进行更广泛部署 [31] - 技术瓶颈突破:电池技术进步是关键,例如宁德时代研发的凝聚态电池能量密度达500 Wh/kg,几乎是现有电池的两倍,预计在26-27年投入应用后,能使eVTOL航程从100英里跃升至300英里以上 [32] - 无人机进化:消费级无人机集成高级传感与AI,例如大疆Air 3S集成LiDAR激光雷达;行业级无人机自主能力显著提升,例如Skydio的X10无人机可在无GPS环境下实现厘米级精准悬停;大疆FlyCart 30重载无人机能在珠峰海拔6000米极端环境下执行任务 [34] - 个人飞行装备:初创公司瞄准“超轻型飞行器”市场,例如瑞典Jetson Aero的Jetson ONE售价14.8万美元,订单排到2027年;中国快轮科技的Rictor X4售价仅3.99万美元,但相关法规和空域管理仍是未解难题 [35] 水下探索技术的拓展 - 核心观点:潜水技术正通过增强潜水员感知与生理能力、实现常态化深海科考以及发展水下机器人,不断拓展人类水下探索边界 [36] - 单人潜水增强:潜水员增强视觉显示系统能接收声纳数据,在零能见度水域重构实时3D海底模型;Scubapro的Galileo HUD等设备将关键数据投射在潜水员眼前;北京大学团队研发的便携式柔性水下外骨骼使潜水员平均空气消耗量减少22.7%,作业时间延长20%以上 [37] - 载人深海潜水:中国“奋斗者”号等三台深海载人潜水器已累计下潜1746次,2025年完成314次下潜,进入高频常态化作业阶段;“蛟龙”号于2024年完成技术升级,具备了高可靠性;“奋斗者”号在2025年成功完成首次北极密集冰区下潜科考 [38] - 水下机器人:驻留型水下机器人和远程操控技术实现“水下数字在场”,例如Oceaneering公司的Freedom AUV能长期驻留海底充电基站;TechnipFMC的Gemini ROV配备自动换刀机械手,在深水阀门操作任务中效率提升一倍以上 [40] 人工智能向通用智能(AGI)的演进 - 核心观点:AI正从一个“偏科的背诵天才”向“心智健全的思考者”转变,通过补齐能力短板和提升行动力,有望在2030年前后进化为人类外脑2.0 [43][44] - 补齐智能拼图:第一是“会思考”,新一代推理模型学会在输出前进行自我辩论和推导;第二是“好记性”,通过Titans架构、嵌套学习和进化的RAG技术构建长期记忆;第三是“懂世界”,视频和世界模型开始理解真实世界的物理规律;第四是“自学习”,通过优化推理时计算、模拟试错和自我博弈探索自主学习能力 [46][47] - 提升行动力:智能体需优化“感知→决策→组装→执行”四个易崩溃的环节;通过“规划RL化”、反思能力内化(如Reflexion研究)等方法来训练任务执行能力;自适应机制通过演示学习、GUI Agent强化学习和Skills封装来连接工具调用与任务执行 [49] - 未来形态:一是基础模型即智能体,将规划、工具操作等能力直接集成进模型;二是AgentOS,在操作系统层做“意图入口+跨应用执行”,如深度集成的手机AI助手,可能成为AI去App化的新流量入口 [50] 脑机接口从修复到增强 - 核心观点:脑机接口正从科幻走向现实,侵入式技术成为重获机能的标准疗法,非侵入式技术则激发普通人神经交互的新能力,并与AI智能体协作打开未来想象 [51] - 侵入式BCI治疗:Neuralink的N1植入物包含1024个记录电极,截至2025年中有5名四肢瘫痪患者接受植入,能凭意念控制电脑;其“盲视”项目获FDA“突破性设备”认定,旨在通过刺激视觉皮层为患者恢复视觉感知;Synchron公司的Stentrode系统采用血管内介入技术,避免了开颅风险 [52][53] - 非侵入式BCI增强:生成式AI改变了脑电信号解码,Meta研究团队利用AI模型从脑磁图信号重构受试者听到的语音内容,解码准确率超过70%;科技巨头入局消费级应用,如Meta研发基于肌电图的神经腕带,苹果在AirPods中集成脑电传感器专利 [54] - 未来协作与挑战:AI可通过BCI实时解码大脑意图并转化为行动,实现“意念驱动”的人机协作;同时也带来神经数据隐私、精神边界等伦理挑战,全球正在形成“神经权利”立法浪潮 [55] AI赋能个人创造力与组织变革 - 核心观点:AI眼镜、智能体和机器人将个人创造力放大,同时催生超级个体、小团队和大型企业组织形态的深刻变革 [57][65][68] - AI眼镜:成为拓展感知的日常设备,通过碳化硅波导与MicroLED实现轻薄高亮显示,通过肌电与眼动追踪实现“眼到意到”的交互,通过6G与边缘计算实现强大实时AI能力,将现实世界升级为被持续语义化、实时标注的认知空间 [57][58] - AI智能体:正逐步进入工作流,成为个人智力与执行力的增强伙伴,预计到2030年,人机协作将经历从“人类兜底”到“AI先做一版”,再到AI完成更复杂工作闭环的三个阶段 [60][61] - 机器人:2025年进入“工业验证”阶段,高分辨触觉传感、世界模型驱动的训练以及成本下降推动规模化应用,例如智元A2定价9.9万元,宇树G1约1.6万美元;据预测到2031年,具身智能机器人BOM成本将再降40% [62] - 超级个体与小团队:AI工具使“一人公司”成为可能,开发者可独立完成产品开发至运营,实现月入几十万甚至百万美元;小团队凭借高效协同和创新,能撬动过去需要成百上千人才能完成的产出,例如Notion、Figma、Stability AI和Torch等案例 [65][66][67] - 大型企业重塑:在AI冲击下,大型企业在人才“选、育、用、留”方面发生根本变革,评价标准转向“能不能做成事”和“AI-Native”素养,协作方式转向动态组建超级小团队和人机协同,激励方式从雇佣关系转向共创伙伴关系 [70][71][72][73] 2030年的机遇与基础要素重构 - 核心观点:科技进步正在重构信息、能量、物质三个世界基本要素,推动丰裕社会的到来,但同时也伴随多重挑战 [79] - 信息升维:地面+太空算力、6G通信、空天互联网编织全球智能网络,算力像电力一样成为普惠的基础设施 [79] - 能量重构:太阳能成本下降,虚拟电厂整合分布式能源,核聚变持续取得进展,能源成本趋近于零将改变经济可行性 [79] - 物质解放:合成生物学可“编程”物质,例如从二氧化碳合成淀粉的效率超越自然光合作用8.5倍;AI光选机实现垃圾精准分拣,让“城市矿山”成为现实 [79]
2026前沿科技趋势:塑造自己的下一个版本
腾讯研究院· 2026-01-30 16:18
文章核心观点 文章以“生命力2030”、“体力2030”、“脑力2030”、“创造力2030”及“追求2030”为框架,系统展望了至2030年,以人工智能、基因疗法、外骨骼、飞行器、脑机接口、具身智能等前沿科技将如何深刻重塑人类在健康、行动能力、认知能力、创造力及社会组织形态方面的未来图景,核心在于阐述科技如何以人为本,赋能个体能力倍增,并推动社会向更高效、更普惠的方向转型[5][6][28][29][48][66][89][90] 一、人类生命的“第三次转型” - 延长健康寿命 - 人类预期寿命在过去一百多年里翻倍,主要发达国家从1900年的约40岁增长到2000年的超过80岁,中国人均寿命从建国初期的49.7岁增长至2025年的78.4岁[7] - 但预期寿命增长已大幅放缓,过去三十年中,全球最长寿人群的预期寿命年均增长率已降至0.25年以下,部分地区出现停滞[8] - 全球正接近从追求“活得更久”转向追求“活得更好”的“第三次生命转型”,即延长健康寿命[9] - 到2030年,若不加干预,非传染性疾病预计将给全球经济带来高达47万亿美元的累积成本,而将人类健康寿命延长1年,产生的全球经济价值将高达38万亿美元[9] - 免疫早筛、重症治疗和延缓衰老是延长健康寿命的核心路径,基因疗法和人工智能是关键前沿科技,2030年有望成为此次转型的启航时刻[10] 二、生命可编程 - 基因疗法修补和优化生命代码 - 基因疗法正从“化学小分子修补”进入“生命代码优化”时代,随着CRISPR 2.0、体内递送系统和表观遗传重编程的突破,有望在2030年前后实现阶段成熟[11] - **预防性基因疗法取得临床突破**:Verve Therapeutics在2025年4月公布的Heart-2期1b临床试验数据显示,单次注射碱基编辑疗法可使家族性高胆固醇血症患者LDL-C平均降低53%,部分患者降幅高达69%,PCSK9蛋白水平平均降低60%,预示一次性治愈心血管疾病的可能[12] - **RNA疗法实现长效控制**:Alnylam与罗氏开发的RNAi降压药,仅需每六个月注射一次即可使血压持续稳定在健康水平[15] - **mRNA CAR-T技术取得进展**:斯坦福大学团队开发的mRNA CAR-T技术,在小鼠淋巴瘤模型中清除了肿瘤,使75%的小鼠实现了长期无瘤生存[15] - **表观遗传重编程开启逆转衰老曙光**:Life Biosciences公司在灵长类动物模型中,利用基于山中因子的疗法成功恢复了受损视神经功能,并逆转了视网膜细胞的DNA甲基化年龄,计划于2026年初启动全球首个针对“逆转衰老”机制的人体临床试验[17] 三、健康可规划 - 人工智能提效医疗与解码生命 - 人工智能正成为医疗领域的“操作系统”,预计到2030年将在药物研发、疾病筛查和个人健康管理环节产生切实成效[21] - **生成式AI加速药物研发**:剂泰科技与北京大学第三医院等合作的AI优化候选药物MTS-004已完成III期临床,成为国内首款完成III期临床的AI赋能制剂新药;Insilico Medicine的AI设计抗肺纤维化药物已在二期临床试验取得积极结果,计划2025年底启动三期临床[22] - **AI与多组学技术结合助力疾病早筛**:Gene Solutions利用AI分析循环肿瘤DNA,单次抽血可筛查75种癌症,灵敏度78%,特异性99%;DeepGEM大模型通过病理图像1分钟即可预测肺癌驱动基因突变,精准度78%~99%;AOA Dx利用AI分析血液成分,实现了超过90%的卵巢癌早期检测准确率[23] - **AI帮助量化衰老和定位衰老根因**:日本团队开发基于尿液细胞的非侵入性衰老检测方法,结合机器学习预测误差仅为4到5年;研究利用AI分析基因组数据发现,体细胞突变是驱动表观遗传改变的根本原因[25] 四、体力=电力 - 外骨骼恢复和提升人类陆地行动力 - **医疗领域**:外骨骼从代步工具进化为促进神经康复的智能设备,傅利叶智能的ExoMotus M4集成了动态减重和力反馈技术;美国Medicare在2024-2025年间对外骨骼报销政策的突破,使其进入主流医疗器械行列[31] - **工业领域**:外骨骼提升工人力量与安全,German Bionic的Cray X和Exia外骨骼提供高达30kg助力,并能通过数据记录和提醒减少职业损伤;福特汽车引入外骨骼技术后,其全球工厂的损工工伤事故率下降了75%[31] - **个人消费领域**:千元级外骨骼产品出现,极壳于2025年推出的Hypershell X Ultra外骨骼,功率1000瓦,重量1.8公斤,单块电池续航30公里,售价仅几千元[32] - **技术演进方向**:利用Transformer模型使外骨骼能主动适应用户需求;通过生理分层传感架构实现精确控制;软体外骨骼和形状记忆合金等新型致动器使设备更轻薄、静音[33][34] 五、飞上天空 - 飞行技术的三条进化路径 - **eVTOL商业化攻坚**:预计到2040年,中国eVTOL市场规模将达410亿美元,年销量约16万台;美国目标在2027年实现初步运营,2030年进行更广泛部署[37] - **电池技术是关键**:宁德时代研发的凝聚态电池能量密度达500 Wh/kg,几乎是现有电池两倍,预计26-27年投入应用后,可使eVTOL航程从100英里跃升至300英里以上[37] - **无人机进化为空中机器人**:消费级无人机如大疆Air 3S集成LiDAR实现夜间避障;行业级无人机如Skydio X10可在无GPS环境下厘米级精准悬停;大疆FlyCart 30重载无人机能在珠峰海拔6000米运送物资[40] - **个人飞行装备探索**:瑞典Jetson Aero的八旋翼飞行器Jetson ONE售价14.8万美元;中国快轮科技的个人eVTOL产品Rictor X4最高时速50英里,续航20分钟,售价3.99万美元,但相关法规和空域管理仍是挑战[41] 六、潜入未来 - 潜水技术不断拓展人类水下探索边界 - **单人潜水增强**:潜水员增强视觉显示系统可在零能见度水域重构实时3D海底模型;Scubapro的Galileo HUD等设备将关键数据投射在潜水员眼前;北京大学研发的便携式柔性水下外骨骼使潜水员平均空气消耗量减少22.7%,作业时间延长20%以上[42] - **载人深海潜水常态化**:中国“奋斗者”号等三台深海载人潜水器累计下潜1746次,2025年完成314次下潜;“蛟龙”号在2024年完成技术升级,具备高可靠性;“奋斗者”号在2025年成功完成首次北极密集冰区下潜科考[43] - **水下机器人实现数字在场**:Oceaneering公司的Freedom AUV可长期驻留海底充电基站,自动执行巡检;TechnipFMC的Gemini ROV配备自动换刀机械手,在深水阀门操作任务中效率提升一倍以上[45] 七、智力x2 - 能自主学习的外脑2.0 - 通用人工智能的进化正致力于抹平AI能力的“锯齿形分布”,并从“打榜跑分”转向以“行动力”为评价标准,目标是到2030年前后进化为人类外脑2.0[50][51] - **补齐智能的四块拼图**: - **会思考**:以OpenAI o1和DeepSeek R1为代表的推理模型具备思维链和自我纠正能力;强化学习使模型能组合技能解决新问题[52] - **好记性**:谷歌Titans架构引入深度神经长期记忆;嵌套学习和进化的RAG技术使AI能持续积累经验[53] - **懂世界**:OpenAI Sora 2、谷歌Veo 3等视频和世界模型开始理解并维持物理规律的一致性[53] - **自学习**:研究通过优化推理时计算、模拟环境试错、自我博弈等方式,让AI掌握自主学习能力[54] - **AI学会做事的关键**:针对工具调用“感知→决策→组装→执行”环节进行系统性优化;通过“规划RL化”、内化反思能力等训练任务执行能力[55][57] - **未来智能体形态**:一是基础模型即智能体;二是AgentOS,在操作系统层实现意图入口和跨应用执行,可能成为AI去App化的新流量入口[59] 八、接口+1 - 脑机接口打开从修复到增强的新纪元 - **侵入式脑机接口成为标准疗法**:Neuralink的N1植入物含1024个电极,截至2025年已有5名四肢瘫痪患者接受植入,可凭意念控制电脑;其“盲视”项目获FDA突破性设备认定,旨在通过刺激视觉皮层为患者恢复视觉感知[61] - **血管内介入脑机接口**:Synchron公司的Stentrode系统通过微创手术将电极送入血管壁,渐冻症患者可凭意念控制iPhone等设备[61] - **非侵入式脑机接口指向“增强”**:Meta研究团队利用AI模型从脑磁图信号重构语音,解码准确率超70%;科技巨头如Meta、苹果、Snap正研发消费级神经接口产品,将成为空间计算时代的标准交互方式[63] - **脑机接口与智能体协作**:研究已证明AI可实时解码大脑意图,未来可能实现“意念驱动”的人机高效协作,但也带来神经数据隐私等伦理挑战[64][66] 九、个人创造力x3:眼镜+智能体+机器人 - **AI眼镜拓展感知**:碳化硅波导与MicroLED推动眼镜向极薄、高亮度发展;肌电与眼动追踪实现“眼到意到”的交互;6G与边缘计算支撑实时多模态AI能力,使现实世界被实时语义化增强[67][68] - **AI智能体扩充知识型创造力**:智能体如ChatGPT、Manus已进入工作流,未来将更具备自主学习、稳定执行和个性化支持能力,成为个人帮手[71] - **人机协作三阶段**:2026-2027年为“AI执行+人类兜底”;2028-2029年为“AI先做一版+人处理例外”;2030年后取决于AI持续学习能力以完成更复杂闭环[72][73] - **机器人提升体力型创造力**:2025年人形机器人进入“工业验证”阶段,Figure AI在宝马工厂参与生产,Agility Robotics完成10万次物流搬运[74] - **机器人技术迭代**:高分辨率触觉传感器赋予机器人“手感”;视觉-语言-动作模型与世界模型推动训练效率;核心零部件国产替代使成本下降,智元A2定价9.9万元,宇树G1约1.6万美元,预计到2031年BOM成本再降40%[74] 十、小团队大能量:用创新力重新定义“大公司” - **超级个体与一人公司涌现**:借助AI工具,个人可独立完成产品开发、营销与运营,实现月入几十万甚至百万美元,在细分市场展现行业影响力[75] - **小团队创造大价值**:小团队决策链短、响应敏捷,创造力可提高10倍以上,能撬动过去需大规模团队才能完成的产出[76] - **案例印证**:Notion早期不足十人团队完成核心研发,约40人时估值达20亿美元;《星露谷物语》由一人开发成为全球畅销作品;Figma以远小于传统公司的团队规模,以200亿美元被收购;Stability AI早期仅十余人通过开源Stable Diffusion迅速成为AI独角兽;医疗数据服务公司Torch仅4名员工,于2026年被OpenAI以4亿美元收购[76][78][79] 十一、大型企业的下一个版本 - 在“融化”中重塑未来 - **选人转型**:评价标准从学历、年资转向“能不能做成事”;“AI-Native”素养成为基础能力;AI深度参与识人流程,使招聘系统成为动态的“能力雷达”[82][83] - **育人个性化**:企业通过AI系统为员工提供动态个性化学习路径;利用VR/AR进行情境化训练;构建知识管理平台与社区,使经验可查询复用[84] - **用人更灵活**:岗位边界模糊,人机协作成常态;超级小团队成为主流;组织围绕任务动态组建临时项目团队,内部出现“内部自由职业者”机制[85][86] - **留人走向共生**:激励方式从KPI导向转向基于任务价值与体验;合作关系从固定雇佣转向共创伙伴;企业角色从雇主转向“人才与伙伴的平台”[87][88] 十二、能力倍增后的自我反思与2030展望 - **机遇**:信息、能量、物质三大基础要素被科技重构。算力像电力一样普及;太阳能成本下降,虚拟电厂兴起;合成生物学可“编程”物质,如从二氧化碳合成淀粉的效率超越自然光合作用8.5倍[95] - **挑战**:端侧智能体带来隐私边界挑战;AI情感伴侣可能导致情感依赖;深度伪造技术引发“合成混乱”;AI替代可能引发“意义贫困”;科技能力不均可能固化为新的阶层分化;存在决策外包与治理失灵风险[96][97] - **世界仍需人类解决问题**:全球仍有近7亿人生活在极端贫困线下,气候变化、公共卫生、教育公平等问题仍需投入解决[98]
GPT-5.2破解数论猜想获陶哲轩认证,OpenAI副总裁曝大动作
36氪· 2026-01-29 21:24
OpenAI发布AI科研平台Prism并成立OpenAI for Science团队 - 公司于凌晨发布了新一代AI科研平台Prism,该平台由GPT-5.2加持,供科学家撰写和协作研究,即日起向所有拥有ChatGPT个人账户的用户免费开放 [1] - 公司副总裁Kevin Weil表示,目标是赋予每位科学家AI超能力,让世界在2030年就能开展2050年的科学研究 [1] - 公司于2025年10月宣布成立全新的OpenAI for Science团队,核心致力于探索大语言模型助力科研人员的路径,并优化旗下工具为科研人员提供支持 [1] OpenAI布局科研领域的战略意图与竞争格局 - 公司认为,通用人工智能(AGI)能为人类创造的最重大、最积极的价值,正是其推动科学进步的能力,例如帮助探索全新的药物、材料和器械 [3] - 在AI科研领域,公司已面临激烈竞争,谷歌DeepMind早在数年前便已成立AI-for-science团队,并打造了AlphaFold、AlphaEvolve等具有开创性的科学模型 [2] - 公司布局OpenAI for Science,很大程度上是为了在科研这一新领域抢占先机,因为真正的技术创新尚未到来 [16] GPT-5系列模型在科研中的能力评估与表现 - 公司副总裁Kevin Weil评价当前模型的实际能力时表示,模型还达不到取得颠覆性新发现的水平,但能让人不必把时间浪费在已经解决的问题上,这也是对科研的一种加速 [2] - 搭载了推理模型的GPT-5,在解决复杂问题方面较GPT-4有了质的飞跃,在包含400多道博士级专业问题的GPQA基准测试中,GPT-4正确率为39%,而GPT-5.2正确率达到92% [5] - 模型能力被认为早已超过90%的研究生,甚至达到了人类能力的极限,例如能在国际数学奥林匹克竞赛中取得金牌级成绩 [5] - 模型擅长找到科研人员尚未意识到的现有研究成果及关联线索,协助草拟数学证明过程,并为实验室验证假说提供实验思路 [8] - 模型几乎阅读了过去30年发表的每一篇论文,不仅能理解本领域内容,还能从其他不相关的领域中提炼出可类比的思路 [9] GPT-5在科研应用中的实际案例与用户反馈 - 一位开通了GPT-5付费服务的科研人员反馈,GPT-5会犯一些比人更愚蠢的低级错误,但一直在进步 [2] - 范德堡大学物理与天文学教授Robert Scherrer表示,他和研究生为一个问题钻研了数月都毫无头绪,GPT-5却成功解决了它,但模型仍会犯一些低级错误 [10] - 非营利性研究机构杰克逊实验室的生物学教授Derya Unutmaz表示,以前需要几个月才能完成的数据集分析,现在用大语言模型就能完成,不用大语言模型已经行不通了 [10] - 加州大学伯克利分校的统计学家Nikita Zhivotovskiy认为,大语言模型最有用的地方在于能挖掘出其研究工作与一些未知现有研究成果之间的意外关联,但几乎没见过模型能提出真正值得单独发表的全新观点 [10] - 利物浦大学化学教授Andy Cooper表示,其团队并不会借助大语言模型构思研究思路,但这项技术已开始在更庞大的自动化系统中显现实用价值,比如大语言模型可协助操控机器人 [11] 模型存在的缺陷、引发的争议及优化方向 - 模型存在“幻觉”问题,曾导致科学期刊论文出现核心思路错误,例如将检测非线性理论的实验方案错误地设计为检测非定域性理论 [12] - 去年10月,公司高管曾宣称GPT-5已为多个数学未解难题找到解决方案,但事后被数学家指出只是从早期研究论文中挖掘出了已有的答案,相关帖子随后被删除 [6] - 近期有消息称,GPT-5.2 Pro破解了一道埃尔德什猜想(第281号),其提出的新证明方法已被菲尔茨奖得主陶哲轩验证并收录,证明思路与之前的方法“相当不同” [7] - 公司正对模型整体设计作两大思路优化:一是让GPT-5在给出答案时降低置信度,具备认知层面的谦逊性;另一方向是利用GPT-5反向对自身输出进行事实核查 [3][14] - 公司正在探索让模型充当自身校验者的工作流程,即一个模型完成初步推理,再将结果交由另一模型审核,通过筛选和反馈进行改进,这与谷歌DeepMind为AlphaEvolve打造的模式高度相似 [15] 对AI驱动科研未来的展望与预测 - 公司副总裁Kevin Weil预测,2026年对于科研领域的意义,将堪比2025年之于软件工程,一年后,倘若一名科研人员还未深度运用AI开展研究,就可能已经落后 [3] - 范德堡大学教授Robert Scherrer表示,如果当前的发展趋势能持续下去,很快所有科研人员都会用上大语言模型 [10] - 加州大学伯克利分校统计学家Nikita Zhivotovskiy相信大语言模型正在成为科学家们必不可少的技术工具,就像曾经的计算机和互联网一样,那些拒绝使用这类工具的人将会长期处于劣势 [10]
CSIWM个股点评:2026年关键里程碑
中信证券· 2026-01-29 20:23
核心观点与估值 - 中信里昂研究认为软银集团在2026年有多项关键事件可能催化市场表现[5] - 软银集团股价在2026年1月进一步回调,截至1月28日报4201.0日元,市值为1599.90亿美元[13] - 市场共识目标价为6632.40日元,较当前股价有约57.9%的潜在上行空间[14] 关键催化因素 - 据报软银正考虑以7500-8300亿美元估值向OpenAI投资300亿美元,此消息推动了股价上涨[5][6] - 2026年关键驱动因素包括AI采用速度、机器人战略、OpenAI融资与业务进展、Stargate项目等[7] - 其他催化因素包括股票回购、新投资项目、IPO市场以及软银愿景基金业绩改善[9] - 软银具备高度AI敞口,对OpenAI、Arm、软银愿景基金及机器人领域的持股提供多条上行路径[8] 业务与财务概况 - 软银集团收入主要来自软银业务(占90.0%)和Arm(占6.9%),地区上亚洲占91.8%[13] - 公司主要股东为孙正义,持股29.14%[14] - 过去3个月日均成交额为24.70亿美元[13] 主要风险 - 首席执行官孙正义是战略核心,其若不再参与管理将引发市场严重担忧[11] - 软银电信业务面临加剧的竞争压力,且高负债在利率上行时可能引发问题[11] - OpenAI明确IPO时间表及具体估值可能被市场解读为负面信号[11] - 日元走强将对公司构成风险,因其多数资产位于海外[11]
GPT-5.2破解数论猜想获陶哲轩认证!OpenAI副总裁曝大动作:正改模型核心设计,吊打90%研究生但难出颠覆性发现
AI前线· 2026-01-29 18:07
OpenAI发布AI科研平台Prism并成立OpenAI for Science团队 - OpenAI发布由GPT-5.2驱动的新一代AI科研协作平台Prism,并向所有ChatGPT个人用户免费开放 [2] - OpenAI于2024年10月宣布成立全新的OpenAI for Science团队,核心目标是探索大语言模型助力科研的路径并优化相关工具 [2] - OpenAI副总裁Kevin Weil表示,公司的目标是赋予每位科学家AI超能力,加速科研进程,目标是让世界在2030年就能开展2050年的科学研究 [2] OpenAI布局科研领域的战略动机与竞争态势 - OpenAI认为,通用人工智能(AGI)能为人类创造的最重大价值在于其推动科学进步的能力,例如帮助发现新药物、材料和探索现实本质 [5][6] - 在AI科研领域,OpenAI面临激烈竞争,谷歌DeepMind早在数年前便成立了AI-for-science团队,并打造了AlphaFold等开创性科学模型 [3][4] - OpenAI for Science的布局,很大程度上是为了在AI科研这一新领域抢占先机 [20] GPT-5系列模型的当前能力与局限性 - 搭载推理模型的GPT-5在解决复杂问题方面较GPT-4有质的飞跃:在考察博士级专业知识的GPQA基准测试中,GPT-4正确率为39%,而GPT-5.2正确率达到92% [7] - 模型能力被认为已超过90%的研究生,并在国际数学奥林匹克竞赛中取得金牌级成绩,达到了人类能力的极限 [7] - 然而,模型目前还达不到取得颠覆性新发现的水平,有时会犯一些“比人更愚蠢”的低级错误 [4][12][13] - 模型曾因宣称解决数学未解难题但实际只是挖掘已有答案而引发争议,被指沟通“过于草率” [8][9] GPT-5在科研中的实际应用与价值 - GPT-5擅长帮助科研人员找到他们尚未意识到的现有研究成果及跨领域关联线索,从而催生新思路 [11] - 模型能够协助草拟数学证明过程,并为实验室验证假说提供实验思路 [11] - GPT-5.2几乎阅读了过去30年发表的每一篇论文,并能从上千个不相关领域中提炼出可类比的思路,充当一个“从不休息”的合作者 [12] - 实际案例显示,有科研人员借助GPT-5在数月未解的问题上取得突破,或以前所未有的速度完成数据分析 [12][13] 科研界对AI工具的态度与反馈 - 部分科研人员认为大语言模型正变得像计算机和互联网一样,是科学家必不可少的技术工具,拒绝使用将处于劣势 [13][14] - 有科学家指出,大语言模型目前主要是在整合现有成果,而非创造真正全新的研究方法,几乎未见其提出值得单独发表的全新观点 [14] - 也有态度不那么乐观的科研人员认为,大语言模型尚未从根本上改变科研方式,但其在自动化系统(如操控机器人)中可能更有实用价值 [15] OpenAI针对模型缺陷的优化方向 - OpenAI正重点优化模型,让其降低置信度,具备认知层面的“谦逊性”,以更委婉的方式(如“以下思路可供参考”)提供参考思路而非绝对答案 [18] - 公司探索的另一方向是利用GPT-5对自身输出进行事实核查,构建让模型充当自身校验者的工作流程,这与谷歌DeepMind为AlphaEvolve打造的模式相似 [19] - 尽管新一代模型产生“幻觉”(错误信息)的概率已大幅降低,但公司承认问题依然存在,并认为关键在于如何将错误观点转化为科研探索过程的一部分 [17][18]
专访|人工智能同样需要“终身”学习——访人工智能促进协会主席斯蒂芬·史密斯
新华社· 2026-01-29 12:13
大语言模型的另一个缺陷是缺乏因果推理能力。史密斯表示,大语言模型擅长抓相关性,却难以理解因 果关系,规划能力有限。有些系统看似能做计划,其实只是根据预先设定好的步骤行动。"大语言模型 不会问自己:'如果我这样做,接下来会发生什么?'这也解释了为什么大语言模型有时会给出荒谬答 案。" 新华社新加坡1月29日电 专访|人工智能同样需要"终身"学习——访人工智能促进协会主席斯蒂芬·史 密斯 新华社记者舒畅 人工智能(AI)下一步会如何发展?在人工智能促进协会主席、美国卡内基-梅隆大学机器人研究所 教授斯蒂芬·史密斯看来,答案可能藏在人类的学习方式里——持续乃至"终身"学习。 第40届人工智能促进协会年会近日在新加坡举行。史密斯在会议期间接受新华社记者专访时说,人工智 能近年来最引人注目的突破是大语言模型的崛起。经过海量数据训练,这类模型能理解和生成文本,甚 至处理更多类型的内容。"当前很多研究都是顺应这股浪潮,或者在其基础上探索新方向。" 当前的许多人工智能正是基于大语言模型,但史密斯认为,大语言模型存在局限。目前大多数大语言模 型通过训练形成基础模型后就被"冻结",缺乏持续更新和"成长"。 因此史密斯认为,从这个 ...
2026年春节红包能救大厂AI 吗?
36氪· 2026-01-29 12:13
文章核心观点 - 2026年春节红包大战反映了科技巨头在AI时代的战略焦虑,其核心是争夺未来AI交互的“前台”入口主权,防止自身应用被“空心化”为后台插件[2][8][14] - 通过现金红包激励用户与AI互动是一种认知错位,难以建立用户对AI的智力依赖,反而可能因产生大量低质数据而损害模型能力,属于低效的“垂死挣扎”[5][6][20][22] - AI产品的成功应依赖于其作为实用工具的核心能力与用户体验,而非金钱激励或强行嵌入旧有社交场景,公司需要创新互动模式以获取高质量数据来训练模型[26][28][30] 红包大战的本质与动机 - 巨头投入巨额资金进行红包营销,如腾讯计划10亿,百度计划5亿,旨在重现2015年微信支付通过红包完成冷启动的成功,但此次背景与逻辑已完全不同[1][4] - 此举是公司为应对AI时代“主权”定义改变而发起的“主权保卫战”,核心目标是争夺成为用户与数字世界交互的唯一“AI前台”,避免自身超级应用被降级为后台“供货商”或“插件”[8][12][14] - 红包大战也是向资本市场传递信心的“焦虑安慰剂”,表明公司并未在AI时代缺席,尽管其可能清楚当前策略并非通往未来的有效钥匙[21][22] 现金激励的局限性 - 2015年微信红包成功的关键在于其构建了“绑定银行卡-进入移动支付生态”的刚需闭环,而当前AI红包缺乏类似的闭环,难以改变用户习惯[5] - 现金激励只能带来日活数据的虚假繁荣和用户的功利性参与,无法培养用户对AI作为“智力外挂”的依赖,补贴停止后用户极易流失[5][20] - 为领取红包而产生的低质量AI交互数据(如无意义的指令)会对大模型训练产生负面影响,德州大学2025年研究显示,垃圾数据比例升至100%可使模型推理能力暴跌23.6个百分点[6] AI时代的主权重构与行业格局风险 - AI的智能特性可能颠覆现有应用格局,用户未来或只需与一个AI助手对话即可完成购物、搜索等任务,这将使淘宝、抖音、微信等超级应用面临被“空心化”为后台供应链、视频库或数据库的风险[12][13] - 巨头试图用互联网时代“圈地”构建围墙花园的逻辑,来控制天性趋向“大一统”和“中立”的AI技术,这存在根本性的悖论与冲突[15][16] - 百度因其“信息终极分发”的基因,视自身为可调用一切应用作为“神经元”的“超级大脑”,其战略目标与AI的特性更为契合[14] 用户行为变迁与市场挑战 - 2026年的用户已对红包营销感到疲劳,小额红包从“惊喜”变为“打扰”,参与动机大幅下降[18][19] - AI作为纯工具属性产品,其采用取决于效用而非网络效应或社交关系,用户极其理性,会直接比较不同AI助手的能力差异[20] - 强行将AI嵌入现有社交场景(如腾讯元宝的“派”)可能制造尴尬,形成“四不像”产品,既无法满足专业协作需求,又可能破坏随性的社交氛围[23][24][26] 对AI产品发展与营销的建设性建议 - 红包互动设计应从“单向输出”转向“双向训练”,例如让用户投票选择AI生成的最佳内容,从而为公司获取高质量的人类偏好标注数据,这相当于将红包资金转化为“数据采购费”[28][30] - 营销策略应从“普惠撒钱”转向“精准激励”,例如用1亿资金吸引KOL、创作者等种子用户,通过他们生产的高质量教程和用例来示范AI价值,驱动普通用户的好奇心与 adoption[31] - AI产品的根本在于提升智能与实用效率,目标应是让用户感到“不带着这个AI助理,还真不行”,而非依赖红包吸引[32]
月之暗面三位联创深夜回应一切,3小时答全球网友23问,杨植麟剧透Kimi K3提升巨大
36氪· 2026-01-29 08:17
智东西1月29日报道,今天凌晨,月之暗面核心团队在社交媒体平台Reddit上举行了一场有问必答(AMA)活动。三位联合创始人杨植麟 (CEO)、周昕宇(算法团队负责人)和吴育昕与全球网友从0点聊到3点,把许多关键问题都给聊透了,比如Kimi K2.5是否蒸馏自Claude、 Kimi K3将带来的提升与改变,以及如何在快速迭代与长期基础研究之间取得平衡。 ▲AMA栏目截图(图源:Reddit) 一开始,便有网友抛出尖锐问题:Kimi K2.5有时会自称为Claude,有人怀疑这是对Claude进行蒸馏的证据。杨植麟回应道,这一现象主要是 由在预训练阶段对最新编程数据进行了上采样,而这些数据似乎与"Claude"这个token的关联性较强,事实上,K2.5在许多基准测试中似乎都优 于Claude。 谈及Kimi K3,杨植麟没透露太多细节,但提到了K3会在Kimi Linear上加入更多架构优化,他相信,就算Kimi K3没比K2.5强10倍,也肯定会 强很多。 整场问答中,月之暗面的三位联合创始人共回答了40多个问题。智东西也向他们提出了3个问题,并获得了直接回应。 当智东西问及月之暗面的算力储备时,杨植麟称 ...