Workflow
通用人工智能(AGI)
icon
搜索文档
全球顶尖大模型,通关不了“宝可梦”:这些游戏都是AI的噩梦
创业邦· 2026-01-26 08:10
文章核心观点 - 顶尖AI模型在医学、编程、数学等专业领域表现卓越,却在一款儿童游戏《宝可梦》中屡屡受挫,这揭示了当前通用人工智能在开放世界中的持续推理、长期规划、记忆与因果理解等方面存在显著能力鸿沟[2][3] - 游戏《宝可梦》因其回合制、无需即时反应但要求长期目标坚持的特性,正逐渐成为评估AI模型在复杂、长周期任务中真实能力的非正式但极具说服力的测试基准[7][24] AI在《宝可梦》游戏中的具体表现与挑战 - **Claude系列模型的挣扎**:Anthropic的Claude Sonnet 3.7在2025年2月的直播中仅“会玩”但难以通关,会在关键节点卡住数十小时并犯低级错误[2] 早期版本表现更灾难,有的无法走出新手村[3] 即便能力提升的Claude Opus 4.5,也曾因未意识到需砍树而在道馆外绕圈四天[3] Claude Opus 4.5累计运行超500小时、执行约17万步,但受限于每一步操作后的重新初始化,其长期记忆存在短板[7] - **Gemini模型的成功与原因**:谷歌的Gemini 2.5 Pro在2025年5月成功通关一款难度相当的《宝可梦》游戏[5] 其成功关键并非模型本身更聪明,而在于使用了更强大的工具集,如将游戏画面转写为文本以弥补视觉理解弱点,并提供定制化解谜与路径规划工具[5] Gemini 3 Pro随后完成了难度更高的《宝可梦水晶》,且全程未输一场战斗[10] - **核心能力缺陷**:游戏要求AI在没有明确指令的开放世界中持续推理、记忆数小时前的决策、理解隐含因果关系、在数百个可能行动中做出长期规划,这些对8岁孩子轻而易举,却是当前AI的鸿沟[3] AI面临的核心挑战是无法在长时间跨度内持续执行单一明确目标,容易忘记几分钟前的行动[8] 存在“知道却做不到”的断层,例如知道需寻找道具却无法在二维地图中稳定定位[8] 工具集的重要性 - **工具集决定成败**:在《宝可梦》这类长期任务中,工具集的差异被放大至足以决定成败的程度[5] Gemini的工具集被比喻为“钢铁侠装甲”,使AI并非赤手空拳进入游戏[5] 相比之下,Claude使用的工具集更为简约,其尝试更直接地反映了模型自身的真实能力[5] - **工具集拓展能力边界**:配备合适工具集的AI可能在软件开发、会计、法律分析等知识工作中展现极高效率[10] 例如Anthropic的Claude Code工具集允许模型编写并运行自有代码,已被用于成功管理《过山车大亨》中的虚拟主题公园[10] AI行为特征与进步 - **行为近似人类**:在人类数据上训练的模型会表现出近似人类的行为特征[10] 例如,当Gemini 2.5 Pro模拟“恐慌状态”(如宝可梦即将昏厥)时,其推理质量会显著下降[10] Gemini 3 Pro通关后,为自己留下了一段非任务必需的、带有情感投射的备注[10] - **能力持续演进**:Claude Opus 4.5在自我记录和视觉理解上明显优于前代[10] Gemini模型从通关《宝可梦蓝》到挑战更高难度的《宝可梦水晶》,展示了进步[10] 其他揭示AI能力边界的复杂游戏 - **《NetHack》**:这款随机性强且有“永久死亡”机制的地牢游戏,需要常识逻辑和长期规划,AI表现甚至远逊于人类初学者[13] - **《我的世界》**:在开放世界中,AI经常在长达数十小时的资源收集过程中“忘记”初衷,或在复杂导航中迷路,独立“击败末影龙”仍是幻想[15] - **《星际争霸 II》**:通用模型在处理“战争迷雾”的不确定性以及平衡微操与宏观建设方面力不从心,若直接通过视觉指令接管会瞬间崩盘[17] - **《过山车大亨》**:管理乐园需要追踪数千名游客状态,AI在处理大规模财务崩溃或突发事故时极易出现推理断层,导致破产[19] - **《艾尔登法环》与《只狼》**:这类强动作反馈游戏对毫秒级反应有要求,目前的视觉解析延迟意味着AI还在“思考”时角色往往已经阵亡[22] 《宝可梦》作为AI测试基准的意义 - **成为非正式测试标准**:《宝可梦》正逐渐成为AI评估领域一种非正式却极具说服力的测试基准[24] Anthropic、OpenAI和谷歌的模型相关直播累计吸引数十万条评论,谷歌在技术报告中详细记录进展,公司高管在公开场合提及,Anthropic在行业会议设立展示区[24] - **更接近现实复杂任务**:与一次性问答的传统基准不同,《宝可梦》能在极长时间内持续追踪模型的推理、决策与目标推进过程,这更接近现实世界中人类希望AI执行的复杂任务[24]
AI应用龙头,又被空头整了
搜狐财经· 2026-01-25 16:40
公司股价表现与市场地位 - 公司是过去两年美股AI应用的领军者,一年内股价飙升超过700%,市值一度突破2000亿美元 [1] - 2026年初股价遭遇剧烈震荡,从745美元的高点迅速回调至520美元左右 [1] - 近三年(2023/01/01至2026/01/01)股价涨幅达4856.70%,振幅达6993.30% [10] 财务业绩与盈利能力 - 2025年第三季度营收达14.1亿美元,同比增长68% [1][11] - 2024年全年软件平台收入达32.2亿美元,同比增长75% [11] - 2025年第三季度调整后EBITDA利润率高达82%,远超同业 [1][13] - 同业对比:The Trade Desk的EBITDA利润率在30%-40%,Unity Software则在盈亏平衡线附近 [15] 做空机构CapitalWatch的指控核心 - 指控公司是跨国洗钱网络的关键一环,涉及跨国有组织犯罪和反洗钱法律危机 [3][5] - 关键个人股东唐浩的持股资金被指来源于中国非法P2P平台“团贷网” [5] - 团贷网在2019年崩盘前非法集资高达2535亿人民币 [7] - 指控唐浩通过虚构服务贸易、利用地下钱庄“对敲”交易、家族代持网络(妹妹唐玲)三步完成资本外逃和洗钱 [7] 做空机构指控的营收来源问题 - 柬埔寨太子集团被指控通过公司平台洗白诈骗所得黑金 [8] - 太子集团关联企业(如柬埔寨应用WOWNOW)在公司平台购买巨额广告,资金以“广告费”名义流入 [8] - WOWNOW作为服务于1700万人口市场的应用,其广告投放规模被指与市场体量极不匹配,缺乏商业逻辑 [9] - 这种模式被指解释了公司异常的营收来源和超高利润率 [9] 其他做空指控与商业争议 - 做空机构浑水曾指控公司AXON 2.0算法侵犯隐私,在用户拒绝跟踪下仍进行精准投放,存在合规隐患 [9] - 多空博弈的核心争议在于公司能否持续利用技术红利实现高增长和高利润 [10] 公司业务转型与商业模式 - 公司成功从游戏发行为主转型为纯粹的广告技术平台,于2025年彻底剥离游戏制作业务 [11] - 商业护城河建立在MAX聚合平台和AXON推荐引擎之上 [16] - MAX平台通过应用内竞价机制垄断大量头部手游广告库存 [16] - 公司收入绝大部分由游戏支撑(近90%),并在游戏领域保持明显的投资回报率优势 [17] 行业长期结构性风险 - 通用人工智能(AGI)的发展可能颠覆现有流量分发逻辑和广告平台模式 [18] - AI代理(AI Agents)将使决策权从“人”转移到“代理”,用户可能通过单一超级AI入口完成操作,绕过传统应用和广告 [18] - 公司作为流量中介的商业模式可能面临去中介化的降维打击 [18][20] - 行业预测:到2028年,60%的品牌将使用代理AI进行一对一互动,传统渠道营销将终结 [19]
AI应用龙头,又被空头整了
格隆汇APP· 2026-01-25 16:29
作 者 | 弗雷迪 数据支持 | 勾股大数 据(www.gogudata.com) 在过去两年的美股市场里,Applovin堪称AI应用的顶流。 这家公司凭借AI广告的业务定位,在一年内股价曾飙升超过700%,市值一度突破2000亿美元大关,成为纳斯达克乃至标普500指数中AI应 用端的绝对领军者。 业绩更是展示了令人咋舌的盈利能力,2025第三季度营收同比增长68%,调整后EBITDA利润率达到了令同业难以企及的82%。 如此强势的增长,似乎印证了华尔街对其"AI应用之王"的赞誉。 然而,就在市场情绪最为高涨的时刻,一份来自做空机构CapitalWatch的重磅报告,一下把市场热情给打下来了。 2026年初,Applovin的 股价遭遇了剧烈震荡,从745美元的高点迅速回调至520美元左右。 01 深渊凝视 近期,CapitalWatch发布了题为《东南亚洗钱集团的纳斯达克"洗衣机"》的调查报告,瞬间击碎了Applovin的完美滤镜。 这份报告并没有纠结于常见的估值泡沫或技术细节,而是直接抛出了一个逆天的指控: Applovin并非单纯的商业奇迹,而是一个庞大跨国洗 钱网络的关键一环。 来源:华尔街见闻 这 ...
马斯克喊出25万亿估值!Optimus Gen 3必须救活特斯拉!
机器人大讲堂· 2026-01-25 12:03
文章核心观点 - 特斯拉正进行重大的战略转向,将未来增长核心从汽车业务押注于Optimus人形机器人,并设定了宏大的估值与量产目标,但此举是在汽车主业增长见顶、面临严峻挑战背景下的“弃车保帅”式豪赌,其成功与否取决于Optimus的技术突破、商业化进程以及公司能否平衡新旧业务 [1][3][4][7][22][28] 特斯拉汽车业务现状与挑战 - **销量下滑与市场地位动摇**:2025年特斯拉全球交付汽车163.6万辆,同比下降8.6%,连续两年下滑,且全年电动汽车销量首次被比亚迪超越 [7][8] - **欧洲市场严重下滑**:2025年一季度,特斯拉在德国、瑞典、丹麦等国销量跌幅均超50%,法国市场销量下滑41.1% [8] - **盈利能力大幅恶化**: - 2025年第三季度单季净利润13.73亿美元,同比大降37% [8] - 2025年第一季度单季净利润4.2亿美元,同比骤降71% [8] - 2025年第三季度运营利润率仅5.8%,创近五年最低,较2024年同期的10%大幅下滑 [8] - **其他增长引擎受阻**:全自动驾驶(FSD)软件在全球多国遭遇严格监管审查,商业化落地进程受阻 [10] Optimus人形机器人的战略定位与进展 - **战略核心地位**:公司将其视为关键的救命稻草和核心战略,CEO埃隆・马斯克回应称该愿景很可能成真,并认为机器人业务价值将远超汽车板块,有望推动公司估值突破25万亿美元 [3][4][10] - **产品迭代与规划**:项目自2021年公布,第三代产品Optimus Gen3预计于2026年2-3月正式亮相,定位为通用人形机器人,目标覆盖工业、家庭、医疗、太空等多场景 [11][13] - **技术竞争力**: - 复用汽车业务的全栈技术、成本控制与软硬件协同能力 [14] - 搭载与FSD同源的纯视觉感知方案,依托Dojo超算与数亿英里路测数据 [14] - Gen3版本全身45个自由度,手部22个自由度可完成0.08毫米精度操作 [14] - 结合Grok大模型与世界模拟器,单日可积累人类五百年操作经验 [14] - **生产与测试进展**:正在得克萨斯州超级工厂搭建专用生产线;2025年底已有原型机在弗里蒙特工厂小规模部署,承担电池搬运等基础任务 [16] - **与高管激励绑定**:马斯克的薪酬方案要求其在2030年前完成100万台人形机器人的交付目标,以解锁限制性股票 [16] Optimus面临的商业化困境与挑战 - **量产进度严重滞后**:2025年原定生产5000台的目标落空,实际产量仅数百台,远未达到万台级生产目标 [17] - **技术短板尚未突破**: - 自主运行仍依赖后台远程操控,此前演示中存在行动平稳性问题 [17] - 实现真正的商业化应用需要通用人工智能(AGI)支撑,但业内认为AGI落地至少还需十年以上 [17] - **供应链存在瓶颈**:核心部件如灵巧手对精密制造要求极高,量产存在瓶颈,尽管已选定7家中国公司作为核心组件一级供应商 [21] - **规模化应用时间推迟**:受技术与供应链制约,业内分析规模化应用至少还需推迟3-5年,此前规划的2027年千万台级量产目标缺乏现实支撑 [21] 特斯拉战略转型的风险与市场质疑 - **“弃车保帅”的业务风险**:2025年第三季度281亿美元营收全部来自汽车板块,若削减该业务投入,可能导致市场份额进一步萎缩 [22][24] - **现金流压力巨大**:2025年第三季度投资活动现金流净额为负89.5亿美元,公司已削减近一半资本支出以维持稳定,而机器人项目需要持续高额投入且回报周期长 [24][25] - **市场对目标的信任质疑**:马斯克过往多次“夸大式声明”兑现乏力,其提出的25万亿美元估值、十年部署10亿台机器人的目标被外媒批评为“又一次极度夸大的声明”,有观点认为这是抓住新炒作周期 [27] 未来展望与关键节点 - **2026年第二至第三季度成为关键节点**:Optimus Gen3的正式发布及其技术成熟度将决定市场对项目的信心 [28] - **成功的关键在于平衡**:公司必须守住汽车业务基本盘以稳定现金流,从而支撑机器人项目循序渐进;需要平衡好新旧业务节奏并稳步突破技术瓶颈,Optimus才有可能重塑公司估值逻辑 [28]
AI、区块链与量子计算,三者融合的未来潜力
新浪财经· 2026-01-25 07:43
AI技术演进趋势 - AI正从一次性对话的聊天机器人演进为具备理解现实世界、持续推理、调用工具和保留记忆能力的智能协作体,即Agentic AI [2] - 人工智能已告别单纯数字生成时代,迈入智能体与物理智能深度融合的新纪元 [2] - 人工智能正朝着通用人工智能方向迈进,其能够广泛理解、学习并完成人类可胜任的任何智力任务 [5] - 通用人工智能演化的下一阶段是超级人工智能,其将全面超越人类智能,在科学创造力、问题解决及社会互动方面展现无与伦比的能力 [5] 核心技术融合 - AI智能体、区块链与量子计算三项技术正在融合,并以从未想象过的方式塑造世界 [2] - 超级人工智能与区块链、量子计算等新兴技术的融合,可以进一步放大其变革潜力 [7] - 量子计算是融合体系的“引擎”,其处理海量数据的能力可显著提高AI的学习和问题解决效率,尤其对依赖大规模数据集的机器学习至关重要 [8] - 量子计算非凡的处理能力有望解决全球最紧迫问题,如开发定制新材料、通过精确模拟分子结构推动药物研发、以及加速核聚变能源发展 [8] - 区块链为高级智能提供了安全、透明且合乎伦理的部署框架,为记录和验证交易提供了不可篡改的方式 [8] - 量子计算与区块链存在双向互动:抗量子算法可确保区块链网络抵御潜在量子攻击,而量子计算的速度又能大幅提高区块链网络的性能和可扩展性 [8] 行业应用与变革 - 在医疗保健领域,IBM的沃森系统已被用于分析患者数据以提供个性化治疗 [9] - 量子计算的加入能以前所未有的规模模拟分子相互作用,从而进一步增强如沃森等AI系统的能力 [9] - AI可在健康问题显现前预测风险,区块链在全球系统中安全管理患者数据并确保隐私,量子计算则助力发现新疗法攻克难以治愈的疾病 [9] - 在金融与商业领域,万事达卡已在利用AI分析其区块链网络上的交易数据以识别欺诈异常 [11] - IBM和马士基等公司利用AI与区块链融合提高供应链透明度,通过AI预测物流问题,并通过区块链提供不可篡改的全球货物流动记录 [11] - 量子计算的加入将进一步用于求解复杂的金融模型和优化投资组合,为金融领域带来前所未有的透明度和安全性 [11] - 在出行与环保领域,特斯拉和Waymo等公司正将AI与先进计算结合开发自动驾驶 [11] - 量子计算快速处理复杂算法的潜力,将极大增强自动驾驶车辆的实时决策能力 [11] - 在气候领域,量子计算与AI的模式识别结合,正在创建更精确的气候模型,帮助人类预测并降低气候变化的影响 [11]
周鸿祎:2026年全世界至少会出现100亿个智能体,百亿级公司在AI领域都算小公司
新浪财经· 2026-01-24 11:57
AI行业发展趋势与预测 - 预测到2026年,全球至少会出现100亿个智能体,届时百亿级公司在AI领域都算小公司 [3][7] - 指出2024年行业追逐大模型,2025年大模型开始转型升级为智能体,而智能体是AI在各行各业真正落地的关键 [3][7] - 认为大模型与智能体需要实现双向进化,仅片面追求大模型增加参数和算法突破,难以实现通用人工智能(AGI) [4][8] 算力需求的结构性变化 - 指出行业在2024、2025年将训练算力与推理算力混为一谈是一个错误,训练算力需求大但为少数大公司专享,绝大多数普通人和公司需要的是推理算力 [3][7] - 举例说明需求差异:与大模型日常聊天(每月几万个token)与使用智能体制作短剧或进行业务培训(可能需要百万甚至千万级别算力投入)的算力消耗完全不同 [3][7] 智能体发展的核心驱动力与生态 - 强调中国开源生态在全球促进了智能体的繁荣发展,例如东盟国家正在使用中国的开源模型构建其国家系统 [3][7] - 指出未来许多未参与AI竞争的国家可能面临困境,人工智能竞争目前主要集中在中美两个玩家之间 [3][7] AI落地应用的关键角色转变 - 纠正行业误解,认为AI的主角不仅是训练大模型和搞芯片,垂直领域的业务专家、行业专家才是让AI进入企业、行业的关键 [4][8] - 指出每个单位都存在大量隐性知识、潜规则和企业秘密,将这些知识用于训练智能体,而非通用训练,是抢占AI发展核心红利的关键 [4][8] - 以自身开发短剧智能体的经验为例,说明最高水平的工程师也无法提供专业运镜、情感表达等内容,需要摄像师、导演等业务领域从业者的经验,他们是AI落地的主角 [5][8]
燧原科技科创板IPO获受理 | 融中投融资周报
搜狐财经· 2026-01-24 11:20
燧原科技科创板IPO获受理 - 2026年A股首单IPO申请获上交所受理 拟融资60亿元 保荐机构为中信证券 [3] - 募集资金拟用于第五代和第六代AI芯片系列产品的研发和产业化项目 以对标国际厂商高端产品性能 [3] - 公司成立于2018年3月 是“国产GPU四小龙”中成立最早但IPO最晚的公司 最后一轮融资后估值超过200亿元 [3] - 股东阵容包括国家集成电路产业投资基金 腾讯 武岳峰资本 国方金浦 上海国投 红点中国 美图公司等 [3] 曦望完成近30亿元战略融资 - 一年内顺利完成近30亿元战略融资 投资方包括三一集团旗下华胥基金 范式智能 杭州数据集团等产业方 以及IDG资本 中金资本 高榕创投等知名VC/PE机构 [4] - 公司前身为商汤大芯片部门 2024年底分拆独立 专注于高性能GPU及多模态场景推理芯片的研发与商业化 [5] - 拥有八年技术沉淀 二十亿研发投入及两代量产芯片工程化验证 所筹资金将用于下一代推理GPU的核心技术研发与规模化量产 [4][5] 西贝餐饮获A轮融资 - 内蒙古西贝餐饮集团有限公司获A轮融资 投资方包括台州新荣泰投资有限公司 呼和浩特市集体共创企业管理中心等 [4] - 公司注册资本从8990.2896万元增至10168.0175万元 增幅约13.1% 创始人贾国龙及部分原有股东持股比例下降至约26.16% [4] - 公司此前有2026年上市计划 [4] 中科宇航IPO辅导验收 - 上市辅导状态已变更为辅导验收 从2025年8月备案至今耗时五个月 成为继蓝箭航天后IPO进程最快的商业航天企业 [6] - 公司成立于2018年12月 是中国科学院力学研究所孵化的商业火箭公司 主营“力箭”系列运载火箭研制及发射等业务 [6] - 力箭一号火箭已完成十一次飞行 成功将84颗卫星送入太空 入轨载荷总质量超11吨 [6] - 2025年8月股份转让项目估算公司估值约为111亿元 至今已完成8轮融资 [6][9] - 2026年1月12日 力鸿一号遥一飞行器完成亚轨道飞行试验 为太空制造 太空旅游等领域打下技术基础 [6][7] 多支产业基金设立与扩募 - **湖北省港航发展基金**完成扩募 引入江汉区战略性新兴产业发展引导基金 扩募后基金认缴金额约28亿元 其中江汉基金认缴出资1.5亿元 [9] - 该基金定位于投向湖北省交通水运项目建设及相关产业 采用1+N母子基金模式 [9] - **名川资本第三期人民币基金**在安徽滁州设立 注册资金1亿元 是合肥工业大学与地方政府合作的首支科研成果转化基金 聚焦智能制造 新能源 新材料等领域 [10] - **优必选参与设立机器人产业基金** 基金出资总额6.6亿元 其中优必选出资3亿元 基金将重点关注智能终端 机器人与人工智能等领域 [11] - **中山致远望睿创业投资基金**正式成立 以医疗器械为主要投资方向 管理人深圳国创致远 [13] - **辽宁辽盛创科天使创业投资基金**完成备案 总规模2亿元 是辽沈地区首支省 市 区三级政府共同参与的天使基金 聚焦人工智能 生物医药等六大重点领域 [13][14]
学界大佬吵架金句不断,智谱和MiniMax太优秀被点名,Agent竟然能写GPU内核了?!
AI前线· 2026-01-23 17:18
文章核心观点 - 文章围绕“通用人工智能(AGI)能否成为现实”展开了一场深度辩论,两位来自学术界与产业界的一线研究者基于对算力、模型架构、应用落地的不同理解,阐述了各自对AGI定义、发展现状及未来趋势的判断 [6][7] - 尽管对AGI的实现路径存在分歧,但双方均认为,相较于抽象定义,AI技术(尤其是智能体)的实际“实用性”及其对工作方式的变革才是关键,并一致看好小模型、开源模型、新硬件及多元化架构的未来发展 [15][23][55] 关于AGI定义的争论 - **定义视角**:AGI的定义主要有两种主流视角,一种关注模型覆盖的认知任务广度,另一种则从经济角度出发,看其是否引发新的工业革命并改变生产方式 [14][35] - **共识与分歧**:双方达成共识,认为AGI的具体定义并不重要,关键在于它是否改变了人类的工作方式 [15][55]。丹·傅认为,以5-10年前的标准看,当前的语言模型在写代码、生成语言等方面已实现早期设想的AGI,并可能引发软件工程领域的工业革命 [34]。蒂姆·德特默斯则认为,当前关于AGI的狂热预测源于特定社群的信息茧房,缺乏对计算现实的考量 [36] 算力增长的潜力与极限 - **算力极限论**:蒂姆·德特默斯认为“计算是物理的”,内存迁移、带宽、延迟及冯·诺依曼瓶颈决定了算力不可能无限扩张,指数增长终将放缓,Scaling Law也不例外 [10][37]。他指出,从DRAM到HBM等硬件创新已接近物理极限,量化技术(如4位精度)也已发展至尽头,功能和硬件潜力均已被充分挖掘 [40][42][43] - **算力潜力论**:丹·傅认为当前谈“算力见顶”为时过早,现实系统中算力被严重低估和浪费,大量性能消耗在内核调度与系统开销上 [12]。他指出,当前评测的“最强模型”多基于一两年旧的算力集群训练,未能代表当下硬件的真实上限 [12][49]。通过新一代硬件(性能提升约2–3倍)、系统与工程优化(算力利用率提升约3倍)及更大规模集群(规模效应约10倍)三者叠加,理论上可用算力有接近90倍的提升空间 [13][18][46] 智能体(Agent)的发展与应用 - **拐点时刻**:丹·傅指出,2025年6月是Agent发展的关键拐点,当时代码智能体成功攻克了被视为编程领域终极难题之一的“GPU内核编程”,使其个人工作效率提升了5倍,其团队也能快速完成原本需耗时数月的复杂系统开发 [17][20][62][63] - **高度通用性**:蒂姆·德特默斯认为代码Agent本身就是高度通用的Agent,因为代码几乎可以描述和解决所有数字化问题,并断言超过90%的代码和文本本应由Agent生成 [20][66] - **应用与管理范式**:双方将Agent比作“需要精细化管理的实习生”,人类需提供明确背景、拆解任务并设定约束,而将注意力聚焦在方向把控与结果校验上 [21]。丹·傅强调,专业知识越深厚的专家,Agent能为其创造的效率增量就越显著 [21][74] - **必备技能**:蒂姆·德特默斯强调“要么善用Agent,要么被时代淘汰”,使用Agent并有效检查、编辑其输出(约10%的工作)将成为未来核心技能,能带来巨大的生产效率提升 [20][67][68] 人工智能行业未来趋势预判 - **小模型与开源模型**:双方均认为小模型将成为行业新热点,针对特定领域数据训练的小模型部署难度低、性能出色,将更具吸引力 [23][81]。开源模型(如GLM-4.7)的能力将进一步飞跃,并开始媲美最优秀的前沿模型 [23][26][83] - **硬件多元化与专业化**:硬件赛道将走向多元化发展,训练与推理环节的专业化分化会加剧 [23][24]。推理芯片将更侧重在手机、笔记本电脑等终端设备本地运行 [61] - **架构创新**:Transformer架构独霸天下的时代将落幕,状态空间模型(SSM)、线性注意力及各类混合架构等新架构将登上舞台 [25][84][86]。中国团队在架构创新上更敢于探索多种可能性,通过架构创新或极致性能让开源模型脱颖而出 [26][85] - **多模态与端侧AI**:多模态领域(如视频生成)及端侧AI(在笔记本电脑、手机等设备上运行的AI)预计将有进一步发展 [23][83] - **中美发展路径差异**:相比美国“先做出最强模型,再等待应用出现”的思路,中国模型团队的发展思维更务实,更关注模型能否真正落地并在现实场景中产生价值 [26][55]
硅谷投资人亲历达沃斯:AI下半场拼成本、能源与落地
第一财经· 2026-01-23 11:22
全球AI行业趋势与竞争格局 - 全球科技界已进入“多体系并行”的常态,对AI的讨论重心从对开源模型的惊叹,转向更务实的技术路径、成本竞争、能源瓶颈等深层博弈 [1] - 谷歌强势回归,构建全栈式人工智能生态,其推理成本不到OpenAI的30%,并通过浏览器和搜索收集高质量真实世界反馈以加速迭代 [5] - 开源生态活跃度超乎以往,中国在全球开源生态中已成为“重要贡献者”,例如Kimi的K2等项目,提升了其在全球技术协作网络中的影响力 [5] AI技术路径与成本竞争 - AI竞争不仅是模型能力竞争,更是系统优化和成本的竞争,推理成本、数据隐私与安全、数据孤岛等是规模化落地必须跨越的鸿沟 [9] - 大量应用型初创公司不再执着于打造底层大语言模型,转而基于开源生态中的“小语言模型”和垂直领域Agent,结合自身高质量数据进行微调优化 [6] - 在To B场景和本地化部署中,小模型比大模型更实用、更经济,意味着更低的可负担成本、更高的数据隐私安全以及更便捷的私有化部署 [6][9] 地缘政治与区域市场需求 - 欧洲企业出现“数据主权”焦虑,由于美欧政治摩擦,许多欧洲巨头对于将核心数据交给美国AI公司心存芥蒂 [1][7] - 欧洲企业开始渴望本地化、可控的AI解决方案,这打破了硅谷公司“天然全球化”的旧有叙事,为全球技术格局带来新变数 [8] 能源瓶颈与基础设施 - 能源成为AI发展的基础瓶颈,在耗尽GPU之前,人类可能最先耗尽电力,硅谷科技巨头焦虑于陈旧的电网设施和升级乏力 [10] - 科技巨头不得不亲自下场应对电力问题,例如微软自掏腰包补贴当地居民以平抑电价波动,马斯克和扎克伯格也投身电力设施建设 [10] - 中国拥有全球最强的电力基建和网络,为AI算力提供了坚实的能源底座,在AI拼成本、拼能耗的下半场,这种基础设施优势将转化为巨大竞争力 [13] AI与产业融合落地 - AI与产业结合加速落地,重点领域包括医疗与金融、太空经济 [11] - 2026年被视为AI医疗大年,美国最大的非营利医疗机构之一正以前所未有的速度推进数据与AI整合,AI应用已从“辅助诊断”向“治疗手段”进化 [11] - 金融、保险及相关产业占美国GDP约20%,是一个被低估的巨无霸市场,针对特定场景的AI Agent能够撑起百亿美元的估值 [11] - 太空经济领域,SpaceX的发展轨迹展示其从火箭发射服务公司演进为AI Native和Robotics Native的完整生态构建者,并且已实现盈利 [12] 中国科技竞争力 - 中国在机器人领域拥有显著成本优势,以宇树科技为代表的企业,其人形机器人成本可能只有美国的十分之一,基于强大供应链的“好用且便宜”构成独特比较优势 [13] - 中国在制药层面的创新能力已可与美国比肩,越来越多的跨国药厂开始收购中国的新药研发企业,证明其在生物科技等前沿领域的商业化取得显著进展 [13] 对AGI的展望 - 距离真正的AGI(通用人工智能)还很远,其定义为AI能做人类90%以上的工作,同时比90%的人类做得更好 [13] - AI既能实现商业自动化、削减成本,也能助力业务增长、创造新岗位,若能将人们从繁重复劳动中解放,将开启人类更自由探索的新阶段 [14]
如何为人工智能“立心”?儒学有独特解释
观察者网· 2026-01-23 11:11
AI技术演进方向与儒学思想的融合 - AI技术正朝着具身智能和通用人工智能方向演进 这一发展路径强调“经验”或“体验”对于智能形成的重要性 与中国文化倚重常识和经验的思维方式相契合 [1][3][4] - 当前主流AI发展沿袭图灵和冯·诺依曼体系路线 过于注重数理算法和理智 缺乏感性、身体联系以及经验与常识 存在通用性强但针对性弱的缺陷 [4] - 未来的AI发展方向预计将与常识联系越来越紧密 并需要借鉴现象学方法 强调体验、具体场景和身体结合 这与儒学的论说方法及具身智能的特性相一致 [4][10] 区域发展与AI机遇 - 山河四省等传统文化高地 历史上曾是金融创新中心 在智能时代凭借其深厚的文化底蕴和数据资源的“可复用”特性 有机会再次成为系统性创新的中心 [5] - 存在“隔代遗传”规律 农业文明地区在信息革命时代可能具备后发优势 农业文明的特质与智能时代的居家办公、个性化定制等模式存在天然适配性 [6][7] - 在数据时代 “人文经济”将起重要作用 山河四省等人文资源富集地区 可通过AI技术活化其独特的文化故事与资源 转化为新的发展机遇 [7][8] 智慧时代的知识资本演变 - “知本”概念应演进为“智本” 强调从文本知识到活智慧的转变 AI时代看重的是智慧而不仅仅是死的知识 [8][9] - 智慧时代的核心在于“知行合一” 这里的“知”指良知 强调认识与实践的统一 将知识用在合适的地方并看其是否起作用 [9] 儒学对AI及网络理论的指导价值 - 儒学是世界上唯一研究“活的网络”的学问 它研究的是以亲情联系的人际网络 即人心 这与当前AI向具有生命特征的“活”的智能发展方向相契合 [1][12][16] - 儒学可为AI提供核心思想指导 即“为天地立心” 追求让真正的“心”与系统建立深度连接 具备自主搏动和主动功能 而非图灵测试式的伪装 [12][13][14] - 儒学的“亲亲”思想是农业文明的“魂” 其核心是和谐亲和 追求矛盾的双方合一 未来AI发展应基于此思想 实现人、机、物三元融合 促进互补合作与共赢 [17][18][20] 人文学科在AI时代的价值 - 未来文科将越来越重要 其核心价值在于个性化、体验和情感 这是超越内卷和价格战 实现增值的关键 例如文科生擅长把握情感中细腻的差异 [21] - 发展已进入文理融合的时代 新的信息科学范式包含文科与理科部分 AI需从左脑的理科思维 向结合右脑的创造、联想及情感体验的方向发展 即文理结合、人物结合 [22]