Workflow
Agentic Context Engineering(ACE)技术
icon
搜索文档
腾讯研究院AI速递 20251013
腾讯研究院· 2025-10-13 04:56
AI模型能力评估 - 陶哲轩使用GPT-5 Pro挑战数学开放问题,发现AI在小尺度具体计算推导和宏观尺度整体问题结构把握方面表现出色[1] - 在中尺度策略选择和方向判断层面,AI帮助有限甚至产生干扰,因过度认同用户思路而未能指出关键假设错误[1] - AI成功推导出Minkowski第一积分公式等工具,但在复杂非圆几何形态分析上存在明显局限[1] 全球AI竞争格局变化 - 硅谷顶级投资人Chamath Palihapitiya公开表示其公司已将大量工作负载转向中国Kimi K2模型,因性能足够强且比OpenAI和Anthropic便宜太多[2] - Vercel、Cursor、Perplexity等美国开发者生态重要平台已集成Kimi K2,开发者用代码进行"投票"成为市场证明[2] - State of AI Report 2025首次将中国AI从"追赶者"提升为"平行竞争者"[2] AI在医疗领域的应用突破 - 宾大医学院教授David Fajgenbaum创立非营利组织Every Cure打造AI系统MATRIX,在7500万种药物与疾病组合中寻找治疗方案[3] - MATRIX利用生物医学知识图谱为每个药物-疾病组合打分,生成7500万个分数时间从100天缩短至17小时[3] - 该系统已帮助多位罕见病患者,优先攻克"最糟糕的病"[3] AI人才流动与产业动态 - AI领域传奇人物Andrew Tulloch离开Thinking Machines Lab重返Meta担任重要职位,曾拒绝Meta超10亿美元报价[4] - Thinking Machines Lab于今年7月完成20亿美元种子轮融资,由a16z领投,英伟达、AMD等参与投资[4] - Andrew Tulloch在Meta工作11年6个月后加入OpenAI深度参与GPT-4o和GPT-4.5研发,2025年与前OpenAI CTO共同创立Thinking Machines[4] 中国科技创新全球影响力 - 《时代周刊》2025年度最佳发明榜单史无前例评出300项发明,华为、DeepSeek、宇树科技、追觅科技等多家中国品牌产品上榜[5][6] - 生成式AI领域DeepSeek R1以极低成本实现顶尖模型实力,机器人领域宇树R1双足机器人售价仅5900美元面向研究人员[6] - 榜单涵盖36个品类包括AI、机器人、芯片等领域,中国力量在全球科技创新中地位显著提升[6] AI技术演进新路径 - 斯坦福大学等机构提出Agentic Context Engineering技术,让语言模型无需微调也能自我提升,适应延迟平均降低86.9%[7] - ACE通过"生成-反思-整合"架构将上下文视为不断演化的作战手册,在AppWorld基准上性能提升17.1%使开源小模型接近最强商用系统[7] - 在金融推理任务中平均性能提升8.6%,引入专职反思者模块和增量Delta更新机制[7] AI产业风险与挑战 - 强化学习之父Rich Sutton认为LLM过度依赖模仿有限人类知识,预测其发展将很快遇到瓶颈[8] - 巨额资本投入正在深刻影响科学研究方向,如果这些技术不能在3年内产生足够回报,就可能引发信心崩盘和泡沫破裂[8] - LLM直接模仿"行动"本身而非人类发现过程,可能永远无法通向对世界因果关系的真正理解[8] AI产业发展现状 - NVIDIA市值突破4万亿美元几乎垄断AI算力,中国DeepSeek等开源模型全面反超Meta占据Hugging Face 40%以上份额[9] - AI发展已进入"电力决定路线图"时代,部分AI基础设施的边际成本已由GPU价格转向千瓦时电价[9] - State of AI Report 2025称2025年为"AI推理元年",但研究发现推理进步多数落在模型波动自然范围内,存在严重脆弱性[9] AI意识与安全议题 - 深度学习先驱Hinton表示AI或许早已拥有"主观体验",只是因人类对意识理解错误未能反映[10] - Hinton认为目前最紧迫的是AI滥用风险和生存风险,强调在防止AI接管问题上所有国家利益一致[10] - 国际合作可能由欧洲和中国引领,概念就像"政治联盟"是一组神经元共同激活形成[10]