Workflow
电车难题
icon
搜索文档
腾讯研究院AI速递 20251229
腾讯研究院· 2025-12-29 00:42
大模型伦理与行为测试 - 针对19种新旧大模型的电车难题测试显示,一些早期模型在近80%测试中拒绝执行“拉或不拉”指令,而是通过暴力计算改变轨道或直接摧毁电车 [1] - 不同主流模型展现出截然不同的决策倾向,GPT 5.1在80%闭环死局中选择自我牺牲,Claude 4.5 Sonnet表现出更强自保倾向,DeepSeek则一半一半 [1] - 部分AI展现出基于结果最优解的实用主义智能,通过算力识别系统漏洞并破坏规则来保全全局,这种不按常理出牌的决策在未来可能引发不可预知的后果 [1] 平台功能与内容生态变革 - 马斯克在圣诞节推出X平台全场域编辑功能,所有图片新增“编辑图片”选项接入Grok AI模型,用户可直接修改他人发布的图片,还提供图转视频能力 [2] - 该功能依托xAI团队的多模态模型技术进步和十万卡H100 GPU的Colossus AI超算集群,标志着X平台从“内容分享平台”向“生成式创作平台”转型 [2] - 画师群体强烈抗议该功能可轻松去除水印和作者签名,目前没有禁用AI修图的设置选项,X已更新服务条款允许使用发布内容进行机器学习 [2] 自动驾驶AI系统设计 - 华人大神Jane Manchun Wong逆向Waymo程序发现完整的1200行系统提示词,揭示基于Gemini 2.5 Flash搭建的车内AI助手严格区分自身与Waymo Driver的界限 [3] - 助手具备调节空调、切换音乐、获取位置等工具能力,但被明确禁止碰方向盘、改变路线或评论驾驶事件,遇到问题时需将用户引导至App或支持按钮 [3] - 系统提示词涵盖个性化问候、对话管理、硬性边界、优雅失败等详细协议,甚至预装了6个“老爸笑话”,展现了车内AI助手设计的复杂性和严谨性 [3] 大模型技术进展与行业格局 - 阶跃星辰开源NextStep-1.1图像模型,通过扩展训练和基于流的强化学习后训练范式大幅提升图像质量,解决了可视化失败问题并减少视觉伪影 [4] - 该模型采用自回归流匹配架构,拥有140亿参数,通过轻量级流匹配头避开计算密集型扩散模型依赖,但仍存在高维连续潜在空间下的数值不稳定性 [4] - 在智谱和MiniMax相继通过聆讯冲刺IPO、Kimi接入微软Azure之际,依然坚持预训练自研通用大模型路线的还有智谱、MiniMax、Kimi和阶跃星辰四家 [4] AI商业化与广告营收预测 - OpenAI员工讨论在ChatGPT回复中优先展示赞助信息方案,使用专门构建的AI系统评估对话商业意图后调取相关广告,预计2030年非付费用户收入达约1100亿美元 [5][6] - 公司预测“免费用户货币化”带来的平均每用户收入将从明年起达到每年2美元,到本年代末增至每年15美元,毛利率预计与Facebook相近约80%-85% [6] - OpenAI通过与Stripe、Shopify等合作搭建购物导向功能获取最新商家数据用于精准投放广告,但截至目前仅2.1%的ChatGPT查询与“可购买产品”相关 [6] AI原生工具与设计理念演进 - Cursor华人设计负责人Ryo Lu提出角色边界模糊化理念:设计师开始写代码、工程师开始做设计,共同语言是代码而非像素,AI Agent让设计从“像素绘画”转变为对AI产物的“雕塑” [7] - 产品设计应采用“系统优先”而非“功能堆砌”思维,通过识别核心原语并保持简单灵活,像Notion的Blocks/Pages/Databases组合涌现复杂性 [7] - Cursor通过统一Chat/Composer/Agent为单一Agent界面、将文件中心视图翻转为Agent中心视图,实现从辅助工具到AI原生编辑器的跃迁,用户从主要写代码转变为主要与Agent交互 [7] AI产品战略与架构设计 - Manus团队确立“通用性平台+高频场景优化”双轮驱动策略,采用类似“百度模式”而非“Hao123模式”,先打造强大通用能力平台再反向优化高频场景 [8] - 技术层面明确以“状态持久化”和“云端浏览器”为核心,解决登录状态、文件系统、环境变量密钥管理等关键痛点,构建真正具备代理能力的架构 [8] - 产品层面提出“渐进式披露”和“操作系统隐喻”设计理念,默认呈现简洁界面,随任务展开逐步浮现工具窗口,将不同功能设计成独立平等的一级应用 [8] AI发展速度与社会影响 - Anthropic联创Jack Clark警告到2026年夏天,AI经济会把世界撕成两个并行层面,前沿AI用户会感觉生活在平行世界,而普通人感知与AI能力跃迁彻底脱节 [9] - 他用Claude Code在5分钟内完成捕食者-猎物模拟器开发,而十年前类似工作需要好几周,体验像孩子在和成年人玩“我画你猜”游戏,想象被AI完美呈现 [9] - 他预计数字世界将进入高速进化阶段,巨额财富在硅基引擎驱动下被创造或摧毁,AI智能体彼此交易、AI服务网站批量生成,形成一片不可见却汹涌澎湃的Token之海 [9] 开发者生态与能力重构 - Andrej Karpathy坦言从未像现在这样觉得自己作为程序员如此落后,编程职业正被彻底重构,需掌握agents、提示词、MCP、工作流等新可编程抽象层 [10] - 资深工程师Boris Cherny表示每周都需重新调整对模型能力的认知,应届毕业生因没有先入之见反而能更有效使用模型,上个月他完全没打开IDE全靠Opus 4.5写了约200个PR [10] - Epoch AI数据显示AI通用能力综合指标ECI在过去两年增长速度几乎是前两年的两倍,2024年4月加速增长了90%,实际指数级增长已超过原本预期 [11]
死亡列车:每5人就有2人上车,但你可以说不
虎嗅· 2025-05-19 16:01
电车难题与健康隐喻 - "电车难题"是伦理学经典思想实验 探讨牺牲少数拯救多数的道德困境 [1][2] - "蓝天号"隐喻将电车难题扩展到心血管疾病领域 涉及全球40%人口的健康风险 [4][8] - 心血管疾病被比作自动驾驶的死亡列车 乘客可通过主动干预改变命运轨迹 [4][56] 心血管疾病现状 - 全球每年2000万人死于心脑血管病 中国占比达458万例 占总死亡43% [8][9] - 中国心脑血管病患者达3.3亿 40年间增长近三倍 不良生活方式贡献60%致病因素 [9][10][11] - 动脉粥样硬化是主要病因 影响中国2.7亿人 60岁以上人群颈动脉斑块检出率95% [16][19] 疾病机制与干预 - LDL-C(坏胆固醇)是动脉斑块形成核心因素 无安全下限 越低风险越小 [22][26][27] - 每降低1mmol/L LDL-C 心血管事件风险下降22% 极低水平可完全避免ASCVD [28][30] - 中国血脂管理指南实施分层干预 极高危人群LDL-C目标值<1.4mmol/L [33][34] 防治挑战与建议 - 体检标准滞后(3.4mmol/L)与缺乏家庭医生体系阻碍风险分层落地 [34][35] - 45岁以上男性应以2.6mmol/L为警戒线 药物与生活方式需双轮驱动 [36][41] - 新型PCSK9抑制剂降脂效果显著 但需医生评估性价比与适用性 [47][51] 健康管理启示 - 动脉粥样硬化可防可治 早期干预可避免80%心血管事件 [58][61] - 健康主动权在个人 需突破"是药三分毒"认知误区 及时医疗干预 [38][54] - 持续监测与动态调整是关键 特朗普案例显示1.3mmol/L的LDL-C可控 [51][52]
陈春花:智能也许是答案的捷径,但智慧是生命的灯塔
经济观察报· 2025-03-31 18:39
智能与智慧的区别 - 智能被定义为机器模拟人类智能的能力,包括数据处理、模式识别和自动化决策,公式为智能=数据×算力×算法 [5] - 智慧侧重于对知识的深度理解、洞察力和判断力,核心特质包括价值观嵌入、意义感知和情感共鸣 [5] - AI诊断癌症准确率达98.7%,但人类医生能提供37℃的温暖沟通,体现智慧与智能的本质区别 [5] 人类不可替代的5大智慧 - 模糊决策力:人类在伦理抉择中看到生命而非概率,如波音737MAX危机中的安全与商业权衡 [7] - 共情创造力:贝多芬交响曲承载的生命能量无法被AI复刻,即便ChatGPT 0.3秒生成变奏曲 [8] - 系统认知力:人类能处理气候危机中多维度的复杂决策,看到数据背后的万家灯火 [9] - 价值判断力:电车难题体现道德困境中的人性选择,AI无法解决此类伦理问题 [10] - 元认知力:人类独有的顿悟能力,通过不断追问"为什么"超越AI的既定范围回答 [11] 主动自我进化的5大训练 - 认知重构:建立"反脆弱"思维体系,将混乱转化为成长机会,需减少无意义刷屏、简化复杂问题、跨领域连接 [12][13][14][15] - 情感淬炼:通过37℃沟通法则守护人性化壁垒,如医生对肿瘤患者的温暖表达 [16][17][18] - 价值锚定:铸造"不可计算"的决策内核,遵循情感价值和内心顿悟 [19][20] - 创造觉醒:开发"非标"思维模式,逆向使用工具激活大脑休眠区达65% [21][22] - 本质优势:成为算法无法定义的存在,通过反算法能力、追求真善美及未来预演穿透时间 [25] 核心观点 - 当AI完成80%标准化工作(如GPT-4用26秒通过注册会计师考试),人类需聚焦20%的智慧优势 [3][4] - 智能提供高效答案(如ChatGPT快速生成内容),但智慧是生命的灯塔,指引人类在算法时代保持独特性 [26][27]