腾讯研究院AI速递 20250619

谷歌Gemini 2.5发布 - 谷歌发布Gemini 2.5全系列模型，其中Flash-Lite版本速度最快、性价比最高，输入仅0.1美元/百万token [1] - Gemini 2.5在玩宝可梦游戏时展现类人行为，生命值低时会"恐慌"导致推理能力下降 [1] - 2.5系列采用稀疏MoE架构，原生支持多模态和百万级token长文本，性能全面超越前代 [1] 微软三大算法突破 - 微软发布三大创新算法rStar-Math、LIPS和CPL，通过蒙特卡洛树搜索和代码增强CoT等方法突破大模型推理瓶颈 [2] - rStar-Math通过自我进化和Python代码验证提升数学推理质量，LIPS结合符号工具和大模型实现数学证明策略优化 [2] - CPL算法通过高层次抽象计划空间搜索和Step-APO学习关键步骤，显著提升模型跨任务泛化能力 [2] MiniMax视频模型海螺02 - MiniMax发布海螺02视频生成工具，可创建10秒1080P视频，在国际榜单图像生视频项目排名第2，超越谷歌Veo3 [3] - 海螺02实现逼真物理效果、精确物体交互和复杂杂技动作，支持多语言提示，10秒视频仅需一次生成 [3] - 国际视频生成榜单前五名中四家为中国厂商，展现中国在该领域的领先地位 [3] Meta智能眼镜战略 - Meta与意大利高端品牌Prada合作开发AI智能眼镜，拓展与EssilorLuxottica之外的时尚公司合作 [4] - Meta将于6月20日发布面向运动人群的Oakley智能眼镜，售价约360美元，具备更好的防风雨性能 [4] - 自2023年以来Meta与Luxottica已售出200万副Ray-Ban智能眼镜，计划到2026年底年产量提升至1000万副 [5] 罗永浩数字人直播 - 罗永浩数字人在百度电商首场直播吸引超1300万人次观看，GMV突破5500万元，部分品类超真人首秀数据 [6] - 百度慧播星技术实现"神形音容话"五维统一，通过剧本驱动多模协同，直播中AI调用知识库1.3万次 [6] - 百度计划追加10万个数字人名额和1亿元补贴，推动数字人直播产业规模化发展 [6] 大模型"六小龙"调整 - 大模型"六小龙"半年内22位高管密集离职，零一万物7位、百川智能和智谱AI各5位 [7] - DeepSeek低成本高性能冲击下，零一万物放弃训练大模型转向阿里云，百川智能基础模型进入静默期，阶跃星辰关闭冒泡鸭产品 [7] - 商业化成生存关键，六小龙需在开源大模型时代寻找差异化应用突围 [7] 港科广医学模型 - 港科大等发布首个医学世界模型MeWM，通过3D扩散模型模拟不同治疗方案下肿瘤形态演变，图灵测试准确率达79% [8] - 系统构建"策略生成-动态模拟-风险评估"闭环，在肝癌TACE治疗中F1-score达64.08%，接近专业医生水平 [8] - MeWM生存风险预测C-Index达0.752，融入医生决策可带来13%性能提升，实现从经验驱动到数据驱动的精准医疗转型 [8] Karpathy软件3.0观点 - Andrej Karpathy提出软件3.0（提示工程）时代正在取代1.0（代码编程）和2.0（神经网络），LLMs具备类似公用事业、晶圆厂和操作系统的多重属性 [10] - LLMs存在"锯齿状智能"（既能解决复杂问题又在简单任务失败）和"顺行性遗忘症"（缺乏长期记忆）两大缺陷，需要新的"系统提示学习"范式来存储问题解决策略 [10] - AI产品设计应采用"自主性调节滑块"，通过控制生成-验证循环实现人机协作，同时强调为智能体而非人类构建工具，因为智能体是数字信息的新消费者类别 [10] Sam Altman AI预测 - Sam Altman预测未来5-10年AI将具备自主科研能力，真正发现新科学，o3推理能力已达博士水平，科学家效率提升3倍 [11] - OpenAI理想产品形态是"AI伴侣"，通过多种界面融入生活，了解用户目标并主动提供帮助，而非局限于传统计算设备 [11] - 对Meta高薪挖人回应称其缺乏创新文化只会复制，认为人类会快速适应超级智能时代并创造新工作角色，AI不会造成严重就业威胁 [11] 斯坦福AI创业研究 - 斯坦福研究1500名员工和844项职业任务，发现41%的AI创业投资流向员工不需要的"红灯区"和"低优先区"，投资与需求严重错配 [12] - 45.2%职业偏好"人机平等伙伴关系"模式，艺术设计领域仅17.1%任务欢迎自动化，员工最想自动化的是不享受且不担心失业的任务 [12] - AI时代价值技能发生倒置，"培训教授他人"从薪资第21位跃升至人类参与需求第2位，人际关系处理将比信息处理更有价值 [12]