Workflow
腾讯研究院AI速递 20250619
腾讯研究院·2025-06-18 23:22

谷歌Gemini 2.5发布 - 谷歌发布Gemini 2.5全系列模型,其中Flash-Lite版本速度最快、性价比最高,输入仅0.1美元/百万token [1] - Gemini 2.5在玩宝可梦游戏时展现类人行为,生命值低时会"恐慌"导致推理能力下降 [1] - 2.5系列采用稀疏MoE架构,原生支持多模态和百万级token长文本,性能全面超越前代 [1] 微软三大算法突破 - 微软发布三大创新算法rStar-Math、LIPS和CPL,通过蒙特卡洛树搜索和代码增强CoT等方法突破大模型推理瓶颈 [2] - rStar-Math通过自我进化和Python代码验证提升数学推理质量,LIPS结合符号工具和大模型实现数学证明策略优化 [2] - CPL算法通过高层次抽象计划空间搜索和Step-APO学习关键步骤,显著提升模型跨任务泛化能力 [2] MiniMax视频模型海螺02 - MiniMax发布海螺02视频生成工具,可创建10秒1080P视频,在国际榜单图像生视频项目排名第2,超越谷歌Veo3 [3] - 海螺02实现逼真物理效果、精确物体交互和复杂杂技动作,支持多语言提示,10秒视频仅需一次生成 [3] - 国际视频生成榜单前五名中四家为中国厂商,展现中国在该领域的领先地位 [3] Meta智能眼镜战略 - Meta与意大利高端品牌Prada合作开发AI智能眼镜,拓展与EssilorLuxottica之外的时尚公司合作 [4] - Meta将于6月20日发布面向运动人群的Oakley智能眼镜,售价约360美元,具备更好的防风雨性能 [4] - 自2023年以来Meta与Luxottica已售出200万副Ray-Ban智能眼镜,计划到2026年底年产量提升至1000万副 [5] 罗永浩数字人直播 - 罗永浩数字人在百度电商首场直播吸引超1300万人次观看,GMV突破5500万元,部分品类超真人首秀数据 [6] - 百度慧播星技术实现"神形音容话"五维统一,通过剧本驱动多模协同,直播中AI调用知识库1.3万次 [6] - 百度计划追加10万个数字人名额和1亿元补贴,推动数字人直播产业规模化发展 [6] 大模型"六小龙"调整 - 大模型"六小龙"半年内22位高管密集离职,零一万物7位、百川智能和智谱AI各5位 [7] - DeepSeek低成本高性能冲击下,零一万物放弃训练大模型转向阿里云,百川智能基础模型进入静默期,阶跃星辰关闭冒泡鸭产品 [7] - 商业化成生存关键,六小龙需在开源大模型时代寻找差异化应用突围 [7] 港科广医学模型 - 港科大等发布首个医学世界模型MeWM,通过3D扩散模型模拟不同治疗方案下肿瘤形态演变,图灵测试准确率达79% [8] - 系统构建"策略生成-动态模拟-风险评估"闭环,在肝癌TACE治疗中F1-score达64.08%,接近专业医生水平 [8] - MeWM生存风险预测C-Index达0.752,融入医生决策可带来13%性能提升,实现从经验驱动到数据驱动的精准医疗转型 [8] Karpathy软件3.0观点 - Andrej Karpathy提出软件3.0(提示工程)时代正在取代1.0(代码编程)和2.0(神经网络),LLMs具备类似公用事业、晶圆厂和操作系统的多重属性 [10] - LLMs存在"锯齿状智能"(既能解决复杂问题又在简单任务失败)和"顺行性遗忘症"(缺乏长期记忆)两大缺陷,需要新的"系统提示学习"范式来存储问题解决策略 [10] - AI产品设计应采用"自主性调节滑块",通过控制生成-验证循环实现人机协作,同时强调为智能体而非人类构建工具,因为智能体是数字信息的新消费者类别 [10] Sam Altman AI预测 - Sam Altman预测未来5-10年AI将具备自主科研能力,真正发现新科学,o3推理能力已达博士水平,科学家效率提升3倍 [11] - OpenAI理想产品形态是"AI伴侣",通过多种界面融入生活,了解用户目标并主动提供帮助,而非局限于传统计算设备 [11] - 对Meta高薪挖人回应称其缺乏创新文化只会复制,认为人类会快速适应超级智能时代并创造新工作角色,AI不会造成严重就业威胁 [11] 斯坦福AI创业研究 - 斯坦福研究1500名员工和844项职业任务,发现41%的AI创业投资流向员工不需要的"红灯区"和"低优先区",投资与需求严重错配 [12] - 45.2%职业偏好"人机平等伙伴关系"模式,艺术设计领域仅17.1%任务欢迎自动化,员工最想自动化的是不享受且不担心失业的任务 [12] - AI时代价值技能发生倒置,"培训教授他人"从薪资第21位跃升至人类参与需求第2位,人际关系处理将比信息处理更有价值 [12]