腾讯研究院AI速递 20250530

开源AI模型 - DeepSeek-R1新版本开源，编程能力超越Claude 4 Sonnet，与o4-mini性能相当 [1] - 新模型具备深度推理能力、自然文本生成、支持30-60分钟长时思考，能完美执行复杂代码 [1] - 实测在3D动画、网站设计和复杂推理问题上表现优异，思考过程更稳定，能处理长链条推理 [1] AI视频创作 - 可灵2.1上线，价格降低65%，效果和速度均有提升，形成标准版、高品质版、大师版三档分层 [2] - 高品质版效果媲美旧版大师版，支持1080P画质，运动效果出色，但仅支持图生视频 [2] - 新版本性价比显著提升，普通用户适合选择高品质版，商业级制作可搭配大师版 [2] 腾讯产品AI升级 - 腾讯元宝、ima、搜狗输入法、QQ浏览器等产品接入DeepSeek R1最新版，从开源到上线仅用不到1天 [3] - 用户可在腾讯多款产品中选择DeepSeek模型R1深度思考，实现免费不限量使用 [3] - 腾讯坚持双模型驱动，选择更先进的模型并第一时间部署上线 [3] AI浏览器创新 - Opera发布首款"AI Agent"浏览器Opera Neon，重新定义浏览器在代理网络中的角色 [4] - Opera Neon由Neon Chat(聊天)、Neon Do(执行网页任务)和Neon Make(复杂创作)三大功能组成 [4] - Neon Make利用云技术执行复杂任务如生成报告、设计游戏原型和构建Web应用，离线时也能工作 [4] 3D大模型升级 - VAST升级Tripo Studio，推出智能部件分割、贴图魔法笔刷、智能低模生成和万物自动绑骨四大功能 [5] - 智能部件分割实现一键拆建，智能低模生成在保留细节前提下大幅减少面数 [5] - 万物自动绑骨功能能快速完成骨骼权重分配，非专业人士也能完成全流程3D创作，效率提升10倍以上 [5] 自动驾驶与实时视频生成 - 自动驾驶大牛创立Odyssey，推出世界模型实现视频实时生成，速度达40毫秒/帧，支持实时交互 [6] - 该技术通过真实生活视频学习像素和动作，采用窄分布模型架构解决自回归建模挑战 [6] - Odyssey已获2700万美元融资，预览版由H100 GPU集群支持，输出30FPS的5分钟连贯交互视频 [6] AI科学研究 - AI科学家Zochi的论文被顶会ACL主会录用，成为首个独立通过A*级别会议同行评审的AI系统 [7] - Zochi的论文展示了多轮攻击方法，在GPT-3.5上成功率达100%，GPT-4上达97% [7] - Zochi能自主完成从文献分析到同行评审的科学研究过程，论文质量高 [7] 具身机器人商业化 - 优理奇推出轮式双臂机器人Wanda 2.0，售价8.8万元起，已量产交付，具备自主完成复杂长序列任务的能力 [8] - Wanda 2.0搭载融合触觉的预训练多模态大模型UniTouch和长序列任务规划模型UniCortex [8] - 优理奇通过全栈自研降低70%成本，面向类C端小B客户市场，已完成数亿元融资 [8] 机器人技术升级 - 波士顿动力Atlas机器人升级，具备3D空间感知和实时物体追踪能力，可360°旋转头部和腰部 [9] - 技术核心包括2D物体检测系统、基于关键点的3D空间定位以及SuperTracker物体位姿跟踪系统 [9] - 系统融合运动学数据、视觉数据和力反馈，实现精确手眼协调，团队正致力于构建统一基础模型 [9] AI行业趋势 - Google CEO Pichai认为AI是比互联网更大的平台级变革，未来将走向多终端并行 [10] - AI进入构建可用产品的第二阶段，搜索正转变为能代表用户执行任务的Agent [10] - AI带来的关键变革在于交互方式转变和创作门槛降低，第三阶段将是AI与物理世界结合 [10]