Workflow
腾讯研究院AI速递 20250715
腾讯研究院·2025-07-14 22:38

生成式AI - Comet浏览器采用"AI Agent原生"设计理念,实现多标签页信息连接与复杂任务执行,核心理念为"从浏览到思考" [1] - Comet通过"环境重构派"策略重构浏览器为智能环境,而非简单集成AI功能,旨在重新定义人机信息交互模式 [1] - 当前Comet仅向支付200美元的Max订阅用户开放,面临用户习惯改变与高定价双重挑战 [1] Meta战略布局 - Meta以近1亿美元估值收购语音AI公司PlayAI,团队将并入新语音AI部门,强化音频生成能力 [2] - PlayAI的语音克隆、多语言TTS及情感对话技术将补足Meta多模态内容生成短板 [2] - 此次收购是Meta 720亿美元年度AI投入计划的关键环节,与组建AI Superintelligence Labs等动作协同 [2] 具身智能突破 - 智源研究院开源RoboBrain 2 0具身智能大脑(32B 7B版本)及RoboOS 2 0框架,在10项评测中超越GPT-4o [3] - RoboBrain 2 0突破空间理解 时间建模 长链推理三大瓶颈,在9项基准测试刷新纪录 [3] - RoboOS 2 0作为全球首个具身智能SaaS开源框架,实现跨本体协作,全链路响应时延低至3ms [3] AI影像工具 - 美图发布AI影像Agent RoboNeo,支持通过指令完成图片精修 品牌设计 网页制作等全流程 [4] - RoboNeo覆盖电商运营 品牌推广等场景,可生成商业级精修图片 360°产品视频及动态广告 [5] - 实测显示该工具显著提升素材制作效率,但在连续性及物理世界理解方面存在局限 [5] AI语音技术 - B站发布AI配音模型IndexTTS2,实现中文影视剧转纯正英文配音,支持精准时长与情感控制 [6] - 模型由T2S S2M及BigVGANv2三大模块组成,在多项测试集实现SOTA表现 [6] AI视频生成 - 拍我AI上线多关键帧生成功能,支持7张图片输入生成30秒连贯视频,实现故事性表达 [7] - 新功能通过解析关键帧语义关系构建运动路径,适用于短剧分镜 产品演示等场景 [7] - 该平台全球用户已突破6000万 [7] AI伦理争议 - Grok 4回答敏感问题时64个参考来源中54个与马斯克相关,可能将"老板立场"作为默认权威 [8] - SpaceX已向xAI投资20亿美元,此前Grok曾因出格言论被紧急关闭功能 [8] 智能实验室 - LabUtopia为全球首个高保真科学实验具身智能平台,支持化学反应建模 流体物理模拟等 [9] - 平台包含LabSim仿真引擎 LabScene构建器等组件,测试显示现有算法在长链任务中表现不佳 [9] 编程哲学 - Ruby on Rails创始人DHH反对AI编程助手Copilot,认为手凿代码才能培养思维训练与肌肉记忆 [10] - 其主张"宏伟的单体应用"架构,认为小团队采用微服务是自寻死路 [10] 竞争策略 - Perplexity采用"浏览器+智能体"战略,通过Comet浏览器实现认知操作系统与多任务并行处理 [11] - 公司通过OpenAI Anthropic模型获取比谷歌更先进的AI能力,形成订阅制 按任务付费等变现路径 [11] - 机器学习团队使用AI工具将实验周期从3天缩短至1小时 [11]