腾讯研究院AI速递 20260428
腾讯研究院·2026-04-28 00:16

一、OpenAI入局AI手机 - OpenAI正与联发科、高通合作开发手机处理器,立讯精密拿下独家协力设计与制造合同,预计2028年量产 [1] - OpenAI意在掌控操作系统与硬件,让AI Agent突破苹果权限沙箱限制,初期瞄准全球每年3至4亿台高端手机市场 [1] - 这是其音箱、眼镜、耳机硬件矩阵的最后拼图,已挖角苹果20多位硬件大牛,旨在走出一条不同的AI硬件路径 [1] 二、Anthropic推出AI桌宠硬件 - Anthropic工程师发起开源项目Claude-Desktop-Buddy,官方参考硬件采用深圳M5Stack的M5StickC Plus,搭载乐鑫ESP32芯片 [2] - 该硬件通过蓝牙连接电脑,可显示Claude工作状态并一键审批操作,内置18种ASCII小动物形象,复刻了Claude Code源码泄露的宠物系统 [2] - M5Stack被选中得益于深圳供应链优势与文档质量,海外同类硬件成本是国内3至4倍,公司使命是为AI世界准备基础设施 [2] 三、DeepSeek大幅降价 - DeepSeek-V4全系两款模型的输入缓存命中价格降至首发价的1/10,Flash版为每百万tokens输入0.02元,Pro版为0.025元 [3] - 叠加4月25日Pro版输入价格75%的降幅,缓存未命中价格为每百万tokens 3元、输出为6元,限时优惠持续至5月5日23点59分 [3] - 此次降价被视为抢占市场份额、开启token缓存价格战,促使开发者评估将工作流从Claude或GPT迁移至DeepSeek [3] 四、阿里发布视频生成模型 - 阿里ATH团队推出HappyHorse 1.0视频生成模型与创作平台,采用原生多模态架构与音视频联合生成方案,已开启灰测 [4] - 该模型支持多模态视频生成与视频编辑两大核心功能,在画面质感、运镜流畅度、人物面部真实感等方面表现突出 [4] - 主打广告、电商、短剧、社媒及国际化出海场景,包月会员720P 5秒视频低至2.2元,并有限时全场7折优惠 [4] 五、百度发布智能体新版本 - 百度文库网盘联合推出通用智能体GenFlow 4.0,月活用户突破1亿,月任务交付达2亿次,一年内迭代了四个版本 [5] - Office Agent全面升级,PPT、Excel、Word三大Agent支持自然语言生成与一键排版,新增记忆中心实现自主思考与项目记忆 [5] - 深度兼容OpenClaw支持手机电脑协作与定时任务,团队版Agent军团将于5月底发布,可将团队工作流压缩至13分钟 [6] 六、灵光App上线世界模型功能 - 灵光App正式上线体验世界模型功能,首次将世界模型搬到手机端,支持随时随地一图生成3D世界 [7] - 用户上传一张图片即可选择生成图中世界,或输入第一人称视角探索指令,几秒内即可生成可探索的虚拟世界 [7] - 进入后通过摇杆控制进退,以第一人称视角漫步操作,体验类似游戏般的世界探索方式 [7] 七、小红书发布AI治理主张 - 小红书首次公布AI治理主张,欢迎创作者使用AI突破创意瓶颈,让AI成为创意放大器 [7] - 鼓励创作者如实标识AI相关内容,对于未主动标注的AI内容,平台将统一添加标识,严守真实底线与安全红线 [7] - 平台将持续建设AI内容识别与治理能力,并上线针对AI笔记贴条提示的申诉通道,反对AI造假与侵权 [7] 八、OpenAI图像模型取得突破 - OpenAI发布GPT Image 2,上线12小时同时登顶文生图、单图编辑、多图编辑三大分榜,盲测胜率达93%,领先第二名Banana 2达241分 [8] - 该模型采用从零重构的通用模型架构,被定位为首个具备原生思考能力的图像模型,文字渲染准确率推至99% [8] - 随着DALL-E 2与3将于5月12日退役,API高质量出图价格为0.21美元/张,图像生成进入推理时代,对扩散模型路线形成冲击 [8] 九、a16z对AI投资的观点 - a16z联合创始人Marc Andreessen认为,风险投资中机会成本错误远比成本错误更危险,错过下一个Google意味着失去千亿美元价值 [9] - 识别顶尖创始人需关注智力、勇气与原始驱动力三要素,伟大创始人能在童年痕迹或天赋中显现非做成不可的决心 [9] - AI价值约99%将归属使用者形成消费者剩余,技术高度民主化但人才高度集中于硅谷 [9]

腾讯研究院AI速递 20260428 - Reportify