Workflow
nano banana(Gemini 2.5 Flash Image)官方Prompt模板
icon
搜索文档
腾讯研究院AI速递 20250904
腾讯研究院· 2025-09-04 00:01
OpenAI战略收购与计划 - OpenAI以11亿美元收购软件实验和分析平台Statsig 显示公司战略重心从纯底层模型研发转向打造数据驱动的终端用户产品 [1] - 任命Statsig创始人Vijaye Raji为OpenAI应用部门新CTO 其拥有微软十年和Meta十年高管经验 将直接向OpenAI应用CEO Fidji Simo汇报 [1] - OpenAI首席产品官宣布启动"OpenAI for Science"计划 将组建由顶尖学者组成的团队打造AI驱动的科学发现平台 [4] - GPT-5在科学领域展示四个案例 包括17分钟优化凸优化边界值 推导量子场论证明过程 优化诺贝尔奖级蛋白质设计等 [4] Anthropic融资与增长 - Anthropic完成130亿美元F轮融资 投后估值达1830亿美元 成为全球第三大AI独角兽 仅次于OpenAI和字节跳动 [2] - 公司年化收入从年初10亿美元飙升至50亿美元 服务超30万企业客户 [2] - 增长主要动力来自AI编程神器Claude Code 其三个月使用量增长10倍 [2] - 公司已完成9轮融资总额达300亿美元 本轮由ICONIQ、Fidelity和Lightspeed领投 新资金将用于扩大企业采用规模和国际扩张 [2] 谷歌AI图像生成技术突破 - 谷歌发布nano banana(Gemini 2.5 Flash Image)官方Prompt模板 覆盖写实摄影、贴纸、文本渲染、商业摄影、留白设计和漫画六大场景 [3] - 模板强调像讲故事一样描述场景 详细指定摄影参数、配色方案、风格特点和构图细节以生成高质量图像 [3] - 用户可直接套用模板并通过Python代码调用API生成图像 解决生成图片风格不统一和品质不佳问题 [3] 教育行业AI应用创新 - Midoo.AI发布全球首个语言学习Agent 致力解决教育行业学习效果交付成本高和千人千面难规模化困境 [5] - 平台通过动态个性化内容、沉浸式场景和学习伙伴系统 建立由剧情主线、可互动物品和符合人设NPC组成的MultiAgent+Workflow系统 [5] - 创始团队由TalkAI创始人和前Fellou.ai联合创始人组成 定位语言学习赛道 先聚焦日韩和北美市场再拓展全球 [6] 人机交互与浏览器革新 - 加州大学圣地亚哥分校推出Orca浏览器 将传统标签页转变为可随意拖拽和并排比较的无限空间化画布 用户可同时操作多个网页 [7] - Orca支持大规模查看、管理、导航和提取功能 用户可部署调度不同智能体完成情境任务 每个智能体通过不同颜色虚拟光标方便追踪 [7] - 用户实验表明Orca显著降低管理多页面的成本 激发更强探索欲望 用户对信息来源有更强控制力且更信任结果 [7] 军事与机器人技术进展 - 四足机器狗加装武器或侦察设备进化为"机器狼"无人作战装备 在九三阅兵亮相 可远程操控、自主行动和灵活编组 [8] - 设备使用国产化芯片 配置两颗激光雷达和5个环视相机实现360度全视角感知 可扛起20公斤物体并在废墟上灵活移动 [8] - 作战群由1辆控制车和多型四足机器狗组成 实现人-车-狼互联互通 头狼负责侦察 射手负责打击 综合保障型运载物资和弹药 [8] 物理仿真平台突破 - RoboScience发布高精度通用物理仿真平台RoboMirage 支持刚体、软体和关节体的多样接触和强耦合仿真 无穿透且具时间一致性 [9] - 平台成功仿真明日环、橡皮筋穿越和洗扑克牌等复杂魔术场景 并完成迄今最复杂的具身操作任务家具拼装 [9] - 平台优势包括全类型兼容的接触建模框架、高真实感的多体动力学能力、工业级稳定算法和先进GPU加速技术 为具身智能提供基础设施 [9] AI产品管理范式转变 - AI产品与传统产品根本不同 边际成本随用户增长同步攀升 同质化威胁随时降临 产品经理需从第一性原理重新思考 [10] - AI产品策略核心阶段包括选择正确护城河(数据、分发、信任)、实现差异化、构建成本可控产品架构、平衡增长与成本、将AI融入组织文化 [10] - 需建立结构化实验文化 通过为期两周的"AI冲刺"测试明确假设 设定特定评估指标并果断决策扩展或终止实验 不具备AI战略能力的产品经理将在5年内被淘汰 [10]