Workflow
Portraits
icon
搜索文档
小众AI宝藏清单,谁会是下一个爆款?
AI研究所· 2025-07-10 17:53
核心观点 - 一批创新型AI应用通过跨界融合和功能创新,在细分领域展现出独特潜力,包括艺术音乐生成、UI设计、职场指导、虚拟旅游、动画创作和语音复刻等方向 [1][23] National Gallery Mixtape - 通过谷歌Gemini多模态模型解析世界名画(如梵高《向日葵》),将画作色彩、光影转化为对应情绪的大提琴曲或钢琴旋律 [2][3][5] - 采用MusicFX DJ实时作曲技术,支持用户调整音量/顺序/叠加效果,并显示"轻盈""钢琴"等音乐特征标签 [3][5] Stitch - 由Google Labs推出的UI设计工具,前身为Galileo AI,可将文字描述直接转化为完整UI设计稿 [6][7] - 支持导出Figma文件或前端代码,比Vercel v0更贴近设计师工作流,适用于快速验证产品创意 [9] Portraits - 以Google/苹果前高管Kim Scot为原型的AI虚拟人,提供职场指导与场景模拟训练 [10][11] - 支持语音/文字交互,可进行角色扮演演练并生成事后总结报告,模拟20年大厂高管的经验指导 [13] Talking Tours - 通过互动地图实现全球地标"云游览",AI导游提供建筑历史、文化背景的实时讲解 [14][17] - 支持街景浏览和即时问答,用户拍摄快照可触发AI重新生成讲解内容 [17] Whisk - 采用Gemini 2.5 Pro模型解析用户上传的参考图片(如猫+皇冠),生成Imagen 3图像 [18] - 集成Veo 2功能可将静态图转为短视频,降低动画创作门槛 [19] 声塔 - 基于科大讯飞"三阶段层次化语音建模框架",仅需用户朗读一句话即可克隆声线 [21][22] - 支持将文本转为带个人语音特征的播客音频,复现说话停顿、口音等细节 [21][22]
谷歌AI试穿神器真神了!上传照片秒出OOTD,视频效果和照镜子没区别
量子位· 2025-06-27 16:09
谷歌Doppl应用 - 谷歌推出最新应用Doppl 支持用户上传照片实现虚拟试穿功能 可生成动态视频展示服装上身效果[1][2][11] - 该应用支持全身照上传 要求照片包含头顶到脚部且服装贴身 也可使用预设AI模特 服装图片需光线自然无褶皱[14][15][16] - 除试穿外 应用可自动搭配未上传的上下装 但不支持鞋子、内衣、泳衣及配饰试穿 涉及隐私或违规服装会输出基础款效果[18][19][21][22][23] - 用户可将试穿效果分享给他人征求意见 目前功能仍在测试阶段 网友期待全球上线[25][27][30] 谷歌购物功能迭代 - 谷歌5月已在Search Labs推出静态试穿功能 用户购物时点击图标上传全身照即可查看服装效果[8][9] - Doppl升级为动态试穿 效果更直观 官网提供使用建议如选择模特双臂下垂的服装图片以优化生成效果[11][12][15] Google Labs其他实验项目 - Portraits项目可生成名人肖像并对话 首个主角为《Radical Candor》作者Kim Scott 利用Gemini提取其言论进行交互[31][32][34][35][36] - Flow项目支持文生视频 可实现摄像头控制及电影级画质生成[37][39][41]
隐藏在Google Labs里的5个神级AI应用。
数字生命卡兹克· 2025-06-24 22:33
Google Labs概述 - Google Labs是Google官方的AI创新项目合集,包含30多个已开放或即将开放的AI产品 [3][5] - 项目调性聚焦于趣味学习、简化交互提升生产力、AI与日常生活结合 [5] - 曾孵化Notebooklm(开创性AI播客工具)和Whisk(简化生图交互工具)等创新产品 [4] 重点产品解析 1 National Gallery Mixtape - 艺术与AI融合工具:输入画作自动生成配乐,并标注乐器种类和风格 [10][11] - 支持音乐DIY:用户可在生成基础上二次创作 [15] - 案例展示:梵高向日葵生成忧伤大提琴曲,圣经题材画作生成紧张错拍音乐 [18][22][23] - 当前局限:仅支持内置画作库,不支持自定义上传 [28] 2 Learn About - 结构化学习工具:通过知识框架→卡片笔记→知识沉淀→互动测试四步法教学 [32][34][38][47] - 特色功能: - "The Big Picture"模块可视化知识结构 [35] - 提供简化版/深度版/图像化三种知识总结方式 [40] - 互动式停顿思考设计增强学习效果 [44][45] - 开放式答题评估系统附带详细改进建议 [48][50] 3 Little Language Lessons - 实用性语言学习工具,聚焦高频场景需求 [54][59] - 核心功能: - 特定场景词汇短语速成(如粤语打车场景) [61][63] - 本地化俚语对话学习 [64] - 拍照识物翻译功能 [65] 4 Stitch - AI驱动的UI设计工具,前身为Galileo AI [69][72] - 双模式生成: - 自然语言描述生成完整APP界面(如外卖APP) [72] - 手绘草图转UI设计 [74] - 支持Figma画布无缝编辑 [75] 5 Portraits - 虚拟职场导师系统,基于真人专家数据训练 [80][81] - 原型人物为Google/苹果前高管Kim Scott,整合其著作与演讲数据 [82] - 功能特点: - 覆盖甩锅应对、绩效谈判等典型职场问题 [85] - 理论讲解+角色扮演+流程复盘三段式教学 [86] - 严格聚焦专业领域,拒绝闲聊 [86] Google Labs战略价值 - 历史沿革:2002年创立,曾孵化Gmail、Google Maps等核心产品,2011年关闭后于AI时代重启 [93][94][99] - 创新方法论: - 小目标启动:以1万周活用户为初期目标 [101][102] - 快速迭代:50-100天完成创意落地 [104][105] - 前瞻视角:规划5-10年后AI融合场景 [106][107] - 战略定位:在超级大厂中保持创新活力的实验田 [108][110]