Flow

搜索文档
AI语音从“输出”到“输入”,资本在用千万美元押注什么?
36氪· 2025-07-30 11:09
7 月 16 日,语音输入创企 Willow Voice 宣布完成 420 万美元天使融资,由 YC 领投;而就在几天前,6 月 25 日另一家语音输入创企 Wispr Flow 也宣布完 成了 3000 万美元 A 轮融资。 此前,我们一直在观察 AI 语音赛道,但能拿到融资的基本都是做语音合成,也就是"输出"。比如赛道头部的 ElevenLabs,在今年 1 月份,完成了 C 轮 2.5 亿美元融资,估值达到 30 亿美元以上。 但最近的 2 笔融资,貌似在释放另一种信号,反向做"输入"的语音创企,正在获得资本的关注。 语音输入 2012 年就有,为什么还能拿到融资? Willow Voice 和 Wispr Flow(下文简称为 Willow 和 Flow)专注 ASR 技术(自动语音识别),两款产品基本类似,都有点类似"语音输入法",用户只需要 按下电脑或手机上的特定按钮,就能直接将讲话的内容转录成文字。 乍听上去,这已经是我们在日常生活中习以为常的功能,比如,微信 2019 年就在 iOS 端推出了"语音转文字功能",苹果更是在 2012 年的 iOS 6 中就上线 了最初版本的"语音听写"(Voi ...
AI模型持续突破,股掌柜证券咨询前瞻科技主线投资机遇
中国产业经济信息网· 2025-07-16 20:10
人工智能技术突破 - 美国大模型独角兽Anthropic发布新一代Claude Opus 4与Claude Sonnet 4,其中Opus 4被誉为"世界上最好的编程模型",在智能体任务中表现稳定高效 [1] - 谷歌在I/O开发者大会推出AI影视制作平台"Flow",整合Veo、Imagen和Gemini三大模型,实现音画同步、剧本生成、角色对话等复杂自动化内容创作 [1] - 昆仑万维正式上线Skywork Super Agents App,标志着中国AI智能体技术加速走向全球用户 [1] 产业链价值重估 - 以AI大模型为代表的前沿技术将成为未来几年资本市场核心焦点,产业链从算力基础设施到应用落地环节均处于持续景气与技术渗透加速的双重推动下 [1] - 在中美科技竞合格局深化、政策支持加码背景下,具有核心技术能力与产业整合优势的本土企业有望在多模态模型、AI Agent、智能终端等关键场景实现快速突破 [1] 投资配置策略 - 股掌柜证券构建AI产业链前瞻性配置图谱,覆盖算法支持、应用生态、智能终端到算力基础设施,帮助投资者精准识别受益环节 [2] - 研究团队建议关注AI大模型技术突破与商业化进程领先的企业,以及有望率先实现产品变现的重点应用场景 [2] - AI大模型在"可用性"与"创造力"层面同步跃升,带动投资逻辑从底层推理走向场景落地 [2]
谷歌(GOOGL.US)Gemini解锁付费新技能,照片转视频功能全面开放
智通财经网· 2025-07-11 10:36
产品发布与功能更新 - 谷歌母公司Alphabet宣布面向付费用户开放"照片转视频"功能,该功能年初仅限小范围测试,现正式登陆Gemini人工智能助手 [1] - 自周四起,特定地区订阅Google AI Ultra和Pro计划的用户可通过Gemini网页版使用该功能,移动端应用将在本周内陆续推送更新 [1] - 新功能允许用户基于单张照片及文本描述生成带声音的8秒短视频,生成的MP4格式视频分辨率为720p,采用16:9横向画幅 [1] - 该功能由谷歌五月发布的最新一代视频生成模型Veo 3驱动,此前仅限通过独立付费影视工具Flow使用 [1] 市场竞争格局 - 此次更新使该功能直接集成至Gemini聊天界面,标志着谷歌在AI视频领域与美国竞争对手OpenAI、Runway AI Inc保持同步 [1] - 全球市场竞争激烈,中国阿里巴巴集团、AI初创企业Manus和快手科技过去数月均发布了升级版视频工具 [1] 技术实现与限制 - 测试显示技术仍存缺陷,上传个人照片要求生成人物讲话视频时,输出结果多次改变面部特征甚至人种 [2] - 能成功实现"植物随风摆动"或"静态猫片说话"等简单指令,但对"照片人物跳霹雳舞"等复杂要求,仅生成人物挥手画面 [2] - 谷歌发言人回应称AI模型并无修改人物外貌的设定指令,照片转视频及面部动画仍属新技术,可能基于单张图像生成与原始内容不符的结果 [2] - 模型更擅长活化其他场景,如日常物品动画化、画作动态化及自然照片增运动效果 [2] 内容安全措施 - 谷歌强调已采取"重要后台措施确保视频生成符合规范",禁止使用公众人物(包括名人、政要及知名企业家)图像生成视频 [1] - 政策同时禁止煽动危险行为、暴力或群体攻击的内容 [1]
Meet the Only "Magnificent Seven" Stock That Is Cheaper Than the S&P 500 (According to This Key Metric)
The Motley Fool· 2025-06-27 18:17
科技巨头"七巨头"概况 - "七巨头"指市值最大的七家科技公司:英伟达、微软、苹果、亚马逊、Alphabet、Meta Platforms和特斯拉[1] - 这些公司长期表现优于标普500指数 2023年对市场整体涨幅贡献显著[2] - 2025年部分成员如苹果和Alphabet表现不及标普500 Alphabet估值已低于标普500[3] Alphabet估值分析 - Alphabet远期市盈率仅17.4 低于标普500的21.8 当前市盈率18.6也低于标普500的28.4[10] - 远期与当前市盈率差距小 显示市场对其短期盈利增长预期较低[11] - 公司收入高度依赖谷歌搜索业务 占服务收入65.6% 达500亿美元[13] 业务结构与竞争挑战 - 主要收入来源包括谷歌搜索、YouTube、谷歌网络、订阅服务和硬件设备 云业务和其他创新项目占比较小[12] - 谷歌搜索面临ChatGPT、Claude、TikTok等新兴信息平台的竞争威胁[14] - 公司已推出Gemini AI模型 并升级搜索AI功能 近期发布Flow影视制作工具等创新产品[15][16] 未来发展潜力 - Gemini AI整合至生态系统可能加速公司增长 竞争压力反而推动创新[17] - 尽管搜索业务优势减弱 但盈利仍具持续增长潜力 支持现金流、投资和股东回报[18] - 当前估值水平被显著低估 成为长期投资者的吸引力选择[18]
谷歌AI试穿神器真神了!上传照片秒出OOTD,视频效果和照镜子没区别
量子位· 2025-06-27 16:09
谷歌Doppl应用 - 谷歌推出最新应用Doppl 支持用户上传照片实现虚拟试穿功能 可生成动态视频展示服装上身效果[1][2][11] - 该应用支持全身照上传 要求照片包含头顶到脚部且服装贴身 也可使用预设AI模特 服装图片需光线自然无褶皱[14][15][16] - 除试穿外 应用可自动搭配未上传的上下装 但不支持鞋子、内衣、泳衣及配饰试穿 涉及隐私或违规服装会输出基础款效果[18][19][21][22][23] - 用户可将试穿效果分享给他人征求意见 目前功能仍在测试阶段 网友期待全球上线[25][27][30] 谷歌购物功能迭代 - 谷歌5月已在Search Labs推出静态试穿功能 用户购物时点击图标上传全身照即可查看服装效果[8][9] - Doppl升级为动态试穿 效果更直观 官网提供使用建议如选择模特双臂下垂的服装图片以优化生成效果[11][12][15] Google Labs其他实验项目 - Portraits项目可生成名人肖像并对话 首个主角为《Radical Candor》作者Kim Scott 利用Gemini提取其言论进行交互[31][32][34][35][36] - Flow项目支持文生视频 可实现摄像头控制及电影级画质生成[37][39][41]
冠军队独享200w?这波是冲大学生来的,超千支队伍已组队报名
量子位· 2025-06-23 16:11
大模型变现与AI广告 - 生成式AI正在重构广告行业商业模式 底层技术探索空间巨大 [4][25] - Meta 2024年Q4广告营收同比增长21%达468亿美元 占总营收96.7% [9][12] - 谷歌CEO宣布重点押注生成式AI广告 涉及内容创作、分发模型等全链路 [15] AI广告技术突破 - Meta与英伟达合作的Andromeda系统使广告召回率提升6% 质量提升8% 部分回报率增长22% [10] - 谷歌推出Veo 3/Imagen 4等工具链实现广告创意全流程AI化 [17] - 推荐系统与生成模型融合实现"生成即推荐" 可动态创造个性化广告素材 [27][29] 行业变革方向 - 广告从"千人千面"升级为"一人千面" 实现场景化智能生成 [20][21] - 广告与种草边界模糊 内容性质增强 转化率提升 [24] - 传统展示广告向生成式内容消费链转型 追求精准而非曝光 [22] 技术架构与挑战 - 核心技术包括用户建模(特征嵌入/序列建模)、生成模型设计、多任务优化(CTR/CVR) [32] - 需解决生成多样性、实时性、伦理风险等挑战 [33] - 全模态序列生成式推荐(AMGR)代表推荐系统从识别到创造的范式转变 [44] 商业应用案例 - Meta的Advantage+AI工具提升Reels广告投放效率 [11] - 可口可乐AI广告案例显示创意本体可完全由AI生成 [18][20] - 多模态生成技术使广告可无缝植入新闻、视频等场景 [30] 产业人才机遇 - 腾讯广告算法大赛聚焦AMGR 提供360万奖金及直通offer机会 [44][45] - 参赛者可接触腾讯真实业务数据 培养广告思维与业务敏感度 [42][43] - 赛事基于Angel平台提供动态算力支持 解决资源瓶颈 [48]
计算机周观点第5期:网证管理办法发布,AI关注点持续向“落地”转移-20250617
海通国际证券· 2025-06-17 19:13
报告行业投资评级 - 计算机行业投资评级为增持 [1] 报告的核心观点 - 网证管理办法发布,鼓励使用网号网证,有望打开市场空间,线下可带动身份核验设备需求,AI 发展稳步推进,持续看好计算机板块 [3][4] 报告具体内容总结 投资建议 - 建议关注华大九天、达梦数据、金山办公、新大陆、通行宝、赛意信息、合合信息;相关标的为日联科技 [4] 网证管理办法相关 - 国家网络身份认证公共服务可提供申领网号、网证及身份核验等服务,平台将传统身份证信息转化为加密虚拟凭证 [4] - 六部门联合公布《国家网络身份认证公共服务管理办法》,自 2025 年 7 月 15 日起施行,明确网号、网证自愿使用原则,鼓励推广应用及平台接入,利好相应板块 [4] AI 技术进展 - 5 月 22 日 Anthropic 发布 Claude 4 系列模型,具备分析大型数据集、执行长期任务和采取复杂行动的能力,适合编程,旗舰模型能保持近 7 小时专注,拓宽了 AI 应用范围 [4] - 5 月 20 日谷歌发布多款 AI 新品,Gemini 全面融入谷歌生态和用户日常,科技巨头对 AI 关注点向“实际应用”转变 [4] 公司数据 | 公司 | 收盘价(元) | 总市值(亿元) | EPS(元/股)2024A | EPS(元/股)2025E | EPS(元/股)2026E | PE(倍)2024A | PE(倍)2025E | PE(倍)2026E | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 华大九天 | 115.92 | 629.38 | 0.20 | 0.43 | 0.57 | 579.6 | 269.6 | 203.4 | | 达梦数据 | 216.10 | 244.71 | 5.44 | 5.63 | 6.77 | 39.7 | 38.4 | 31.9 | | 金山办公 | 285.91 | 1322.83 | 3.56 | 4.22 | 5.10 | 80.3 | 67.8 | 56.1 | | 新大陆 | 30.60 | 315.81 | 1.00 | 1.30 | 1.50 | 30.7 | 23.5 | 20.4 | | 通行宝 | 23.19 | 96.13 | 0.52 | 0.82 | 1.07 | 45.0 | 28.3 | 21.7 | | 赛意信息 | 27.70 | 113.62 | 0.34 | 0.54 | 0.69 | 80.7 | 51.3 | 40.1 | | 合合信息 | 161.07 | 225.50 | 4.93 | 4.86 | 5.97 | 32.7 | 33.1 | 27.0 | 注:2024EPS、收盘价、市值来源于 Wind,为 2025 年 5 月 26 日数据,其他数据来源于 HTI [5]
3个趋势,看AI到底是怎么重构广告行业的?
36氪· 2025-06-11 17:42
谷歌AI战略转向 - 公司宣布进入AI平台转型新阶段,发布Gemini 2.5和Flash模型,展示贯穿搜索、广告、内容生成的AI Mode [1] - 通过AI模式将广告与内容深度融合,实现高度个性化和自动化广告投放,重构广告分发机制和商业路径 [1] 广告系统重构 - 广告系统从"人工创意+平台匹配"转向"AI自动生成内容+全渠道自动投放"模式 [2] - Performance Max模式在2022年三季度完成对旧版智能购物广告的全面替代 [2] - 公司不是在优化广告,而是重新定义广告本身 [2] 创意生产自动化 - 发布Veo 3、Imagen 4和Flow等AI产品,提供全流程自动化创意工具 [2][4] - 创意生产从资源密集型、人力驱动模式转向高度自动化、AI驱动的内容生成模式 [2] - Veo 3可将静态产品图自动转化为带有镜头语言的视频短片,极大降低高质量视频创作门槛 [4] 个性化范式转变 - 广告从"千人千面"迈入"一人千面",实现针对个人的超个性化投放 [3] - Gemini能力集成到搜索界面,结合购物图谱展示个性化产品列表面板 [3] - 通过"查询扇出"解析用户隐含意图,实现更精准的产品推荐 [3] 智能代理功能 - 引入智能代理结账功能,允许用户设定期望购买金额,自动完成交易 [5] - 公司从搜索引擎转变为主动购物代理,从"帮助发现"升级为"促成交易" [5] - 广告主竞争重点从驱动点击转向优化"代理推荐"表现 [5] 广告与搜索体验融合 - AI总览月活跃用户达15亿,"AI搜索"类型使用量提升10%以上 [6] - 广告直接融入AI生成的答案中,成为"有用信息"的一部分 [6] - 广告曝光总量可能下降,但单次曝光转化率有望显著提升 [6] 品牌主应对策略 - 打造品牌专属智能体,实现素材审核、投放决策自动化 [7] - 提供面向智能体的服务接口或数据产品,提升品牌在AI生成内容中的可见性 [7] - 注重"品效合一"的长期主义,实现品牌建设与销售转化协同增长 [9] 广告生态变革 - 广告从"链接引擎"转向"答案引擎",创造新的盈利机制 [8] - "零点击"搜索普及,品牌主须转向AI可发现性和权威性建设 [8] - 广告与内容界限模糊,用户难以感知"是否为广告" [8]
3个趋势,看AI到底是怎么重构广告行业的?
腾讯研究院· 2025-06-11 15:44
谷歌AI战略转向 - 谷歌CEO Sundar Pichai宣布公司正处于AI平台转型新阶段 通过Gemini 2 5和Flash模型发布 展示贯穿搜索 广告 内容生成的AI Mode 实现商业模式根本性重构 [1] - 谷歌将广告与内容深度融合 实现高度个性化和自动化广告投放 重构广告分发机制和商业路径 [1] 广告系统重构 - 谷歌广告演进从2000年AdWords到2021年Performance Max 实现"AI自动生成内容+全渠道自动投放"模式 2025年I/O大会进一步纵深推进 重新定义广告本身 [4] - 广告创意"流水线"全面AI化 Veo 3将静态产品图自动转化为视频短片 极大降低高质量视频创作门槛 [5] - AI从效率工具变成创意本体和投放决策者 智能代理渗透用户全流程 广告即内容 自然融入AI生成搜索结果 [6] - 创意生产范式从资源密集型向高度自动化AI驱动转变 品牌主可降本增效 重构工作流程 重塑创意生产体系 [7] 个性化范式转变 - 广告从"千人千面"迈入"一人千面" 通过Gemini能力集成到搜索界面 改变用户交互方式 实现更精准产品推荐 [9][10] - 智能代理结账允许用户追踪价格并自动购买 谷歌从搜索引擎转变为主动购物代理 广告主竞争重点转向优化代理推荐表现 [10] - AI模式推动广告行业实现真正"一人千面" 广告互动对用户都是独一无二的 实时生成的"交互内容" [11] 广告与搜索体验融合 - 谷歌AI总览月活跃用户达15亿 AI搜索类型使用量提升10%以上 广告直接融入AI生成答案 成为"有用信息"部分 [14] - AI缩短用户决策路径 颠覆互联网广告底层逻辑 广告曝光总量可能下降但单次转化率有望显著提升 流量分发机制与定价模型面临结构性变革 [15] 广告行业未来展望 - 品牌主需转型策略 从争夺搜索结果页位置转向争夺"被AI引用"机会 优化在购物图谱中的数据表现 [18] - 打造品牌专属智能体 与广告平台深度交互 实现素材审核 投放决策自动化 确保品牌调性与市场投放统一性 [19] - 提供面向智能体的服务接口或数据产品 提升品牌在AI生成内容和智能推荐中的主动性与可见性 [19] - 注重"品效合一"长期主义 通过AI赋能精准投放与内容创新 实现品牌建设与销售转化协同增长 [19]
5月全球人工智能领域新看点
新华社· 2025-06-02 11:37
大模型技术进展 - 中国深度求索公司完成DeepSeek R1模型升级,新版本DeepSeek-R1-0528在思维深度、推理能力及长文本生成(如议论文、小说、散文)方面显著优化,输出更贴近人类风格 [2] - 美国Anthropic推出Claude 4系列两款新模型:Opus 4(行业领先编程模型,擅长复杂长期任务)和Sonnet 4(指令理解与推理能力升级) [2] - 谷歌发布Gemini 2.5系列模型(性能与智能推理大幅提升)及多模态模型(Imagen 4图像生成、Veo 3视频生成、Lyria 2音乐生成、Flow电影制作工具),支持文本到高质量视觉内容转换 [3] AI技术缺陷与改进 - AI生成内容存在信息不准确问题,日本研究团队类比为"感觉性失语症"(表达流畅但语义错误),需突破内部模式僵化限制 [4] - 中科院自动化所与鹏城实验室提出AutoThink推理策略,通过省略号提示和三阶段强化学习实现自主切换思考模式,在数学数据集上平衡准确率与算力效率 [5] 行业政策与国际合作 - 日本通过首部AI专门法律《人工智能相关技术研究开发及应用推进法》,设立首相领导的"AI战略本部"并制定基本计划以促进研发与防滥用 [7] - 中国与上合组织发布《人工智能应用合作中心建设方案》,聚焦开源服务、产业对接、人才培育等领域加强跨国合作 [7] 社会经济影响 - 国际劳工组织报告显示全球25%工作岗位可能受生成式AI影响,影响性质取决于技术管理方式 [6]