多模态
搜索文档
活动报名:AI 视频的模型、产品与增长实战|42章经
42章经· 2025-08-10 22:04
AI视频模型技术路径与能力展望 - Luma AI模型产品Lead戴高乐分享视频模型与世界模型的技术路径及未来能力展望 [2] - 探讨视觉模型从diffusion到DiT再到autoregressive的技术演进历程 [3] - 分析更智能的视觉模型能力发展前景 [3] Pixverse用户增长与商业化策略 - 爱诗科技联合创始人谢旭璋分享Pixverse两年内实现6000万用户的关键决策 [3] - 外部模型、自研模型与应用产品的选择与迭代策略 [4] - 从模型到特效类产品的转化逻辑及0-6000万用户的增长点与商业化路径 [4] 视频工具产品增长方法论 - 前OpusClip增长产品负责人谢君陶提出视频工具获客需聚焦创作者长期合作模式 [5] - 转化阶段强调灵活精准的定价策略与分阶段价格实验设计 [5] - 留存策略以用户为中心,通过客服团队与运营保持长期连接 [5] - 早期数据基建的取舍与数据驱动决策在增长中的关键作用 [5] 行业交流活动信息 - 活动聚焦AI视频领域模型、产品、增长三大维度实战经验分享 [10] - 线上会议时间为8月16日10:30-12:30,限额100人(非投资行业优先) [7][10]
关于 AI Infra 的一切 | 42章经
42章经· 2025-08-10 22:04
AI Infra的定义与架构 - AI Infra包括硬件和软件两部分 硬件指AI芯片 GPU 交换机等设备 软件层面类比云计算分为三层 [3][4] - 最底层类似IaaS 解决基础计算 通信和存储问题 中间层类似PaaS 包含资源调度 资源管理等平台 MaaS归属这一层 [4][5] - 最上层近似SaaS应用层 但在AI Infra领域更倾向于理解为训练及推理框架的优化层 [5] AI Infra的发展历程 - 第一批AI Infra人如贾扬清 李沐 陈天奇等有算法背景 他们为充分利用GPU而开发AI Infra [6] - 第二批AI Infra人主要推动AI Infra在工业界的规模化应用 [6] - 大模型兴起使AI Infra进入主舞台 类似搜索引擎兴起时的机会窗口 可能十年二十年才出现一次 [7][9][10] AI Infra与传统Infra的差异 - AI Infra绝对核心是GPU 传统Infra核心是CPU [11] - AI Infra需要更极致 更贴合AI特殊需求 太阳底下没有太多新鲜事但要做到更极致 [12] - Infra人才相比算法更强调积累 算法依赖年轻人而Infra需要长期经验 [14] AI Infra的核心指标与价值 - 线上服务侧关注首字延迟 吐字稳定性 整体成本 训练侧关注每张GPU处理数据量和训练效率 [15] - 优化Infra可显著降低成本 例如1万张GPU每月租金1亿 利用率提升10%可节省1000万 [18][19] - 小公司可通过对比云厂商方案决定是否自建Infra 云服务商价值在于帮助小公司节省优化成本 [20][21] AI Infra的商业模式 - 第三方公司短期价值在于提供API集贸市场 让客户自由选择不同API [22] - 长期来看 第三方需与硬件或模型垂直整合才能建立壁垒 避免被云厂商或模型公司取代 [24][25] - MaaS服务商可通过与硬件厂商深度合作获得差异化优势 类似游戏机独占游戏 [26][27][28] AI Infra与模型效果 - Infra水平影响模型效果 优化更好的Infra可在相同算力下多学20%数据 提升模型效果 [36][37] - MFU是常见指标但单一指标难判断优劣 DeepSeek的MFU偏低但Infra并不差 [37][38] - DeepSeek成功关键在于选对优化目标 即给定推理成本训出最好模型 而非传统训练算力优化 [39][40][41] AI Infra的未来趋势 - 当前最重要指标是decoding速度 直接影响线上业务成本和强化学习效率 [44] - 多模态仍有突破可能性 需实现理解和生成的统一 类似GPT-3.5让专用模型退休 [63][64] - 开源模型促进AI Infra发展但也可能阻碍创新 如过度优化Llama影响新范式探索 [69] AI Infra的组织架构 - 理想协作是Infra 算法 数据团队共同决策 大厂中Infra常被视为支持角色缺乏影响力 [46][47][49] - 合理架构应是Infra人设计模型结构 数据人负责刷分 算法人主攻训练范式革新 [54] - 大厂人才结构错配 如DeepSeek Infra工程师多于算法工程师 而多数大厂相反 [81][82] AI Infra的创业机会 - 训练侧商业模式难成立 因训练方不愿泄露核心竞争力 推理侧如加速优化仍有机会 [67][68] - 国产芯片需专门设计模型结构提升性价比 Step 3开源模型支持国产卡商用并达到SOTA [69][73][74] - 多模态成本有望大幅下降 理解已不贵但生成仍贵 视频生成一年后可能降至几分之一 [75][76][77]
逐鹿人工智能下半场,AI应用商业化起量!基金经理最新观点
券商中国· 2025-08-10 18:21
AI产业进入商业化闭环阶段 - AI正进入从算力投入到云服务消耗、再到商业化收入,最终回到算力再投入的良性循环,AI应用的起量是推动这一飞轮效应的关键 [1] - 国务院提出深入实施"人工智能+"行动,推动AI在经济社会发展各领域加快普及、深度融合,形成以创新带应用、以应用促创新的良性循环 [2] - 多位基金经理认为AI将进入商业化闭环新阶段,海内外AI应用加速起量,带动token调用量爆发增长,核心产品ARR斜率走陡,AI正逐渐进入下半场的应用爆发阶段 [2] AI应用商业化起量起规模 - 今年是AI应用商业化开始起量、起规模的关键一年 [3] - 海外方面:Cursor成为历史上最快达到5亿美元ARR的公司,Anthropic的ARR在半年内从10亿美元飙升至近40亿美元,OpenAI年化收入突破100亿美元(同比增长80%),Google的token日均调用量达16万亿(同比增长50倍) [3] - 国内方面:快手可灵推出10个月后ARR突破1亿美元,字节豆包大模型日均token使用量超16.4万亿(环比增长3.7万亿,较发布时增长137倍) [3] - AI功能正渗透进日常工作生活,token数量爆发式增长代表实际使用量飞速增长,Deepseek降低单位算力成本推动应用落地 [4] AI应用商业化进展与方向 - AI应用行情不再由事件催化主导,而是聚焦商业化实际进展,美股AI应用公司不断上修AI驱动业绩预期 [4] - AI应用聚焦B端和C端双轨赋能:B端以AI智能体为核心实现降本增效,2025年全球AI工具在代码生成等领域的应用率超25%;C端通过硬件集成和多模态体验重塑用户体验,但变现较弱 [5] - 短期可关注B端AI智能体方向和C端多模态相关方向,GPT5和国内政策支持为催化因素 [5] AI智能体成为核心入口 - AI Agent是人机交互的重要入口,OpenAI发布的GPT-5强化了Agent功能,可自动完成复杂任务 [6] - 2025年被称为"智能体元年",智能体将演变为蜂群、集群,改变企业组织运营模式 [6] - AI智能体从2023年代理型工具阶段演进至2025年产业渗透阶段,实现垂直深耕和规模化落地 [7] - AI Agent有望成为新的互联网核心,催生手机厂商和互联网厂商的入口争夺,荣耀与智谱、苹果与阿里等合作抢滩AI Agent [7] 端侧创新为下一轮增长引擎 - AI端侧(手机、PC、眼镜等)进展相对缓慢,市场期待C端爆款产品和硬件突破 [10] - iPhone17系列的AI升级有望带动芯片、主板等产业链环节升级,AR/MR设备或成为多模态AI终端更优选 [10] - 智能眼镜、智能玩具和智能家居是端侧AI重要载体,智能眼镜行业2024年销量300万台,预计2027年达1亿台(对应1000亿元市场空间) [11] - 端侧创新是新一轮科技周期重要催化剂,硬件迭代速度快,明后年或见明显改善 [11]
用友网络20250807
2025-08-07 23:03
公司和行业内容总结 用友网络 **核心观点和论据** - 公司通过人员优化大幅减少亏损,现金流已回正,上半年经营性净现金流入同比增加6亿元,新签合同额上半年增长近8%,二季度增速达18%[2] - 组织架构从区域制转向行业垂直管理,短期影响订单,但2025年一季度起订单明显改善,预示业绩拐点到来[2] - BIP平台累计研发投入达100亿,占总收入60%,通过打通企业内部数据流和业务流,提供全面解决方案,主要面向大型企业客户[2] - 2025年8月中旬将发布BIP平台新版本,从3.0升级到BIP5,提升技术架构和功能,更好满足大型企业需求[2] - 下周五将发布库存管理、人力招聘和人力资源等多个方向的AI agent产品,预计2025年8月30日的中期报告中披露更多AI相关进展[2] **业绩表现** - 2025年第二季度单季度收入实现6%至10%的正增长,利润端大幅减亏,减少一到两个亿的亏损[3] - 预计今年收入增长接近10%,达98.8亿元,明年恢复到10%以上,达110亿元,后年预计达125亿元[4] - 今年亏损将大幅收窄,明年实现盈亏平衡,后年逐步恢复到正常净利润率[4] **估值情况** - 目前PS水平为5.4倍,相较行业平均7.6倍有超过40%的上涨空间[4] - 被作为重点推荐标的[4] **AI应用** - 全球企业服务类AI应用发展迅速,SAP、Salesforce、ServiceNow等公司取得超预期表现[6] - BIP平台具备与ServiceNow类似的能力,累计研发投入达100亿,占总收入60%[6] - 将在下周五发布多款AI应用产品,包括库存管理、人力招聘和人力资源等多个方向的agent产品[8] **组织架构调整影响** - 过去两年从区域制转向行业垂直管理模式,短期内导致部分订单丢失[7] - 自2025年一季度起订单情况明显改善,业绩进入拐点[7] 其他公司 **万兴科技** - 在多模态领域有望取得重大进展,业绩相较去年有所修复,收入增长预期为10%~20%,利润有望盈亏平衡[11] - 今年上半年移动端产品收入增速预期超过100%,全年AI收入接近两个亿[11] - 未来在多模态领域的发展前景广阔[12] **申桑达** - 在数据服务方面表现突出[11]
华福证券:“Coding+多模态”重估UGC平台价值
智通财经网· 2025-08-07 16:52
AI UGC生态价值驱动因素 - AI Coding降低非专业用户对游戏和互动视频等开发门槛 侧重赋予UGC交互性与功能逻辑 [1] - 多模态能力通过文生图/视频/音频等方式丰富UGC素材质量 让创作者高效获得素材 [1] AI游戏平台发展现状 - Roblox 2025Q2发布超过4400万款游戏 其中70%新游戏包含AI生成资产 AI工具缩短开发时间35% [1] - TapTap星火编辑器整合AIGC技术 提供可视化编程与免费素材 实现从创作到上线的闭环发行 [2] 中短视频平台AI应用进展 - 快手可灵2.0模型月活用户增长25倍 全球用户突破2200万 累计生成1.68亿个视频和3.44亿张图片 [3] - 哔哩哔哩2025Q1 AI相关视频观看时长同比提升超100% 形成AI绘画/视频生成/编程等多领域创作社区 [3] IP开发平台AI战略 - 阅文集团Top10动漫中7部来自腾讯动漫 计划通过AI多模态提升动漫IP开发效率和内容形态丰富度 [4]
海外重磅AI大模型接连发布!恒生科技ETF基金(513260)连续7天净流入,港股通科技30ETF(520980)收涨近1%三连阳!
新浪财经· 2025-08-06 16:48
港股科技ETF表现 - 恒生科技ETF基金(513260)收涨0.28%实现三连阳 全天成交额超4亿元 近7日净流入超5亿元 最新规模超52亿元创新高 融资余额保持1.2亿元以上[1] - 恒生科技成分股涨跌互现 比亚迪电子涨超7% 中芯国际涨超2% 腾讯控股、阿里巴巴、快手涨超1%[3] - 港股通科技30ETF(520980)收涨0.89% 全天成交达1.63亿元 近20日净流入超12.6亿元[3] AI大模型技术进展 - 谷歌发布Genie 3通用世界模型 可生成数分钟交互式3D环境 较Genie 2的10-20秒水平有数量级提升[5] - Anthropic推出Claude Opus 4.1 在Agent任务、真实世界编码和推理能力上全面提升 计划未来几周推出更大幅度模型修改[5][6] - OpenAI发布GPT-oss-120b和GPT-oss-20b开放权重模型 具备与o4-mini相当的现实世界性能 可在电脑本地运行[5] - 马斯克宣布下周开源Grok 2 Anthropic计划未来几周发布重大模型改进[6] 下一代大模型发展预期 - 下一代大模型(如GPT-5)预计以2-3倍规模实现近10倍智能水平 推理性价比提升一倍以上 8月起有望陆续面世[7] - 模型在逻辑推理、原始多模态、记忆系统等方面持续突破 加速下游应用商业化进度[7] - Agent方向:下一代模型逻辑推理向原理学习迈进 增强准确性和创新思考能力 带动办公应用、企业管理等场景大规模落地[8] - 多模态方向:原生多模态成为主流 处理文本、图像、视频、音频更高效 带动编辑工具、教育/医疗/科研、智驾、机器人等场景落地提速[8] - 算力需求:模型规模和数据量增长 MoE为核心发展趋势 训练及推理需求带动算力指数级提升 推动算力芯片、服务器、云计算领域增长[8] AI应用商业化前景 - AI应用发展步入拐点期 预计2025年核心AI应用公司AI业务贡献达2-5个百分点 2026年起有望接近或达到双位数[9] - 中国企业Deepseek-R1大模型凭借低成本、高性能和开源特性 推动AI商业化应用加速[10] - 港股科技龙头广泛分布于AI全产业链 涵盖大模型开发、商业应用及终端生态环节 受益于AI产业变革红利[10] 港股市场展望 - 下半年港股牛市继续 科技、消费资产与产业发展趋势更契合 基本面更优 吸引南下资金持续流入[9] - 中美经贸关系边际缓和 美国对华科技产品出口限制减少 港股互联网巨头或加大AI基础设施资本投入[11] - 港股互联网估值不高 AI产业周期向上趋势确认 推动港股科技龙头重新跑赢市场[11] 企业动态 - 美团启动中小商户发展扶持计划 重点支持长期经营、复购高、口碑好的中小餐饮商户 预计年底新增覆盖超10万家餐饮小店 单店助力金最高5万元[6]
东方证券:多重催化驱动趋势加速 锚定多模态与出海机遇
智通财经网· 2025-08-06 14:55
核心观点 - 坚定看好多模态AI和出海赛道 产业发展和商业模式优势将带动行业公司享受高成长和高估值 [1] - 重视下半年垂类多模态AI应用机会 技术突破和成本优化将加速产业趋势发展 [1] - 特别关注有多模态AI应用出海布局的公司 起量速率可能更快 [1] 技术发展进展 - 主流AI产品能保持5-10秒视频稳定性和一致性 行业正探索生成视频时长上限 [2] - 字节提出CaptainCinema电影级短片生成框架 采用双步规划器实现叙事连贯性 [2] - 年内可能看到1分钟左右时长的AI视频出现 时长提升将加速内容渗透率 [2] 成本优化与商业模式 - 快手可灵视频生成产品在推理层面实现毛利打平 [3] - 阿里Wan2.2的MoE架构可节省50%计算消耗 [3] - 行业成本持续下降将带来"更好更便宜"的产品 提升用户渗透速率 [3] - 技术迭代推动推理成本进一步下降 用户使用成本降低 [3] 内容创新与扩容 - AI漫剧直接生成中AI参与度从50%提升至近80% [3] - AI转绘漫剧对真人实拍短剧进行再创作 全球发行更具普适性 [3] - 新内容业态成熟将带动内容市场扩容 AI视频可触及规模扩大 [3] 市场空间测算 - AI视频潜在空间测算为416亿美元 [4] - P端市场:海外2亿+国内1.6亿创作者 35%月活使用比例 海外10%/国内8%付费渗透率 月ARPU 35/17美元 对应38亿美元市场空间 [4] - B端市场:内容制作规模1984亿美元 20%AI渗透率 对应397亿美元市场空间 [4] - 考虑P端和B端场景重合 给予P端50%折算 得出416亿美元总市场空间 [4] - 海外用户付费能力和意愿更强 内容创作人工成本更高 [4] 关注公司 - 建议关注:快手-W(01024) 美图公司(01357) 万兴科技(300624) MiniMax(未上市) [1]
OpenAI 推出两款开源模型,GPT-5蓄势待发!
经济观察报· 2025-08-06 14:36
开源模型发布 - OpenAI推出两款开源模型GPT-oss-120b和GPT-oss-20b,这是自2020年发布GPT-2以来首次推出开源语言模型 [2] - 两款模型采用专家混合(MoE)架构的Transformer,以减少活跃参数数量 [3] - GPT-oss-120b每个token激活5.1亿参数,总参数量为1170亿;GPT-oss-20b激活3.6亿参数,总参数量为210亿 [3] - 模型支持高达128k的上下文长度,GPT-oss-20b需要至少16GB显存,GPT-oss-120b需要至少60GB显存 [3] 性能表现 - GPT-oss-120b在核心推理基准测试中表现接近OpenAI o4-mini,在竞赛编码、通用问题求解等方面超越o3-mini [4] - GPT-oss-120b在健康相关查询和竞赛数学表现上优于o4-mini [4] - GPT-oss-20b在相同评估中达到或超过o3-mini性能,尤其在竞赛数学和健康领域表现突出 [4] 战略转变与竞争 - OpenAI此次开源模型发布是对市场趋势的回应,旨在重新融入开源生态 [5] - 谷歌DeepMind于8月4日宣布推出第三代通用世界模型Genie 3,加剧市场竞争 [5] - OpenAI与英伟达、AMD等芯片制造商合作,确保模型在各种芯片上良好运行 [5] 模型安全性与市场预期 - 两款开放模型相比o3和o4-mini更容易出现"幻觉"现象,GPT-oss-120b和GPT-oss-20b分别对49%和53%的问题产生幻觉 [6] - OpenAI在预训练期间过滤了与化学、生物、放射性等相关的有害数据 [6] - 市场普遍预期OpenAI的下一个重大更新将是推出GPT-5 [6] GPT-5预期 - GPT-5将整合GPT系列基础模型、o系列推理模型以及GPT-4o全模态模型的三方能力 [7] - GPT-5单次推理的算力消耗不会大幅增加,API价格或较GPT-4o仅小幅增长甚至维持不变 [7] - GPT-5推理性价比有望提升一倍以上,将显著改善AI应用的盈利能力 [7]
多重催化驱动趋势加速,锚定多模态与出海机遇
东方证券· 2025-08-06 13:45
行业投资评级 - 传媒行业评级为"看好"(维持) [5] 核心观点 - AI视频生成产业存在三大市场预期差逻辑:单位时长延伸(年内或达1分钟)、成本下降带动价格降低(如阿里Wan2.2节省50%计算消耗)、内容新品类扩容(如AI漫剧AI参与度达80%) [1][2] - 技术突破显著:字节Captain Cinema框架通过双规划器实现电影级短片生成,快手可灵实现推理成本下降与毛利打平,行业技术迭代速度超预期 [1][2] - 商业化空间测算达416亿美元(P端38亿+B端397亿),其中P端基于2亿海外+1.6亿国内创作者,假设35%月活渗透与10%/8%付费率;B端基于1984亿内容制作市场20%渗透率 [3][9][13][17] 技术进展 - 视频时长:主流产品达5-10秒一致性,字节Captain Cinema框架通过关键帧生成+动态填充技术探索1分钟长视频 [1] - 成本优化:阿里Wan2.2采用MoE架构节省50%计算消耗,快手可灵实现推理成本下降与边际利润转正 [2] - 内容生产:AI漫剧生成参与度从50%升至80%,AI转绘技术提升全球发行普适性 [2] 投资标的 - 重点推荐:快手-W(01024)、美图公司(01357)、万兴科技(300624)、MiniMax,关注多模态AI出海企业 [4] - 逻辑支撑:海外市场ARPU达35美元(国内17美元),内容创作人工成本更高,出海企业商业化弹性更大 [3][10] 市场测算 - P端模型:海外2亿创作者×35%月活×10%付费×35美元ARPU+国内1.6亿×35%×8%×17美元=38亿空间 [9][10][11] - B端模型:1984亿内容制作市场×20%渗透率=397亿空间,与P端重合部分按50%折算 [13][17] - 汇率换算:416亿美元对应2912亿人民币(汇率1:7) [17]
别听模型厂商的,Prompt 不是功能,是 bug
Founder Park· 2025-08-04 21:38
AI投资与创业趋势 - Conviction投资的AI公司包括Cursor、Cognition、Mistral等,覆盖基础设施、模型和应用层[10] - AI公司收入增长迅猛,部分公司在极短时间内实现从零到1亿美元年化收入,增速超历史任何技术革命[11] - 传统行业拥抱AI速度最快,称为"AI跨越式发展效应",如法律、医疗等领域已实现规模化应用[31][33] AI技术进展与多模态机会 - 推理能力成为AI最显著突破,解锁高风险决策、序列化问题等新场景[13] - Agent类创业公司申请量增长50%,多模态应用如HeyGen、ElevenLabs年收入突破5000万美元[14][15] - 语音将成为多模态最先落地领域,医疗咨询、销售等场景迎来新机会[17] - GPT-4价格18个月内从$30/百万token降至$2,蒸馏版低至$0.1,推动应用普及[18] AI应用成功案例与方法论 - Cursor 12个月内收入从100万增至1亿美元,用户达50万开发者[21] - Cognition成为企业代码提交量最高"贡献者",Windsurf被OpenAI以30亿美元收购[21] - 代码成为AI应用突破口因:结构化逻辑、结果可验证、研究人员重视、工程师自我工具开发[23][24] - 成功产品需领域知识、智能编排、精心呈现输出,避免通用文本框[30] 产品构建与竞争策略 - Prompt是过渡阶段缺陷而非功能,最佳产品应"读懂用户心思"[28] - Copilot模式价值被低估,从辅助到自动化是完整光谱[32] - 执行力是AI时代护城河,Cursor通过卓越执行赢得市场[35] - 私有数据和深度工作流构成应用构建者优势,非模型巨头可轻易复制[36] 行业机会分布 - 法律行业Harvey成立两年年收入超7000万美元,医疗领域OpenEvidence覆盖美国1/3医生[33] - 机器人学、生物学等领域存在巨大机会,需创新数据收集方法[34] - 游戏规则每12个月重塑一次,新模型发布带来持续获胜机会[36]