Workflow
AI视频生成
icon
搜索文档
全球圈粉6000万,被国内粉丝催着上线,PixVerse「国内版」一手实测来了!
机器之心· 2025-06-07 11:59
产品发布与市场反响 - 爱诗科技推出国内版AI视频生成工具「拍我 AI」,该产品为全球热门应用PixVerse的本地化版本,已登陆各大应用商店并提供网页端深度体验[4] - 产品上线前已引发国内用户强烈期待,后台收到大量催上线私信,反映出市场对高质量AI视频工具的需求[2][12] - 海外版PixVerse已积累6000万全球用户,月活达1600万,曾位列美国应用总榜第四并登顶视频类应用榜首[13][14] 产品功能与技术特点 - 提供上百种模板支持一键生成同款视频,大幅降低创作门槛,适合新手用户快速上手[6] - 专业功能包括首尾帧控制、多主体合成、运镜设计、视频重绘等,支持短片及电影级创作[8][30][39][40] - 首创5秒内视频生成速度,实测各项指标拉满时生成时间仍不超过1分钟,显著优于行业水平[44] - 底层模型迭代迅速,从V2到V4.5平均每两月更新一版,国内外版本均搭载最新V4.5模型[45] 市场表现与行业地位 - PixVerse上线30天即实现百万访问量,2024年4月达成88天1000万次视频生成的里程碑[17] - 通过病毒式传播的创意模板实现破圈,典型案例包括科目三舞蹈、吉卜力风格等流行内容[18][24][27] - 在专业创作者群体中建立口碑,用户评价显示其渲染稳定性、动作逼真度及运镜功能显著优于竞品[15] 公司战略与竞争优势 - 采用「好玩+好用」双轨策略:降低普通用户参与门槛,同时满足专业创作者高阶需求[49][50] - 形成用户生态良性循环:普通用户模仿专业作品,专业创作者汲取大众创意灵感[51] - 作为成立仅两年的中国初创公司,在视频生成赛道已具备与OpenAI、谷歌等巨头竞争的实力[17] 行业影响 - 产品国内上线将加剧AI视频生成赛道竞争,为行业树立功能丰富度与生成速度的新标杆[47] - 已验证的全球市场成功模式(6000万用户基础)有望在国内复制,可能改变视频创作生态格局[52]
爱诗王长虎、谢旭璋:“不会创业” 的创始人,怎么做出用户量第一的 AI 视频产品
晚点LatePost· 2025-06-06 19:05
公司概况 - 爱诗科技由80后王长虎与90后谢旭璋联合创立,团队组合打破"35岁以下更适合大模型创业"的行业偏见 [3][4] - 公司定位为AI视频生成领域,同时开发底层模型与to C应用产品,全球用户超6000万,是竞品可灵的3倍 [4] - 核心产品PixVerse移动端上线6个月月活达1600万,国内版"拍我 AI"于6月6日正式发布 [4][6] 产品与技术 - 差异化路径:聚焦普通人需求,通过模板化设计(如毒液变身、科目三跳舞等)实现零Prompt操作,用户首条视频即可获万至百万点赞 [4][8][9] - 技术迭代:模型V3将生成成功率提升至近100%,V3.5将等待时间压缩至10秒内,累计更新7版模型 [6][9] - 生成效率:V4模型实现5-7秒生成5秒视频,正在探索实时生成技术以模糊创作与消费界限 [16][17] 市场表现 - 病毒式传播案例:毒液变身模板全球播放量超10亿次,咧嘴笑模板推动PixVerse登顶美国iOS下载榜前五 [6][12] - 商业化进展:订阅收入已覆盖绝大部分成本,现金流接近转正 [7] - 全球化布局:视频内容天然跨语言传播,高GDP国家贡献主要收入,暂未精细化运营区域市场 [12] 行业竞争 - 视频生成第一梯队:国内为爱诗、快手可灵、MiniMax海螺,海外Google表现突出,认为Sora实际效果与demo差距显著 [14] - 对抗大厂逻辑:视频行业持续分化(长/短视频、直播等),新内容形态需增量供给,非存量替代 [10] - 技术壁垒:毒液模板半年未被复现,依赖高质量生成模型与持续用户洞察能力 [12] 战略决策 - 关键转折:2023年6月All in视频生成,抓住当时行业非共识机会 [23][24] - 资源分配:Sora发布后坚持原定技术路线,未盲目追加资源追赶,最终验证模型实效优于Sora [26] - 双引擎驱动:前期以模型技术为核心,后期产品与模型协同进化,产品需求反哺技术方向 [20] 行业趋势 - 技术架构:主流仍为DiT,自回归+Diffusion混合架构显现潜力但存在帧间误差挑战 [15][16] - 交互革命:实时生成将改变视频线性叙事,用户可动态改变剧情走向,视频与游戏界限模糊化 [17][18] - 价值认知:视频生成领域整体被低估,较之大语言模型更少舆论关注但实际商业落地更快 [24][25]
Sora免费首秀遇冷,微软能否借其重振AI视频领域雄风?
搜狐财经· 2025-06-05 21:33
微软终于将Sora模型免费开放给公众,但这一举措似乎来得有些迟。近日,微软Bing宣布在其应用中新增了Bing视频 创作器功能,该功能基于OpenAI的Sora模型,允许用户通过简单的文本提示生成视频。这也是Sora首次面向大众免费 开放使用。 几乎在同一时间,另一家公司Manus也推出了其原生文生视频功能,并嵌入到了自家的Agent工作流中。这两家公司几 乎同时在其产品生态中引入文生视频功能,不禁让人质疑微软这一步棋究竟慢了多少。 Sora模型自诞生之日起便备受瞩目,甚至被誉为"AI视频领域的牛顿时刻"。然而,不断延期的发布时间、高昂的定价 以及复杂的安全风险等问题,让市场对它的期待逐渐降温。如今,尽管微软通过Bing免费上线了视频创作器功能,但 Sora的表现却显得有些差强人意。 在实际测试中,Bing视频创作器在视频长度、画面比例、生成速度以及多模态融合功能等方面都存在明显短板。生成 的视频质量也远不及市场上的其他同类产品。例如,在对比测试中,Bing视频创作器生成的羊驼跳舞视频画面主体辨 识度低,背景AI感强烈,整体质感较为粗糙。 从Sora模型首次曝光到现在,整个事态的发展颇具戏剧性。微软一直对So ...
从“牛顿时刻”到“鸡肋时刻”:微软免费Sora的尴尬首秀
虎嗅· 2025-06-05 18:34
微软Bing视频生成器发布 - 微软Bing推出基于OpenAI Sora模型的视频创作器,首次面向用户免费开放[2] - 功能允许通过文本提示生成视频,但存在明显局限:视频长度仅5秒,画面比例仅9:16,最多排队生成3个视频[12] - 生成速度较慢,Fast模式需几分钟,Standard模式需数小时[12] Sora模型发展历程 - Sora曾被OpenAI誉为"AI视频领域的牛顿时刻",但因延期、高价和安全问题导致市场期待消退[8] - 从2024年初发布到年末上线,期间不断释放小道消息展示能力,但频繁跳票错过黄金发展期[28][31] - 最终发布时被OpenAI CEO称为"视频版的GPT-1"[28] 产品性能对比 - Bing视频生成器效果停留在2024年水准,处理复杂提示词准确性不足,与用户期望有差距[26] - 测试案例显示:羊驼跳舞场景中主体辨识度低,背景AI感强;茶杯场景色彩生硬,视觉效果奇怪[14][22] - 与Sora原版对比,后者在动态光效、动作流畅度和画面协调性上明显更优[15][23] 行业竞争格局 - 中国厂商如快手可灵、字节即梦、通义万相等已完成多次迭代,部分产品已跑通商业化[30][39] - 谷歌Veo3在性能上领先但成本高,而Kling等价格适中产品迅速积累2200万用户[44] - 阿里巴巴通义团队采取开源策略,在开源领域获取关注[43] 微软与OpenAI关系 - 双方从紧密合作到"心生嫌隙",贯穿Sora研发周期[32] - 微软2024年招揽Mustafa Suleyman负责AI业务,意图摆脱对OpenAI依赖[33] - 围绕Sora发布策略和资源支持存在博弈,微软最终获得"副产品"而非完整产品[6][7] 市场影响与展望 - 微软免费策略可能引发新一轮行业竞争,但行动被视为被动追赶而非创新[45] - Sora仍具技术优势,结合微软庞大用户生态可能快速扩大影响力[38][39] - 行业共识认为AI下半场比拼产品能力,场景入口将成为关键[40]
Manus AI能生成视频了,实测发现不少翻车名场面,网友:有种2011年的美
36氪· 2025-06-05 17:26
当代 AI 视频创作者有三件套:提示词、积分、以及抽卡。 继 Veo 3 刚刚掀起一轮小高潮后,Manus 也能生成视频了,功能挺全,经过实测,在 Agent 加持下, 支持图生视频、文生视频等标配功能。 该功能目前已经向 Basic、Plus 和 Pro 用户开放抢先体验。 先说结论,你要真指望它一句话秒出大片,那还是先降低心理预期。 高情商,不是不能用,只是抽卡的概率有些感人;低情商,用网友的话来说,花里胡哨,视频质量也有种 2011 年的美。 按照过往惯例,Manus 大概率也是套壳某家 AI 视频模型,但鉴于目前还没厂商认领,我们也不好断言,而经过一轮实测,我们也总结出几个特点: 图生视频:效果能打,但也随机抽卡 从体验上看,Manus 的图生视频明显要比文生视频靠谱得多。 我上传了一张威尔史密斯的照片作为参考,让其生成吃面的视频,效果还算可接受,风格统一、角色一致性尚可。 肤色和构图风格维持得比较好,相比于当前的视频主流模型,算得上是正常发挥。 并且,5 秒的视频仅扣了 44 积分,考虑到如果是普通用户,那么开通一个 Basic 账号,积分也足够用了。 抽卡严重,基本默认生成约 5 秒的「默剧」片段 ...
腾讯开源的HunyuanVideo-Avatar上传一张图+一段音频,虚拟角色“活”过来
搜狐财经· 2025-06-04 10:48
产品技术特点 - 腾讯开源的HunyuanVideo-Avatar是一个视频生成工具,能够通过上传一张图片和一段音频,让图中的人物、动物或虚拟角色动起来并开口说话、唱歌或表演[1] - 该工具的核心逻辑是"数字人导演",能够从静态图中理解场景,并根据音频情感让角色动起来[3] - 产品包含三个关键模块:1)保留原图细节,避免"网红脸"效果,能精准保留衣服褶皱和背景光影[3] 2)能从音频中提取情感特征,生成细腻表情[4] 3)支持多角色独立互动,唇形、表情、手势和眼神交流自然[5] 应用场景 - 电商直播:可生成24小时在线的AI主播,根据促销文案做出夸张表情刺激用户下单[6] - 音乐平台:QQ音乐用于生成歌手AI分身演唱新歌,酷狗用于长音频绘本虚拟人讲故事,全民K歌支持用户生成专属MV[6] - 影视创作:导演可通过场景草图和旁白脚本生成分镜动画[7] 系统配置要求 - 最低配置需要NVIDIA RTX 3090显卡(24GB显存)才能流畅生成720p视频[8] - 推荐配置为NVIDIA A100显卡(80GB显存)可输出电影级画质[8] - 详细配置要求包括:GPU、内存、存储和CUDA版本[9]
Veo3逼真脱口秀火爆全网,视频生成的GPT时刻到了吗?
第一财经· 2025-05-26 14:38
2025.05. 26 本文字数:3653,阅读时长大约6分钟 导读 : "瑕疵非常多,也很贵。" 作者 | 第一财经 刘晓洁 吕倩 "如果AI生成的角色拒绝相信他们是AI生成的,会怎么样?" 近日,海外博主用谷歌最新视频模型Veo 3生成的一些人物视频火了。在这些视频中,有一群人集体高 呼抗议"We're not prompts(我们不是提示词)",还有一位男士举着手机自拍,背景是美妙的高山峡 谷,他指着身后,"你想说我背后的完美创造物,仅仅是0和1的结果,一串二进制代码,再无其他?这 不合理。" 当然台词和剧本是人创作的,但由AI生成的这些人物和场景都极具真实感,无论是光线在人脸上投下的 阴影与高光,还是人物的长相、口型,在阳光下眯起眼睛的神态都极为自然。配合Veo 3新的原生音频 生成功能,人们再一次惊呼"真实不存在了"。 事实是否真的如此,视频生成的GPT时刻终于来了吗?第一财经记者采访的Veo 3的使用者们并不这么 认为。AI Talk主理人、AIGC创作者汗青提到,Veo 3确实是很好的技术,但并没有网传那么夸张,例 如视频生成质量有提升但不惊艳,价格不低,现阶段对实际生产帮助还不大。 AIGC创 ...
AI视频生成告别默剧时代!谷歌Veo 3一步生成高质量音画大片,rap、电影、动画片都拿捏
量子位· 2025-05-21 14:31
谷歌Veo 3视频生成模型 - 谷歌推出最强视频生成模型Veo 3,能够从画面到对白完全由AI原生生成,支持各种影视风格[1][4] - Veo 3具备电影级音视频能力,用户可通过自然语言描述角色、场景,并指定对白和语气[4][5] - 模型已面向Google AI Ultra订阅用户开放,企业用户可通过Vertex AI平台调用[5] Veo 3的多样化应用 - 用户生成内容涵盖说唱、复古烹饪节目、洗脑神曲等,展示模型强大的创意表现力[6][7][8] - 模型可应用于教育场景,如生成古希腊数学家毕达哥拉斯的教学视频[9] - 支持营销场景,能够重复强调同一概念实现洗脑效果[10] Veo 3的技术特性 - 模型支持连续生成长视频,通过首尾帧功能可制作1分钟左右的连贯视频[13][14] - 音频生成能力突出,可模拟电影级音效和角色自白[14] Veo 2的升级功能 - Veo 2新增"参考视频"功能,用于保持视频风格统一和角色形象一致[16] - 其他升级包括相机控制、画面扩展、物体添加/移除等功能[18] - 新功能已在Flow工具中部分上线,完整版即将登陆Vertex AI平台[19]
诺瓦星云(301589) - 2025年5月20日投资者关系活动记录表
2025-05-20 20:05
产品应用与市场定位 - 公司聚焦视频显控核心算法研究及应用,产品包括显示控制系统、视频处理系统和基于云的信息发布与管理系统,可应用于庆典赛事、会议活动等领域,未提及可用于新能源汽车内显示屏 [2] - 智慧城市是公司产品应用重要场景之一,具体订单和业绩情况关注公司业绩公告 [4] 产品收入占比 - 2024 年 LED 显示控制系统收入实际占比 46.17% [3] - 2024 年售后服务收入占比不足 5% [3] - 2024 年视频处理系统占公司总营收比重为 40.94% [11] 产品技术与市场应对 - 面对 Mini/Micro LED 技术迭代,公司将跟踪 MLED 行业趋势,增强预研和研发投入巩固市场地位 [3] - 有针对 Micro LED 直显专用控制系统研发计划,具体信息关注官网和订阅号、服务号 [3] 服务与运营 - 通过完善服务网络、远程运维平台等提升服务效率,服务收入转型规划关注官网和订阅号、服务号 [3] - 屏老板是免费售前方案工具服务,登录注册为方便记录保存方案库,会分析采纳免费供大众使用建议 [5][6][7] 库存与供应链管理 - 2024 年存货周转率为 1.03 次,同比下降 12%,通过需求预测系统和“PO + Forecast 模式”优化采购和库存管理 [3] - 对同一类型芯片按国际和国产品牌布局供应商,与战略合作供应商联合开发关键器件,PCB 布局三家以上战略供应商并协商年度合作协议 [8] 行业趋势与市场规模 - 受宏观环境影响,国内市场有压力,海外市场预计增长良好,MLED 产业预计保持快速增长,LED 显示屏市场规模将扩大 [4] 应收账款情况 - 2024 年应收账款周转天数同比增加 5 天至 48 天,账龄 1 年以内应收账款占比 97.98%,回款情况良好 [3][7] - 2024 年应收账款坏账准备计提比例同比持平,账龄结构合理 [5] 财务指标与费用管控 - 2024 年毛利率为 55.25%,同比提升 3%,净利率保持稳定,通过费用管控实现盈利韧性,未来重视数字化建设降本增效 [7] - 2024 年海外收入占比 19.1%,财务费用实际为 -272.93%,实施全球化布局提供服务 [7] - 2024 年政府补助占净利润比例达 12%,主要为即征即退增值税,具有可持续性 [9] - 2024 年分红比例维持在 25%,货币资金占总资产比例由 12.69%提高到 18.11%,资本结构稳健 [9][10] - 2024 年资产负债率为 32.52%,同比下降约 16 个百分点,未来优化债务融资结构 [10] - 2024 年研发费用率为 16.47%,研发投入 5.40 亿元,高于行业可比公司,将保持高强度研发投入 [10][11] 客户与市场拓展 - 2024 年度前五名客户合计销售金额占年度销售总额比例为 27.20%,第一大客户占比为 8.66%,无大客户依赖风险,将拓展客户群体 [11] - 通过展会推广、峰会营销等提升品牌影响力,参与虚拟展会和线上技术研讨会拓展获客渠道 [8] 人才结构与创新 - 2024 年年末员工总数同比增长 12.73%,研发人员占比 41.17%,略有下滑因加强海外销售,未来强化研发团队建设 [10] 产品竞争与应对 - 面对行业竞对推出一体化解决方案,公司通过前瞻性技术布局、完善创新体系、优化服务应对产品同质化竞争,并购计划关注公告 [11] - 2024 年视频处理设备收入同比增长 25%,毛利率同比增长 2.99%,通过跟踪新技术、参股上游芯片厂商优化供应链提升溢价能力 [11] ESG 相关 - 公司重视 ESG 工作,践行节能环保措施和绿色办公理念 [12]
38岁创业卖小家电,女大佬一年赚1个亿,刚宣布退市;三十年老牌物流巨头停止运营,老板失联丨Going Global
创业邦· 2025-05-18 18:22
「Going Global 出海周报」 是创业邦推出的出海系列栏目,旨在为出海领域的创业者和投资人精选 出海大事件、海外大公司、投融资消息,本篇为栏目第 286 篇报道。 整理丨赵晓晓 本周(202 4 . 05 . 11 - 2025.05.17)出海大事件包括: TikTok被欧盟指控广告违规,最高可能面临年营业 额6%的罚款;Temu可能在美国恢复全托管模式;SHEIN在美国降低零售价;速卖通继续加码百亿补贴; 淘宝加速出海,哈萨克斯坦上线俄语版;阿里国际站加推美国专场大促;南洋国际物流集团停止运营; 美团 Keeta、蜜雪同一天宣布进入巴西市场;高盛预言:未来90天中国出口将爆火;美国对华小额包裹关 税据报低至30%等。 出海四小龙 TikTok 被欧盟指控广告违规,最高可能面临年营业额 6% 的罚款 5 月 15 日,欧盟指控 TikTok 违反《数字服务法》规定,没有提供有关广告内容、目标用户和广告 付费者的必要信息。该法案规定,互联网平台需要发布一个广告资源库,旨在让研究人员和用户检测 诈骗广告。 如果这一指控成立, TikTok 最高可能面临全球年收入 6% 的罚款。据 Oberlo 数据, ...