AI视频生成

搜索文档
量大管饱!让藏师傅疯狂涨粉的 Nano Banana 玩法合集 02
歸藏的AI工具箱· 2025-09-05 17:12
核心观点 - Nano Banana作为多模态AI模型在图像生成、视频制作和3D建模等多个创意领域展现出强大能力 其应用范围从艺术创作扩展到实用工具开发 显示出在内容生成市场的巨大潜力[1][3][73] AI艺术创作应用 - 利用书法字帖和人物姿势生成具有中国风意境的AI舞蹈视频 通过特定提示词控制人物风格和光影效果[4] - 使用即梦图片3.1模型生成基础图像 提示词包含CG厚涂风格、精致五官、瓷白肌肤等详细视觉要求[4] - 通过可灵2.1首尾帧生成视频 配合专业转场提示词实现平滑过渡 支持A类关联性强的原地演变和B类差异巨大的运镜驱动转场策略[12][14][15] 3D建模与可视化 - 将建筑平面图转换为等距摄影级3D渲染图 使用Hyper3d工具生成GLB格式3D文件[17][24][26] - 基于3D俯视图生成指定视角的室内渲染图 如从餐桌看向卫生间的视角 并支持家具样式替换[19][20][22] - 通过Cursor和GPT-5开发前端网页 实现3D模型交互展示 点击特定位置可显示对应渲染图[28] 营销与内容创作 - 创建夸张广角镜头效果的视频封面 通过前景物品放大技术提升点击率 比平时封面效果更好[33][35] - 利用视觉推理能力实现照片位置反推和地标图像生成 基于地图标记生成对应实景照片[37][38][39] 产品设计与转换 - 车辆改装功能可指指定涂装参考图更改车辆配色、轮毂设计和拉花装饰 并生成多阶段改动图片[41] - 将饮品图像转换为柔软充气玩具设计 采用哑光织物纹理和细微缝线强调充气效果[51][52] - 建筑转换为等距3D图标风格 支持任意建筑照片转换而非仅限于地标建筑[49] 教育内容生成 - 生成多张涂鸦风格图像解释"期货"概念 采用统一的手绘风格和英文文本 适合制作知识卡片[54] - 开发专用网页工具支持3:4比例图片导出 可直接用于小红书内容发布[56] 实体产品可视化 - 将汽车渲染图转换为收藏级手办模型 包含印刷包装盒和3D打印机场景[58][59][60] - 动漫角色转真人cosplay并手持手办 保持发型、配饰和服装的高度还原[62][63] 时间序列预测 - 预测建筑100年后荒废状态的形象生成 视频形式展现更具表现力[65][66][68] 多图像融合技术 - 混合无关图像生成连贯故事分镜 保持美学表现和人物一致性 across 9张连续画面[69][71] - 支持即梦智能多帧视频生成 实现多场景串联和角色整合[73]
拍我AI宣布接入谷歌Nano Banana,创意视频生成免费6天
新浪科技· 2025-09-05 11:22
技术合作与产品升级 - 公司AI视频生成平台拍我AI宣布接入谷歌Nano Banana(谷歌Gemini 2.5 Flash Image)技术 [1] - 公司近期发布PixVerse V5与Agent创作助手 用户只需选择模板并上传图片即可自动生成5-30秒完整短片 [1] 市场活动与用户增长 - 公司开启为期六天限时免费活动(拍我AI免费开放日) 持续至9月10日 期间用户可免费体验Agent创作助手 [1] - 平台全球用户规模已突破1亿 今年6月6日上线中国版本拍我AI [1] 产品功能与应用场景 - 用户可免费制作动态壁纸 宠物小剧场 切水果或奇幻创意短片 [1] - Agent创作助手能自动识别图片特征生成创意短片 [1]
快手年内已累计回购约20亿港币 高盛、瑞银等多家机构调高目标价
格隆汇· 2025-09-02 11:58
公司回购动态 - 9月1日单日回购113.7万股 金额超8371万港币 [1] - 今年以来累计回购3993.43万股 总金额约20亿港元 [1] 机构评级与目标价 - 杰富瑞、高盛、瑞银及东方证券均给予买入评级 [1] - 目标价区间为83至95.37港元 [1] 内容生态与创作者表现 - 万粉以上创作者投稿量同比增长超100% [1] - 月收入超千元创作者数量同比增长近12% [1] - 短视频与直播双线创作者获流效率高出单一类型创作者4-10倍 [1] - 泛知识与三农垂类创作者增长显著 [1] AI技术发展与应用 - 可灵AI技术达行业前沿水平 下游场景渗透率加速 [2] - OneRec推荐系统提升用户时长2.5% [2] - OneRec在本地生活场景推动GMV提升20%以上 [2] - 未来计划将OneRec覆盖比例提升至50%-60% [2] 商业化与电商进展 - AI视频生成全球可触达市场规模约1400亿美元 [2] - 快手AI视频生成月收入持续破亿 全球排名第一 [2] - 80%日活用户每日接触商业内容 [2] - KOL带来GMV同比增长16.5% [2] - 外循环广告在短剧游戏领域强劲 内循环广告受益泛货架加载量提升 [2] 战略方向与竞争优势 - 短视频与直播一体化运营为核心策略 [1] - 公私域循环与短直联动机制助力创作者流量变现双增长 [1] - AI技术布局与业务基本面相辅相成 [1][3] - 在视频生成、推荐算法及创作者支持方面投入巩固平台竞争力 [3]
爱诗科技发布PixVerse V5和Agent创作助手 全球用户规模已超过1亿
证券日报网· 2025-08-29 15:42
这一系列技术和产品的同步迭代,不仅见证了爱诗科技从技术突破到功能创新,再到规模化应用的快速 成长,也为PixVerseV5的创新奠定了坚实基础。 本报讯 (记者梁傲男)8月27日,全球用户规模突破1亿的AI视频生成企业北京爱诗科技有限公司(以 下简称"爱诗科技")正式发布新一代自研大模型PixVerseV5,并同步上线全新Agent创作助手。此次升 级不仅巩固极速生成优势,还在视频真实度与创作灵活性上实现飞跃提升,推动AI视频生成走向更广 泛的日常应用。 新一代PixVerseV5基于准实时生成能力,全面优化了动态效果、超清视觉处理、一致性保持、指令遵循 等核心环节,在效率与质量上同步跃升。无论是专业创作者还是普通用户,都能在人物运动、二次元、 宠物拟人、商业广告、科幻和艺术等多种场景,获得全新的创作体验。 与PixVerseV5同步上线的,是全新"Agent创作助手"功能。这一功能专为零基础用户设计,降低了视频 创作门槛。它不再只是提供"模板",而是像一个随身的AI导演:用户只需选择喜欢的模板并上传一张图 片,PixVerse(拍我AI)Agent即可自动识别其特征,生成一段5秒至30秒的完整短片。即便用户 ...
爱诗科技PixVerse V5升级发布,全球用户规模已超1亿
新浪科技· 2025-08-28 13:32
公司产品发布 - 爱诗科技发布新一代自研大模型PixVerse V5并同步上线Agent创作助手 [1][2] - PixVerse V5基于极致蒸馏、人类偏好拟合和统一特征空间等核心技术演进 具备急速生成、更逼真和指令响应更精准三大特色 [2] - 用户最快5秒可生成360P短片 1分钟可生成1080P高清视频 [2] 市场地位与用户规模 - PixVerse全球用户规模突破1亿 累计生成视频数超过8亿个 [1] - 在权威平台Artificial Analysis测试中 PixVerse V5在图生视频项目中排名全球Top2 在文生视频项目中位列Top3 [2] 产品性能表现 - PixVerse V5在AI视频模型排行榜中ELO评分达1,315 置信区间为-14/+16 位列总榜第2名 [1] - 相比其他主流模型 字节跳动Seed模型以1,348分排名第1 MiniMax海螺02 Pro以1,283分排名第3 [1] 技术创新与应用 - Agent创作助手专为零基础用户设计 通过模板选择和图片上传可自动生成5-30秒完整短片 [2] - 该技术推动AI视频生成走向更广泛的日常应用 显著降低视频创作门槛 [2]
爱诗科技正式发布PixVerse V5和Agent创作助手
证券时报网· 2025-08-27 20:11
人民财讯8月27日电,8月27日,记者获悉,AI视频生成企业爱诗科技,8月27日正式发布新一代自研大 模型PixVerse V5,并同步上线全新Agent创作助手,目前爱诗科技全球用户规模突破1亿。 ...
阿里开源14B电影级视频模型!实测来了:免费可玩,单次生成时长可达分钟级
量子位· 2025-08-27 10:24
产品发布与特性 - 阿里发布音频驱动视频生成模型Wan2.2-S2V 仅需一张图片和一段音频即可生成电影级数字人视频 [1] - 模型支持单次分钟级生成 具备影院级音频生成视频能力和基于指令的高级动作与环境控制 [5] - 模型通过混合并行训练和全参数化训练构建超60万个音视频片段数据集 [19] 技术实现 - 融合文本引导全局运动控制和音频驱动细粒度局部运动 实现复杂场景音频驱动视频生成 [19] - 采用AdaIN+CrossAttention控制机制解决音画同步问题 [20] - 利用层次化帧压缩技术将历史参考帧拓展到73帧 实现稳定长视频生成 [21] - 通过多分辨率训练支持竖屏短视频和横屏影视剧等不同分辨率场景生成需求 [22] 用户体验与效果 - 模型生成视频面部表情自然 口型一致且肢体动作丝滑 [1] - 用户可通过通义万相官网免费体验 每日登录赠送50积分 [11] - 实测显示模型对口型能力出色 唇形与台词基本匹配 [13] - 用户生成内容涵盖动漫人物朗诵 人物贴画唱歌及大段rap演绎等多种场景 [15][16][17] 生态影响与市场表现 - 通义万相视频生成模型家族在开源社区和第三方平台下载量已超2000万 [23] - 模型发布即开源 可通过GitHub Modelscope和HuggingFace等平台获取 [24]
AI视频生成新品实测:这怎么不算影院级呢?
量子位· 2025-08-25 23:47
模型性能表现 - 作为全球首个中文音视频一体化生成的I2V模型,在中文语音和口型同步方面表现自然[3][6] - 升级版本擅长复杂运镜和镜头叙事能力,画质进一步提升[7] - 视频生成精细度较高,生成视频大小达20.8M,比对比产品3M大很多[18] 功能应用场景 - 仅用1张图片和1段提示词即可生成带音效的视频,例如猫呼噜声和虫子叫声[4] - 支持宠物动态写真生成,使照片自然动起来[20][29] - 支持创意实现如让林黛玉念《葬花吟》或麦当劳叔叔推荐肯德基[34] - 提供5秒和10秒两种视频长度选择[47] 语义理解能力 - 对提示词中部分内容如"奔跑"和"黄蝴蝶"存在理解忽略现象[15][45] - 对情绪把控有待提升,出现中气十足林黛玉和被迫营业麦当劳的情况[35] - 人手生成仍是历史难题,还有进步空间[46] 音效处理特性 - 可生成效果音和对话,但不会自主生成背景音,需要手动添加BGM[44] - 音效表现突出,如键盘敲击声效果不错[43] - 提供单独的背景音选项但选择后无变化[44] 价格优势 - 限时优惠价格1.4元/5秒,低至行业70%[49] - 登录赠送每月210免费额度[50] - 正常价格2.5元/5秒,200秒视频仅需100元,比对比产品便宜一大半[52] 生成效率 - 视频生成需3分钟,相比对比产品不到1分钟的速度较慢[16][17] - 可能因画面精细度较高导致生成时间较长[18] 生态整合 - 已在百度移动生态广泛使用,结合本土中文生态更适合中国创作者[57] - 提供免费额度获取机会[52]
首个接入GPT-5的视频Agent!一句话生成商业级广告大片,分镜配音字幕等全包了
量子位· 2025-08-25 10:32
产品核心功能 - AI视频生成Agent只需一句提示词即可自动完成分镜、画面、配音、字幕等全流程制作[1][2] - 能够真实还原现实世界画面 从食物到人物动作都极致逼真[4] - 将原本需要数周的视频制作时间缩短至数天甚至数分钟[5] - 不同于传统AI视频生成单个镜头片段 而是直接交付完整创意项目[7] 技术架构特点 - 全球首个接入GPT-5的视频Agent[4][9] - 打造完全自动化的创作生态系统 使AI成为云端创作团队[9][10] - 具备持续学习能力 能记住品牌风格和历史创作[11] - 包含脚本策划、视觉合成、配音字幕三大智能模块[16] 商业应用价值 - 内容产出效率提升10倍 可快速批量生产爆款视频[12] - 支持企业广告、品牌宣传片、产品发布会视频等商业场景[13] - 从0到1构建专业级影视内容 建立可持续创作的影视王国[14] - 通过简单文字指令即可生成商用级视频 降低专业制作门槛[19][21] 用户体验优势 - 操作界面简化 所有功能通过输入栏即可完成[19] - 自动将文本指令分解为创意构思、脚本编写和分镜生成[21] - 支持实时修改调整 生成的图像自动归类到对应分镜[23][25] - 自动完成剪辑过程 并提供项目回放功能追溯创作历程[26] 市场反响 - 小范围开放邀请码后迅速在X、Reddit、YouTube等平台刷屏[6] - 主要创新在于改变了创作协作模式 从单点效率提升转向完整项目交付[7]
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
量子位· 2025-08-24 09:13
开源发布 - xAI正式开源Grok 2模型 包含42个文件 总大小约500GB [1][5][6] - 模型需通过HuggingFace下载 官方建议使用SGLang推理引擎运行 要求8个GPU且每个显存超过40GB [5][6][14] - 模型参数未明确公开 网友推测为2690亿参数的MoE架构 [9][10] 技术性能 - Grok 2在多项基准测试中表现竞争力:GPQA达56.0% MMLU达87.5% MMLU-Pro达75.5% MATH达76.1% [8][12] - 在LMSYS排行榜总体Elo分数曾超越Claude和GPT-4 [6] - 模型采用非商业开源协议 与MIT/Apache 2.0等主流协议存在差异 [11][13] 产品动态 - Grok APP更新v1.1.58版本 新增AI视频生成功能 [16][17][19] - 马斯克宣称xAI将很快超越谷歌 并认为中国公司是主要竞争对手 [20] 发展路线 - Grok 3预计将在半年后开源 [1] - 公司曾延迟原定开源时间节点 但最终完成发布 [2][3][4]