Workflow
Oiioii
icon
搜索文档
Sora的对手来了?我们实测了字节新品”随变” | 模力工场
AI前线· 2026-01-23 17:18
字节跳动推出AI视频生成应用“随变” - 字节跳动于2026年初上线AI视频生成应用“随变”,旨在AI视频生成领域打造类似“抖音”的产品,与OpenAI的Sora形成竞争[4][5] 产品定位与核心功能 - “随变”应用界面设计与抖音相似,但功能简化,主要保留“创作”和“合拍”两个核心入口[7] - 用户使用前需创建专属的AI数字形象作为其在应用内的数字分身[7] - 创作功能支持生成图片、动图和视频,内置多种流行风格模板,如蓝调摄影滤镜、渐变色光影、粘土风、治愈日漫风等,功能上与“剪映”存在重叠[11] - “合拍”功能允许用户的AI形象与经典角色(如企鹅、蒙娜丽莎)互动,组成CP,并提供了预设的提示词模板[13] - 当前生成视频的方式较为固定,仅支持“已有模板图+预设提示词”的图生视频模式,不支持完全自由的文本生成或混合多种元素[14] 横向测评:能力维度对比 - 测评将“随变”与Sora、Oiioii在动作流畅性与合理性、指令执行完整度、微表情与情绪刻画、场景与世界观构建、细节逻辑与准确性、生成时间等维度进行对比[21][22] - 动作流畅性与合理性:“随变”表现较弱(★ ★ ☆ ☆ ☆),场景切换生硬,缺乏动作过渡;Sora表现最强(★★★★★),物理逻辑自然;Oiioii基础流畅但细节逻辑易出错(★ ★ ★ ☆ ☆)[22] - 指令执行完整度:“随变”仅能执行部分指令,常简化处理(★ ★ ☆ ☆ ☆);Sora能较好理解并执行复杂指令(★★★★☆);Oiioii能执行大部分指令但细节有偏差(★ ★ ★ ☆ ☆)[22] - 微表情与情绪刻画:“随变”是核心优势,表现非常到位,有“人味”(★★★★★);Sora和Oiioii相对机械,精细度一般(★★★☆☆)[22] - 场景与世界观构建:“随变”场景切换较生硬(★ ★ ☆ ☆ ☆);Sora真实感强,物理合理(★★★★☆);Oiioii是核心优势,场景宏大,镜头语言丰富(★★★★★)[22] - 细节逻辑与准确性:“随变”在简化中能保持基础合理(★ ★ ★ ☆ ☆);Sora和Oiioii均表现较高,一致性较好(★★★★☆)[22] - 生成时间:“随变”生成速度极快,约10-15秒(★★★★★);Sora稳定偏慢,约2-3分钟(★★★☆☆);Oiioii提供两档模式,快速生成极快(约1分钟内),故事短片模式则很慢[22] 各产品综合评估 - “随变”被定位为“情感渲染大师”,优势在于人物微表情与情绪递进表现惊艳,10秒级生成速度重新定义用户预期,契合短视频消费节奏,且零门槛无缝上手,完全继承抖音交互逻辑[23][25] - “随变”的劣势在于多指令执行完整度不够,牺牲了复杂动作合理性与场景连贯性,难以支撑复杂叙事和长片创作,工具属性大于创作平台属性[23] - Sora被定位为专业创作的“预可视化引擎”,优势在于动作流畅性、物体运动轨迹和物理合理性上具有断层式领先,能较好理解并执行包含多步骤、场景转换的长文本指令,输出视频的稳定性、一致性和电影感画质处于行业第一梯队[25] - Sora的劣势在于情感表达略“机械感”,微表情不够细腻,生成耗时较长,无法满足即时分享的冲动,且存在使用门槛[25] - Oiioii被定位为创意快速落地的“快剪导演”,优势在于生成宏大场景、氛围渲染和镜头语言上颇具想象力,能快速搭建出“故事感”画面,独创“快速生成”与“故事短片”双模式,结合分镜编辑与自动音频生成,适合快速脑暴、概念可视化[24][26] - Oiioii的劣势在于细节逻辑有误,在物体互动、手部细节、空间关系上频繁出现明显错误,且生成质量不稳定,复杂视频生成速度慢,质量波动较大[26][28] 总结与适用场景 - “随变”在生成速度与情绪表达上表现突出,适用于需要快速产出情感化短视频的场景[29] - Sora在复杂指令执行与物理模拟方面保持优势,适合对逻辑性与完成度要求较高的创作[29] - Oiioii通过分镜编辑等功能降低了完整短片制作门槛,为创意可视化提供了可行路径[29] - 对于抖音的资深用户,若希望体验AI视频生成的即时效果与社交玩法,“随变”是一个不错的选择[29]
对话张楚:AI现在还是水浅王八多,但我想用它做部动画片
虎嗅APP· 2026-01-20 21:20
对AI音乐创作工具的评价 - 音乐人张楚认为当前AI音乐创作工具(如Suno、Udio)的产出是“二流货”,美学上存在缺陷,其交付的作品如同“一坨纸花”,缺乏真实样本的深度与美感[13][14][17] - 他指出AI在音乐创作上表现“扁平”和“僵硬”,未能展现出在严密和声与调式逻辑规则内应有的、超越人类的创造性应用能力[13][15][16] - 他认为问题根源可能在于开发者的美学水平或数据质量,推测“大公司”可能未开放顶级数据,导致AI只能在浅层维度重复,无法进行高维度的交互[13][17] 对AI时代创作“民主化”的批判 - 张楚将当前AI驱动的便捷化创作体验比喻为“LSD准世界”,认为其简化甚至省略了创作中关键的思考与调试过程,直达结果的方式令人担忧[27][28] - 他批评这种趋势导致创作失去具体性和独特性,并以“北京101中学的春天”和“青岛四中的春天”为例,指出AI目前无法表达不同具体场域下的独特美感[23][24] - 他强调人的“神性”在于主动为世界“加线索”,即便增加的是“0”,这种对抗被简化流程所困的主动性是人的核心定义[30][31] 个人创作理念与身份转变 - 张楚目前自我定位为“工科生”,强调理性与结构,其近期花费约三个月时间用Logic Pro对90年代的两张经典唱片进行重新编曲,旨在引入更理性化的物理空间感[4][9][11][12] - 他摒弃了早期“摇滚歌手”身份所关联的抽象概念与标签(如“地下”),认为沉迷于虚构的优越感“不构成进化”,主张应关注具体、有生命力的事物[43][47][48][50] - 他认为年轻人应“勇敢地做有体系的事情”,将勇敢的原初生命力与理性的体系构建相结合[45][46] 对科技行业与产品的看法 - 张楚欣赏乔布斯时代的苹果公司,认为其早期产品(如作曲软件)集合并推动了“有生命力”的向前探索,他是乔布斯的“死粉”[56][57] - 他对马斯克的看法由欣赏转为不喜欢,认为其行为(如星链卫星接近中国空间站)更多是利益驱动,而非纯粹的科技至上[56] - 他购买了中国品牌蔚来EC6电动汽车,并表达了对中国“有理想的科技人”及“科技梦”的支持,希望他们能被理想指引而不被带歪[59][60][61][63] 未来的创作计划 - 张楚计划在2026年制作一部构思约十年的动画片,旨在探讨“存在性的孤独”,区别于东方文艺作品中常见的源于社会结构脱离的孤独,他更想表达个体面对宇宙的、平静而庄严的孤独状态[64][65][66] - 他欣赏欧洲动画(法、英、西)因启蒙理性传统而形成的叙事结构,以及日本动画让艺术进入社会服务的理性能力[65] - 他对使用AI动画和视频生成工具(如Oiioii、Medeo)持开放态度,在试用后反馈“用了,特别好”,表明其愿意尝试新技术辅助实现创作愿景[68][69][71]
模型加速更迭的 11 月,锦秋发生了这些事|Jinqiu Update
锦秋集· 2025-12-02 14:20
融资动态 - 星尘智能完成数亿元A++轮融资 由国科投资和蚂蚁集团联合领投 锦秋基金连续多轮支持[1] - 灵启万物4个月获3轮近亿元融资 最近一轮由锦秋基金领投 采取小脑+大脑架构[2] - 微纳核芯完成超亿元B轮战略融资 由蓝驰创投领投 专注存算一体AI芯片技术[3] - VideoTutor完成种子轮1100万美元融资 由YZi Labs领投 主打生成个人专属教学视频[4] - NemoVideo完成近千万美元Pre-A轮和天使轮融资 Pre-A轮为IDG资本独投 聚焦视频创作者工具[5] - 深度原理完成超亿元人民币A轮融资 用于材料发现智能体研发[6][7] 技术产品进展 - 宇树科技发布全身遥操作平台 实现人形机器人精准复现人类动作[8] - 地瓜机器人发布具身智能机器人大算力开发平台S600 推出一站式开发平台[9] - 灵启万物发布demo视频 机器人以接近真人流畅度执行家务 重点突破小脑部分[10] - OiiOii上线全球首个动画创作Agent 内置7个专业Agent实现一站式服务[12] 行业研究活动 - Leonis Capital发布AI 100报告 基于全球10000余家AI初创企业数据 显示资本倾向算力与数据[14] - 锦秋基金举办CEO大会 分享2025 AI创投趋势 聚集多位行业专家[17] - 锦秋基金创始合伙人杨洁获投资界F40中国青年投资人荣誉[19] - 锦秋基金获投中网2025行业关注度提升最快投资机构称号[21]