人工智能图像生成

搜索文档
Midjourney入局视频生成,图像模型V7不断更新,视觉卷王实锤了
量子位· 2025-06-16 18:30
Midjourney视频生成模型 - 视频生成效果展示包括跑步动作、人物和空间转换非常丝滑[2] - 挖蛋糕场景逼真,勺子上有倒影等细节[3] - 多人物动作和视角切换流畅[14] - 小猫动作和人手动作具有物理真实感[16] - 小狗滑滑板场景展示[18] - 小猫美甲精细,手部纹路和指纹细节突出[21] - 叠毯子场景中手部发力和褶皱表现真实,但毯子自动缩回存在不合理性[24] - 爬楼梯场景中花朵从右手飘到左手存在逻辑问题[27] - 视频生成模型在物理真实感、纹路细节、动作平滑度上表现优秀[26] - 缺乏音频功能,与Veo 3相比无法生成乐器声音[28][29][30] Midjourney图像模型V7更新 - 图像模型V7不断更新,支持语音生图功能[37] - 从3月开始呼吁用户参与图像评分以完善V7[38] - 4月发布V7 alpha版本,包含Relax和Turbo模式[39][40] - 手部纹理生成逼真[41] - 旗舰功能"草稿模式"可将提示栏改为对话模式,支持语音输入生成图像[44][45][47] - 草稿模式生成成本减半,渲染速度提升10倍[49] - 快速模式优化耗时从40秒降至18秒[50] - 图像生成速度整体提升40%,快速模式渲染时间从36秒减至22秒,Turbo模式从13秒减至9秒[51][52][53] 公司动态与市场反应 - 视频生成演示引发Reddit热议,点赞量达2.5k[5][6] - 用户评价视频效果"与现实无法区分"[9] - 公司会议展示视频生成功能,强调"动画化图片"作为差异化优势[33] - 动画风格是Midjourney的强项[34] - 定价策略考虑用户需求,展现诚意[35][36]
设计速度提升100倍,质量翻10倍:豆包超能创意1.0体验
歸藏的AI工具箱· 2025-04-29 16:18
豆包超能创意1.0升级核心功能 - 图片生成效率和修改效率大幅提升 显著降低设计门槛 [1] - 新增批量生成能力 支持不同内容、比例和风格的批量生成 速度比4o模型快很多 [2][5] - 智能增强功能使模型能自动联想和获取知识 无需详细提示词 [12] - 具备上下文理解能力 可基于前序生成结果进行连续修改 [19] - 支持从小说内容直接转换分镜图片 保持人物形象一致性 [19][23] 批量生成能力 - 可针对同一设计生成不同比例的社交媒体图片 [5] - 基于同一内容生成不同风格图片 或同风格不同内容图片 [5] - 一次性生成10个不同品牌的胶囊图片 自动识别品牌主营业务 [1][2] - 一次性生成10种不同风格的字体设计海报 [8] - 基于线稿批量生成12张同风格空状态插图 [10] 智能增强功能 - 模型自动补充常识性内容 如根据3个样机案例生成其他样机 [12] - 根据示例自动发散生成其他案例 如基于星巴克门店生成4个国内茶饮品牌门店 [17] - 模仿图像风格生成8个世界著名景点插画 自动替换地标和景色 [14] 上下文理解能力 - 保持角色形象一致性 如星尘猫IP可变换为不同风格 [20][23] - 自动规划分镜脚本 如30秒洗发水广告的12个连贯分镜 [25] - 支持风格转换 如将写实分镜变为日式赛璐璐风格 [25] 应用场景拓展 - 营销图片生成 如品牌胶囊图片 [1] - 字体设计 如10种风格字体海报 [8] - UI设计 如空状态插图 [10] - 广告创意 如洗发水分镜脚本 [25] - IP形象设计 如星尘猫系列 [20][23]