Midjourney

搜索文档
教程 | 如何做出 X 上爆火的 AI 蓝图动画
量子位· 2025-07-17 13:52
Midjourney风格代码技术 - Midjourney风格代码(Sref Code)是一种类似风格滤镜的功能,用户通过在提示词中添加`--sref`和对应数字即可套用预设视觉风格,无需繁琐描述即可保持作品风格一致性 [8][9] - 示例显示输入"一杯牛奶"后生成图片,添加风格代码`--sref 2007748773`可100%复现相同风格 [10][13] - 该技术特别适用于系列化创作(如绘本),通过固定代码实现风格统一 [15] 风格代码应用案例 - 博主@aoki_tosh使用该风格制作的MV在X平台迅速传播,几天内获得300万播放量 [5][6] - 典型应用场景包括机械恐龙蓝图设计,通过保留技术细节标注(如原理图、尺寸线)和复古对比配色(高饱和度纯色背景+对比色点缀)实现专业化视觉效果 [23][24][25] - 用户可通过替换主体对象(如恐龙品种)和配色参数快速生成新图像,例如将背景改为高饱和度蓝色/紫色/黄色纸张 [30][32] 进阶创作方向 - 复杂动画尝试:测试让机甲生物分解或变形的提示词,但需注意Midjourney动画模型对提示词的响应存在随机性 [35][37][40] - 风格多样性探索:推荐关注X/INS平台的日更创作者及资源网站midjourneysref.com,该平台支持关键词检索风格代码 [41][45] - 核心创作理念强调在工具标准化基础上追求个性化创新,提出"当千万人使用同一工具时,应探索创造独有风格" [48]
【七彩虹教育】最好用的AI是什么?语音助手?大语言模型?文生图?
搜狐财经· 2025-07-15 21:37
人工智能发展现状 - 人工智能领域近期出现小爆发期,语音识别、会议总结工具、交互式文字模型以及图像生成技术如Midjourney、StableDiffusion、HunyuanDiT、Flux等纷纷涌现 [1] 信息处理效率分析 声音 - 人类可理解的语速约为每分钟150-200字,每个字约1字节,信息量约为200 bytes/minute或1600 bits/minute [4] - 语音相关人工智能技术如语音识别和合成已接近或超过人类水平,例如阿里开源的CosyVoice和SenseVoice [11] 图像 - 假设每秒处理一幅1024x1024像素RGB图像,每幅约3.15 MB,每分钟信息量可达189 MB [6] - 图像生成和识别技术尚未达到人类水平,主要因图像信息量远高于语音和文字 [11] 文字 - 平均阅读速度每分钟250-300个英文单词,每个单词约5字节,信息量约为1250 bytes/minute或10,000 bits/minute [8][9] - 大语言模型如ChatGPT和阿里QWen2逐步接近人类水平,QWen2已成为全球开源模型领先者 [11] 信息含量与技术难度关系 - 信息含量排序为语音<文字<图像,技术难度与之正相关,语音最易处理,图像最难 [11]
猫狗土味短剧,一个月赚走50万
投中网· 2025-07-12 14:30
AI萌宠市场现状 - AI萌宠内容在短视频平台获得高热度,包括拟人化宠物短剧和图文内容,吸引大量用户互动[3][5][7] - 典型案例包括《霸道雪总爱上我》等短剧最高播放量达286.3万次,以及"松弛猫Chillcat"IP单帖点赞量5.8万[22][23] - 2024年中国城镇宠物(犬猫)数量超1.2亿只,消费市场规模突破3000亿元,为AI萌宠内容提供用户基础[54] 创作者生态与变现模式 - 创作者主要分为剧情派(如辣糖的玛丽苏短剧)和艺术派(如张栗的IP化作品),均获得高流量但变现能力差异大[21][31][32] - 变现渠道包括广告植入(单条报价四位数)、知识付费(教程价格1-299元不等)、平台激励和周边销售,但广告收入波动大且AI内容难以精准展示产品效果[34][36][38][40] - 头部案例如成都某MCN机构通过AI宠物账号实现月涨粉100万、首月广告收入50万元,但多数创作者实际收入远低于此[7][30][32] 技术应用与行业痛点 - 主流工具Midjourney月成本约430元,创作者需花费2-3小时/集(短剧)或半天/组(图文)进行内容生成与调整[47][46] - AI生成存在随机性缺陷,如宠物比例失调、缺乏眼神交流感,需反复调整提示词或后期处理[44][45] - 行业面临侵权问题,部分作品被无授权搬运至海外平台,单条搬运内容获200万点赞,但国内AI版权保护法规尚未完善[58][60][61] 市场驱动因素与未来挑战 - "AI+萌宠+短剧"组合成功原因:萌宠自带流量、AI降低制作门槛、短剧特性掩盖画质缺陷[55] - 目标用户包括养宠人群(情感投射)、AI技术爱好者及霸总/女主剧受众,形成差异化广告植入空间[55] - 挑战在于用户对AI内容新鲜度下降,需持续创新内容形式,同时解决版权保护与创意同质化问题[57][62]
马斯克疯狂点赞,Lovart凭什么是世界上第一个设计智能体?
搜狐财经· 2025-07-12 13:18
Lovart的核心定位与市场表现 - 产品在海外科技圈迅速引爆 官方视频播放近百万 推特引发5000条讨论 马斯克点赞 24小时内超2万名用户申请试用邀请码 [3] - 区别于现有AIGC工具 定位为"创意团队"而非单一工具 重构AI时代创意工作生产关系 [3][8] - 创始人陈冕提出"SaaS本质是服务由人提供 而AI成为服务主体" 商业价值在于提升甚至替代特定职业生产效率 [8] 产品创新与交互设计 - 采用"画布+对话框"交互范式 左边无限大画布(桌子) 右边对话框 支持自然语言指令修改作品 [9][10] - 交互设计复刻"甲方站在设计师旁指点"场景 将复杂工作流封装为自然沟通方式 [9][11] - 不同垂直领域AI需要不同交互界面 设计领域需共享视觉空间 纯对话交互不足 [11] 竞争策略与行业洞察 - 避开与Adobe、Midjourney等巨头正面对抗 聚焦创意个体户和Prosumer群体 [14] - 选择"价值链条最长、最痛苦、最依赖人工协作"领域 用AI Agent端到端打通 [13] - 判断Midjourney代表1.0时代已成熟 ComfyUI的2.0时代门槛过高 果断下注Agent代表的3.0时代 [15][16] 行业变革与未来展望 - 从取代单一工具到取代个体职业 最终可能取代具有协作能力的团队 重构生产关系 [19] - 让顶尖设计能力突破价格壁垒 向所有人平权开放 [19] - 创始人经历互联网行业大战后 认为AI浪潮是创业者的救赎机会 [19]
瑞承:AI抢不走的本事,才是你的铁饭碗!
金投网· 2025-07-07 16:49
人类在AI时代的核心价值 - 审美力、共情力、创造力是AI无法替代的人类独特能力,将在AI时代愈发珍贵 [1] - 这些能力本质上是回答"人为什么是人"的核心特质,守住它们才能确保人类在技术变革中的立足之地 [7] 审美力 - AI可以模仿艺术形式但无法理解作品背后的文化内涵和情感表达,如八大山人画作中的悲怆情绪和中国哲学思想 [3] - 培养审美力的方法包括:实地艺术体验(美术馆参观)、跨媒介感知训练(电影光影分析)、生活美学实践(插花配色) [3] - 系统学习美学理论(黄金分割原理)和文化传统(中国画留白理念)有助于深化审美理解 [3] 共情力 - AI能处理客观数据但无法感知人类细微情绪,如病人发抖的手或学生隐藏的委屈 [5] - 共情力培养途径:深度倾听(不打断父母倾诉)、社会观察(体验不同职业生活)、沟通技巧改进(非暴力表达) [5] - 真正的共情体现在捕捉未言明的需求并提供精准支持 [5] 创造力 - AI擅长组合现有方案但缺乏突破性联想能力,如乔布斯将书法美学融入科技产品的创新 [7] - 激发创造力的方法包括:跨领域学习(程序员读诗)、留白思考(每日发呆时间)、本质追问(马斯克的成本分析法) [7] - 人类创造力的本质在于建立非常规联系和持续追问可能性 [7] 人机协作模式 - 理想分工模式:AI负责批量生成(100张设计图/数据处理),人类负责价值判断(选择最打动人心的方案) [7] - 技术应用方向应聚焦于放大人类独特优势,而非简单替代 [7]
伦敦大学学院Echo Zhang:AIGC是一面照见创意、价值与信任的镜子
环球网资讯· 2025-07-06 14:39
AIGC技术定义与发展 - 生成式人工智能(AIGC)指能够生成文本、图像、音乐和视频的算法工具,代表产品包括ChatGPT、Midjourney和DALL·E [2] - 人工智能发展经历四波浪潮:符号推理→统计学习→深度学习→当前AIGC作为"共创伙伴"阶段 [3] - AIGC被文化学者定义为"文化软件",正在重塑数字时代的文化表达与传播方式 [3] AIGC行业应用 教育领域 - AI可动态调整学习难度并按需生成个性化学习资料,提升教育包容性与灵活性 [4] - 主要风险包括学生过度依赖导致批判性思维弱化,以及技术分布不均加剧数字鸿沟 [4] 医疗领域 - AI生成诊断报告和图像分析工具显著提升医疗效率,例如Google DeepMind的MedGemma模型可处理多模态医疗数据 [4] - 商汤科技推出"大医"模型,具备生成医疗报告、解释诊断结果和模拟智能问诊功能 [4] AIGC社会影响 - 在媒体行业导致信息污染与虚假内容泛滥,创意产业面临AI作品版权归属争议 [5] - 对文字、设计、客服等岗位产生潜在替代效应,引发职场结构性变化 [5] - 核心挑战在于AIGC可能引发社会信任危机,需要建立技术应用的伦理框架 [5] AIGC发展理念 - 技术本质是数据重组而非创造,最大价值体现在人类与AI的协同创作场景 [3] - 需通过跨领域合作(技术+艺术)释放创意潜力,实现"更加人性化"的技术发展方向 [3][5]
AI改变了一切,除了猫咪
虎嗅APP· 2025-06-30 18:22
AI猫咪视频的流行现象 - AI猫咪视频分为两种类型:拟人化剧情类和技术展示类,前者如"大橘剧场"讲述连续故事,后者如奥运会跳水猫展示AI技术突破[6] - 数据表现亮眼:YouTube频道Batysyr通过20个AI猫咪视频月增77万粉丝获1亿播放量,Cat channel 91转型后月增200万订阅者且单视频播放量从数万跃至千万级[8] - 国内平台同步爆发:抖音、小红书等平台出现大量AI猫咪账号,单个视频点赞量普遍达数千至上万[8] 商业化变现模式 - 平台分成收益显著:创作者安胜运营的百万粉账号矩阵月收入达2万元人民币,单条千万播放TikTok视频可分账1200-2000元[12] - 广告植入成为主流:如"LT小狗日记"在短剧中植入宠物用品和食品广告,部分头部创作者开始收费提供制作流程教学[12][13] - 出现投机行为:包括批量生产低质内容骗取流量,以及借热度发行猫主题Meme币等加密货币[13] 技术驱动因素 - 工具门槛大幅降低:Midjourney、Stable Diffusion等绘图工具配合Pika等视频平台,使完整制作流程成本可控制在数十元,新手1小时可掌握[19] - 物理模拟能力突破:AI开始准确模拟水花飞溅、身体翻转等物理现象,技术公司如快手通过可灵平台主动打造"打工人猫"等模板示范[19] - 企业借势营销:MiniMax等公司因"猫咪跳水"视频获得TechRadar等媒体关注,被建议作为行业技术标杆[20] 文化心理基础 - 猫科动物具备先天优势:幼态持续特征触发人类保护欲,表情神秘性成为情感投射载体,有效规避AI人脸生成的恐怖谷效应[23] - 数据积累深厚:互联网数十年的猫内容沉淀为AI训练提供丰富素材库[23] - 情感共鸣机制:无论是逆袭剧情还是生活挫折,观众通过AI猫共情自身经历,形成情感宣泄出口[24] 行业意义 - 技术普及路径示范:显示尖端技术需通过贴近大众情感的方式实现规模化应用[24] - 用户习惯培养:以无害形式帮助用户适应AIGC内容,为更广泛的AI生成场景铺路[24] - 内容创作范式转变:验证"荒谬感+真实感"的内容公式在算法推荐时代的传播效力[16][19]
AI改变了一切,除了猫咪
虎嗅· 2025-06-30 11:25
AI猫咪内容行业现状 - AI猫咪视频在抖音、小红书和TikTok等平台广泛传播,主要分为拟人化剧情类和技术展示类两种形式[7][8] - 拟人化剧情类以"大橘剧场"为代表,通过连续剧情的"宠物短剧"吸引观众,例如"Chubby"胖橘猫系列获得全球网友关注[7] - 技术展示类以挑战物理定律为特点,如三花猫完成专业跳水动作的视频在Instagram获得近2亿播放量[8] 行业数据表现 - YouTube频道Batysyr通过20个AI猫咪视频实现单月77万粉丝增长和1亿播放量[11] - Cat channel 91转型AI猫咪内容后月新增200万订阅者,视频播放量从几万跃升至千万级[11] - AiCat7频道30天内粉丝增长达127万,国内平台同类账号内容点赞量普遍达到数千至上万[11] 商业模式与变现 - 创作者通过平台分成获得收益,单条千万播放量TikTok视频可分得1200-2000元人民币[14] - "AI宠物短剧"植入广告成为变现方式之一,如"LT小狗日记"为宠物用品和食品品牌推广[15] - 部分头部创作者通过收费教程变现,例如@orange.cat899博主对制作流程咨询进行收费[15] 技术驱动因素 - Midjourney、Stable Diffusion等AI绘图工具和可灵、Pika等视频平台大幅降低创作门槛[23] - 典型制作流程包括ChatGPT生成剧本、AI绘图工具创作主角、一键生成视频并后期加工,新手一小时可掌握[23] - AI技术突破实现物理规律模拟,如水花飞溅效果和空中翻转动作,增强内容真实感[23] 平台与公司布局 - 快手通过可灵平台主动打造猫咪内容生态,发布"打工人猫"等模板视频引导用户创作[23] - MiniMax等AI公司借助"猫咪跳水"等爆款内容实现病毒式营销,获得科技媒体关注[24] - 行业存在利用AI猫咪热度发行加密货币现象,如"Book of Meow"猫主题Meme币营销案例[17] 用户心理与文化基础 - 猫类内容成功利用"幼态持续"心理学效应触发用户情感共鸣[26] - 猫脸生成有效规避"恐怖谷效应",相比人脸更易被观众接受[26] - 互联网积累数十年的猫类内容数据库为AI训练提供充足素材[26]
收到迪斯尼110页诉讼起诉,却让用户疯狂,Midjourney到底做了什么?
创业邦· 2025-06-27 11:10
核心观点 - AI图像生成平台Midjourney通过颠覆性产品设计和社群共创模式,重塑数字创意产业范式 [5][7][17] - 公司以不到50人团队实现年营收2亿美元,人均产出超500万美元,展现极高运营效率 [10] - 创始人David Holz提出"想象力平权"理念,将AI定位为人类思维的延伸而非替代工具 [31][34][47] 产品与技术 - 基于Diffusion模型的AI图像生成平台,用户通过文字提示(Prompt)即可输出高质量图像 [7] - 完全依托Discord社群运营,1600万用户形成独特的Prompt经济与共创文化 [8][17] - 强调"风格化"与"美学控制",提供/weird等指令探索非主流创意 [42] 商业模式 - 采用订阅制按需付费模式,避开传统软件许可证销售路径 [23] - 从边缘用户(游戏社区/数字艺术爱好者)切入,逐步渗透广告/电商等主流市场 [24][26] - 拒绝开放商业API,坚持服务个体创作者而非企业流水线 [39][40] 竞争策略 - 与传统设计工具形成错位竞争:无UI界面/无图层工具/无图形编辑功能 [13][15] - 构建"创意平台"新价值网:将创作重心从技术操作转向意念表达 [16][20] - 通过Discord实现"反馈-迭代-传播"闭环,形成集体创作智慧 [18] 行业影响 - 催生AI美术指导、Prompt设计师等新兴职业 [10] - 挑战好莱坞内容霸主的"审美主权",引发迪士尼/环球影业版权诉讼 [3][35] - 推动AI视觉设计从辅助工具向"创作前置平台"转型 [26] 组织文化 - "社区即公司"运营理念,用户反馈直接驱动产品演化 [44] - 团队深度参与Discord社群,形成去中心化管理结构 [44] - 坚持"慢商业"战略,明确拒绝为IPO牺牲产品理念 [40][41]
收到迪斯尼110页诉讼起诉,却让用户疯狂,Midjourney到底做了什么?
36氪· 2025-06-26 10:02
公司概况 - Midjourney是一个基于Diffusion模型的AI图像生成平台,用户通过输入文字描述(Prompt)即可生成高质量图像,强调风格化、美学控制和用户体验 [4] - 公司成立于2022年,团队规模不足50人,未进行外部融资,但已实现年营收2亿美元,人均产出超500万美元 [6] - 产品完全依托Discord社群运营,注册用户超1600万,形成独特的共创文化 [4][6] 产品创新 - 颠覆传统设计工具交互模式,采用"文本提示→图像生成"的对话式交互,消除复杂界面和操作流程 [7][10] - 首创"社群即产品"模式,用户通过Discord公共频道实时分享作品和Prompt,形成集体创意工作坊 [11][13] - 技术底层聚焦"感知放大"而非功能叠加,实现从技术操作到意念表达的范式转换 [9][23] 商业模式 - 采用订阅制按需付费模式,核心用户为非专业创作者和小型内容团队,年营收达2亿美元 [6][15] - 催生Prompt经济新生态,衍生AI美术指导、Prompt设计师等新兴职业 [6] - 拒绝传统商业化路径,不开放API接口,坚持"慢商业、重内核"战略 [28][29] 竞争策略 - 错位切入非专业创作者市场,避开与Adobe等巨头的功能竞争,构建平行价值网 [14][15] - 通过Discord社区自下而上扩张,从游戏社区、数字艺术爱好者等边缘群体切入主流市场 [16][18] - 重新定义创作关系链,将"人-工具-作品"转变为"想象驱动+AI生成+社交共创"的新范式 [16][19] 创始人理念 - 核心理念为"AI是人类想象的引擎",主张技术应扩展而非替代人类创造力 [20][22] - 推行创作平权主义,通过极简交互降低专业门槛,打破传统创意工具的精英垄断 [24] - 在产品中注入独特AI美学,鼓励秩序中的混沌美,追求诗意共鸣而非流水线风格 [30] 行业影响 - 挑战传统内容巨头的审美主权,推动视觉创作从机构垄断向个体赋权转变 [1][25] - 开创生成式AI的社区驱动模式,证明小团队可通过范式创新实现行业颠覆 [35][36] - 展示AI与人文理想的结合可能,为技术发展提供"唤醒可能"的新方向 [37]