Workflow
AI创作
icon
搜索文档
一个创作者如何证明他不是AI?
36氪· 2026-01-16 11:58
文章核心观点 - AI的普及导致内容创作领域出现“作者有罪推定”现象,人类创作者需要不断自证清白,而“创作本真性”的传统观念及其三个前提(孤独天才神话、人性不可穿透、价值源于稀缺)正在崩塌[1][4][6][7][8][9] - 追求“作品是否由人创作”这一标准本身已经过时,真正的价值应转向作品是否回应了真实的人类生存困境,以及创作行为所嵌入的关系网络[10][11][13][14] - AI工具在提升效率的同时,也导致依赖创作谋生的普通创作者被迫支付“人性税”(包括时间、尊严和署名税),使得“人类手工创作”可能像“有机食品”一样成为溢价特权[16][18][19][20] - 人与AI共存的出路在于重新定义“创作者”为“混合主体”,其核心特征是创作权基于问题定义、人性被承认为创作成本、以及建立“创作血缘”溯源系统,但这面临现实困境,因为创作群体分裂且缺乏新的哲学语言来描述混合主体[21][22][23][25] 当一个人被指控"这看起来像 AI 写的",究竟发生了什么? - 创作默认来自人的前提被取消,进入“作者有罪推定”时代,创作者需要不断证明自己是人且拥有署名权[1] - 指控源于大脑难以区分AI与人类的“完美”,在信息过载环境下,读者采用“宁可错杀”的简单策略以规避受骗风险,这本质是内容信任机制崩溃后的社会自保[2] - 指控最讽刺之处在于,它通常来自最无能力辨别真伪的人,并成为一种权力倒置的手段,让无法创造完美的人通过质疑来获得道德优越感[2] - 这类指控是对创作者时间、主体性和存在感的否定,将其长期训练成果压缩为“几秒生成”,并将其声音降格为信息噪音[4] - 指控具有无法证伪的暴力特性,任何自证行为(如展示创作过程)在怀疑论者眼中都可能被视为更深层的伪装,形成指控零成本而辩护需无穷精力的权力陷阱[4] 真正泛滥的AI垃圾与指控的双标机制 - 互联网上充斥大量低质、瞎编乱造的AI生成内容(如“震惊体”标题、语法不通的SEO文章),但这些“赛博泔水”很少遭到“是否为AI创作”的指控[5] - 指控机制存在阴险的双重标准:被质疑的永远是“好到可疑”的作品,而非“烂到确定”的垃圾[5] - 在AI内容泛滥的背景下,公众形成一种模糊直觉,认为AI内容要么是低质噪音,要么是过于平滑的模板输出,这迫使人类创作被挤压到既不能太乱也不能太顺的狭窄位置[5] 追求“是不是人写的”还有意义吗?——关于创作本真性的探讨 - AI技术正在飞速迭代,通过模仿人类的口吃、笔误、情绪波动等方式进行“AI去AI化”,最终可能完美模拟一切曾被视作“人性痕迹”的不完美[6] - “创作本真性”概念建立在三个正在崩塌的前提之上:1)创作是孤独天才的神话,而AI暴露了绝大多数创作本质是模式识别、混合与优化[7];2)人性是不可穿透的黑箱,但神经科学与AI表明“灵感”可能只是大脑在噪声中寻找模式的结果[8];3)价值来源于稀缺性,当AI使高质量创作变得充足,基于稀缺性的定价逻辑面临挑战[9] - 问题的意义发生转移:重点不应再是“谁写了它”,而应是“它是否参与并回应了一个真实的问题”[10] - 真正不可数据化的并非创作行为本身,而是创作行为所嵌入的关系网络,以及作品与特定生命碰撞产生的“关系中的真实”[10][11] - 人类执着于在作品内部寻找人性证明是一场必输的战争,真正的出路是将战场转移到作品之外的创作生态、关系网络和生存实践中[13] - 对个体创作者,短期内追求“人写”仍有意义(因市场仍依此定价),但对文明而言,此概念必须被废弃,未来的创作者身份应被定义为带着个人经历、思考能力及读者关系去生成回应的“问题意识”[13] - 人性最终体现在“不得不创作”的绝望与对有限性的恐惧中,而非创作成果里[14] 内容上的人性,会变成一种特权吗?——关于“人性税”的分析 - 技术革命的“初心”是解放生产力,但历史表明,生产力红利往往首先被用于提高生产标准而非减少劳动,AI让“更快、更多、更像样”成为可能,随即被组织和市场吸收为新的KPI,填满了创作者的产能缺口[16] - 对依赖创作谋生的普通创作者(如网文作者、商业画师),AI更像是一种被迫接受的生产制度升级,他们需要支付三种“人性税”:1)时间税:不使用AI会导致产能不足和竞争力下降[18];2)尊严税:使用AI可能被贬为“提示词工人”,职业尊严被稀释[18];3)署名税:创作成果归因模糊,署名权变得脆弱[18] - 能负担“低效创作”(即保持人性化工作方式)的人,因拥有时间、资源或声誉护城河,越来越像享有特权,而“人类手工”在创作领域可能走向类似“有机食品”的溢价模式[18][19] - “人性税”的本质是效率至上的评价体系导致竞争更密集、标准更高、议价权更集中,迫使普通创作者用更少时间交付更像样的结果,从而必须额外付出才能保留原本默认属于人的工作方式与尊严[20] 人与AI在创作领域应该如何共存?——关于“混合主体”的构想与现实困境 - 需要重新发明“创作者”概念为“混合主体”,其特征包括:1)创作权基于“谁定义了问题”,而非“谁动了笔”,将创造力的核心从执行提升至认知与提问[21][22];2)承认“人性”(如不完美、情绪)是创作的一种“冗余成本”,应为其不可控性定价,而非将其作为价值来源或自证工具[23];3)建立“创作血缘”溯源系统,以贡献图谱取代单一署名,记录创意、执行、情感等多重贡献[23] - 实现这一构想需要法律承认多重主体创作、平台支持贡献度追踪、教育转向培养提问能力,并形成一种新的文化契约,将焦点从“这是谁写的”转向“这解决了什么问题”[23] - 现实实现前景悲观,因为创作群体本身分裂:顶尖创作者可依靠肉身创作生存,底层创作者已接受作为AI插件,而承受身份焦虑的中间层最为脆弱和分裂,既抵抗又利用AI,无法形成统一战线[25] - 根本困境在于缺乏哲学突破和新的概念工具来描述“既非纯粹人性,也非纯粹机器”的创作主体,导致讨论被困在“我不是AI”的否定句中,无法形成肯定的身份表述[25] - 对当前创作者的实践建议是:不要试图证明自己不是AI[25]
火爆全网的《卢浮宫小猫》AI视频万字创作心得分享,这可能是他们最毫无保留的一次。
数字生命卡兹克· 2026-01-16 09:25
文章核心观点 - 文章详细记录了数字艺术家海辛与阿文为浦东美术馆卢浮宫大展创作AI宣传片《卢浮宫小猫》的全流程,分享了从创意、选角、定调、音乐、分镜、美术到动画的完整方法论与实战经验,旨在展示AI工具在专业影视创作中的高效应用与艺术潜力 [8][9][24] - 创作者强调,尽管当前AI模型能力强大且便捷,但专业创作者更应借此追求更高的艺术标准,通过深入的手工构思与分次迭代来控制作品质量,而非依赖AI代理一键生成,模型越方便越要逼自己做得更好 [165][166] 选角与故事设定 - 项目最初主角设定为与浦东美术馆黑白主题色匹配的奶牛猫,故事围绕一幅油画展开,但因宣传周期长需两支短片,追车情节会导致调性偏离“美术馆官方宣传片”气质而被整体弃用 [27][28][30] - 最终确定主角为一白一橘两只猫,白猫代表法国,橘猫延续其作为“上海代言”的属性,此设定既保证了主角视觉明亮以吸引观众眼球,也呼应了之前的作品系列 [32] - 影片分为上下两支,上半支讲述法国小白猫来上海的故事,下半支讲述浦东代言橘猫去看展的故事,两支短片均围绕实际展品(孔雀纹样盘与“赛诗会诗版”)进行叙事设计 [19][20][22] 影片定调与音乐设计 - 创作早期即确定影片“调性”,包含核心画面影调与音乐两部分,音乐能直接引导观众感受并反向决定剪辑节奏 [36] - 受浦东美术馆“镜厅”启发,确立了“镜像”核心概念,用以结构卢浮宫与浦东美术馆、上海与巴黎、两只小猫之间的关系,早期探索了分屏动画形式 [39][41] - 主乐器选择钢琴,原因一是其干净的和弦与“水波纹”倒影质感联想契合,二是镜厅的格子结构让人联想到钢琴键盘的秩序感 [46] - 叙事类短片配乐需要“弧线”以匹配故事的起承转合,结构包括开篇引入、展开叙述、转折、高潮旋律和专门补写的收尾(outro) [47][49] - 使用Suno生成和编辑音乐,因其可对片段进行细致控制,如规定旋律长度和特定时间点的情绪,并通过调整“音频影响度”(Audio influence)在保留基础旋律上进行变奏,例如为上海篇加入萨克斯以营造老上海爵士感 [50][52] 分镜构思与叙事节奏 - 开篇分镜要求“信息量高”,力求在前三个镜头内讲清故事,例如第一个镜头暗示故事核心(如猫与海报),第二个特写介绍主角,第三个全景交代环境与镜像关系 [57][59][60] - 分镜节奏感来自景别的变化,避免全景接全景的单一感,通过全景与特写的切换形成收放感,并用简单动画引导观众视线 [62] - 在展示白猫喜爱孔雀纹样盘的奇幻段落中,通过镜头运动与构图设计引导注意力:用卢浮宫经典雕塑(如胜利女神像)作背景点缀,采用极端仰拍使前景白猫占据更大体积,强迫观众关注猫的同时识别地点 [67] - 为保持观众注意力始终跟随主角,会刻意拿掉容易“抢戏”的元素,如画框中的人像 [70] - 高潮后的“回转现实”处理简洁,通过切回猫的特写再切至客观镜头,让观众明白奇幻段落源自猫的幻想 [71] - 对于信息量大的段落(如展品运输),采用蒙太奇和分屏处理,并避免出现人脸以防止观众注意力被转移 [76] - 转场设计注重“意向连续”,例如前后镜头都出现飞机意向,即使风格从写实跳至马赛克艺术也不会让观众感到突兀 [83] 美术风格与AI工具应用 - 美术原则是“第一眼要好看(电影感),第二眼要耐看(丰富的细节)” [97] - 为契合卢浮宫伊斯兰艺术展主题,深入研究了该艺术风格,并总结出“伊兹尼克风格”(Iznik style)和“马赛克艺术”(Mosaic art)等高效关键词 [96] - 选对AI模型被类比为“选对乙方”,目前生图主力是Nano Banana Pro,也用于大部分修改,部分配合Photoshop手动细调 [100] - 展示了AI高效修改的能力,例如项目中途将主角从黑猫全部改为白猫,使用早期工具耗时一天半完成所有镜头修改,而使用Banana Pro后可通过一句话指令批量完成,效率更高 [102][105][107] - 提示词撰写趋向简化,依赖模型的多模态理解能力,例如直接上传图片让AI提取元素并转换风格,而非撰写长篇提示 [111] - 对于复杂创意(如“猫在水边跑,倒影是孔雀”),必须分步迭代:先构建透视草图,生成基础场景;再逐步添加细节(如铺地砖、加入展品);最后处理动画,而非一次性交给AI生成 [120][122][123][124][127][129] - 提升AI合成成功率的技巧包括:先裁剪素材再生成以使模型更聚焦;对于需要多次复用的主体(如猫、蝴蝶),先将其提取到纯色背景再更换背景,避免模型“吃掉”主体或改变其外观 [132][137] - Photoshop的“协调”功能在合成时用于自动匹配环境光影,提升效率,但整体使用频率在降低 [141][143] - 对于需要高度确定性的地标或展品镜头,常采用将AI生成的猫合成到真实场景照片上的方法 [131] 动画制作与视频工具 - 主力视频工具是Google的Flow,常用模型是Veo 3.1,因其画面更具电影感,辅助使用可灵、海螺、即梦、万相、Ruma等 [147] - Flow的涂鸦功能可有效指导角色动作,例如在首帧上画运动路径并附加提示词,能让猫按指定方向走出画外 [149][152] - 认为当前已进入可以“P视频”的时代,Flow的隐藏编辑功能允许在生成视频中添加、删除元素,甚至改变摄像机运镜 [150] - Luma的Ray3在测试中表现出强大的视频合成与质量提升能力,但生成速度较慢 [153] - 万相(Wan)2.6的“新建角色”功能对动物角色生成效果出色,能基于一段模糊视频创建高清、被“主人认可”的角色,并用于新场景表演 [154] - 制作落版(结尾)微动效时,有时会选用动态幅度较小的上一代模型,以避免新模型过度发挥导致动效夸张 [157] 创作流程与废稿反思 - 创作流程遵循“先定画面与音乐调性,再推进分镜”的顺序 [34][36] - 对于关键镜头,采用“先确定尾帧(高潮画面),再反推设计首帧和镜头运动”的方法,以收敛想象,使镜头可控 [70] - 在情节未完全确定时,会用Sora等工具跑样例以快速测试节奏和构图,但最终是否采用取决于其是否符合既定影调与叙事逻辑 [80] - 废稿量巨大,尤其在效率工具升级后探索更多,例如曾尝试制作上海特色的“蝴蝶酥”镜头、卢浮宫内的夸张动效以及利用光影构成蝴蝶的创意镜头,均因动态实现困难或风格不符“低调奇幻”的基调而放弃 [160][162][164][167]
兆驰股份旗下风行在线与阿里云达成深度合作
证券时报网· 2026-01-14 14:04
公司与阿里云达成深度合作 - 兆驰股份旗下数字文娱核心板块风行在线与阿里云正式达成深度合作 [1] - 合作达成时间为1月12日 [1] 合作核心内容 - 双方将围绕AI创作一站式平台的技术研发展开深度协同 [1] - 双方将围绕智能创作引擎升级展开深度协同 [1] - 双方将围绕数字内容生态建设展开深度协同 [1]
技术突破让XR从“实验室概念”变成新质生产力 “老”牌电影基地焕发“新”生
央视网· 2026-01-13 12:16
文章核心观点 - 虚拟现实(XR)技术正在深刻变革中国电影产业,从制作到放映的全产业链条日趋成熟,并推动行业从实验性项目向标准化、产业化体系迈进 [1][13] 技术应用与用户体验 - XR影院提供“沉浸式观影”体验,观众可“走进”电影并与银幕互动,打破了传统影院在时间和空间上的限制 [1][2] - 观影设备轻便化,头显重量仅180克,支持双目8K超宽视野,长时间佩戴不易眩晕,提升了用户体验 [4] - XR技术硬件持续迭代,从几年前相对笨重的初代设备,发展为如今轻便、高清、低延迟的产品,使其从实验室概念转变为实用的生产力工具 [9] 制作流程革新与成本控制 - XR虚拟影棚彻底改变了传统影视制作模式,无需搭建实景,可通过数字资产环境瞬间切换场景(如从盛唐宫殿切换到未来都市),大幅降低了成本并缩短了制作周期 [5] - 在同一影棚内即可完成跨时空表演,提高了制作效率 [5] - XR技术被应用于预演、拍摄、后期合成等影视制作全流程 [8] 产业链与生态构建 - 西安正在打造完整的XR影视生态,形成“技术—内容—消费”闭环 [8] - 产业链上游由本地科技企业攻关核心硬件 [8] - 产业链中游由西影集团等组建专业虚拟制片团队,推动技术应用 [8] - 产业链下游通过XR影院、文旅体验馆等不断落地,连接消费市场 [8] 技术创新与AI融合 - 西影推出的“影谱·汉语电影AI创作平台”能辅助编剧写剧本、帮导演做分镜,甚至生成视频样片 [11] - 该平台的XR模块即将上线,未来AI将不仅能“写故事”,还能实现空间化叙事,进一步融合技术与内容创作 [11] 标准化与产业化发展 - 全国首个“国家虚拟现实电影技术创新中心”正式落户西影,将为XR电影的技术规范、内容质量和设备认证制定“中国标尺” [12] - XR电影在西安正完成从“做一个项目”到“建一套体系”的跨越,标志着该领域从实验走向产业 [13]
包干包会,当“创作”成了年轻人的新职业
搜狐财经· 2026-01-07 12:51
行业趋势:内容创作成为年轻人职业新赛道 - 年轻人就业心态转变,内容创作被视为可替代传统职场的职业新赛道,吸引力在于“自己当老板”和避免职场内耗 [6] - 内容创作的目的并非“逃离工作”,而是换一种方式参与社会生产,实现自我价值与收入的双重满足 [13] - 2025年抖音精选青年创作者成长计划中,上万名青年创作者凭借优质内容生产获得回报,证明其正成为一种可靠的新职业选择 [13][31] 创作者案例与成功路径 - 旅行领域创作者@何香蓓通过系列vlog融合知识与经历,拥有800万粉丝,单条视频吸粉百万,系列播放超8800万次 [8][10] - 情感连接领域创作者@北范南调通过送家乡饭传递乡愁,为长沙朋友送丹东特产的视频获569万点赞,实现稳定变现并收获情感价值 [11][13] - 非遗传承领域创作者@陈川同学,其首条关于“藕丝步云履”的视频获850万播放,加入青创计划后20天达成50万粉丝里程碑 [15][17] - 非遗创新领域创作者@陈楚念融合非遗与现代艺术,账号粉丝近80万,总点赞超3800万,其机械傩舞作业获超500万点赞并入选教材 [17][19] - 自然科普领域创作者@笨豆独立完成自然探索纪录片全流程,账号粉丝超58万,总点赞达415万以上,成为青少年科普代表 [19][24] 优质内容的核心竞争力 - 在注意力饱和的环境中,可持续的内容需具备不可替代性,即融入个人独特视角、专业沉淀或情感温度的差异化内容 [15] - 成功创作者的共同点是内容具备不可替代的社会价值,如传承文化、科普知识或治愈情感,从而具备抵御流量波动的长期生命力 [24] - 优质内容的核心是“做好自己”而非“讨好别人”,找到独特优势并打造创作标签才能在竞争中站稳脚跟 [15] 平台支持体系与赋能效果 - 抖音青创计划为创作者提供创作课程、流量体系、商业变现、线下社区与创作舞台五大模块的全周期支持 [25] - 平台通过精准推荐机制赋能创作者,青创计划内创作者达成10万粉丝的时间比其他优质作者快近60天 [25] - 2025年有3086万名青年在抖音开始创作,青创计划内累计创作7413个千万级播放作品及371个五千万播放作品 [25][28] - 平台对接外部资源,如与全国百所高校合作覆盖55个国家、触达学生超12万人次,并输送创作者参与专业影展并获奖 [27][28] - 平台为创作者提供与行业顶尖人物(如苹果CEO库克、作家莫言、余华)对话的机会,拓展其创作视野 [29] 商业变现与市场规模 - 青创计划搭建了清晰的商业变现路径,让优质内容稳定转化为收入 [30] - 2025年7月以来,抖音青创计划中1.4万名创作者作品播放量突破5000亿次,实现月入过万,累计获得超8亿元现金收入 [30][31] - 平台数据显示,近半年抖音AI创作稿件量增长91%,优质内容的播放量、播放时长同比分别提升160%、220% [32] - 游戏、人文社科等17个优质内容品类的播放时长同比翻番,创作风格从200余种增加到800余种,显示市场对优质内容的迫切需求 [32]
在这个AI创作大赛里,你可以改编《三体》
中国青年报· 2026-01-05 19:13
公司战略与产品动态 - 哔哩哔哩于1月5日宣布启动面向全球创作者的首场“AI创作大赛” [1] - 大赛设置“开放赛道”与“三体改编赛道”两个主赛道 [1] - “开放赛道”强调原创内容 作品时长不低于3分钟 题材与风格不限 [1] - “三体改编赛道”由公司与三体宇宙联合发起 要求基于《三体》世界观进行改编或创新 [3] - 大赛共设置77个获奖席位 总奖金池超过300万元 其中一等奖奖金高达100万元 [3] 内容生态与社区运营 - 《三体》相关的二创内容是哔哩哔哩社区生态中的核心品类之一 [3] - 站内关于《三体》的解析、速读、动画二创等内容层出不穷 [3] - 例如UP主“文曰小强”的《三体》解析系列视频 在站内累计播放量超过2117万次 [3] - 公司通过大赛鼓励以AI创作对《三体》原著留白空间进行拓展和复现 [3] 活动规则与评判标准 - 大赛从1月5日开启征稿 [1] - 对AI视频给出了明确的判断标准:故事性第一 技术服务于叙事 [3]
侵权与乱序的遮羞布要被掀了,AI魔改视频专项整治明起开展
扬子晚报网· 2025-12-31 11:34
专项治理行动概述 - 国家广播电视总局宣布自2026年1月1日起在全国范围内开展为期一个月的专项治理以整治“AI魔改”视频传播乱象 [1] - 治理重点清理基于四大名著、历史题材、革命题材、英模人物等电视剧作品进行“AI魔改”的三类违规视频 [1] - 专项治理同步清理将少年儿童所熟知的动画形象进行改编生成的各类邪典动画 [1] AI魔改视频的具体问题与表现 - 第一类问题视频严重违背原作精神内核和角色形象颠覆基本认知解构普遍共识 [1] - 第二类问题视频内容渲染血腥暴力猎奇低俗宣扬错误价值观违背公序良俗 [1] - 第三类问题视频存在对中华文化挪用篡改的突出问题导致对真实历史时空中华文明标识产生明显错位认知冲击文化认同 [1] - 2025年初对电视剧《红楼梦》《西游记》的AI魔改引发关注例如视频中甄嬛使用机关枪林黛玉回旋踢贾宝玉 [1] - 2025年下半年AI魔改视频卷土重来并渗透低龄群体例如“外国山海经”“AI山海经”“奥特曼怀孕”“小猪佩奇打骷髅”等内容在中小学生中流行 [2] - 有孩子因接触此类内容产生错误认知如认为“山海经就是国外的中国的山海经一点儿也不好看” [2] 行业影响与侵权风险 - AI魔改的泛滥本质是低门槛技术与流量至上逻辑的共谋导致经典IP沦为猎奇恶搞的素材库 [4] - 此类行为涉嫌侵犯著作权人的改编权与信息网络传播权 [4] - 使用原影视剧片段未经授权构成侵权使用人物形象可能侵犯明星肖像权 [4] - AI魔改视频消解文化共识扭曲历史认知 [4] 监管响应与治理方向 - 2025年广电总局网络视听司曾发布《管理提示(AI魔改)》要求各平台整改相关短视频内容 [1] - 专项治理被视为对AI魔改乱象的精准纠偏是一次必要的“刹车” [4] - 真正的长效治理需要依靠法律确权平台担责公众识辨的多元合力 [4]
2025,我们戳穿谎言,曝光潜规则
第一财经资讯· 2025-12-31 00:30
外贸数据造假行业操作模式 - 地方商务部门为完成外贸出口目标,联系外贸从业者开设具备出口资质的空壳公司[3] - 空壳公司从沿海报关中介手中购买出口数据,这些数据源自无资质的中小出口商家,形成“无主”数据交易链[3] - 相关政府部门不关心空壳公司的人员参保、缴税情况,财政局仅根据名单和数额向企业发放奖励资金,该操作已持续十数年[3] 媒体报道与信息环境变迁 - 新闻主要传播介质已从报纸电视转向移动互联网,社交媒体上的只言片语常成为报道突破关键[6] - AI创作的“记者手记”已见诸报端,信息丰富与检索便利并未完全消除谎言,AI幻象与信息茧房问题凸显[6] - 记者进行事实核实时面临挑战,例如致电官方求证时可能遭遇强烈抵触与回避[7] 其他被曝光的潜在违规案例 - 存在伪造学历进入顶级医学殿堂的个案[5] - 存在挪用资产、涉及不正当男女关系的宗教场所管理案例[5] - 存在同一团队(“最忙五人组”)反复在不同项目中标或参赛得奖的现象[5] - 存在已被捐赠给博物馆的数百年前画作(如仇英《江南春》)再次出现在拍卖会的情况[5]
2025,我们戳穿谎言,曝光潜规则
第一财经· 2025-12-31 00:21
文章核心观点 - 文章通过记者对2025年一系列事件的调查与回顾,揭示了多个领域长期存在的“潜规则”现象,并探讨了在信息时代背景下,追求真相与打破常规所面临的挑战与价值[3][6][7][8] 出口数据造假行业现象 - 部分地方商务部门为完成外贸出口目标,联系从业者开设空壳公司,并从沿海报关中介手中购买出口数据,形成造假链条[4] - 该链条涉及多方:无资质的中小出口商家提供数据源,报关中介作为数据卖方,空壳公司作为数据买方和报关主体,地方商务和财政部门则负责目标考核与发放奖励资金[4] - 此类操作已持续十数年,成为行业“常规操作”,但利益相关方通常“只做不说”,直至内部平衡被打破才得以曝光[4][6] 2025年被曝光的其他“潜规则”案例 - 教育领域存在伪造学历进入顶级医学殿堂的案例[7] - 宗教机构领域出现挪用资产及不正当男女关系的指控[7] - 招投标领域存在“最忙五人组”专家被反复使用于不同项目并中标或获奖的现象[7] - 文物收藏领域出现已被捐赠给博物馆的珍贵画作(如仇英《江南春》)再度现身拍卖会的情况[7] 媒体调查环境与行业变化 - 调查报道的突破方式发生变化,社交媒体的只言片语常成为关键线索,同时需对视频等素材进行更严格的甄别[8] - 新闻传播介质已从报纸电视转向移动互联网,并出现AI参与内容创作(如“记者手记”)的趋势[8] - 信息过载时代并未自动消除谎言或普及常识,反而可能出现AI幻象、信息茧房及价值观割裂加剧等问题[8] - 在某些情况下,对敏感事件的追问可能被视作禁忌,记者甚至可能遭到严厉斥责,反映出舆论环境的复杂性[9]
所想即所见,所言即所闻,可灵AI打开全民创作新入口
北京商报· 2025-12-30 14:51
核心观点 - 可灵AI通过发布大一统多模态模型“可灵O1”和2.6版本的“音画同出”能力,实现了视频创作流程的革命性简化,将视频创作从专业技能转变为人人可及的日常表达 [1][3][9] 技术突破:大一统多模态模型“可灵O1” - 可灵O1是全球首个大一统多模态视频模型,基于MVL理念,打破了传统单一视频生成任务的模型边界 [3] - 该模型将参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改变换、风格重绘、镜头延展等多种任务融合于同一个全能引擎,实现一站式创作流程 [3] - 用户只需输入自然语言指令,模型即可完成像素级语义重构,例如“把这张白天的照片改成夜晚”、“给主角换一条红裙子” [3] - 模型具备“导演思维”,能记住角色的特征,确保在镜头切换时主体特征稳定,并支持自由组合多个不同主体或与参考图混搭 [3] - 同步升级的可灵图像O1模型也主打特征高度一致,支持纯文本生成或上传最多10张参考图进行融合再创作,确保主体元素稳定和画面氛围统一 [4] - 该系列模型对系列短剧、广告电商、品牌IP等用户是刚需,实现了从灵感构思到最终输出的“一站式闭环” [4] 技术突破:“音画同出”能力 - 可灵2.6模型的“音画同出”能力让角色不仅能动作精准,更能开口说话、发出环境音效,且声音与画面节奏严丝合缝 [5][6] - 该能力重构了传统“先生成无声画面,再人工配音”的割裂工作流,用户输入文本或图片加提示词,即可一键生成包含人声、音效、环境声的完整视频 [6] - 语音当前支持中英文,单次生成最长10秒 [6] - 突破体现在三大维度:音画协同,实现深度语义对齐;音频质量接近专业混音效果;语义理解能准确把握复杂剧情与口语表达 [6] - 模型具备音色控制能力,支持生成说话、对话、旁白、唱歌、Rap等多种声音类型,并可混合环境音效,让创作者能控制角色的语气、情绪和背景音乐 [6] 行业影响与创作范式转变 - 技术将视频创作从专业技能变为人人可及的日常表达 [1] - 图灵奖得主指出,AI本质是“模式识别”的强大工具,不会取代艺术家,但会改变他们工作的方式 [7] - 公司的愿景是“让每个人都能用AI讲出好故事”,其主语是人,旨在通过提升基础模型能力定义人类与AI交互的新方式 [8] - 公司赋予创作者更高自由度的控制权,如调节动作幅度、修改镜头节奏、删除帧、叠加多段生成结果,让声音和画面“同频” [8] - 在艺术节上展映的三支短片由艺术家与可灵超级创作者联动完成,是对未来创作范式的预演 [9] - 此次技术升级可能标志着“用一张图讲一个有声有色故事”时代的开始 [9]