Workflow
AIGC
icon
搜索文档
CVPR 2025 | SketchVideo让手绘动起来,视频生成进入线稿时代
机器之心· 2025-05-17 14:00
生成式AI视频技术发展 - 生成式AI在文本和图像领域已成熟,视频生成成为AIGC重要研究方向,应用于影视制作、短视频合成等领域[1] - 现有商用/开源模型(如Sora、可灵、CogVideo)依赖文本/图像输入,但存在几何细节控制不足、运动信息难以精确调节等局限性[7][9] - 视频局部二次编辑需解决空间与时序一致性难题,当前方法多聚焦整体风格变化而非局部几何编辑[9][11] SketchVideo技术创新 - 提出基于线稿的可控视频生成/编辑方法,仅需1-2帧关键帧线稿即可生成时序一致的动态视频,支持局部区域修改[1][12] - 采用跳跃式残差控制结构:将条件模块以固定间隔嵌入预训练模型(CogVideo-2B),参数开销减少50%以上[11][12] - 引入帧间注意力机制,通过稀疏传播关键帧控制特征实现全视频一致性[12] - 视频编辑新增视频嵌入模块,结合局部融合策略保留非编辑区域内容[12] 应用效果展示 - 单帧线稿+文本输入可生成高质量视频,指定时间点与线稿匹配度达90%以上[15][17] - 双帧线稿输入可控制物体运动轨迹,实现定制化生成[17][19] - 真实视频编辑支持局部区域修改(如树枝移动、头部旋转),新内容与原始视频运动同步[19][21] 行业影响 - 突破专业视频制作门槛,用户通过简单线稿即可创作动态内容,效率提升约70%[23] - 技术已被CVPR 2025收录,相关代码及Demo在GitHub和YouTube开源[8][23] - 相比传统文本驱动方法,几何控制精度提升40%,填补了视频生成领域可控性空白[9][12]
助力创作者确权、监测维权等,“创意中国”版权服务平台发布
南方都市报· 2025-05-17 00:18
平台发布背景 - 科技发展为文化创新提供新手段和平台 同时带来版权保护和运用的新机遇与挑战 [1] - 中华版权联合多家机构共同打造"创意中国"版权服务平台 旨在以数字版权为核心整合文化创意资源 [1] - 平台发布是落实《版权工作"十四五"规划》中"建设著作权数据服务信息化平台"部署的重要举措 [1] 平台功能与服务 - 平台集成版权确权 公告查询 展示推广 作品保管 授权交易 监测维权等多项功能 [1] - 提供一站式全链条版权服务 推出定制化版权解决方案 [1] - 逐步开放注册功能 服务对象包括个人创作者和文化企业 [1] 技术支持与生态建设 - 采用区块链确权 智能合约交易 AI创作评估等前沿技术 [2] - 构建覆盖版权服务 版权孵化到商业转化的全链路生态系统 [2] - 中华版权已联合多家头部版权孵化运营伙伴构建版权生态联合体 [1] 合作伙伴与活动 - 与湖南马栏山天择微链科技 成都九天星空科技等4家公司签署合作协议 [2] - 启动AIGC数字艺术品征集展示活动 推动AI技术与文化创意深度融合 [2] - 中国版权杂志社将利用全媒体传播矩阵优势搭建跨界合作桥梁 [2]
重磅!揭秘机器人界「Sora」,完成1000+任务的“硬件密码”
机器人大讲堂· 2025-05-16 17:49
核心观点 - 清华大学叉院ISRLab与星动纪元联合推出开源AIGC生成式机器人大模型VPP(Video Prediction Policy),被誉为机器人界的"Sora",引领机器人从数字世界迈向物理世界 [1] - VPP模型具备视频预测策略、高频执行、跨本体学习和可靠透明性等核心优势 [1] - 星动XHAND1作为行业首创关节全直驱仿人五指灵巧手平台,为VPP模型提供硬件支持,已能完成超1000个任务 [2] 星动XHAND1技术优势 - 全直驱技术:配备12个全主动自由度,单指实现10次点击/秒,最大负载25kg,最大握力80N [2][5] - 可反驱性:提升机器人容错率,增强VPP模型在复杂环境中的鲁棒性 [7] - 高功率密度与耐用性:采用高功率密度空心杯电机和驱动器,使用寿命远超同类产品 [8] - 全方位全链遥操作:支持Apple Vision Pro、Manus手套等设备,实现人类操作策略的高效学习 [11] - 充分解耦:关节独立控制优化,提升数据采集和算法开发效率 [16] - 高兼容性:支持ROS2/ROS1、Ubuntu系统,适配x86/ARM架构 [17] 性能验证与应用 - 在Real-World Dexterous Hand任务中实现67%的真机测试成功率 [26] - 电流力控技术显著降低强化学习及sim-to-real算法开发中的现实差距(Gap) [20] - 配备270°环绕指尖高精度触觉传感(精度0.01N),是目前唯一支持触觉传感仿真的全驱灵巧手 [22][23] - 与同类产品相比,在力控精度和复杂操作泛化能力方面表现突出 [29] 未来发展 - 计划与更多机器人大模型深度协同,实现硬件-算法联合迭代升级 [29] - 结合VLA与AIGC技术进行融合创新,拓展应用边界 [29] - 积极拓展开源生态,吸引开发者共建多场景应用库 [29]
飞书深诺:2025年全球RPG市场研究报告
搜狐财经· 2025-05-16 16:21
市场整体概况 - 报告聚焦2024年全球RPG手游市场,覆盖Android与iOS平台,研究内容包括下载量、收入占比、热门品类、厂商分布及IP产品表现等 [1] - 2024年RPG手游收入占全球整体手游收入比例达25.6%,远超其他品类,但下载量仅占3.3%,显现出极强的吸金能力 [21] - RPG品类收入规模排名稳居第一,高单次安装成本的同时也拥有高平均每用户收入,是拥有高投资回报率的品类 [19] 核心品类与玩法趋势 - 传统品类如回合制RPG、MMO仍占据重要地位,韩国厂商在MMO领域表现突出 [2] - 新兴品类崛起:放置RPG因轻量化玩法受青睐,中国厂商在该领域表现亮眼;Roguelike、生存RPG、开放世界RPG等创新玩法增速显著 [2] - IP改编产品表现突出,《行尸走肉》《怪物猎人》《地下城与勇士》等知名IP衍生游戏进入热门榜单,IP自带流量与粉丝基础成为吸金关键 [3] 全球区域市场特征 - 东南亚贡献超2成下载量,北美及日韩占据7成收入份额,成熟市场变现优势明显 [33] - 北美偏好开放世界、ARPG及IP改编大作,东南亚对轻度RPG、回合制游戏接受度高,日韩二次元、幻想题材需求旺盛 [7] - 从ARPD来看,日韩地区最高,分别达到$60、$25以上,港澳台大洋洲等地次之,ARPD均在$10以上 [36] 厂商竞争格局 - 中国厂商凭借品类创新与本地化能力在全球市场占据重要位置,在2024年达到34%的市场份额 [25] - 日本厂商深耕二次元、幻想题材,IP改编能力突出,《勇者斗恶龙》《最终幻想》等系列持续贡献收入 [7] - 韩国厂商以MMO和高品质画面见长,在亚洲及部分欧美市场具有较强竞争力 [7] 用户行为与市场趋势 - 付费用户更倾向为IP价值、画面品质及社交玩法买单,MMO与IP改编游戏的付费金额增速显著 [4] - 云游戏、AI生成内容(AIGC)等技术逐步应用,提升开发效率与玩家体验 [4] - 跨平台联动(如手游与主机、PC端数据互通)成为趋势,增强用户粘性 [5] 产品表现与细分市场 - 2024年RPG手游收入榜中未见新品踪影,产品平均上线时间超过6年,《Pokémon GO》连续多年位居榜首 [30] - 放置RPG手游全球下载量位列第一,占据RPG总下载份额近20%,而回合RPG、ARPG分别位列第二、第三 [31] - 在RPG细分类别中,回合RPG收入占比远超其他细分品类,占比超30%,排名第二、第三的MMORPG和放置RPG的收入占比分别为21%、15% [29] 技术与体验升级 - 云游戏、AI生成内容(AIGC)等技术逐步应用,提升开发效率与玩家体验,如《云城之光》等产品尝试结合新技术吸引用户 [4] - 跨平台联动(如手游与主机、PC端数据互通)成为趋势,增强用户粘性 [5] 二次元营销趋势 - 超六成RPG手游用户偏好二次元文化,RPG新玩家中二次元用户占比超30% [42] - 二次元用户注重内容且互动性强,通过精美的角色PV、真人coser营销和跨IP联动,可以激活粉丝共创热情 [42]
腾讯混元发布混元图像2模型
快讯· 2025-05-16 15:43
腾讯混元在微信公号上宣布发布混元图像2模型,称该模型的两大特点为实时生图和超写实画质。腾讯 混元表示,相比前代模型,腾讯混元图像2模型参数量提升了一个数量级,可实现毫秒级响应,支持用 户可以一边打字或者一边说话一边出图。新模型图像生成质量提升明显,可有效避免AIGC图像中的"AI 味"。(腾讯混元) ...
芒果超媒24年及25Q1业绩点评:优质剧集拉动会员付费,精品内容持续供给
华安证券· 2025-05-16 14:48
报告公司投资评级 - 维持“增持”评级 [2][11] 报告的核心观点 - 2024 年公司营收 140.80 亿元,yoy - 3.75%;营业利润 17.42 亿元,yoy - 4.21%;归母净利润 13.64 亿,yoy - 61.63%;扣非归母净利润 16.45 亿,yoy - 2.99%;全年净利率 9.7%,毛利率为 29.0%,净利润下滑受企业所得税优惠政策变动影响 [5] - 25Q1 公司营收 29.00 亿元,yoy - 12.76%;归母净利润 3.79 亿,yoy - 19.80%;扣非归母净利润 3.03 亿,yoy - 35.03%,一季度收入收缩因传统电视购物业务板块收入下降,且公司加大投入致净利润同比下降 [6] - 2024 年芒果 TV 上线综艺 160 档,创新综艺占比 40%,有效播放量居行业第一,全网和电视综艺有效播放 TOP10 榜单中芒果综艺分别占 5 席和 4 席;上线重点影视剧 27 部,3 部上榜豆瓣 2024 年评分最高的 10 部华语剧集榜单,影视剧储备超 100 部;上线微短剧 340 部,打造“长中短”内容生态优势 [7] - 芒果 TV 12 月 MAU 达 2.77 亿,位居四大长视频平台第三名,会员规模达 7331 万,会员收入达 51.48 亿元(yoy + 19.3%)创新高,得益于热门综艺和剧集带动,海外下载量达 2.61 亿,收入从 6200 万元增长至 1.41 亿元 [8] - 公司大模型实验室和“芒果大模型”通过备案,在多种内容创作中赋能,如对部分项目用虚拟现实技术拍摄降本增效,还储备多个重点项目 [9] - 预计 25 - 27 年公司实现收入 149.2/160.0/172.9 亿,25 - 26 年前值为 163.1/173.9 亿,实现归母净利润 18.2/21.3/24.1 亿,25 - 26 年前值为 23.6/25.0 亿 [11] 根据相关目录分别进行总结 财务指标 |主要财务指标|2024A|2025E|2026E|2027E| |----|----|----|----|----| |营业收入(百万元)|14080|14916|15998|17291| |收入同比(%)|-3.7|5.9|7.3|8.1| |归属母公司净利润(百万元)|1364|1824|2125|2412| |净利润同比(%)|-61.6|33.7|16.5|13.5| |毛利率(%)|29.0|30.0|30.5|30.9| |ROE(%)|6.1|7.5|8.0|8.4| |每股收益(元)|0.73|0.98|1.14|1.29| |P/E|36.84|24.16|20.74|18.27| |P/B|2.24|1.81|1.67|1.53| |EV/EBITDA|6.47|6.19|5.62|5.02|[13] 财务报表与盈利预测 资产负债表(单位:百万元) |会计年度|2024A|2025E|2026E|2027E| |----|----|----|----|----| |流动资产|17872|19406|21403|23881| |现金|3901|5579|6570|8855| |应收账款|4540|3822|4989|4440| |存货|1332|1831|1523|2104| |非流动资产|14658|15386|16190|16887| |资产总计|32530|34792|37593|40768| |流动负债|9803|10269|10978|11779| |负债合计|10000|10467|11176|11977| |归属母公司股东权益|22489|24313|26438|28850| |负债和股东权益|32530|34792|37593|40768|[14] 利润表(单位:百万元) |会计年度|2024A|2025E|2026E|2027E| |----|----|----|----|----| |营业收入|14080|14916|15998|17291| |营业成本|9992|10449|11114|11956| |营业利润|1742|2053|2423|2753| |利润总额|1763|2088|2461|2793| |所得税|420|292|369|419| |净利润|1343|1795|2092|2374| |归属母公司净利润|1364|1824|2125|2412| |EBITDA|7215|6258|6722|7069|[14] 现金流量表(单位:百万元) |会计年度|2024A|2025E|2026E|2027E| |----|----|----|----|----| |经营活动现金流|-25|6563|6083|7271| |投资活动现金流|-7685|-4884|-5092|-4985| |筹资活动现金流|-288|0|0|0| |现金净增加额|-7997|1678|991|2285|[14] 主要财务比率 |会计年度|2024A|2025E|2026E|2027E| |----|----|----|----|----| |成长能力 - 营业收入同比(%)|-3.7|5.9|7.3|8.1| |成长能力 - 营业利润同比(%)|-4.2|17.8|18.1|13.6| |成长能力 - 归属于母公司净利润同比(%)|-61.6|33.7|16.5|13.5| |获利能力 - 毛利率(%)|29.0|30.0|30.5|30.9| |获利能力 - 净利率(%)|9.7|12.2|13.3|14.0| |获利能力 - ROE(%)|6.1|7.5|8.0|8.4| |获利能力 - ROIC(%)|4.3|6.2|6.7|7.1| |偿债能力 - 资产负债率(%)|30.7|30.1|29.7|29.4| |偿债能力 - 净负债比率(%)|44.4|43.0|42.3|41.6| |偿债能力 - 流动比率|1.82|1.89|1.95|2.03| |偿债能力 - 速动比率|1.04|1.08|1.20|1.26| |营运能力 - 总资产周转率|0.44|0.44|0.44|0.44| |营运能力 - 应收账款周转率|3.50|3.54|3.57|3.61| |营运能力 - 应付账款周转率|1.82|1.82|1.82|1.82| |每股指标 - 每股收益(元)|0.73|0.98|1.14|1.29| |每股指标 - 每股经营现金流(摊薄)(元)|-0.01|3.51|3.25|3.89| |每股指标 - 每股净资产(元)|12.02|13.00|14.13|15.42| |估值比率 - P/E|36.84|24.16|20.74|18.27| |估值比率 - P/B|2.24|1.81|1.67|1.53| |估值比率 - EV/EBITDA|6.47|6.19|5.62|5.02|[14]
阶跃星辰×光影焕像联合打造超强3D生成引擎Step1X-3D!还开源全链路训练代码
机器之心· 2025-05-16 10:42
核心观点 - 阶跃星辰与光影焕像联合发布并开源3D大模型Step1X-3D 该模型总参数量达4 8B(几何模块1 3B 纹理模块3 5B) 具备高保真与可控性 可广泛应用于游戏 影视 工业设计等领域 [1] - Step1X-3D通过数据驱动与算法协同优化 建立了包含200万高质量训练样本的数据库 并采用增强型网格-SDF转换技术 使水密几何转换成功率提升20% [4][7] - 模型采用3D原生两阶段架构 解耦几何与纹理表征 几何生成采用混合VAE-DiT架构 纹理生成基于SD-XL模型优化 实现细节生动且多视图一致 [10][15][16] - Step1X-3D在CLIP-Score等核心指标上超越主流3D模型 成为开源社区最具竞争力的3D生成方案 [25] 技术架构 - **几何模块**:采用混合VAE-DiT架构生成水密TSDF表示 通过锐利边缘采样技术精准还原几何细节 参数量1 3B [15] - **纹理模块**:基于SD-XL模型深度定制 利用几何条件引导与多视图同步技术 参数量3 5B [16] - **控制技术**:兼容主流2D生成模型控制方法(如LoRA微调) 支持对称性 表面细节等属性调控 [18][19] 数据与训练 - **数据处理**:从超500万原始数据中筛选出200万高质量样本 并开源800K 3D资产及完整预处理策略 [4] - **训练优化**:采用FLUX MMDiT结构与Rectified flow算法 实现3D表示的直接建模 [13] 应用与性能 - **应用场景**:覆盖游戏娱乐 影视动画 工业制造等领域 提供从创作到落地的全链路支持 [1] - **性能表现**:在CLIP-Score等自动评估中多项指标领先 生成内容与输入语义一致性达行业最高水平 [23][25] 团队背景 - **阶跃星辰**:以构建AGI为目标 规划从单模态到多模态统一的技术路径 [27] - **光影焕像**:专注3D AIGC与空间智能技术 团队含港科大博士及字节 美团等企业人才 [27][28]
谷歌Deepmind发布编程AI Agent;OpenAI宣布向ChatGPT用户开放GPT-4.1模型丨AIGC日报
创业邦· 2025-05-16 08:01
OpenAI发布GPT-4.1模型 - OpenAI宣布GPT-4.1模型即日起在ChatGPT中提供,该模型专攻编码任务和指令遵循 [1] - Plus、Pro和Team用户可通过模型选择器中的"更多模型"下拉菜单访问GPT-4.1 [1] - 企业版和教育版用户将在未来几周内获得访问权限 [1] - OpenAI将推出GPT-4.1 mini替代现有的GPT-4o mini,并向所有用户开放 [1] CoreWeave大幅增加AI基础设施投资 - 英伟达支持的AI初创公司CoreWeave计划今年投入200亿至230亿美元用于AI基础设施和数据中心容量建设 [2] - 投资目的是满足包括微软在内的客户日益增长的AI需求 [2] - 该巨额支出计划公布后,公司股价盘后大跌近8% [2] 谷歌Deepmind发布编程AI Agent - 谷歌Deepmind发布用于设计高级算法的编程AI Agent AlphaEvolve [3] - AlphaEvolve解决了300多年历史的数学难题"亲吻数问题",在11维空间中建立了新的下界 [3] - 该AI发现了由593个外层球体组成的结构型,超越了之前数学家的记录 [3] 新型AI芯片降低大语言模型能耗 - 美国俄勒冈州立大学科研团队研发出新型AI芯片,可将大语言模型能耗降低50% [4] - 新芯片通过训练分类器识别并纠正错误,以更智能高效的方式恢复数据 [4] - 该成果在IEEE定制集成电路会议上发布,被视为半导体领域的重大突破 [4] 法国超级计算机完成升级 - 法国让·扎伊超级计算机完成第四次扩展,计算能力提升4倍 [5] - 升级后每秒可进行125.9千万亿次运算,存储容量增至约100拍字节 [5] - 该计算机成为法国乃至欧洲AI领域最强大且使用最广泛的超级计算机之一 [5]
专访未来数字产业研究院院长巩强:文创企业“只靠情怀,是扛不住的”
每日经济新闻· 2025-05-15 22:07
数字文创的定义与内涵 - 数字文创可从名词和动词两个维度理解:作为名词指以数字技术和文化资源为基础的新经济形态,包括虚拟产品如NFT或虚实结合体验如VR [5] - 作为动词指用数字手段重塑文化生产消费全过程的动态机制,强调模式革新而非形式标签,例如传统相声通过数字化改良也可归入数字文创 [6][8] - 与传统文创的核心区别在于数字化对生产逻辑的根本性改变,例如纸媒与短视频在信息传达方式上的差异 [6] 数字文创产业发展阶段 - 当前处于"赛博迁移"阶段后期,主要表现为将现实文化内容数字化迁移,如文物扫描和线上博物馆 [8] - 标志性特征是主流文化消费场景已实现数字化覆盖,但面临数字化深度不足、资源供给单一、公众参与度低等挑战 [9] - 技术发展速度远超产业应用速度,存在显著滞后性,需突破文化数字化的广度与深度瓶颈 [8][9] 企业核心能力框架 - "内容-技术-运营"三角模型是企业定位的核心框架,中小企业需至少占据一项优势领域 [11] - 内容能力关键在于文化资源的深度开发与转化能力,而非简单占有资源,例证如《黑神话:悟空》对西游题材的创新解读 [11] - 技术能力侧重应用而非研发,重点在于如何利用AI等工具提升内容表达与用户体验 [13] - 运营能力涵盖商业模式创新与场景打造,典型案例包括阿那亚社群运营和《长安十二时辰》NPC互动 [13] 商业模式与市场需求 - 五种新兴商业类型(沉浸、焕活、化身、共情、共益)对应消费者从物质到精神、被动到主动的需求升级 [13] - 沉浸式体验满足深度参与需求,焕活式回应传统文化创新诉求,化身式关联数字身份认同 [13] - 未来市场可能呈现多模式融合趋势,爆发力取决于企业捕捉未满足需求的能力 [14] 行业转型关键挑战 - 传统文化机构转型面临的核心矛盾在于传统体系与数字经济时代的适应性冲突 [16] - 系统性思维是把握AIGC等机遇的关键,需明确新技术与核心能力的结合点而非盲目跟风 [16] - 政府应发挥引导与赋能作用,通过搭建平台、数据共享、人才支持等政策营造创新环境 [16] 从业者发展建议 - 需平衡情怀与商业逻辑,通过扎实的商业化能力实现文化价值转化 [20] - 在快速变化环境中保持系统性思维,避免被热点牵引而失去核心聚焦点 [20] - 创新想象力是突破同质化竞争的关键要素,需持续探索未被开掘的领域可能性 [20]
岩山科技(002195) - 2025年5月15日投资者关系活动记录表
2025-05-15 18:18
活动基本信息 - 活动类型为业绩说明会,时间是2025年5月15日15:00 - 16:30,地点通过上海证券交易所上证路演中心,形式为网络文字互动 [2] - 上市公司接待人员包括董事长叶可、副董事长兼总经理陈于冰等多位公司高层 [2] 公司业务相关问题回复 股权激励计划 - 截至目前,公司无新的股权激励计划,后续若推出将依法依规履行决策程序并披露 [2] 海外业务 - 公司以“成为全球领先的人工智能、科技创新公司”为愿景,关注海外市场机会,但目前业务主要在境内,2024年境外收入占公司营业收入仅2.03%,外部环境对经营无重大影响 [2][3] 降本增效 - 公司将持续进行资源整合优化,加大研发投入同时优化费用管控,聚焦核心项目,采取降本增效、开源节流方式提升运营管理效率和盈利能力 [4] 2025年业绩增长点 - **互联网信息服务领域**:稳步发展现有业务、加强产品技术升级,2345.com持续创新,探索AI工具、产品出海等新方向 [5] - **人工智能板块** - **智能驾驶领域**:Nullmax纽劢科技开发完善多模态端到端智驾方案,加强视觉算法和深度学习技术优势,向全自动驾驶演进,探索在物流、机器人等行业应用场景,拓展海外市场 [5] - **脑机接口及类脑智能领域**:岩思类脑研究院开展大脑内部状态解析与调控、脑电大模型研究,推进大脑内在状态调控及非器质性脑疾病等方面商业化落地 [5] - **AIGC领域**:岩芯数智围绕“Yan架构”加强核心算法创新及迭代升级,构建全模态实时人机交互系统,推动设备升级,健全商业化落地链路,渗透设备端应用场景 [6] - **多元投资板块**:秉承价值投资理念,开展股权投资、金融产品投资等业务,控制风险,提高资金使用效率及投资收益 [6]