Workflow
拍我AI
icon
搜索文档
实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?
36氪· 2026-01-16 09:30
文章核心观点 - 爱诗科技发布的PixVerse R1是全球首个真正意义上的“实时生成世界模型”,它代表了一种介于视频、游戏和虚拟世界之间的全新媒体形式,可能对游戏、互动视频、社交、广告等多个领域产生深远影响 [1][3][12] - 该技术通过让用户设定世界观后自主生成连续画面和故事,并支持用户通过自然语言实时交互改变内容,突破了传统视频AI需要预设提示词、等待生成且结果固定的局限 [6][10][11] - 对于游戏行业而言,PixVerse R1的价值不仅在于提升制作效率,更在于其作为新型底层设施,有望催生出全新的游戏品类和交互模式,拓宽行业的品类边界 [14][15][23] 产品与技术特性 - PixVerse R1由爱诗科技研发,用户只需设定世界观(如奇幻异世界、赛博朋克等),模型即可自主发展出连续的画面和故事,无需持续输入具体指令 [6] - 模型支持用户在观看过程中随时通过文字或语音指令实时干预内容发展,画面能即时根据要求变化,并且内容在某些指令后能回归原始状态 [10][12] - 与以往视频AI技术不同,PixVerse R1无需指定剧情提示词即可自行发展,修改内容无需等待,未来若开放长时间持续能力,将呈现为一个可自行发展、持续存在的视觉世界,而非固定时长的视频文件 [11] - 目前模型处于内测阶段,提供了13款预设世界观供用户体验,每次体验时长因算力成本限制为5分钟,但官方称技术上可实现无限发展 [6] 公司背景与成就 - 爱诗科技成立于2023年4月,其团队已达成多项成就:生成4K画质视频的AI模型(全球首个)、5秒快速生成视频、国际月活跃用户突破千万、海外权威榜单图生视频第一 [5] - 公司在国内最知名的产品是“拍我AI”,即PixVerse的国内版本 [5] 对游戏行业的潜在影响 - **研发层面**:该技术可辅助游戏团队进行世界观预研,通过观察AI在给定世界观框架下的自主故事发展,为世界观构建和故事设计提供灵感 [17] - **研发层面**:可基于该技术开发新的内容型玩法,例如将不影响主线的剧情交由玩家选择体验内容,或由玩家投票决定指令,让AI决定故事走向,作为运营活动 [18] - **发行与营销层面**:其可交互特性可用于买量素材,让潜在玩家在进入游戏前就能按自身需求“尝鲜”,了解游戏设计;平台也可利用大数据预判玩家偏好,为每位玩家生成独一无二的宣发素材 [19] - **品类创新层面**:该技术可能催生或革新互动影视游戏,例如通过语音对话与剧中人物直接沟通;也可能解决跑团玩法游戏因自由度太高而难以数字化的难题,充当线上游戏的“主持人” [19][20] - **品类创新层面**:其“输入内容改变画面”的全新交互模式,有望启发开发出全新的小游戏类型 [20] - **行业价值层面**:AI对游戏行业的最大价值在于不断拓宽品类边界,未来将出现更多前所未见的游戏品类,引发新一轮的行业竞争与布局 [23]
爱诗科技发布实时视频生成模型 PixVerse R1
财经网· 2026-01-14 12:37
公司产品发布与技术突破 - 爱诗科技于1月4日正式发布通用实时世界模型PixVerse R1 [1] - PixVerse R1支持最高1080P分辨率,可实现即时响应,将视频生成从“静态输出、等待成片”推进至“实时交互、持续演化” [1] - 该模型是一种能够对画面、声音等内容进行实时生成和交互建模的人工智能系统,使数字场景能够持续演化并即时响应用户操作 [1] 核心产品能力与用户体验 - PixVerse R1的核心能力在于“实时交互”,视频画面会随着用户指令即时变化 [1] - 用户可以持续调整角色状态、环境变化和镜头走向,系统同步响应并保持画面、角色和场景演化逻辑的一致性 [1] - 视频内容能够连续生成而非反复重启,实现“所想即所见、所说即所现”的交互体验 [1] - 这一变化使AI视频从“生成结果”转变为“生成过程”,用户可像导演一样介入创作节奏 [1] 底层技术架构与优势 - PixVerse R1基于原生多模态基础模型、自回归流式生成机制和瞬时响应引擎构建 [2] - 相关机制使视频成为一条可持续生成、可随时调整的视觉流,而非由孤立片段拼接而成 [2] - 该框架系统性突破了长期困扰AI视频生成的画面突变、逻辑断裂和高延迟问题 [2] 公司背景与市场表现 - 爱诗科技成立于2023年,专注于AI视频生成大模型及应用研发 [2] - 公司海外产品PixVerse及国内产品“拍我AI”目前全球用户规模已超过1亿 [2] - 产品单月月活跃用户超过1600万 [2] - 产品被广泛应用于影视、广告、动漫及内容创作等场景 [2]
爱诗科技发布通用实时世界模型 PixVerse R1
北京商报· 2026-01-14 11:57
公司产品发布 - 爱诗科技于1月14日正式发布通用实时世界模型 PixVerse R1 [1] - 该模型支持最高1080P分辨率,可实现即时响应 [1] - 模型是一种能够对画面、声音等内容进行实时生成和交互建模的人工智能系统 [1] 产品技术特点 - 与传统AI视频生成需要等待数十秒甚至数分钟、一次性输出固定片段不同 [1] - PixVerse R1在生成过程中,视频画面会随着用户指令即时变化 [1] - 用户可以持续调整角色状态、环境变化和镜头走向,系统同步响应并保持画面、角色和场景演化逻辑的一致性 [1] - 实时互动视频生成是其主要应用之一 [1] 公司背景与市场 - 爱诗科技成立于2023年,专注于AI视频生成大模型及应用研发 [1] - 公司投资方包括阿里巴巴、巨人网络等 [1] - 公司海外产品PixVerse及国内产品“拍我AI”目前全球用户规模超1亿 [1]
爱诗科技发布全球首个实时视频生成模型,曾获马云史玉柱团队投资
搜狐财经· 2026-01-14 11:23
公司产品发布与技术突破 - 爱诗科技正式发布全球首个支持最高1080P分辨率的通用实时世界模型 PixVerse R1 [1] - 该模型实现了“实时交互、持续演化”,将视频生成从“静态输出、等待成片”推进至“实时交互、持续演化” [1] - 在生成过程中,视频画面会随着用户指令即时变化,用户可持续调整角色状态、环境变化和镜头走向,系统同步响应并保持一致性 [1] 产品核心能力与用户体验 - PixVerse R1 的核心能力在于“实时交互”,使视频内容能够连续生成而非反复重启,实现“所想即所见、所说即所现”的交互体验 [1] - 用户从“生成结果”的观看者转变为可介入创作节奏的“导演”,创意表达不再被“进度条”打断 [2] - 用户可以在极短时间内连续指示角色做出不同动作或姿态,变化会随着视频进展即时呈现 [2] 技术架构与行业意义 - 模型基于原生多模态基础模型、自回归流式生成机制和瞬时响应引擎构建,生成一条可持续生成、可随时调整的视觉流 [4] - 该框架系统性突破了长期困扰AI视频生成的画面突变、逻辑断裂和高延迟问题 [4] - 该成果标志着实时世界模型从研究探索走向可交互、可部署的产品级阶段 [4] - 实时视频生成技术正在消除内容创作与传播之间的技术隔阂,重塑用户与AI生成内容的互动方式 [4] 行业竞争格局与公司定位 - 全球排名前列的AI视频生成模型多由中国企业推出,相关产品在生成速度、使用成本和并发能力等方面表现突出 [4] - 中国企业在AI视频领域选择了一条不同于高算力、重渲染的技术路线,更强调工程化与系统级能力的突破 [5] - 这种路径使实时视频生成技术更容易走向规模化应用,是中国团队实现“从零到一”产品级突破的重要原因 [5] - 爱诗科技被业内视为OpenAI视频模型Sora的有力挑战者 [6] 应用前景与市场影响 - 实时生成能力有望在AI原生游戏、互动电影、生成式直播电商体验、互动娱乐、影视创作、教育培训、数字仿真等领域释放更大应用潜力 [5] - PixVerse R1开创了“正在发生的现在”的实时生成新纪元,叙事能实现“所想即所现” [5] - 创作与消费的边界逐渐模糊,视频消费者同时也是创作者,能够在观看的同时立即调整和生成新内容 [5] 公司背景与市场表现 - 爱诗科技成立于2023年,专注于AI视频生成大模型及应用研发 [6] - 公司海外产品PixVerse及国内产品“拍我AI”全球用户规模已超过1亿,单月月活跃用户超过1600万 [6] - 产品被广泛应用于影视、广告、动漫及内容创作等场景 [6] - 公司获得了阿里巴巴、巨人网络等企业的投资支持 [6]
一个人用AI,也能拍出获奖电影?|看不见的新大陆
搜狐财经· 2026-01-04 00:01
文章核心观点 - 人工智能,特别是视频生成大模型,被视为与蒸汽机、电力、计算机同级别的通用目的技术,将深刻影响所有行业并成为人人可及的基础设施[4][5][9] - 爱诗科技作为一家AI视频大模型创业公司,通过选择“非共识”的视频生成赛道、打造“人人可及”的C端产品、构建“模型-产品-用户”增长飞轮以及追求极致的组织效率,在全球竞争中脱颖而出,其产品“拍我AI”已拥有超1亿用户[6][10][20][22] - 视频生成大模型代表一种全新的生产力范式,正在重构广告、电商、影视等与视频表达相关的行业,使高质量视频内容的创作门槛大幅降低、成本下降[29][31] 行业背景与趋势 - 2022年是AIGC元年,Midjourney和ChatGPT的推出标志着人工智能进入一个让所有普通人深切感受到其强大的新大时代[4] - 通用目的技术(如AI)具备三个特征:影响所有行业、越来越普及和便宜、推广需要时间和组织制度变革[5] - 上一个AI爆发期是约10年前,由深度学习驱动,但主要服务企业且相对小众[4] 公司战略与定位 - 公司创始人王长虎是拥有20年经验的视频AI领域技术老兵,曾任职于微软亚洲研究院和字节跳动人工智能实验室,主导抖音、TikTok的视觉技术架构及视觉大模型从0到1的建设[1][2] - 2023年,在行业普遍看衰视频生成大模型(认为5年内无法落地)时,公司反其道而行,All in视频大模型赛道,做出了全球TOP25的AI APP[6] - 公司的战略定力源于对视频生成将根本性影响B端和C端的认知,以及团队在视频AI领域的深厚积累,这为其赢得了宝贵的领先时间[9][10] - 公司的战略逻辑是:在颠覆性技术早期,共识意味着红海,“非共识但正确”才是创业公司的机会,关键在于赌注需建立在比别人深十倍的认知上[11][12] 产品与市场 - 公司核心产品“拍我AI”是一款视频生成应用,于2024年1月上线,比Sora早一年推出,上线当月访问量便与当时的明星大语言模型处于同一量级[10] - 产品哲学是“让每个人成为生活的导演”,目标是将视频创作从专业门槛变成人人可及的基础设施,近乎偏执地追求“一键生成”的傻瓜式体验[8][14][15] - 2024年10月上线的v3产品全球爆火,用户只需输入文字描述或上传图片即可在几分钟内生成生动视频,极低的使用门槛使其像病毒一样在全球社交网络裂变[15][16] - 产品覆盖超1亿用户,包括C端普通消费者、专业创作者以及B端的广告公司、电商企业、影视团队[6] - 产品模型迭代效率快,每几个月就有新的升级,持续吸引用户[17] 技术竞争力与增长模式 - 公司的视频生成模型在全球榜单中位列第一梯队,例如其“PixVerse V5”模型在相关榜单中排名第一[8] - 公司构建了“模型-产品-用户”三位一体的增长飞轮:顶级模型驱动产品体验,低门槛产品吸引海量用户,海量用户产生的场景化数据反哺模型进化,形成自我加速的闭环[20][21][22] - 公司是全球少有的在模型、产品、用户三个维度都处于第一梯队的公司[22] 组织与运营 - 公司以实现相对于同行10倍的效率为目标,核心依靠精准的技术判断力和扁平化的组织效率[24][25][26] - 精准的技术判断力源于团队在视频AI领域二十年的深耕,使其在复杂的技术路径选择中能减少试错,用更少资源做更大事情[25] - 扁平化的组织文化借鉴自字节跳动,让好的创意或技术思路能以最快速度直达决策并获取资源,减少内耗[26] - 公司注重吸引优秀、有创业意志的人才,以持续更新技术、保持模型前沿、快速找到用户痛点[28] 行业影响与应用前景 - 视频生成大模型正在重构所有与视频表达相关的行业,广告行业已率先应用,例如为电商场景生成产品广告视频[31] - 该技术催生了新行业(如让漫画直接动起来的“漫剧”),并赋能个人创作者,例如已有完全由一人使用“拍我AI”工具创作的电影在青年电影展入围并获奖[29][31] - 视频生成大模型作为一种新的生产力,使更多人能以更快速度、更低成本创造出同等甚至更高质量的内容[31] - AI已成为一种生产力的底层设施,千行百业都将受益[31]
听完 15 位创业者的「开放麦」,我看到了初创和大厂的注意力差异
Founder Park· 2025-12-24 19:22
文章核心观点 - 2025年AI创业已从“炒作周期”走向“结构性繁荣”,模型推理和多模态能力的大幅提升拓宽了创业场景,涌现出通用Agent、企业服务、消费硬件等众多具有竞争力的赛道[4] - 创业企业与大厂形成共生关系,在To B领域瞄准科技巨头留下的“空隙”,例如垂类定制化解决方案和大模型落地的“最后一公里”,补足了AI产业落地的链条[5] - 多模态生成项目占比高,模型能力提升切中了年轻用户自我表达和创作的需求,创业企业通过建立“新产品-好作品-高频交流-吸引用户-更新模型能力-带来更好体验”的良性循环来抢占市场[5] AI创业趋势与生态观察 - 2024年AI创业场景较为单一,生成对话、角色互动是应用大头,而2025年模型能力提升使创业场景显著拓宽[4] - 火山引擎V-START加速器通过提供字节系资源,能从资源供需背后观察AI创业的“大盘”和“细节”[4] - 创业企业加快抢占市场步伐,并注重建立自己的社区生态以形成良性循环[5] 路演项目概览(按业务领域分组) 企业服务与效率工具 - **呼波特**:主业为AI电话数字员工,面向销售、客服场景,能抓取关键信息并实现“边说边做”的加微信、发短信等操作,已积累200多家真实付费客户[9] - **小宿科技**:专注AI Agent Infra,提供智能搜索、模型、数据等基础设施,业务覆盖80多个国家和地区,已赋能近千家企业[21] - **船水智能**:在金融领域打造TradingAgents实现全智能化股票交易;在企业效率领域推出繁星无线投屏产品,具备智能会议助理功能[27] 内容创作与AIGC - **萱禾映画**:专注于AIGC生成式动画,打造AI动画数据流制作工具,旨在通过技术提升AI动画的IP化与商业化能力[13] - **智灵动力**:作为中国最早进行AI视频创业的团队之一,产品可实现“一句话生成视频”,并与新华社、中央广播电视总台合作打造AI短剧[17] - **爱诗科技**:致力于打造AI视频生成大模型,旗下海外产品“PixVerse”和国内版“拍我AI”已吸引超过1亿用户,并建立了创作者生态[23] - **WeShop唯象**:一站式AI商拍平台,上传商品图即可一键生成带模特和场景的高质量图片与视频,为全球百万商家提供服务[35] 消费硬件与交互体验 - **弋途科技**:致力于移动智能空间探索,应用豆包大模型打造车载语音助手,已覆盖30+大类用车场景[11] - **亮亮视野**:专注AR+AI软硬一体解决方案,其消费级AR翻译眼镜Leion Hey2覆盖100+语种实时翻译,已用于高规格国际会议[15] - **Rokid**:专注于人机交互技术,其AR眼镜Rokid Glasses搭载豆包大模型,可实现多语种翻译、问答搜索等功能[37] - **赛博创力**:专注于AI角色化智能硬件,基于大语言模型开发多模态产品,推动IP潮玩智能化升级[33] 娱乐、教育与陪伴 - **心影随形**:聚焦打造AI游戏伙伴“逗逗AI”,可理解游戏画面并提供实时攻略与情绪价值,用户数已突破1000万[19] - **OneOneTalk**:致力于构建人类的“第二大脑”和“全场景认知操作系统”,从语言学习切入,提供个性化的实时交互服务[25] 3D与数字孪生 - **数美万物**:提供面向制造业的AI 3D建模解决方案Hitem3D,支持最高1536^3分辨率建模,可一键生成高质量三维模型[29] - **镜绽科技**:专注打造下一代3D人形智能体动作生成平台momax,实现低延迟、高拟真的动作生成,覆盖游戏NPC、影视动画等场景[31]
这里,藏着最大的焦虑,也藏着最大的红利
36氪· 2025-12-21 10:00
AI时代的本质与认知 - AI并非简单的生产力工具,而是与工业革命并列、将重构社会结构、经济规则、权力体系的全局性科技革命,标志着人类文明进入AI文明阶段 [13][14] - 区分“工具派”与“时代派”是理解AI的关键分水岭,“时代派”认为AI将改变人类的协作、管理和分配方式 [13] - 技术塑造文明的核心在于改变人与人之间的连接方式,从而重塑权力、财富和意义的分配格局 [29] 当前面临的挑战与普遍焦虑 - 企业家与创业者普遍面临“战略失焦”和“决策瘫痪”,源于AI迭代速度按“周”甚至“天”计算带来的“速度眩晕”,以及信息过载制造的“认知迷雾” [5][6][7][8] - 职场人群存在广泛的“AI替代担忧”,一份覆盖超一万名职场受访者的调研显示,重度担忧者的抑郁比例达34.13% [2] - 在技术不确定性与海量噪音中,企业难以沿用过去定方向、再发展的传统战略制定方式 [9][10] AI对行业与公司的重构影响 - AI将重构千行百业的生产关系,这些生产关系曾对应人的特定技能与岗位,例如AI视频大模型已能替代传统电影制作中的导演、摄影、演员、后期等整支团队 [13] - 当AI成为核心生产要素,企业的价值创造逻辑和增长范式将发生根本性变化,需思考财富分配、生产关系重构等新经济模式问题 [28] - 李开复预测,AI将在未来15年内取代40-50%岗位的技术能力,这不仅是经济问题,更是深刻的“意义危机” [26] 创业者在AI时代的核心价值 - **创造情绪价值的感知力**:人是情绪价值的最终体验者,未来高质品牌将是“高情感含量”的品牌,团结组织与市场需依靠情绪价值 [16] - **提问能力与长程思考等理性意识**:优质决策的核心是定义真问题,人类的提问能力、好奇心、深度思考等理性意识具有不可替代的价值 [19] - **定义生命与组织意义**:创业者是企业意义和生命意义的定义者、诠释者与守护者,意义感是未来组织与个人的刚需 [20][22] 领先者对AI时代底色的洞察 - 谷歌DeepMind首席执行官哈萨比斯指出,AI带来的变革将至少与工业革命同等深刻,并延伸至哲学层面,重塑人类的世界观与人生意义 [25] - 山姆·奥尔特曼关注AI时代财富与权力的分配问题,埃隆·马斯克设想未来可能实现“全民高收入”,核心问题将转向探寻人生意义 [25] - 黄仁勋认为每个人的工作内容会被AI改变,但岗位本身不会消失,只要创新不止,生产力提升不会导致失业 [26] - 李飞飞强调“以人为本”的AI发展,主张AI应增强而非取代人类,并将伦理与人文价值置于研发核心 [26] - 杨立昆强调AI开源与民主化的重要性,以避免权力过度集中于少数公司 [26] 构建AI时代的战略决策框架 - 企业决策需建立在理解AI时代政治、经济、哲学等大问题框架的基础上,思考3年、5年、10年后的可能性 [12] - 创业者需构建开放的认知体系,通过跨学科学习、拥抱开源、与多元背景深度交流,形成独特的“认知神经网络”,以获得战略直觉与定力 [30][31] - 真正的变革并非在旧系统上“加AI”,而是需要从基因层面进行重新编码,创造新形态 [11][12]
技术突变催生新风口!AI视频改写造富规则,关键密码少有人知
搜狐财经· 2025-12-11 21:37
行业爆发与市场表现 - AI视频成为2025年显著的造富风口,创作者与企业均实现高额收入 [1] - 创作者通过AI视频工具接广告单,半年可赚取数十万元 [4] - 头部AI视频公司的年收入从几乎忽略不计飙升至亿元级别,最高接近10亿元 [4] - 主要产品如快手可灵、字节跳动即梦已推行会员制,月费从59元到1399元不等,商业模式清晰 [6] 资本动态 - 2025年下半年AI视频企业迎来融资盛宴,爱诗科技、生数科技等公司融资额从几亿元到上亿美元不等 [7] - 海外公司如Runway和LumaAI也在筹备数十亿美元级别的融资 [7] 技术进步与产品演进 - 技术突破是行业爆发的核心,AI视频生成速度与质量在2025年实现飞跃 [8] - 生成时间从2024年的两天缩短至2025年的5到30秒,画质从780P提升至1080P以上,并支持自然语言交互与一键换风格 [10] - 厂商内卷推动工具从“玩具”变为生产力工具,生成内容真实性大幅提升,肉眼几乎难辨真假 [10] 当前产品局限与用户反馈 - 产品存在三大主要问题:缺乏连续创作功能导致流程繁琐;协作功能差,难以满足团队需求;对复杂动作如舞蹈、体操的精细控制不足,错误率高 [13] - 不同产品各有侧重:拍我AI生成速度最快(5秒出360P,1分钟出1080P),适合紧急项目;海螺AI擅长大动作场景;Vidu视频一致性强但画质一般 [15] - 用户期待能整合各家优点、支持连续创作的超级工具 [15] 行业前景与未来趋势 - 行业仍处早期,当前产品效果已能满足短视频消费,商业循环健康,未来收入预计持续增长 [17] - 预计2026年AI视频将在电商、教育、短剧等领域创造更多收入 [17] - 2026年被视为行业分水岭,可能出现平台级入口,交互式视频成为新热点 [19] - 做出电影级画质的产品被视为决胜关键,技术无法突破的企业可能被市场淘汰 [17][19]
AI视频创业公司挣到钱了
经济观察网· 2025-12-07 08:09
行业商业化进程 - AI视频行业已从技术炫技阶段进入规模化商业变现阶段,头部公司年收入规模已从去年的“少到可以忽略不计”跨入亿元俱乐部,少则1.4亿元,多则逼近10亿元大关 [1] - 多家公司已推出会员订阅模式,月度会员费最低59元,最高1399元 [1] - 与大语言模型赛道不同,AI视频公司已率先找到可行的商业化路径 [2] 收入结构与用户 - C端用户付费订阅成为AI视频公司收入增长的主要驱动力,以爱诗科技为例,其收入近80%来自C端用户付费订阅,且绝大部分是海外用户,欧美用户贡献了超过一半收入,巴西紧随其后 [3] - 快手可灵2025年预计收入达10亿元,其中70%来自会员订阅,主要面向专业影视创作者 [4] - B端企业客户收入开始起量,例如小米、亚马逊云科技、蓝色光标等2万多家企业客户已调用可灵的API服务,爱诗科技也有近20%的收入来自API [4] - 海外普通用户通过AI视频产品获得流量与收入,例如巴西用户制作的视频播放量破2.1亿,两月涨粉30万,促使他们愿意支付每月几十美元的订阅费 [3] 技术进步与产品迭代 - AI视频技术已跨越“可用性”临界点,生成时间从两天缩短至5到30秒,画质从780P飞跃至1080P以上,并支持自然语言交互、一键转风格、局部修改和动作捕捉 [5][6] - 技术进步源于厂商高频迭代,例如爱诗科技核心模型平均3个月迭代一次,可灵一年内完成了5个大版本升级 [6] - 技术进步使AI视频从尝鲜玩具转变为能稳定产出商业素材的生产力工具 [6] 资本市场表现 - AI视频成为2025年一级市场投资热点,爱诗科技、生数科技、LiblibAI等公司接连获得数亿元乃至上亿美元融资,海外公司Runway和Luma AI也在寻求巨额融资 [7] - 爱诗科技B轮和B+轮融资共获得超过7000万美元及1亿元人民币,投资意向金是融资额的数倍,显示投资人热情高涨 [7] - 巨人网络战略投资部负责人表示,AI视频发展速度超预期,爱诗科技的明确To C战略、月活涨至1400万以及API被广泛调用,改变了市场认知 [8] 用户增长与商业化触发 - 爱诗科技的用户增长超出预期,商业化并非提前规划,转折点发生在2024年11月其PixVerse上线的“变身特效”模板,该功能击中了TikTok用户需求,视频累计播放量数十亿,并登顶30多个国家的应用商店榜首 [9] - PixVerse用户两个月内暴涨1000万,突如其来的流量倒逼公司加速商业化进程,以避免被暴涨的算力成本拖垮 [9] 当前产品局限与用户反馈 - AI视频产品存在连续创作功能缺失、团队协作困难以及精细控制不足(如复杂动作错误率较高)等瓶颈 [10][11] - 不同产品各有优劣:拍我AI生成速度快,适合紧急项目;海螺AI呈现大动作能力较强;Vidu多参数功能好、一致性较强,但画质一般 [11] - 用户理想中的产品是能整合各家长处、支持连续创作的“超级工具” [11][12] 未来发展趋势 - 行业判断AI视频目前仍处早期,产品效果已达短视频平台内容消费水准,并已出现健康可持续的商业循环,未来商业收入提高是必然趋势 [12] - 预计2026年AI视频在电商、教育、短剧、漫剧等领域将看到更好的商业收益,下一步的决胜点在于能否开发出电影级画质的AI视频产品,届时可能出现平台级入口或交互式视频 [12]
IT员工抄公司量化代码赚8千万,被罚1.7亿;传毫末智行停工解散、赔偿不明;实习生抽中显卡被公司要求上交?回应来了 | AI周报
AI前线· 2025-11-23 13:33
IT员工窃取量化代码受罚 - 杭州某科技公司IT员工林艺平利用职务便利窃取公司量化交易代码 通过他人证券账户进行趋同交易 在2022年11月16日至2023年9月6日期间获利8857.69万元[3][4] - 浙江证监局对林艺平作出行政处罚 没收违法所得8857.69万元并处以等额罚款 合计罚没1.7715亿元 同时采取5年证券市场禁入措施[5] 自动驾驶公司运营动态 - 长城汽车旗下自动驾驶公司毫末智行被传已于11月22日通知员工停工解散 赔偿机制等后续安排尚未明确[6] - 毫末智行业务面临挑战 随着长城汽车向元戎启行等供应商倾斜 公司处境艰难 2025年曾出现技术副总裁艾锐等核心高管离职的人事动荡[7] 人工智能行业人才流动 - 字节跳动Seed大语言模型团队核心成员乔思远离职加入Meta 视觉模型研究团队核心成员蒋路和田值于今年中离职 蒋路加入苹果 今年该团队已有七位研究骨干离职[11] - TikTok主站视频推荐算法负责人宋洋离职加入Meta 将全面负责Instagram Reels推荐业务 据传Meta创始人扎克伯格亲自邀请并开出数千万美元年薪[14][15] 人工智能初创企业融资与技术进展 - 前百度副总裁景鲲创立的AI公司Genspark完成2.75亿美元B轮融资 融资后估值达12.5亿美元 跻身独角兽行列 同时发布全新平台Genspark AI Workspace[12] - Genspark创始团队背景豪华 CEO景鲲为前百度集团副总裁 CTO朱凯华曾在谷歌开创AI驱动搜索排序技术 COO桑文为MIT博士[13] AI硬件公司运营状况 - Rabbit公司被曝已连续数月拖欠员工工资 部分员工从10月起罢工 但公司仍声称计划在2026年推出下一代AI硬件[16] - Rabbit R1设备实际表现被用户指出远逊于发布会效果 例如实景拍摄需等待20秒才回应 被指如同低端安卓手机安装APK文件[16] 互联网公司AI产品发布与市场反应 - 阿里巴巴AI应用"千问"公测首日因用户涌入过载出现服务拥堵 "阿里巴巴千问崩了"话题登上微博热搜 公司回应称状态良好并计划推出国际版[20] - 蚂蚁集团全模态通用AI助手"灵光"上线两天下载量突破50万 冲上App Store总榜第七 但其闪应用功能因流量过大暂时无法使用[21][22] 人形机器人领域技术争议 - 优必选发布人形机器人Walker S2量产交付视频后 遭Figure创始人布雷特·阿德科克质疑视频造假 称机器人方阵为电脑特效[23] - 优必选回应质疑并发布一镜到底原速视频 公司CBO谭旻表示质疑源于对中国智能制造实力缺乏了解 并称公司公布的所有订单均向公众负责[24] 人工智能大模型技术突破 - 谷歌上线Gemini 3 Pro Image Preview图像模型 支持4K分辨率输出 在MathArena基准测试中达到23.4%正确率 远超其他模型1%左右水平[29][30] - OpenAI推出GPT-5.1-Codex-Max编程模型 专为长时间运行任务设计 采用压缩技术可处理百万级别Token 在SWE-Bench Verified任务中思考Token减少30%[32][33] AI智能体与专用工具发展 - 马斯克xAI公司推出Grok 4.1 Fast模型和Agent Tools API Grok 4.1 Fast拥有200万token上下文窗口 在智能体调用测评中以93.3%得分位居榜首[34][35] - 非营利研究机构FutureHouse发布AI科研系统Kosmos 单次12小时运行可阅读1500篇论文并生成4.2万行分析代码 工作量相当于人类团队半年产出[36] AI在教育与健康领域应用 - 斑马口语正式上线 号称全球首个AI外教一对一产品 基于猿力大模型打造 具备超人类教学能力 能实现低延迟实时对话和精准发音纠错[37] - Lumia公司推出智能耳环Lumia 2 重量不足1克 满电续航8天 可高精度追踪睡眠、体温、月经周期等健康数据 号称"全球最小可穿戴设备"[41] 企业AI应用与开源项目 - 微博发布自研开源大模型VibeThinker 拥有15亿参数 单次训练成本仅7800美元 在国际数学竞赛基准测试上击败DeepSeek R1模型[39] - OceanBase发布并开源首款AI数据库seekdb 开发者仅需三行代码即可构建知识库等AI应用 支持百亿级多模数据检索[40]