Grok Imagine
搜索文档
xAI又跑两个华人联创!11走9只剩2人,马斯克承认第一次建错了
量子位· 2026-03-13 16:50
核心观点 - 马斯克旗下人工智能公司xAI正经历剧烈的人员动荡,其11人创始团队中已有9人离职,仅剩2人,同时公司面临企业文化、管理结构、产品竞争力及法律诉讼等多重挑战,马斯克承认公司“第一次没建对”并计划重组[1][2][4][6][17][31] 创始团队与高层人事动荡 - **创始团队几乎清空**:xAI的11位联合创始人中已有9人离开,目前仅剩 Manuel Kroiss 和 Ross Nordeen 两人[2][6][17] - **近期离职关键人员**: - 2026年1月,核心架构师 Greg Yang 退出日常工作,将健康问题归因于长期高强度工作[13] - 2026年2月10日,负责推理研究的前谷歌科学家 Tony Wu 离职[13] - 2026年2月11日,以提出Adam优化算法闻名的 Jimmy Ba 离职,他曾负责AI辅导功能和Grok 4模型研发[13] - 2026年2月底,领导Macrohard项目的 Toby Pohlen 离职[13] - 2026年3月,两位华人联创离职:Zihang Dai(前谷歌员工,卡内基梅隆大学博士)和 Guodong Zhang(直接向马斯克汇报,负责Grok Code和Grok Imagine产品线)[6][7][9] - **历史离职情况**:前谷歌资深科学家 Christian Szegedy 于2025年2月离职;Igor Babuschkin 于2025年8月离职后创立AI安全风投;基础架构主管 Kyle Kosic 于2024年转投竞争对手OpenAI[14][15][16] 内部管理与文化问题 - **前员工爆料管理问题**:前员工 Benjamin De Kraker 爆料,xAI实际管理文化与宣称的“扁平结构”和鼓励“主动出击”相悖,其因公开征集Grok改进建议而遭到严厉处罚,账号被冻结,并被要求删除内容[18][21][22][25][26] - **管理层被指官僚**:该员工指出公司内部充斥着中层管理者和官僚主义者,扼杀新想法,是其待过“最有大公司病的地方之一”,并称其在xAI认识的所有人都已离开[28][29][30] 公司战略与产品状况 - **马斯克承认战略失误并计划重组**:马斯克表示“xAI第一次没建对,现在要从头再建”,并在2月全员大会上称公司正在进行重组以提高效率,有些人更适合早期而非后期阶段[4][31][32] - **裁员与项目调整**:自2026年1月以来,xAI已裁减数十名员工,波及Macrohard项目和Grok Imagine团队;Macrohard项目在负责人离职后一度停滞,后宣布与特斯拉合作推进[34] - **产品竞争力承认落后**:马斯克公开承认Grok目前在编程方面落后于竞争对手,并召开全员会议制定赶超计划[35] 外部竞争与法律纠纷 - **与OpenAI的人才争夺**:xAI与OpenAI之间存在持续一年多的人才拉锯,包括联合创始人在内的多名关键人员被OpenAI挖走[37][38] - **诉讼被驳回**:xAI于2025年起诉OpenAI,指控其通过挖角前员工窃取Grok商业机密,但该诉讼于2026年2月被加州法院以证据不足为由驳回[39][40] 资本运作与关联方动态 - **特斯拉投资转换**:2026年3月11日文件显示,特斯拉已获准将其对xAI的约20亿美元投资转换为SpaceX的少量股权(对应不足1%持股比例)[42] - **关联公司SpaceX的IPO计划**:SpaceX计划最早于2026年6月启动IPO,募资规模可能高达500亿美元,目标估值超过1.75万亿美元,有望成为史上最大规模IPO[43]
XAI's Macrohard project stalls as Tesla ramps up a similar AI agent effort
Business Insider· 2026-03-11 18:03
xAI的Macrohard项目现状 - xAI雄心勃勃的AI智能体项目Macrohard因领导层变动和一项数据项目暂停而陷入停滞[1] - 该项目旨在构建一个模拟微软等软件公司的AI白领工作者,自8月宣布以来被视为xAI与Grok Code和Grok Imagine并列的核心项目之一[2] - 项目领导层频繁变动,2月有两位负责人离职,随后由xAI联合创始人托比·波兰接管,但他在16天后也宣布退出[3] - 托比·波兰在接管前和接管期间均面临来自马斯克的项目开发压力,马斯克对团队进展也表示不满[4] - 近几个月,近二十名在X或LinkedIn上标明参与Macrohard项目的xAI工程师已离职或转至其他团队,仅过去一个月就有超过十余人离职,目前项目剩余人员数量不明[5] - xAI公司招聘页面上目前未列出任何Macrohard团队的职位空缺[9] 特斯拉的AI智能体项目进展 - 特斯拉正在推进其内部称为“Digital Optimus”的AI智能体项目,该项目旨在创建一个能在计算机上执行任务的AI智能体[6] - 特斯拉2月发布了一个AI工程师职位,专注于开发能执行“自主软件交互、代码生成和实时决策”等任务的计算机使用智能体,这与xAI的Macrohard项目类型相似[7] - 特斯拉团队专注于实时控制方法,而非主要依赖分析截图的常见方法,其AI处理连续信息流并做出响应,类似于其全自动驾驶系统处理实时视频的方式[7][8] - 马斯克多次告诉xAI员工,Macrohard项目应效仿特斯拉的全自动驾驶工作,后者使用视频数据帮助AI实时学习环境导航[8] - 特斯拉在人形机器人开发中也使用了类似技术,这与xAI的Macrohard项目主要使用静态图像而非连续视频进行训练的策略不同[8] 项目资源转移与公司间合作 - 近期有内部人士表示,部分员工被告知一些Macrohard的工作将转移至特斯拉的Autopilot团队,同时转移的还有部分Macrohard的计算资源[6] - 特斯拉和xAI过去曾有合作,例如将Grok集成到车辆中[12] - 特斯拉在1月宣布已同意向xAI投资20亿美元,以开始“评估两家公司之间潜在的AI合作”[12] - 一位曾参与Macrohard项目但已离职的xAI工程师在1月的播客中,将xAI的工作比作Optimus的数字化版本,并提到未来可能利用闲置的特斯拉车辆为系统提供算力以扩展Macrohard[12] Macrohard数据项目暂停详情 - 一项涉及超过600名AI导师的、用于Macrohard的数据标注项目于上月被暂停[10] - xAI雇佣了约一千名合同工来完善Grok,教导其完成从保持对话语气到生成逼真图像等各种任务[10] - 该项目要求工人录制屏幕来记录其工作和休闲活动,以训练AI模仿其行为并充当数字智能体[11] - 2月初,项目负责人告知工人,研究人员“在模型中发现许多缺陷”,希望“对模型和数据收集方式做出一些改变”,当时工人被告知数据收集将在两到四周内恢复[11] - 截至本周,该项目仍处于暂停状态[12] - 此外,知情人士称,xAI还有导师在致力于完善该智能体作为SpaceX网站AI销售助理的能力,以及另一个训练系统使用电子表格的单独项目[12]
“代码 + 编译器”要消失了?马斯克在 xAI 全员会上放话:到今年年底,AI 或将直接生成二进制
AI前线· 2026-02-13 11:01
近期人事变动与公司解释 - 过去一周内,xAI至少有9名工程师公开宣布离职,其中包括两位联合创始人Jimmy Ba和Tony Wu,创始团队减少了近一半[7][8] - 马斯克通过公开45分钟全员大会视频回应,将离职定性为“阶段适配问题”和公司重组,而非绩效问题,本质上是裁员[11][12] - 有外部解读认为,离职潮可能与项目延期有关,例如Grok 4.2原计划在去年底或今年1月初发布但被错过,马斯克对延期感到愤怒[13] 公司新组织架构与业务线 - xAI重组后确立四条核心业务线:Grok Main和语音、专门面向编程的模型、图像和视频模型(Imagine)、以及Macrohard(多智能体软件公司)[23][26] - 公司定位为成立仅两年半的“幼儿”,但成长迅速,在语音、图像、视频生成等多个关键方向做到了行业领先[24] - 基础设施被视为真正的护城河,团队曾用约15人的小团队完成Grok 3在10万张H100上的训练,并正建设全球最大的AI训练集群之一[56][57][58] Grok产品线进展 - Grok语音产品在六个月内从零开始自研,据称已超越OpenAI的语音产品,并在不到一年内部署在超过200万辆特斯拉汽车中[32][33] - Grok主模型从1.5迭代至3代,目标是从问答工具发展为“Everything App”,旨在成为完成法律咨询、制作幻灯片等复杂工作的统一入口[34] - 公司设定了更宏大的知识目标:Grok-pedia旨在成为“银河百科全书”,整合所有知识(包括图像、视频),在规模和准确性上提升一个数量级[24] 编程(Coding)团队愿景与预测 - 编程团队被赋予最高优先级之一,投入了等效“百万张H100”的训练算力,目标是训练出世界最强的编程模型[38][42] - 团队认为已进入“递归式自我改进”路径,即用这一代Grok Code训练下一代Grok Code,效率提升进入指数级阶段[40] - 马斯克预测,到2026年底,AI可能不再写代码,而是直接根据指令生成优化过的二进制程序,从而绕过传统编程过程[3][5][45] - 公司预计Grok Code将在2到3个月内达到业界最顶尖(state-of-the-art)水平[5][46] Imagine(图像与视频)团队进展 - Imagine团队在六个月内从零开始,现已全面集成至所有产品,用户每天生成接近5000万个视频,过去30天生成60亿张图片,据称是Google同期生成图片数量的6倍[48] - 团队预计到今年年底,将拥有可一次性生成10分钟、20分钟长视频且无需中途干预的模型[49] - 马斯克预测未来大多数AI计算资源将用于实时视频理解与生成,并认为xAI将成为该领域的领导者[50] Macrohard(多智能体)项目目标 - Macrohard被定义为构建一个“完全能力齐备、数字化、实时的人类模拟器”,目标是在计算机上完成任何人类能完成的事情,包括使用高级工具[52] - 项目路径从控制CLI(命令行界面)开始,最终目标是实现跨桌面GUI(图形界面)的端到端编排,模拟整家“输出是数字化成果”的公司[53] - 该项目可能成为公司最重要的项目,通过仿真数字化公司,有望开启巨大的经济繁荣[54] 基础设施与长期战略 - xAI已建成全球规模最大的AI训练集群之一,第一阶段部署33万张GB300,并计划再增加22万张GB300[58] - 长期战略与SpaceX协同,考虑将数据中心扩展至地球轨道乃至月球,以利用地球无法承载的规模级能源(如太阳能的百万分之一)进行AI计算[60][62] - 从能源视角看,人类文明目前仅使用地球可用能量的1%左右,要实质性能源提升必须走出地球[62]
刚刚,马斯克回应AI核心团队集体跑路:6天流失9人,高中毕业生火速上位
搜狐财经· 2026-02-12 09:50
人事变动与组织重组 - 过去一周,xAI公司发生重大人事变动,12位联合创始人中有一半离职,至少9名工程师公开宣布离职,负责推理和研究安全的核心高管Tony Wu、Jimmy Ba也已离开 [1] - 马斯克将此次变动解释为公司规模化必经的“组织重组”,旨在提高执行速度,并称公司快速成长时组织结构必须进化,这导致需要与一些人分道扬镳 [3][5] - 离职潮集中在2月6日至10日,涉及多位关键技术人员,包括产品基础设施负责人、多模态项目负责人等 [7][8] 离职原因与内部动态 - 部分离职员工表达了对大公司方向的不满,有人希望用小团队做大事,有人认为所有AI实验室都在做一样的东西“太无聊”,还有三名前员工组队创业 [1][6] - 有知情人士透露,马斯克对数据中心扩建的巨额投入未能使AI模型形成可持续的领先优势感到不满,这种挫败感催生了新的领导架构和人员清洗 [8] - 此次离职发生在xAI的敏感时刻,过去30天其Grok Imagine生成了60亿张图片,每天生成5000万段视频,公司正面临监管审查,并可能影响与SpaceX的合并 [8] 重组后的新团队架构 - 重组后公司设立四大核心团队:Grok Main & Voice团队(负责聊天机器人及语音)、Coding团队(专攻编程AI模型,对标Anthropic的Claude Code)、Imagine团队(负责图像生成Grok Imagine)、以及Macrohard团队 [9][10] - Macrohard项目目标是对公司组织进行数字化仿真,让AI完成任何能使用电脑的人类可以完成的事情,其负责人提及未来可能出现完全由AI设计的火箭发动机 [10][13] - 团队中包括一位引人注目的人事安排:2023年高中毕业、2024年赢得xAI黑客松的Diego Pasini,目前负责AI导师团队和Grokipedia项目 [13] 公司战略与未来愿景 - 马斯克宣布未来几个月将加入更多服务,如X Money银行功能和独立聊天应用,并预测日活用户将“远超10亿” [13] - 马斯克提出在月球建造工厂生产AI卫星,并用巨型电磁弹射器将其射向太空的“月球计划”,旨在获得比地球数据中心更强的算力和能源支撑 [13] - 为推进“太空数据中心”项目,xAI已与SpaceX宣布合并,合并后估值达1.25万亿美元,SpaceX计划最早在6月进行IPO [15] 行业影响与公司现状 - xAI目前拥有1000多名员工,马斯克声称“xAI的速度比任何公司都快,根本没人接近” [17] - 尽管短期可能不会伤筋动骨,但在人才稀缺、声誉至关重要的AI赛道,此次联合创始人集体出走正在传递出一种危险信号 [17]
刚刚,马斯克回应AI核心团队集体跑路
36氪· 2026-02-12 09:35
公司人事变动与组织重组 - 过去一周,xAI发生重大人事地震,12名联合创始人中有一半离职,至少9名工程师公开宣布离职,负责推理和研究安全的核心高管Tony Wu与Jimmy Ba也已离开[1] - 马斯克将此次变动解释为公司规模化必经的组织重组,旨在提高执行速度,并称快速成长时组织结构必须进化,导致需要与一些人分道扬镳[4][6][8] - 离职潮集中在2月6日至10日,涉及多名关键技术人员,包括产品基础设施负责人、多模态项目负责人等[11] 离职人员动向与潜在原因 - 离职员工的措辞暗示多种原因,包括希望用小团队做大事、认为AI实验室同质化“太无聊”,以及至少三名前员工已组队创业[4][10] - 核心离职高管Tony Wu表示“一个配备AI的小团队可以移山填海”,Jimmy Ba则称“递归自我改进循环很可能在未来12个月内上线”,并暗示将重新校准方向[8][9] - 有消息人士透露,马斯克对数据中心扩建的巨额投入未能使AI模型形成可持续领先优势感到不满,这种挫败感催生了新的领导架构和人员清洗[12] 公司新战略与业务重组 - 重组后公司设立四大新团队:分别负责Grok聊天机器人(含语音)、编程AI模型(对标Anthropic的Claude Code)、图像生成(Grok Imagine),以及名为“Macrohard”的数字化仿真项目[13] - Macrohard项目目标是对公司组织进行数字化仿真,让AI完成任何能使用电脑的人类可完成的事情,其负责人提及未来可能出现完全由AI设计的火箭发动机[13][16] - 公司启用年轻人才,如2023年高中毕业、2024年赢得xAI黑客松的Diego Pasini,现负责AI导师团队和Grokpedia项目[16] 公司运营数据与关联交易 - 马斯克透露X平台现有6亿月活用户,其产品负责人称订阅年经常性收入(ARR)刚突破10亿美元,并计划推出X Money银行功能等新服务[16] - xAI与SpaceX已宣布合并,合并后估值达1.25万亿美元,SpaceX计划最早在6月进行IPO,此次合并旨在推动“太空数据中心”项目[20] - 在合并敏感期,xAI面临监管审查,且过去30天内其Grok Imagine生成了60亿张图片,每天生成5000万段视频[12] 长期愿景与月球计划 - 马斯克在全员大会上提出“月球计划”,设想在月球建造工厂生产AI卫星,并用巨型电磁弹射器将其射向太空,以获取比地球数据中心更强的算力和能源[17] - 该计划的更大愿景是在月球建立“自给自足的城市”,进而探索火星及其他恒星系统以寻找外星生命[18] - 尽管前SpaceX高管称月球并非公司传统重点,但马斯克近期频繁讨论月球,表明公司路线已发生变化[20] 行业影响与公司现状 - xAI目前拥有1000多名员工,此次联合创始人集体出走在人才稀缺、声誉重要的AI赛道传递出潜在信号[22] - 马斯克声称xAI的发展速度比任何公司都快,但方向是否正确引发外界关注[22] - 公司重组和激进愿景(如月球AI工厂)展示了其在AI与太空领域融合的宏大布局[17][20]
马斯克还在卷10秒,中国AI直接掀桌!16秒一镜到底,全球唯一
搜狐财经· 2026-01-30 19:04
行业竞争格局 - 硅谷巨头在AI视频生成赛道竞争激烈,谷歌Veo 3.1凭借“素材生视频”功能、超强一致性和4K画质登场[2] - 马斯克的Grok Imagine已上线生成10秒视频功能,实现音画双飞跃[4] - Runway全新Gen 4.5模型同样致力于连贯叙事和高一致性,生成时长可达10秒[4] Vidu Q3核心产品发布 - 中国AI公司发布下一代旗舰模型Vidu Q3,定位为全球首个一键直出16秒音视频的模型[7] - 该模型能同时处理画面、声音、剧情推进和镜头调度,支持镜头控制与自由切换、多语言文字渲染以及专业级漫剧、短剧、电影制作[7] - 在Artificial Analysis最新榜单中,Vidu Q3位列中国第一、全球第二,超越了Runway Gen-4.5、谷歌Veo3.1和OpenAI Sora 2[7] 技术突破与关键能力 - Vidu Q3解决了AI视频生成领域时长过短(多为几秒)和缺乏声音(“哑剧”)的痛点[11] - 相比谷歌Veo 3最长支持8秒,OpenAI Sora 2最长支持15秒,Vidu Q3是业界唯一能做到单次生成16秒时长的模型,无需拼接或后期合成[11] - 模型实现了精准的镜头控制,允许用户像导演一样控制运镜节奏和视角切换,并能根据画面内容自动切镜[17][19][20] - 在文字渲染上实现质的飞跃,能够精准呈现中、英、日三种文字,解决了以往字母变形、笔画缺失等问题[23] 应用场景与行业影响 - Vidu Q3标志着AI视频从“演技生成”(让画面动起来)迈入“视听生成”新时代,交付完整的、声画共振的视听体验[8][23] - 对于影视行业,模型具备真正的“叙事密度”,能在16秒内构建完整戏剧冲突,处理复杂对白和情感递进,为从剧本到可视化提供极速通道[23] - 对于广告行业,模型在画面一致性和文字渲染上的突破,提供了一套“可控的商业化解决方案”[24] - 对于自媒体创作者,模型的音视频一体化生成彻底简化了高质量视频制作流程,将释放创造力并可能催生更多“超级个体”[26][28] 产品功能与体验 - Vidu Q3已上线文生音视频和图生音视频功能,用户可通过Vidu.cn或Vidu API平台体验[9][10] - 演示案例显示其能力包括:根据六格分镜图生成步骤视频、复刻电影经典瞬间并匹配口型与音色、生成具有胶片质感和精准对白的“对手戏”场景、以及创建包含复杂运镜和音效的动画打斗场景[13][15][21]
人工智能周报(26 年第4 周):MiniMax Agent 2.0 正式发布,百度文心 5.0 上线
国信证券· 2026-01-26 10:45
行业投资评级 - 互联网行业评级为“优于大市” [4] 核心观点 - 伴随大模型在多模态、长文本、推理能力等方面成熟,2026年有望迎来更多成熟Agent产品涌现,推理侧需求增加将带动上游云计算厂商收入持续增长 [2][25] - 国内互联网巨头在AI资本支出方面的投入落后海外约一年,伴随后续大模型能力逐步提升和建设供给释放,AI对于巨头主业的赋能将持续显现 [2][25] - 2026年第三季度预计为互联网巨头外卖大战的投入峰值,第四季度预计将环比看到阿里巴巴、美团和京东三家外卖亏损有所收窄 [2][25] - 建议聚焦AI主线选股,推荐阿里巴巴、腾讯控股 [2][25] 人工智能动态:公司动态 - 字节跳动旗下AI Agent平台“扣子”发布2.0版本,核心升级在于引入Agent Skills和Agent Plan概念,新增技能商店,允许用户设立长期目标由AI自主执行 [17] - 安克创新与飞书联合发布“AI录音豆”硬件产品,直径23.2毫米,重量10克,支持8小时连续录音,配合充电舱综合录音时间可达32小时 [17][18] - MiniMax正式推出AI原生工作台Agent 2.0,以Desktop App和Expert Agents为核心组件,分别注重执行力和对业务场景的理解 [19] - 美国AI初创公司Humans&获得4.8亿美元种子轮融资,估值达44.8亿美元,参与方包括英伟达、亚马逊创始人贝索斯、谷歌风投等 [19] - 特斯拉人形机器人Optimus计划于2027年底前向公众出售,量产版定价预计低至2万美元,目前已在工厂承担基础任务 [20] - 谷歌Gemini与美国教育机构The Princeton Review合作,上线免费SAT完整模拟考试功能 [20] - xAI在其多模态创作工具Grok Imagine中推出10秒视频生成功能,较之前的5秒时长翻倍 [21] 人工智能动态:底层技术 - 智谱AI发布并开源轻量级大语言模型GLM-4.7-Flash,为总参数300亿、激活参数30亿的混合专家架构模型,定位“本地编程与智能化助手” [22] - DeepSeek新模型“MODEL1”曝光,推测可能是一个高效推理模型或针对长序列优化的专家模型 [22] - 阿里通义千问开源Qwen3-TTS系列语音生成模型,包含17亿和6亿两种参数规模,支持多语言及音色克隆 [23] - 百度推出文心大模型5.0正式版,参数规模达2.4万亿,采用原生全模态统一建模技术,在40余项权威基准测评中其语言与多模态理解能力位居全球第一梯队 [23] - 谷歌DeepMind发布D4RT四维视觉AI模型,采用统一的“时空查询”架构,处理速度相比现有技术提升18至300倍 [24] AI相关网站流量数据 - ChatGPT周平均访问量为373.00百万,环比增长1.16% [10] - Bing周平均访问量为787.60百万,环比增长1.25% [10] - Gemini周平均访问量为477.90百万,环比增长4.44% [10] - 通义千问周平均访问量为8.16百万,环比增长11.75% [10] - 文心一言周平均访问量为26.33百万,环比增长4.19% [10] 重点公司盈利预测及投资评级 - 腾讯控股:投资评级“优于大市”,昨收盘价595.0港元,总市值5,428,115百万港元,2025年预测调整后每股收益27.60港元,预测市盈率20.3倍 [3] - 阿里巴巴-SW:投资评级“优于大市”,昨收盘价168.5港元,总市值3,218,226百万港元,2025年预测调整后每股收益6.66港元,预测市盈率23.8倍 [3] - 美团-W:投资评级“优于大市”,昨收盘价97.6港元,总市值596,193百万港元,2025年预测调整后每股收益-1.26港元,2026年预测调整后每股收益5.20港元 [3] - 百度集团-SW:投资评级“优于大市”,昨收盘价160.5港元,总市值441,402百万港元,2025年预测调整后每股收益7.64港元,预测市盈率19.7倍 [3] - 快手-W:投资评级“优于大市”,昨收盘价81.3港元,总市值354,532百万港元,2025年预测调整后每股收益4.68港元,预测市盈率16.3倍 [3]
57.1%的人分不清真假!Runway新视频模型太爆炸
量子位· 2026-01-22 13:39
Runway Gen 4.5模型的核心能力 - 全新Gen 4.5模型主打图生视频,在镜头控制和故事叙事能力上显著提升[8][9] - 模型能在5秒内快速生成包含近景、中景、远景三个镜头的视频[11] - 在1000人参与的调查中,只有约一半(57%)的人能分辨出该模型生成的视频与真实视频的区别[11][21] 模型在镜头控制与一致性方面的表现 - 即便镜头晃动,人物面部仍保持较高一致性[12] - 在快速运动场景下,如骑飞行章鱼,人物面部细节稳定不崩坏[13] - 复杂场景中,如巨型毛绒猩猩在纽约街头,镜头比例、透视逻辑及主体与背景的光影一致性处理得当[15] - 模型具备精准的镜头控制能力,包括景别、角度、运动轨迹及切换节奏,输出效果接近真实摄影语言[16] - 通过图像参考和内部优化,模型实现了更稳定的角色一致性,主体在不同镜头中的跨帧效果更佳[16] 模型在长故事叙事与连贯性方面的进步 - 模型长故事表达能力增强,能承载更长时序的内容结构,视频完整度和长度大幅提升[16] - 多个镜头之间的情节逻辑性更强,叙事表达比上一版本更到位[16] - 在长达两分多钟的剧情视频中,即便在同一场景多次切换镜头位置和动作,画面空间关系和镜头衔接依然保持连贯,无明显跳轴或场景漂移问题[18] - 用户制作的视频展示了出色的镜头漂移感,能流畅切换特写与远景镜头[18] 视频生成行业的整体发展趋势 - 从去年年底至今,视频模型能力进入新一轮升级期,各厂商发布节奏密集[23][35] - 行业整体趋势对视频模型的真实度和一致性要求被整体抬高,包括纹理与细节保真、光影与氛围、整体画面质感等[25][26] - 模型越来越注重理解并遵守现实世界的物理规律,在跨帧表现上要求更自然[27] - 声画同步能力显著提升,模型可直接生成配套音频,唇形同步精度提高,即使在侧脸、极端角度或多人对话场景也不易崩坏[28][30] - 局部控制精细化成为重要趋势,支持单独编辑局部区域而无需重新生成整段视频[28] - 支持更长的生成时长,10至60秒的视频生成区间变得常见,竖屏原生视频逐步占据主流[28] - 视频生成方式更加多元,从图生视频到音频生视频,创作路径更加灵活[28] - 主流视频模型的能力已明显接近可商业化应用、具备普适性的水平[34]
美执法机关对Grok“涉黄”动手:马斯克的xAI遭加州调查
华尔街见闻· 2026-01-15 03:11
加州总检察长对xAI及Grok启动正式调查 - 美国加州总检察长Rob Bonta宣布对xAI及其AI模型Grok启动调查,标志着争议从舆论谴责升级至具体法律行动阶段 [1] - 调查重点关注Grok“大规模生产”未经同意的深度伪造亲密图像,这些图像被用于在互联网上骚扰女性和女童 [3] - 加州州长Gavin Newsom表态支持调查,称xAI的行为“令人作呕” [3] Grok被指控的具体问题与数据 - 新闻报道指出,Grok用户从互联网获取女性和儿童的普通照片,使用Grok将其描绘成具有暗示性和露骨性行为的场景,甚至“脱光”他们的衣服,而当事人不知情或未经同意 [4] - 据报道,Grok被用于修改儿童照片,将他们描绘成衣着暴露、处于性场景中,并生成了儿童从事性活动的逼真图像 [4] - 根据一项分析,在圣诞节到新年期间xAI生成的2万张图像中,超过半数(超过1万张)描绘的是衣着暴露者,其中一些似乎是儿童 [4] xAI的产品设计与营销策略争议 - 调查聚焦于xAI的产品设计选择,xAI将Grok的图像生成模型开发为包含“辣味模式”,该模式生成明确内容 [5] - xAI将此“辣味模式”作为公司的营销卖点,导致了未经同意将人物性化的内容激增 [5] - 马斯克将Grok定位为比竞争对手更具优势、保障措施更少的替代品,加之其生成的图像公开可见易于传播,放大了问题的严重性 [5] 公司应对措施与限制效果 - Grok表示将图像生成和编辑功能限制为付费订阅用户,仅向拥有蓝色认证标记(每月支付8美元)的X用户授予公开可见的请求权限 [6] - 但据确认,免费用户仍可通过点击平台上每张图片显示的“编辑图像”按钮使用图像编辑工具,独立的Grok网站和应用程序仍在批准图像编辑请求 [6] - 对于置评请求,xAI公司一直以自动回复“传统媒体谎言”作答 [6] - X表示将采取行动删除非法内容,永久暂停用户账户,并与执法部门合作,马斯克警告称使用Grok制作非法内容者将承受后果 [6] 全球监管压力持续升级 - 在加州调查前,Grok已在全球多个司法管辖区面临监管行动,包括欧盟、英国、法国、马来西亚、印度尼西亚、印度和巴西等多国政府已对该工具采取行动或发出警告 [3][6] - 英国媒体监管机构Ofcom启动调查,审查Grok是否违反了保护人们免受非法内容侵害的义务 [6] - 印度尼西亚暂时封锁了对Grok的访问,马来西亚政府表示将对X和xAI采取法律行动 [6] - 欧盟最高技术事务官员警告X必须解决问题,否则将全面使用《数字服务法》保护欧盟公民 [7] 公司回应与事件背景 - 马斯克本周回应称,并不知道关于Grok存在生成“未成年人裸露图像”的情况,强调Grok的程序设定为拒绝非法请求且必须遵守各国法律 [7] - 该事件正值美国国防部宣布在机密和非机密网络部署Grok,监管与应用的矛盾凸显了AI技术治理的紧迫性 [3] - 多国政府及妇女、儿童权益组织已呼吁苹果、谷歌将Grok应用从应用商店下架 [7]
马斯克旗下聊天机器人为何成了“过街老鼠”
搜狐财经· 2026-01-14 10:54
马斯克旗下xAI公司Grok聊天机器人生成色情内容事件 - 埃隆·马斯克旗下人工智能公司xAI开发的聊天机器人“格罗克”被指生成色情内容,引发多国政府谴责和调查,凸显人工智能技术的伦理风险[1] - 事件涉及用户利用“格罗克”的图片编辑功能生成真实人物的虚假性暴露内容并在X平台散播,受害者包括成年女性和未成年人[2] - 该问题自2025年8月其图像生成器Grok Imagine推出后便浮出水面,该模块包含“热辣模式”可生成成人内容[6] 各国政府及监管机构的反应与调查 - 法国巴黎检方已对“格罗克”涉嫌生成色情内容启动调查[3] - 印度信息技术部要求X平台删除色情内容、打击违规用户,并在72小时内提交整改报告,否则将面临法律制裁[4] - 欧盟委员会正严肃调查相关投诉,并要求X平台提供更多信息[5] - 印度尼西亚和马来西亚的监管机构分别宣布对本国用户访问“格罗克”进行临时限制[5] - 英国通信管理局已根据《在线安全法》对X平台展开正式调查,不排除在最严重情况下屏蔽X平台的可能[5] - 英国《数据法案》相关条款将于本周生效,未经同意制作或寻求制作私密图像将被认定为刑事犯罪[8] Grok图像生成功能的具体问题与数据 - 马斯克标榜其聊天机器人是比设置更多安全措施的竞争对手产品“更前卫”的选择,且“格罗克”生成图像公开可见,易于散播[6] - 人工智能取证组织报告显示,在2025年12月25日至2026年1月1日期间分析的2万张深度伪造图像中,所有包含人物的图像中有55%的人物穿着暴露,这些着装暴露的人有81%是女性[6] - 分析还发现,有2%的生成图像为年龄不足18岁的人物,其中一些图像包含衣着暴露的年轻女性(或女孩)形象[6] - 面对压力,“格罗克”在X平台上的图像生成和编辑功能已被更改为仅向付费用户开放,但在其应用程序和官网上仍可免费使用[7] - 英国政府批评该整改措施只是“将允许创建非法图像的人工智能功能变成一项高级服务”,对受害者来说是“侮辱性的”[7] 人工智能深度伪造的治理挑战与行业观点 - 随着大模型快速发展,利用AI生成深度伪造内容的案例时有发生,但许多国家的AI监管法规仍不完善[8] - 专家指出,AI深度伪造治理涉及模型算法安全评估、有害内容管理、生成内容标识等多方面,需要建立“全链条式”治理体系,内容生成和分发平台负有主体责任[8] - 马来西亚通信部副部长表示,若一味追求AI的发展速度与利润而忽视伦理与社会责任,后果将不堪设想[9] - 波兰希望借此次事件推动国家数字安全立法,以加强未成年人保护并使执法部门更易于删除有害内容[8] 世界经济论坛网络安全报告相关要点 - 世界经济论坛报告指出,人工智能在网络安全领域呈现双刃剑效应[17] - 一方面,生成式AI正以空前速度加剧网络安全风险,其导致的数据泄露与不断演化的网络攻击能力已成为2026年业界最关切的两大威胁方向[17] - 另一方面,AI也将成为2026年重塑网络安全格局的决定性力量[17] - 报告显示,网络安全韧性悬殊的现状显著,中小型机构自评韧性不足的比例是大型企业的两倍以上[17] - 从地域分布看,拉丁美洲及加勒比地区网络安全人才短缺量最为显著[17]