《我的世界》
搜索文档
谢赛宁也玩MC?开源全新世界模型生成多人一致的游戏视角
机器之心· 2026-03-07 12:20
AI研究与游戏环境 - 电子游戏是AI领域发展的重要推动力,其构建的完整世界和易于理解的规则,可用于训练人工智能对物理世界的理解、智能体交互以及构建世界模型[1] - 在视觉相关AI研究中,《GTA》和《我的世界》是两座绕不开的“大山”,分别代表真实世界风格和虚拟自由风格[2] - 谢赛宁团队将世界模型的研究方向转向了《我的世界》[3] Solaris模型与核心贡献 - Solaris是谢赛宁团队开发的首个多人视频世界模型,能够同时生成多个玩家之间保持一致的第一视角视频[5] - 该模型的核心贡献之一是团队完全自主设计并构建的多人数据采集系统SolarisEngine,因为现有平台仅针对单人设定而设计[7] - SolarisEngine是一个可扩展的框架,支持在《我的世界》等游戏中进行协调的多智能体交互和同步视觉捕捉,由1260万帧协调的《我的世界》游戏游玩数据创建[7] 数据采集系统与数据集 - 研究团队从零开始搭建了SolarisEngine数据采集系统,因为市面上没有现成的系统可以用来采集真实的多人游戏数据[11] - 该系统以Mineflayer为基础,构建了通信层以支持机器人协作,并创建了一个涵盖建造、战斗、移动、采矿等核心交互任务的任务类型库[14] - 通过将控制机器人与摄像机机器人配对,并利用自定义服务端插件实现同步,系统解决了视觉画面提取并与动作对齐的问题[15] - 利用SolarisEngine,团队采集了首个带有动作标注、适用于训练世界模型的多人《我的世界》数据集,总计包含9240个任务回合,总计1264万帧[16][17] 模型架构与技术特点 - Solaris是一种可控的视频扩散模型,能够在给定各玩家历史观察与动作的条件下,联合预测多名玩家的未来观察结果[19] - 模型结合了流匹配与扩散强迫进行训练,其中每个玩家及每个时间步都会采样独立的噪声水平,这使得模型在学习对各玩家观察流进行去噪的同时,保持玩家间的一致性[19] - 模型基于MatrixGame 2.0构建,并进行了三项关键改进以支持多人模式:扩展动作空间、引入多人自注意力层以实现玩家间信息交换、以及添加可学习的玩家ID嵌入[20] - 该架构通过在序列维度上进行视觉交错来实现多人建模,多人信息通过一个共享的自注意力模块进行交换[22] 评估方法与实验结果 - 研究团队创建了Solaris Eval数据集,通过7个独特的、不参与训练的真值任务回合,来测试移动、定位、一致性、记忆和建造五种多人协作能力[23][24][26][28] - 在定量比较中,Solaris模型在多个评估类别中表现优于对比方法“帧拼接法”[27][29] - 具体数据:在“定位”能力上,Solaris的VLM评分为62.50,显著高于“帧拼接法”的53.13和“无预训练Solaris”的29.17;在“建造”能力上,Solaris的VLM评分为20.83,而其他两种方法均为0.00;在“一致性”能力上,Solaris的VLM评分为71.35,高于“帧拼接法”的53.11[29] - 尽管“帧拼接法”在“移动”评估中VLM评分(77.08)略高于Solaris(68.23),但定性分析发现该方法在面临“无操作”动作时会出现动作幻觉[27]
毫无游戏经验的新 CEO,能救得了 Xbox 吗?
搜狐财经· 2026-02-25 16:23
微软游戏部门领导层变动 - 微软游戏CEO菲尔·斯宾塞退休,Xbox总裁莎拉·邦德离职,而非由邦德接任,公司任命前人工智能高管阿莎·夏尔马为新任Xbox总裁 [1] - 领导层变动表明公司正大刀阔斧整顿团队并寻求全新发展思路,夏尔马缺乏游戏行业经验引发了Xbox粉丝的不满 [1] - 夏尔马在社媒上展示其游戏活动以回应质疑,她表示游戏是人类的艺术,并承诺“对糟糕的人工智能零容忍”,同时指出游戏需要新的“增长引擎”[3] 新任领导面临的挑战与表态 - 夏尔马承认自己并非资深玩家,其目标是“让Xbox成为最佳游戏平台,回归初心,推出伟大产品”,并认为营造人设是馊主意 [4] - 赢得玩家信任将是一场艰苦战斗,玩家群体并不打算轻易对她抱有信心 [4] - 微软官方声明强调夏尔马拥有丰富的平台构建、发展经验以及全球运营能力,能推动业绩增长 [5] 对前任领导菲尔·斯宾塞的评价 - 菲尔·斯宾塞资历深厚,自Xbox项目伊始便投身其中,曾成功挽救Xbox One并推动行业文化变革 [7] - 斯宾塞对Xbox的未来愿景存在问题,他急于将业务扩展至主机之外,致力于将Xbox打造成“游戏界的Netflix”,并在订阅服务和云游戏领域投入巨资 [7] - 其战略导致市场需求不旺,Game Pass用户规模不及预期,并造成了游戏销量流失、价值贬值以及为充实订阅服务内容而进行的高成本收购等问题 [8] 微软高层战略决策的影响 - 微软CEO萨提亚·纳德拉需为斥资697亿美元收购动视暴雪承担全部责任,该交易规模巨大,让公司在游戏领域的责任远超Xbox用户体量所能支撑的范围 [8] - 首席财务官艾米·胡德要求游戏业务实现30%的利润率,这一目标导致了游戏项目取消、工作室关闭,并迫使《极限竞速》和《光环》等核心IP登陆PlayStation 5平台以寻求盈利 [10] - 公司最高管理层的决策限制了新任领导的改革空间,下一代Xbox硬件的形态(一个基于Windows的高端平台)似乎已尘埃落定,预计最早明年问世 [10] 未来可能的战略调整方向 - 夏尔马可以扭转平台独占策略,她对独占话题持开放态度,但公司的盈利目标可能限制其做出决定 [12] - 可能会降低Game Pass的优先级,不再坚持首发游戏加入该服务,若服务增长乏力,这在财务上可能是必要的 [12] - 将工作室负责人马特·布蒂提拔为夏尔马的二把手,凸显了微软作为一家拥有庞大开发团队的巨型第三方发行商的现实,对《我的世界》《使命召唤》的重视程度与Xbox平台相当 [12] 组织内部问题与改革前景 - 马特·布蒂自2018年执掌工作室矩阵以来,其任期充斥着管理不善,导致项目排期混乱、游戏被砍以及工作室关停 [14] - 微软游戏业务迫切需要彻底革新,若缺乏这一点,夏尔马的改革空间将极其有限,大刀阔斧的裁员、关闭工作室和项目或许是她最有效的手段 [14] - 过去十余年的决策后果将微软游戏业务束缚在笨拙不堪的局面,要理顺需要强硬作风、远见卓识与持久毅力,夏尔马是否具备这些品质以及微软高层是否允许她施展能力仍是未知数 [14]
用4.39亿方块在《我的世界》手搓一款ChatGPT?玩家又一次“整活”,还把游戏玩出了新高度!
猿大侠· 2025-10-10 12:11
项目概述 - 开发者在《我的世界》游戏中构建了一个名为CraftGPT的功能性语言模型,该项目在社交媒体引发广泛关注[1] - 该项目完全使用游戏内的红石电路搭建,未使用命令方块或数据包等辅助工具[14] - 整个建筑占地规模达长1020方块×高260方块×宽1656方块,总计使用约4.39亿个方块[9] 技术规格 - 模型参数量为5,087,280个,在TinyChat数据集上使用Python进行训练,内容为基础英语对话[15] - 模型架构包含6层网络,embedding维度为240,词汇表大小为1920个token[16] - 为节省计算资源,大部分权重被量化为8位,但embedding和LayerNorm的权重分别保留18位和24位精度[17] - 模型上下文窗口仅为64个token,处理能力有限[18] 运行性能 - 生成一次回复需要约两个小时,若在标准游戏环境中运行可能耗时10年以上[22] - 必须使用MCHPRS(Minecraft高性能红石服务器)才能实现合理运行速度[22] - 最低需要32GB内存的电脑,推荐64GB或更高配置[23] 行业意义 - 该项目展示了在游戏环境中实现复杂计算系统的技术可行性[25] - 此前《我的世界》社区已出现16位CPU、运行《毁灭战士》的IRIS电脑等红石创新项目[25][26] - 有玩家在游戏中构建完整CNN神经网络,还有用红石实现神经网络的项目[26][29] - 开发者曾用红石搭建1Hz CPU,本次项目进一步提升了创意天花板[33]
用4.39亿方块在《我的世界》手搓一款ChatGPT?玩家又一次“整活”,还把游戏玩出了新高度
36氪· 2025-10-09 19:44
项目概述 - 开发者Sammyuri在《我的世界》游戏中构建了一个名为CraftGPT的功能性小型语言模型[4][5] - 该项目在游戏内占地面积巨大,长1020方块、高260方块、宽1656方块,总计使用了约4.39亿个方块[7] - 整个系统完全基于游戏内的红石电路搭建,未使用命令方块或数据包[13] 技术规格 - CraftGPT是一个拥有5,087,280个参数的小型语言模型[7][13] - 模型采用6层结构,embedding维度为240,词汇表大小为1920个token[13] - 大部分权重被量化为8位,但embedding和LayerNorm的权重分别保留了18位和24位的精度[14] - 模型使用Python在TinyChat数据集上训练,内容为基础英语对话[13] 系统组件 - 核心组件包括分词器、位置嵌入、词元嵌入、层归一化、240×240矩阵乘法器(4个)[12] - 其他关键部件包括多头注意力机制、键值缓存、960×240矩阵乘法器、修正线性单元[12] - 系统还包含240×960矩阵乘法器、第二层到第六层的循环处理、解嵌入矩阵乘法器等功能模块[12] 性能表现 - 模型上下文窗口非常小,仅能处理64个token的对话[14] - 生成一次回复需要等待数小时,在标准游戏设置下生成一次回复可能耗时10年以上[16] - 即使使用MCHPRS高性能红石服务器优化,生成一次回复仍可能需要几个小时[16] 运行要求 - 运行服务器至少需要32GB内存的电脑,推荐配置为64GB或更多[17] - 用户需要下载MCHPRS并设置plot scale为7,编译过程大约需要10分钟[17][18] - 运行时可使用-io参数启用优化编译,防止向玩家发送非输入/输出方块更新[17] 行业意义 - 该项目展示了在游戏环境中实现复杂计算系统的可能性,刷新了《我的世界》的创意天花板[20] - CraftGPT比GPT-1小约23倍,比GPT-3小175,000倍,但在有限资源下实现了AI功能[25] - 该项目被视为计算机领域令人佩服的成就,能力远超10年前开发的同类系统[25]
巴菲特教导Z世代:选对伙伴是致富的关键
财富FORTUNE· 2025-10-08 21:47
沃伦·巴菲特的职业理念 - 巴菲特认为成功的关键在于明确自身优势、选择合适的人共事以及不害怕犯错 [1] - 与正确的人共事至关重要,工作伙伴应具备智慧、活力和诚信三大首要特质 [3] - 尽早识别合作伙伴的关键特质至关重要,事后试图改变对方是无益的 [4] 成功伙伴关系的案例与警示 - 巴菲特与查理·芒格的伙伴关系延续一生,芒格担任其助手超过四十年,两人相互尊重并能促使对方以不同方式思考 [4][5] - 选错合作伙伴代价高昂,以萨姆·班克曼-弗里德为例,其破产的加密货币交易平台导致客户损失时间和信任 [5] 致富道路的多样性及核心建议 - 成为富翁有无数道路,例如比尔·盖茨编写计算机程序、杰夫·贝索斯在麦当劳工作、MrBeast向YouTube上传游戏视频 [6] - 失败在商业领域不可避免,拥有跌倒后重新站起来的毅力是关键 [6] - 巴菲特最宝贵的投资建议是"投资自己" [6]
重生之在《我的世界》做山姆·奥特曼:网友在线手搓ChatGPT
创业邦· 2025-10-08 11:20
文章核心观点 - 有玩家在《我的世界》游戏中成功利用红石电路构建了一个功能完整的GPT模型,该模型具备500万个参数并能进行简短对话 [4][6][8] - 这一技术演示展示了在非传统计算环境中实现复杂人工智能模型的巨大潜力,标志着游戏平台计算能力的突破 [10][35][50] 技术实现细节 - 构建的GPT模型拥有5,087,280个参数,在Python中使用TinyChat数据集训练,具备词嵌入、位置编码、多头注意力等完整架构 [6][14][19] - 模型技术规格包括:嵌入维度240、词汇量1,920个token、6层网络结构、5个注意力头、上下文窗口64个token [21][22] - 模型权重大部分量化为8位,嵌入层和LayerNorm权重分别以18位和24位存储,整个结构占据1,020×260×1,656方块体积 [23][24] - 当使用高性能红石服务器将tick速率提升40,000倍时,模型可在约2小时内生成一个回复 [22] 构建方法 - 构建流程包括:在电脑上训练小型GPT并压缩权重,将计算方法翻译成红石编码,定义可复用电路模块,通过编译器脚本映射模型 [26][27][28][29] - 利用WorldEdit等工具批量铺设,使聊天信息转化为红石信号,通过时钟脉冲推动信号处理最终生成输出 [30] 红石电路基础 - 红石电路基于数字逻辑原理,信号状态对应二进制(通电1/不通电0),可构建与门、或门、非门等逻辑门 [33][34] - 逻辑门组合可构成加法器、计数器等复杂电路,甚至搭建简单CPU,实现从基础信号到完整运算系统的构建 [34][35] 《我的世界》计算生态 - 社区已在游戏中实现多种计算应用:卷积神经网络识别数字、可运行俄罗斯方块等游戏的CPU、图形渲染、互联网模拟 [38][40][46] - 存在专门教程教授如何在游戏中构建计算机,展示了该平台作为计算实验环境的广泛可能性 [48]
重生之在《我的世界》做山姆·奥特曼:网友在线手搓ChatGPT
量子位· 2025-10-06 13:42
技术实现突破 - 在《我的世界》游戏中利用红石电路(0/1)和存储单元成功构建了一个功能完整的ChatGPT模型,未使用指令集[6] - 该模型具备完整的神经网络架构,包括词嵌入、位置编码、归一化、矩阵乘法、多头注意力、KV cache、激活函数(ReLU)等组件,共6层和5个注意力头[14][18] - 模型拥有5087280个参数(约500万),嵌入维度为240,词汇量为1920个token,上下文窗口大小为64个token[16][18][19] 模型性能与规格 - 当使用Minecraft高性能红石服务器将tick速率提升约40000倍时,模型大约需要2小时才能生成一个回复[20] - 模型大部分权重被量化到8位,但嵌入层和LayerNorm的权重分别以18位和24位存储[21] - 整个建筑占据1020×260×1656方块的体积,在Python中使用TinyChat数据集进行训练[16][22] 构建方法论 - 构建流程包括:在本地训练小型GPT并压缩权重至低精度,将计算方法翻译成红石编码,定义可复用电路模块,编写编译器脚本映射模型,最后借助工具批量铺设完成搭建[25][26][27][28][29] - 聊天信息通过红石信号传输,时钟脉冲推动信号穿过电路,最终通过命令块、告示牌或灯光生成输出[30] 红石电路技术基础 - 红石电路基于数字逻辑原理,每个信号只有通电(1)和不通电(0)两种状态,对应现实中的二进制系统[33][34] - 玩家可利用红石信号构建与门、或门、非门等逻辑门,进一步组合成加法器、计数器甚至简单CPU,实现完整的运算系统[35] 《我的世界》生态创新 - 社区已在游戏中实现多种计算系统,包括卷积神经网络识别数字、可玩多种游戏的CPU、图形渲染、互联网模拟甚至游戏内套娃《我的世界》[37][39][41][44][46] - 该案例表明《我的世界》平台已具备运行复杂AI模型的能力,实现了在游戏环境中运行GPT的技术突破[48]
产值十倍碾压电影业,没有什么能阻挡游戏了
虎嗅· 2025-09-17 11:58
游戏行业的地位与增长 - 全球游戏产业产值在2024年达到4552亿美元,远超电影行业的383亿美元,差距超过十倍 [5] - 游戏产业被视为一种新的艺术和文化现象,其爆发式增长源于对“人性+技术”的叠加利用 [4][5] - 国家级媒体对《黑神话:悟空》的集体关注,标志着游戏的社会文化地位发生显著变化 [4] 游戏的核心要素与理论基础 - 游戏的核心要素包括边界、秩序、规则与自愿性,这些要素被视作人类文明的基石和发展的动力 [6][8] - 游戏设计通过提供明确目标、即时反馈和恰到好处的挑战,使玩家易于进入“心流”状态,获得掌控感和愉悦 [9][13][14] - 游戏活动天然促进知行合一,要求玩家将精神意志与身体行动高度结合 [17][18] 游戏对心理与行为的积极影响 - 权威研究证实适度游戏时间(每天不超过3小时)与心理困扰减少和生活满意度提高相关 [19] - 游戏中的“化身”能通过镜像效应反向影响玩家的现实行为,包括忍受痛苦的能力和社交倾向 [22][24] - 游戏提供心理宣泄,其带来的快乐源于排解现实焦虑,类似于完成现实任务后的积极紧张释放 [11][20] 游戏在教育与创造力领域的应用 - 游戏化学习通过情境式教育发挥学生的主动性、参与感和创造力,例如《我的世界》被纳入学校课程 [26][27] - 研究显示儿童玩电子游戏的时间与创造力(如绘画和创作故事)呈正相关,而使用其他数字工具则无此关联 [28] - 游戏素养涵盖认识、决策、情感、协调、创造和社交六大能力,是互动时代所需的新文化技能 [30][31] 游戏作为文化连接与旅行体验 - 游戏如《动物森友会》和《死亡搁浅》在虚拟世界中建立超越时空的真实情感连接和社交互动 [21][41][42] - 游戏的本质是一场旅行,与文学、电影共享探索未知、自我挑战和文化体验等英雄之旅特征 [35][36] - 优秀游戏的标准在于其能否让玩家在探索可能世界的过程中,获得生命能量并实现与他人的共同创造 [45][46][47]
SensorTower:2025年迄今PC/主机游戏下载量已超10亿次 Steam平台全年收入有望突破120亿美元
智通财经网· 2025-09-17 10:53
平台市场格局 - PC/主机游戏2025年下载量超10亿次 Steam占据最大市场份额 PlayStation紧随其后 Xbox保持相当市场份额 [1] - Steam平台2025年游戏购买收入较2024年同期增长15% 全年收入有望突破120亿美元 [3] 游戏类型表现 - 动作游戏以2.62亿次下载量成为最受欢迎类型 射击游戏1.89亿次 角色扮演游戏1.31亿次 [5] 发行商竞争态势 - 艺电(EAUS)凭借体育游戏、IP系列及EA Originals项目成为下载量最高发行商 [8] - 微软(MSFTUS)与索尼(SONYUS)分列发行商第2、3位 双方各自游戏在对应平台表现更优 [8] - 微软游戏在Xbox平台的超高下载量部分归功于与Game Pass服务的深度整合 [8] 热门游戏产品 - 网易(09999)《漫威争锋》成为2025年下载量最多的PC/主机游戏 [11] - 开普勒互动凭借AA级游戏《光与影:33号远征队》和《REMATCH》获得巨大市场影响力 [11] - 微软通过收购《使命召唤》和《我的世界》系列增强市场表现 两者均为跨平台热门作品 [11] 细分市场表现 - AAA游戏中《EA SPORTS FC 25》和《NBA 2K25》等体育游戏持续主导市场 《怪物猎人:荒野》表现强劲 [14] - AA级游戏《光与影:33号远征队》获得评论界一致好评 下载量甚至超越《NBA 2K25》 [14] - 独立游戏领域《REPO》销量最高 《Schedule I》以双倍价格取得相近下载量表现 [14]
AI陪伴新赛道:他给800万游戏玩家找了个AI搭子?
混沌学园· 2025-08-22 19:58
核心观点 - 公司通过"场景感知"技术重新定义AI陪伴 将情感陪伴与实时场景理解相结合 创造基于共同经历的数字伙伴体验[9][17][18] - 产品定位从抢占用户时间转向增强现有体验 通过嵌入用户现有活动场景提供无干扰陪伴[16][20] - 创始人经历促使公司战略转向深度体验优化 暂停短期变现功能 集中开发多模态视觉语言模型提升核心体验[25][26] 市场定位与用户数据 - 产品已积累800万用户 PC端次日留存率达70% 显示强劲用户粘性[2] - 瞄准移动互联网后时代机会 认为用户时间已被充分分配 新机会在于提升现有时间质量而非争夺时间[3] 产品创新 - 首创"情感陪伴+场景感知"公式 使AI能直接理解用户屏幕内容并提供情境化互动[17][18] - 采用悬浮球/桌宠形式存在 保持随时可用但不打断用户主要活动[20] - 基于共同记忆的互动模式 如提醒用户游戏习惯或成就 创造更真实的陪伴感[21] 技术架构 - 借鉴AI编程助手Cursor的嵌入式设计理念 在不打扰用户的前提下提供精准辅助[11][13][15] - 重点开发多模态视觉语言模型(VLM) 增强对游戏画面的深度理解能力[25] - 通过"看到我"而非仅仅"听我说"的方式实现维度突破 提升互动真实性[18] 商业模式 - 不采用传统APP时间争夺模式 而是通过为现有快乐体验"加Buff"创造价值[16] - 放弃快速变现的游戏皮肤和角色开发 优先投入核心技术提升用户体验[25][26] 行业洞察 - 移动互联网时代结束 用户时间分配趋于饱和 新机会在于体验优化而非流量争夺[3] - 传统AI聊天产品存在根本局限 缺乏共同场景和经历导致互动浮于表面[9] - 人类陪伴需求本质是分享欲和被见证感 而非单纯对话[6][8][9]