Workflow
重生之在《我的世界》做山姆·奥特曼:网友在线手搓ChatGPT
量子位·2025-10-06 13:42

技术实现突破 - 在《我的世界》游戏中利用红石电路(0/1)和存储单元成功构建了一个功能完整的ChatGPT模型,未使用指令集[6] - 该模型具备完整的神经网络架构,包括词嵌入、位置编码、归一化、矩阵乘法、多头注意力、KV cache、激活函数(ReLU)等组件,共6层和5个注意力头[14][18] - 模型拥有5087280个参数(约500万),嵌入维度为240,词汇量为1920个token,上下文窗口大小为64个token[16][18][19] 模型性能与规格 - 当使用Minecraft高性能红石服务器将tick速率提升约40000倍时,模型大约需要2小时才能生成一个回复[20] - 模型大部分权重被量化到8位,但嵌入层和LayerNorm的权重分别以18位和24位存储[21] - 整个建筑占据1020×260×1656方块的体积,在Python中使用TinyChat数据集进行训练[16][22] 构建方法论 - 构建流程包括:在本地训练小型GPT并压缩权重至低精度,将计算方法翻译成红石编码,定义可复用电路模块,编写编译器脚本映射模型,最后借助工具批量铺设完成搭建[25][26][27][28][29] - 聊天信息通过红石信号传输,时钟脉冲推动信号穿过电路,最终通过命令块、告示牌或灯光生成输出[30] 红石电路技术基础 - 红石电路基于数字逻辑原理,每个信号只有通电(1)和不通电(0)两种状态,对应现实中的二进制系统[33][34] - 玩家可利用红石信号构建与门、或门、非门等逻辑门,进一步组合成加法器、计数器甚至简单CPU,实现完整的运算系统[35] 《我的世界》生态创新 - 社区已在游戏中实现多种计算系统,包括卷积神经网络识别数字、可玩多种游戏的CPU、图形渲染、互联网模拟甚至游戏内套娃《我的世界》[37][39][41][44][46] - 该案例表明《我的世界》平台已具备运行复杂AI模型的能力,实现了在游戏环境中运行GPT的技术突破[48]