还在玩AI 3D手办?Gemini 3 Deep Think已能直出STL,可打印实物
机器之心·2026-02-15 14:46

推理模型赛道竞争态势 - 行业竞争已进入白热化阶段,OpenAI、Anthropic和谷歌均在强化推理模型领域重兵投入 [1][2][3] - OpenAI o1系列模型的核心策略是通过强化学习实现“多想一步”,以更长的思考时间换取更稳定可靠的结论 [1] - Anthropic的Claude Thinking模型专注于研究与分析场景,强调在长上下文下的审慎与可靠性 [2] Gemini 3 Deep Think的定位与能力 - 谷歌Gemini 3 Deep Think迎来重大升级,其核心定位是具备“参与科研和工程决策”的实力,而非仅仅追求基准测试的领先 [3][4] - 该模型追求在科研级、工程级、多条件约束问题上更可靠地“把事情做对”,目标是从“纸上谈兵”进化到“动手造物” [15] - 谷歌正试图将大模型从信息助手,推向科研与工程体系里的“第二大脑” [38] 深度空间与物理逻辑推理能力 - 模型面临的一项经典压力测试是生成“一只骑自行车的鹈鹕”的SVG代码,该测试同时考察空间逻辑、结构正确性和细节遵从能力 [5][6] - 更高难度的测试要求生成“加州褐鹈鹕”在繁殖期(头部偏黄,颈部红棕色)骑着一辆带有辐条和正确车架形状的自行车的SVG,这要求模型具备专业的生物、物理和建模知识 [9][10][11] - 测试中“正在蹬踏”的要求,需要AI能正确处理动物肢体与机械(脚丫子对准踏板)的交互,体现物理逻辑理解 [12] 从2D理解到3D创造与制造 - 模型能够将用户的要求、草图或照片,直接建模成可3D打印的实体文件(如STL文件),实现了从平面理解到立体创造的跨越 [15][19] - 例如,模型看到一张锅的照片,能脑补出它在各个角度的尺寸、厚度和把手弧度,并生成立体实物原型,这要求模型具备空间推理(理解结构、体积、厚度、连接)和可制造性考量 [21] - 该能力将专业3D建模(通常需学习数周软件)过程压缩为接近“一键生成”,用户可截图给AI后输出文件并3D打印获得实物 [31][33] 在设计与工程中的实际应用 - 模型能进行带有审美与结构意图的生成设计,例如根据文字描述设计出具有立体感、现代感造型的时尚花盆,并输出STL文件 [23][24][26] - 在更硬核的工程应用中,模型能根据一张3D蜘蛛网图片,直接生成一套完整的设计工具套件,涵盖程序化控制、仿真与优化流程,并支持文件导出 [28][29] - 基于该工具设计的结构(如受蜘蛛网启发的桥梁方案)经过3D打印和受力测试(使用约2.5斤重的设备),证实其在工程上的可行性 [30][32] 在科研与复杂问题解决中的扩展 - 模型能力扩展至多个科学领域,包括化学、物理(含理论物理)等,旨在处理没有明确边界、没有唯一答案、数据杂乱的真实研究问题 [36][37] - 具体应用案例包括:审阅高度专业的数学论文并指出细微逻辑缺陷;优化半导体晶体生长流程;将WiFi网络空间化、可视化,并利用统计关联(如皮尔逊相关分析)推断接入点的物理位置关系 [34][35][36] - 随着通用对话能力商品化,能处理复杂财务模型、实验数据与工程设计的深度推理能力正成为新的竞争高地 [38]

还在玩AI 3D手办?Gemini 3 Deep Think已能直出STL,可打印实物 - Reportify