Workflow
生成式AI
icon
搜索文档
工业级3D世界构建提速90倍!全新框架LatticeWorld让虚拟世界「一句话成真」
机器之心· 2025-09-21 13:26
核心观点 - 提出一个名为LatticeWorld的革命性多模态框架,通过将轻量级大语言模型(LLaMA-2-7B)与工业级渲染引擎(虚幻引擎5)无缝融合,实现从文本描述或草图到高仿真、可交互3D虚拟世界的端到端自动生成 [4][6] - 该框架将传统手工3D场景制作的效率提升了超过90倍,总制作时间从55天缩短至不到0.6天,为游戏、影视、自动驾驶仿真及具身智能等领域带来突破性解决方案 [4][31] 技术框架与核心组件 - **框架核心思想**:利用大语言模型处理场景布局与环境配置的生成,构建多模态输入融合机制,通过结构化中间结果(符号化场景布局和JSON参数)驱动渲染引擎生成最终3D世界 [9] - **场景布局生成模块**:创新性地将复杂空间布局转换为32x32的符号矩阵进行表示(如F代表森林,W代表水体),并序列化为大语言模型可处理的字符串,以保持空间关系完整性 [12] - **环境配置生成模块**:基于生成的布局,进一步生成包含**场景属性**(粗粒度如季节、天气,细粒度如资产材质、密度)和**智能体参数**(类别、数量、行为、位置)的JSON格式配置 [16] - **程序化渲染管线模块**:通过解码器和转译系统,将符号化布局和JSON配置转换为虚幻引擎5可读的多通道灰度图像和原生属性格式,实现自动化渲染 [18] 技术实现细节 - **多模态视觉融合**:利用预训练的CLIP视觉编码器提取地形高度图或草图特征,并通过专门设计的CNN投影网络映射到大语言模型的词嵌入空间,实现文本与视觉信息的融合 [13] - **三阶段训练范式**:包括CLIP微调、投影网络持续预训练以及端到端微调,使用交叉熵损失联合优化投影网络和LLaMA-2-7B模型 [14] - **高质量数据集构建**:构建了两个数据集用于训练:包含8,236个实例的固定高度场景数据集(LoveDA)和包含24,380个实例的可变高度荒野地形数据集(Wild),并利用GPT-4o进行数据标注与增强 [19][20] 性能评估与对比 - **场景布局生成能力**:在固定高度(仅文本)和可变高度(草图/高度图)条件下,LatticeWorld在生成准确布局方面优于GPT-4o、Claude 3.7 Sonnet、DeepSeek-R1及Qwen2-VL-Max等主流模型 [22] - **环境生成与属性控制**:框架能够依据不同的文本描述,有效调整整个场景的环境属性(如艺术风格、季节、天气),生成多样化的自然环境 [27][28] - **动态智能体生成**:支持通过文本描述生成包含类型、数量、分布和行为的智能体参数配置,并能在生成的3D世界中实现基于预定义规则的自主对抗行为(如追逐、攻击) [29] - **效率革命性提升**:与专业艺术家手工创作对比,在完成相同布局和参数指令的任务时,LatticeWorld将总制作时间从55天大幅降低到不足0.6天,效率提升超过90倍 [31] 应用前景与未来方向 - **行业应用**:该技术对需要高质量3D虚拟世界的领域意义重大,包括作为**具身智能和自动驾驶**的仿真与训练基础设施,以及支撑**游戏开发和影视制作**的逼真沉浸体验 [5] - **未来扩展**:潜在发展方向包括设计更丰富的对抗智能体行为策略、支持多玩家控制和AI算法策略、实现智能体身体部位的精细化独立控制,以及扩充资产库以生成更多样的虚拟世界 [35]
围绕“一条链” 盐城变“车城”
新华日报· 2025-09-20 08:00
公司业务与市场地位 - 专注研发和生产汽车座椅高强度滑轨 全球市场占有率超30% 年产能2800万根 可为超700万辆汽车配套 [1] - 产品内含十余项独家专利 作为零重力高端座椅的核心部件发往整车企业 [1] - 智能化改造带来显著效益 工厂自动化率提升至80% 生产效率提高23% 运营成本降低13% 不良品率大幅降至百万分之零点二 [2] - 2024年1-8月实现开票销售12.73亿元 税收1.41亿元 亩均税收超200万元 [2] - 正积极申报"灯塔工厂" 已通过麦肯锡初步评审 预计12月获认证 有望成为苏北首家获此殊荣的制造基地 [2] 技术创新与智能制造 - 引入生成式AI优化冲压换模 数字孪生驱动的光学检测等硬科技 解决滑轨异响行业挑战 [1] - 零部件国产化率达99% 几乎所有配套都能在区域内解决 [2] - 以"高端技术+完整产业链"为核心竞争力 推动中国汽车零部件行业向全球价值链高端攀升 [2] 产业链发展与区域集聚 - 盐城经济技术开发区新能源汽车产业园区集聚519家整车、配套生产及服务业企业 形成较完善产业链条 [3] - 园区成立专业招商团队 绘制产业图谱 驻点敲门招商 高效精准突破 [3] - 2024年上半年园区零部件企业完成开票销售34.1亿元 同比增长22% [3] - 2024年新能源汽车产业园区观摩项目占全区达50% 包括佛吉亚二期、凌云新能源等高质量项目 [3]
刚刚,李飞飞空间智能最新成果!3D世界生成进入「无限探索」时代
自动驾驶之心· 2025-09-20 00:03
产品发布与核心功能 - 斯坦福大学教授李飞飞团队通过创业公司World Labs发布空间智能模型Marble限量测试预览版 [4][19] - 模型支持单张图片或文本提示作为输入生成持久存在、可自由导航探索的宏大3D世界 [5][8][18] - 生成内容具备永久性、零成本浏览器导航支持、高斯点云导出与多段拼接能力 [9][21][22] 技术特性与性能提升 - 生成场景规模较以往更大、风格更多样化、几何结构更干净 [21][23][26] - 支持通过组合多个生成结果构建更大世界 得益于模型在一致性和风格遵循上的进步 [22][31] - 生成场景具备丰富几何复杂度 支持从输入视角背后或更远处进行完整探索 [24] 应用生态与兼容性 - 导出高斯点云可在开源渲染库Spark支持下无缝集成Three.js [21] - 兼容桌面电脑、笔记本电脑、移动设备和VR头显运行 [21][12] - 用户测试反馈积极 有建议提及GUI界面连接世界功能优化 [14] 行业影响与定位 - 被行业人士评价为"真正的大规模3D生成" 与谷歌Genie形成差异化竞争 [9][10][11] - 正式将空间智能推向"无限探索"时代 突破房间尺度限制 [3][31] - 目前通过白名单地址开放试用 官方博客提供详细技术细节 [17][33]
调研速递|赛意信息接受众多投资者调研,AI业务订单亮眼
新浪财经· 2025-09-19 20:05
业绩说明会概况 - 公司于2025年9月19日15:30-17:00通过全景路演网站以网络远程方式召开业绩说明会 [1] - 公司董事长兼总经理张成康、财务总监欧阳湘英、董事会秘书兼副总经理柳子恒参与接待并回答投资者提问 [1] 订单情况 - 公司建议投资者关注巨潮资讯网相关公告和官方微信公众号文章以获取订单信息 [1] 业务信息真实性 - 公司回应业务信息真实性需参考巨潮资讯网公告和官方微信公众号发布内容 [1] 合同资产变动 - 合同资产增加属于正常业务经营情况 与订阅式或买断式业务类型无直接关联 [1] AI业务发展 - AI相关业务上半年订单达1.03亿元 全年保持乐观预期 [1] - 泛ERP领域订单占比约60% 主要应用生成式AI的意图理解及交互能力和Agent的目标分解执行能力实现管理流程自动化和智能化 [1] - 智能制造领域订单占比约40% 采用垂类AI模型结合生成式、判定式和决策式AI能力 应用于工艺优化、AI质检、智能排产和物流路径优化等场景 [1] - PCB制造业的制前工程及工艺报价成本核算方案具有行业独特性 [1] - 业务实现收入情况需关注公司后续公告 [1]
一家营收千亿美元的公司,如何回应AI落地的策略问题
36氪· 2025-09-19 19:59
Amazon Bedrock产品策略与市场定位 - 产品核心理念为“Choice Matters”(选择大于一切),旨在为不同业务提供最契合的基础模型,模型选择多样性和灵活性是关键 [3] - 平台提供模型数量达二百余款,是市面竞品整体“供货”数量的两倍以上 [3] - 已成为应对行业波动、灵活多元化的MaaS(模型即服务)基础设施的几乎唯一答案,其策略对AI落地行业进程产生深远影响 [5][12] 基础模型行业竞争格局演变 - 2025年基础模型厂商竞争态势不断变化,不同模型针对不同地区的服务政策也存在差异,凸显了模型选型灵活性的实际意义 [3] - 早期行业推论认为大模型训练成本极高(万卡集群是入场券),闭源模型将主导市场,“百模大战”会收缩为少数巨头竞争 [4] - 另一技术侧推论认为大语言模型在数据和架构上进化空间有限,导致部分公司如百川智能等过早放弃基础模型技术探索,间接错过AI Agent红利 [4] 模型技术性能与迭代速度 - 大模型技术发展曲线依旧陡峭,市场选择丰富,基于单一模型构建的AI能力易被新技术突破所淘汰 [5] - 定制化To B AI解决方案在2025年技术迭代加速,例如因DeepSeek发布导致早期方案过时,后续又因Qwen3、Kimi K2、DeepSeek v3.1发布而再次更新,出现半年刷新三次的情况 [5] - DeepSeek-V3.1在多项基准测试中表现显著提升:SWE-bench Verified得分66.0,较DeepSeek-V3-0324的45.4提升45.4%;SWE-bench Multilingual得分54.5,较DeepSeek-V3-0324的29.3提升86.0%;Terminal-Bench得分31.3,较DeepSeek-V3-0324的13.3提升135.3% [1] 行业特定解决方案与模型选型 - Amazon Bedrock可为具体行业和场景提供差异化模型选型建议,例如媒体广告行业可选Marengo、Pagsus、Stable Diffusion;金融行业可选Palmyra x5;重推理场景可选DeepSeek-V3.1;文本摘要可选Mixtral [6] - Palmyra x5专为金融场景优化,其上下文窗口达100万Token,比一般推理模型高出一个数量级,更适应财务报告和法律合同分析 [6][7] - 中企出海趋势在2025年达到高潮,国内与海外模型选型模板和采购清单不同,但大多数模型均可在Amazon Bedrock找到 [6] 模型技术发展趋势与能力侧重 - 大模型整体发展从单一走向多元化,从通识能力演变为专业能力,未来Agent平台的内生逻辑需要“Choice Matters”策略 [7] - DeepSeek v3.1更强调Agent能力和推理效率,新增840B Tokens训练数据重点提升代码和数学类占比,以增强逻辑推理和数学能力,被称为“迈向Agentic AI时代的第一步” [8][9] - Qwen3同样重视代码、数学、Agentic数据,并特别强调多语言能力,支持119种语言,其中文训练数据占比仅45% [9] - Qwen3部署成本大幅下降,4张H20即可部署满血版,显存占用仅为性能相近模型的三分之一 [9] Amazon Bedrock平台能力与评估体系 - 平台将模型实验和切换能力沉淀为系统级竞争优势,能够快速测试和部署不同模型的组织优于锁定单一模型方法的组织 [10][11] - 模型评估设置两条核心路径:自动评估适用于客观指标,人工评估针对主观判断并可借用官方提供的人工评估团队,最终生成详细评估报告 [11] - 平台提供精选公开数据集并允许企业上传特定业务数据集,提升了模型测试和选型能力的实际价值,替代了传统咨询公司在模型介绍、推荐与评估方面的部分主营业务 [11][12] 市场影响与财务表现 - “Choice Matters”策略是亚马逊云科技实现营收快速增长的原因之一 [6] - 2024年,亚马逊云科技全球营收突破千亿美元大关 [6] - 音视频模型技术演进加速,AI短剧成为“蓝海市场”,未来市场规模可能达到千亿级 [5]
被预言会“死”的传统写作巨头,Grammarly为何更值钱了?
混沌学园· 2025-09-19 19:58
文章核心观点 - Grammarly在面对ChatGPT等大模型的冲击时,通过主动拥抱生成式AI、重塑公司愿景和战略,成功从语法检查工具转型为AI驱动的生产力平台,构筑了新的护城河 [2][7][12][23] - 公司的核心优势在于其深度嵌入用户工作流的集成能力(覆盖超50万应用和网站)、多年积累的上下文理解与数据隐私保护,以及垂直场景的定制化AI功能 [4][6][8][22] - 通过快速推出生成式AI功能GrammarlyGO、收购文档平台Coda、发布九大AI助手等举措,公司强化了其作为"AI高速公路"的定位,实现从工具到平台的升级 [7][14][20][22] AI赋能写作的底层功力 - Grammarly自2009年创立以来即以人工智能技术为核心驱动力,通过机器学习和自然语言处理提供语法检查、措辞优化等功能 [2] - 在ChatGPT出现前,公司已积累每日超3000万用户和年营收超7亿美元的规模,海量用户数据形成模型训练和反馈的护城河 [3] 大模型来袭的应对策略 - 2023年3月(ChatGPT发布4个月后)快速推出生成式AI功能GrammarlyGO,允许用户在原有界面一键调用AI生成或改写文本,并支持个性化语气和场景适配 [7] - 差异化优势在于结合上下文理解能力(如邮件链分析、企业品牌语调)和数据隐私承诺,提升生成内容的相关性和安全性 [8] - 公司主动重塑愿景,从"语法检查"转向"AI原生生产力平台",新任CEO提出未来办公将进入"智能代理时代",Grammarly目标是成为连接AI代理与工作场景的超级高速公路 [12] 从工具到生产力套件的升级 - 收购文档平台Coda,补齐文档创作环节,推动Grammarly向AI生产力平台演进 [14] - 2025年8月推出九大AI助手,覆盖学术和专业写作场景,包括AI评分器、引文查找器、抄袭检测器等垂直功能,深度定制化整合工作流 [20][21] - 这些功能依托Grammarly的跨应用集成能力(超50万应用和网站),形成难以复制的功能壁垒 [21][22] 护城河构建与行业启示 - 公司的核心护城河并非短期技术优势,而是用户信任、工作流集成及对垂直场景的深刻理解 [25] - 其"AI高速公路"(跨应用集成能力)是工程壮举,使AI能力可无缝渗透至用户各类写作场景 [22][25] - 启示包括:以"乘法思维"结合新技术与自身优势,从工具转向平台以抢占用户工作流 [25]
赛意信息(300687) - 2025年9月19日投资者关系活动记录表
2025-09-19 19:14
财务与订单情况 - 公司AI相关业务上半年订单达1.03亿元 [3] - 合同资产增加属正常经营情况 与订阅制/买断式无直接关联 [3] AI业务分布 - 泛ERP领域AI订单占比约60% 聚焦生成式AI的流程自动化与智能化 [3] - 智能制造领域AI订单占比约40% 应用垂类模型于工艺优化/质检/排产等场景 [3] 产品与技术动态 - PCB行业自研CAM软件信息需关注官方公告 [3] - PCB制造业AI方案在制前工程/成本核算领域具行业独特性 [3] 信息披露说明 - 本次投资者活动不涉及未公开重大信息 [3] - 订单及营收数据需以巨潮资讯网公告为准 [2][3]
超强开源模型Qwen3、DeepSeek-V3.1,都被云计算一哥「收」了
机器之心· 2025-09-19 18:43
亚马逊云科技AI平台模型扩展 - Amazon Bedrock和Amazon SageMaker两大AI平台新增支持OpenAI新开源模型[2] - 两大国产大模型Qwen3和DeepSeek-V3.1被纳入Amazon Bedrock平台[3] - 目前Qwen3和DeepSeek-V3.1已在Amazon Bedrock全球上线 覆盖美国西部(俄勒冈)、亚太地区(孟买、东京)、欧洲(伦敦、斯德哥尔摩)等区域[4] 平台模型生态与战略 - Amazon Bedrock已提供249款大模型 覆盖通用对话、生成、多语言理解与代码助手等多个应用类型[16] - 平台汇聚十四家主流厂商 包括Anthropic、DeepSeek、亚马逊云科技自研Nova模型等[16] - 公司坚持"Choice Matters"战略 强调多模型互补协同 没有一个大模型可以解决所有问题[5] - 客户数据完全由客户控制 亚马逊云科技不会将模型输入输出数据与模型提供商共享或用于改进基础模型[5] Qwen3模型技术特性 - Qwen3是阿里巴巴开源的新一代通义千问模型 在推理、指令遵循、多语言支持和工具调用等方面大幅提升[9] - 部署成本大幅下降 仅需4张H20实现满血版部署 显存占用仅为性能相近模型的三分之一[9] - 采用MoE和密集型架构 MoE模型如Qwen3-Coder-480B-A35B-Instruct和Qwen3-Coder-30B-A3B-Instruct通过动态激活部分参数实现高效推理[10] - 支持256K个token的上下文窗口 使用外推方法可扩展到100万个token[10] - 具备强大的智能体能力 能够执行多步推理和结构化规划 支持与外部环境标准化通信[10] DeepSeek-V3.1模型性能表现 - DeepSeek-V3.1是混合推理模型 同时支持思考模式与非思考模式[14] - 在Browsecomp测试中得分30.0 较DeepSeek-R1-0528的8.9有显著提升[15] - 在Browsecomp_zh测试中得分49.2 较DeepSeek-R1-0528的35.7提升明显[15] - 在SWE-bench Verified测试中得分66.0 较DeepSeek-R1-0528的44.6有大幅提升[15] 模型应用场景优化 - Qwen3-Coder-480B-A35B-Instruct专为复杂软件工程任务设计 擅长高级代码生成和代码库分析[13] - Qwen3-Coder-30B-A3B-Instruct优化代码补全、重构及编程问题解答 支持多种编程语言[13] - Qwen3-235B-A22B-Instruct-2507提供强大的通用推理和指令跟随能力[13] - Qwen3-32B-Dense适用于要求稳定性能、低延迟和成本优化的场景 如移动设备和边缘计算[13] 平台实测性能表现 - DeepSeek-V3.1和Qwen3-235B-A22B-Instruct-2507在简单数学问题上均能在半秒左右给出正确答案[23] - 在多步计算任务中 两个模型都能正确完成并给出完整推理过程[26] - Qwen3-Coder-480B-A35B-Instruct仅用半分钟就完成了"俄罗斯方块+贪吃蛇"游戏的代码编写[28] - Amazon Bedrock提供的服务非常稳定高速 全量模型的性能得到充分保证[31] 开源模型战略价值 - 开源模型在定制化开发和透明性方面具有独特优势 给用户带来更大灵活性和控制权[36] - 用户可通过开源模型直接调用经过优化的托管推理服务 实现快速应用部署[36] - 开放权重特性允许用户根据自身行业数据和需求进行二次开发和定制训练[36] - 高透明性使企业能够清晰了解模型结构、训练数据和算法流程 增强合规性和道德可控性[36] 公司AI发展战略 - 亚马逊云科技CEO将AI描述为"几十年来见过的可能发展最快的技术"[38] - 公司在Amazon Bedrock和SageMaker上构建了拥有超过400款模型的模型库[39] - 开放共赢策略避免与模型提供商正面竞争 专注于成为中立、丰富且可靠的AI基础设施层[40] - 该策略吸引了包括初创公司、大型企业在内的多样化客户生态[40]
电声股份(300805) - 2025年9月19日投资者关系活动记录表
2025-09-19 18:38
财务业绩 - 2025年上半年营业收入12.20亿元,同比增长11.58% [3] - 归属于上市公司股东的净利润2,287.61万元,同比增长115.08% [3] - 扣除非经常性损益的净利润1,366.37万元,同比增长134.38% [3] - 销售费用和管理费用合计同比下降6.05% [3] - 经营活动现金流量净额-3,260.37万元,同比下降151.81% [5] 业务板块表现 - 消费电子行业营销服务收入同比增长13.46% [3] - 数字零售业务收入5.32亿元,同比增长32.16% [5] - 数字零售业务毛利率10.09%,同比下降0.24个百分点 [5] - B2C业务实现营业收入3.48亿元,同比增长63.46% [3] - 新能源汽车出行业务营收1,202.81万元,运营750台自营车辆 [6] 战略发展 - 积极拓展新行业新客户并开发新业务 [3] - 应用生成式AI、大模型、VR/AR、裸眼3D等新技术 [4][5] - 打造品牌产品矩阵并通过并购建设消费者品牌 [4] - 布局国际化发展包括品牌出海和跨境电商服务 [4] - 数字零售业务增长主要来自拼多多和生鲜电商平台 [5] 资金与投资 - 货币资金余额6.25亿元 [5] - 战略投资事项将按规履行信息披露义务 [5]
《“数智时代”的“服务革命”》——网经社独家专访国务院特殊津贴专家郑吉昌教授
搜狐财经· 2025-09-19 18:00
服务经济与数智经济叠加时代 - 中国已进入服务经济和数智经济叠加的历史性转型期 产业属性和消费特征被重新定义 [1][5] - 服务业与制造业加速融合催生新产业形态 数据成为核心生产要素 生产性服务业嵌入全球产业链 [5] - 服务消费成为经济增长重要驱动力 服务是万物互联和平台生态系统的粘合产业 [5] 服务经济理论发展 - 上世纪90年代中国服务产值占GDP30%以下 学界研究空白 传统理论难以解释服务业发展需求 [2] - 服务业不是低附加值辅助部门 而是技术创新与价值创造的新大陆 [2] - 中国服务业需解决劳动力低成本陷阱 服务贸易逆差逆转 服务创新赋能制造业升级三大问题 [4] - 《服务经济论》成为本土化理论建构的标杆著作 [4] 服务经济三维框架 - 价值维度:服务业本质是不可见的价值创造 知识密集型生产性服务业GDP贡献系数是传统服务业3.2倍 [6] - 结构维度:需从消费性服务业主导向生产性服务业主导转型 生产性服务业占比每提升1%带动制造业利润率增长0.6% [6] - 制度维度:服务市场开放需突破资质互认难 数据流动限 监管标准异三大壁垒 服务贸易负面清单2.0版已试点 [6] 数字服务发展趋势 - 生成式AI推动服务众包向智能服务网格进化 2030年45%知识工作通过AI代理完成 [8] - 区块链催生可验证服务 重塑教育认证和医疗记录信任机制 [8] - 元宇宙沉浸式服务在远程办公和虚拟展会领域形成千亿级市场 [8] - 中国数字服务贸易逆差占比从2015年18%升至2024年39% 需加快数字服务标准制定权布局 [8] 生产性服务业核心作用 - 生产性服务业是全球产业链竞争关键 在微笑曲线中占据价值大部分 [9][11] - 生产性服务业知识密集型且附加值高 对城市能级提升具有杠杆效应 [11] - 生产性服务业是产业生态系统黏合剂 增强产业关联并提升整体效率 [11] 未来服务创新方向 - AI推动服务业向更高价值维度进化 催生新商业模式和生态系统 [12] - 核心竞争力是人性化服务与智能化技术结合 AI处理数据与流程 人类专注创意情感和复杂决策 [12] - 服务从功能满足向体验升维和价值共创跃升 消费价值观转向生活质量自我表达和自主选择 [12]