Wow - 财报，业绩电话会，研报，新闻

Wow

搜索文档

猿大侠· 2025-09-02 12:20

模型性能表现 - 在Agent工具调用和指令遵循等基准测试中超过DeepSeek-V3.1、Qwen3 MoE-2507及Claude4 Sonnet [3] - 编程能力与Claude4 Sonnet相当在TerminalBench测试中表现突出 [5] - 总参数量560B 激活参数动态范围为18.6B–31.3B 低于DeepSeek-V3.1(671B/A37B)和Kimi-K2(1T/A32B) [12][13] - 在数学题测试中解答完全正确包括全国一卷圆锥曲线问题及复杂坐标计算 [22][23][24][26][32][33][35][36][39][42][46][47][50][51] - 成功绘制生物学卡尔文循环SVG示意图展现多模态代码生成能力 [53][54] - 准确解答迷惑性量子力学问题识别"薛定谔的死猫"陷阱并指出与原版实验区别 [58][59][61][62][63][64][65] 技术创新架构 - 采用Zero-computation Experts与Shortcut-connected MoE双重架构通过恒等专家映射实现动态计算分配 [13][16] - 使用新路由架构优化专家模型调用通过MoE与密集层通信重叠执行提升效率 [14] - 引入设备级负载均衡损失和PID控制器调节路由概率避免序列级失衡 [16] - 规模化训练采用超参数迁移+模型生长初始化策略用14层模型堆叠成28层加速收敛 [17] - 预训练使用20T token语料中期扩展上下文窗口至128k 后期通过多Agent合成框架进行高难度工具使用训练 [17] - 推理阶段实现多步重叠调度器使CPU调度与GPU计算交错单张H800 GPU生成速度超过100 tokens/s [17][20] 训练效率与成本 - 在30天内完成20T token预训练使用上万个加速卡且训练可用率达98.48% [20] - 输出成本约为0.7美元/百万token 在560B参数规模下实现高效推理 [20] - 相比同级模型在不同上下文长度下均实现更高单GPU吞吐和单用户速度 [20] 公司AI战略布局 - 2023年通过收购光年之外团队强化大模型研发能力王慧文以顾问身份回归后领导GN06独立AI团队 [74][76][77] - 2024年明确"主动进攻"AI战略推出AI编程应用NoCode和代码助手CatPaw 内部AI工具调用量从10%提升至68% [81][82][85] - 2024年研发投入211亿元规模居国内第四过去5年累计投入超1000亿元 [83] - 三层战略架构包括AI提升员工效率(AI at Work)、产品AI化(AI in Products)和自研大模型(Building LLM) [89] - 早期布局具身智能领域投资宇树、星海图、银河通用等头部公司 [88] - AI应用覆盖情感陪伴(Wow)、图像生成(妙刷)、餐饮推荐(问小袋)、交互问答(米鲁)等多场景 [75][78][84]

王兴一鸣惊人！美团首个开源大模型追平DeepSeek-V3.1

量子位· 2025-09-01 12:39

模型性能表现 - 在Agent工具调用和指令遵循方面超越DeepSeek-V3.1、Qwen3 MoE-2507及Claude4 Sonnet [3] - 编程能力与Claude4 Sonnet相当在TerminalBench基准测试中表现突出 [5] - 数学推理能力全面正确成功解答全国一卷数学题并完整展示推导过程 [21][22][23][25][32][34][35][36][38][42][44][45][48][50] - 综合能力测试表现优异可生成生物学卡尔文循环的SVG矢量图形代码 [51][52] - 具备强抗干扰能力在Misguided Attention基准测试中准确识别"薛定谔死猫"问题的逻辑陷阱 [56][58][60][61][62][63] 技术创新架构 - 采用560B参数的MoE架构结合"零计算专家"与Shortcut-connected MoE双重设计 [12] - 动态激活18.6B–31.3B参数总参数量和激活参数量均低于DeepSeek-V3.1(671B/A37B)和Kimi-K2(1T/A32B) [11][12] - 通过零计算专家实现恒等映射完全避免GEMM运算配合PID控制器调节路由概率 [13][15] - 采用超参数迁移+模型生长初始化策略用14层模型堆叠成28层checkpoint加速收敛 [16] - 实现多步重叠调度器使CPU调度与GPU计算交错单张H800GPU生成速度超过100 tokens/s [16][19] 训练效率与成本 - 在30天内完成20T token预训练训练可用率达98.48% [19] - 成本控制显著每百万输出token成本约0.7美元 [19] - 使用两阶段融合20T token语料预训练中期扩展上下文窗口至128k [16] 公司AI战略布局 - 2023年通过收购光年之外团队切入大模型领域 2024年王慧文回归领导GN06独立AI团队 [73][75][76] - 2024年研发投入达211亿元规模居国内第四过去5年累计投入超1000亿元 [81] - 形成三层AI战略架构：AI工具提升10万员工效率、AI改造现有产品、自研大模型 [87] - 推出多款AI应用包括Wow情感陪伴、妙刷图像生成、NoCode编程及CatPaw开发者工具 [74][77][83] - 早期投资宇树、星海图等具身智能公司 2019年启动无人车配送项目 [71][86]

董明珠孟羽童要合体直播？“打工人翻身教科书案例”

搜狐财经· 2025-05-21 14:45

华为发布"电脑界茅台"23999元起售 - 华为发布新款鸿蒙笔记本电脑，起售价23999元，被网友称为"电脑界的茅台"[1] - 社交平台对产品价格讨论热烈，部分用户认为定价过高且碎屏维修成本大[1] - 产品采用巨型折叠屏设计，引发市场对高端笔记本细分领域的关注[1] AI应用非法收集使用个人信息 - 国家网信部门通报35款违规App，包括Kimi、智谱清言等热门AI应用[5] - Kimi(2.0.8版本)存在收集非必要个人信息问题，智谱清言(2.9.6版本)存在超范围收集信息行为[5] - Wow(1.16.5版本)和猫箱(1.57.0版本)两款AI陪伴类产品被指权限声明与业务功能不匹配[5] 撞名胖东来的"胖都来"改名"盈都来" - 浙江商场"胖都来"因名称争议更名为"盈都来"，已完成商标和线上账号变更[7] - 此前胖东来已向市场监管部门投诉并发送律师函，认为存在商标侵权[7] - 更名事件为商场带来舆论关注，形成意外营销效果[8] 钟睒睒回应代工传闻 - 农夫山泉董事长钟睒睒明确表示现有产品无法代工，因水源依赖和生产系统高度定制化[10] - 承认代工是工业体系普遍协同方式，但强调公司从原水处理到标签粘贴均有复杂标准流程[10] - 回应间接澄清了与哇哈哈、今麦郎等竞争对手的市场传闻[11] 董明珠孟羽童或将合体直播 - 孟羽童晒出与董明珠聊天记录，格力确认双方将于5月23日会面，引发合作直播猜测[13] - 孟羽童2021年通过综艺入职格力，曾被视为接班人，后因"利用平台谋私利"争议离职[13] - 董明珠2025年连任后宣布已培养多位接班人，此次互动显示双方关系缓和[13] 天猫奢品前负责人任Vogue中国总经理 - 康泰纳仕任命郎雪月为中国区董事总经理，其曾任天猫奢品负责人及Alipay欧洲市场高管[15] - 人选反映时尚媒体领导标准变化，需兼具品牌管理、数字科技和电商运营能力[15] - Vogue中国近年高管更替频繁，新任命被视为突破数字化转型困局的关键举措[15]