模型开源
搜索文档
智谱“瘦身”,AI公司的商业化大考
搜狐财经· 2025-10-23 11:51
文章核心观点 - 智谱正在进行组织架构和业务线调整,以优化商业化路径并冲刺上市,此次调整反映了中国大模型行业从技术探索向商业化落地转变的趋势 [1][2] - 公司战略重心从高人力成本的定制化项目(AI 1.0模式)转向发展标准化、轻交付的MaaS平台(AI 2.0模式),这是影响其未来估值的关键 [2][11][14] - 公司收缩投入不赚钱的C端业务,同时通过模型开源和发力海外市场寻找新的商业化增长点 [4][8][9] 业务线调整与商业化战略 - 公司对To C/B/G三条业务线进行了人员调整,据传G端产研部门近一半员工被裁,另一半转入交付团队,但公司官方回应称仅为基于战略目标的十余人调整 [1] - 公司持续收缩不够赚钱的C端业务(智谱清言),今年以来基本叫停了该产品在C端的宣传和投放,将资源聚焦于模型本身 [5][6] - 在B端和G端业务上,公司优化成本结构,避免陷入AI 1.0时代的高人力成本困局,其商业化更加明确的toB业务是反复调整的重点区域 [4][8] C端业务现状与价值 - 国内大语言模型产品在C端商业化表现不理想,大厂凭借算力、场景优势推行免费策略,使创业公司面临巨大压力 [7] - 智谱保留C端业务的价值主要在于为B/G端业务做产品预体验入口,以及为未来C端业务可能爆发预留战略窗口 [7] 开源战略与开发者生态 - 公司从2025年开始加大开源力度,包括最新的旗舰模型GLM-4.6也做到了发布即开源,以此培养开发者生态 [8][9] - 通过开源,公司推出了GLM-Coding Plan套餐,以更高性价比吸引超过十万开发者,并带动海外商业化收入预期ARR过亿 [9] - GLM-4.6被认证为"采用速度最快的模型",其token消耗量在12天内从1.68亿增长到159亿 [9] MaaS平台发展与标准化交付 - 公司将MaaS平台作为2025年的发展重点,旨在增收并调整业务中的技术收入比重,这是其打出差异化优势的关键一环 [11][12] - 公司获得浦东创投集团和张江集团总额10亿元的战略投资,将用于投入MaaS开放平台产业生态建设 [12] - 公司通过MaaS平台推行"标准件"类模型产品,试图以标准化交付提升核心产品收入占比,并降低项目制中的人力成本投入 [14] 海外市场拓展 - 公司将宣传重心转向海外市场,注册Z.ai域名,并加快与多个国家政府合作的步伐,在马来西亚、新加坡等地落地大模型基础设施 [8]
通义万相全新动作生成模型Wan2.2-Animate正式开源
智通财经· 2025-09-19 16:35
公司产品发布 - 阿里云于9月19日宣布其通义万相全新动作生成模型Wan2 2-Animate正式开源 [1] - 该模型支持驱动人物、动漫形象和动物照片,可应用于短视频创作、舞蹈模板生成、动漫制作等领域 [1] - 用户可在Github、HuggingFace和魔搭社区下载模型和代码,也可通过阿里云百炼平台API或通义万相官网直接体验 [1] 产品技术升级 - Wan2 2-Animate模型基于此前开源的Animate Anyone模型进行全面升级 [1] - 模型在人物一致性、生成质量等指标上大幅提升,并同时支持动作模仿和角色扮演两种模式 [1] 公司开源战略与市场表现 - 自今年2月以来,通义万相已连续开源20多款模型 [1] - 模型在开源社区和三方平台的下载量已超过3000万,是开源社区最受欢迎的视频生成模型之一 [1] - 通义万相模型家族已支持文生图、文生视频、图生视频、人声生视频和动作生成等10多种视觉创作能力 [1]
通义首个深度研究Agent模型DeepResearch正式开源
每日经济新闻· 2025-09-18 12:27
公司动态 - 通义首个深度研究Agent模型DeepResearch正式开源 [1] - 该模型参数仅30B(激活3B)[1] - 模型、框架和方案均已全面开源 [1] 技术表现 - 在多个权威评测集上取得SOTA成绩 [1] 产品获取 - 用户可在Github、Hugging Face和魔搭社区下载模型和代码 [1]
全文|Meta Q2业绩会实录:预计明年员工薪酬支出将增长
新浪财经· 2025-07-31 19:47
财务表现 - 2025财年第二季度营收475 16亿美元 同比增长22% 不计汇率影响同样增长22% [1] - 净利润183 37亿美元 同比增长36% [1] 人工智能战略 - 公司内部团队正尝试用Llama 4大模型打造自主AI智能体以改进Facebook算法和用户参与度 [2] - 超级智能被视为未来几年重塑所有系统和底层逻辑的关键 公司将持续投入资源 [2][5] - 人工智能技术发展速度超预期 公司需确保拥有顶尖人才团队和行业领先算力能力 [3] - 研发超级智能需小型人才密集型团队 与传统大规模团队模式不同 [6] 资本支出与预算 - 2026年基础设施预算将成为最大支出 包括服务器 数据中心和云服务扩容 [4][9] - 员工薪酬支出是第二大驱动因素 主要来自人工智能领域人才招聘 [4][9] - 2026年资本支出可能超1000亿美元 部分资金将通过合作伙伴关系解决 [10][12] 技术研发方向 - 超级智能研发重点在于"自我改进"能力 使技术具备自身迭代功能 [5] - 核心推荐引擎短期优化包括内容精准匹配 小创作者曝光和用户兴趣探索 [7] - 长期计划开发跨服务基础推荐模型 并将大语言模型深度整合至推荐系统 [7] 开源策略 - 公司坚持部分模型开源原则 不会将所有技术开源 [8][11] - 开源模型体积过大可能带来实用性和安全问题 需权衡利弊 [9][11] 产品发展 - Meta AI模型迭代将显著提升用户参与度 从Llama 4到4 1版本持续优化 [19] - 智能眼镜被视为AI技术理想物理形态 与雷朋合作产品取得积极进展 [20][21] - 智能眼镜可实现多模态AI交互 未来可能成为基础认知工具 [22][23] 投资回报 - 核心AI业务投资回报率强劲 生成式AI仍处早期阶段 [15] - 基础设施投资注重灵活性 服务器将成为最大资金支出项 [15] - 公司通过股票回购抵消股权稀释 维持股东回报 [24]
应激的Llama,开源的困局
36氪· 2025-04-24 19:38
Llama 4 发布表现与问题 - Llama 4 在实测中表现不佳 包括10M token上下文长度出错、小球测试失败、9.11>9.9比大小错误等基础能力缺陷 [1] - 模型发布24小时内被内部员工曝光基准测试造假 领导层将多个测试集混合在后期训练中以制造"看似合格"的结果 [3] - 代码能力严重不足 Maverick版本在Polyglot编程测试中正确率仅15.6%~16% 402B参数规模反而被32B参数的Qwen-QwQ等模型超越 [3] - 多模态能力未达预期 图像理解能力不如谷歌去年开源的Gemma 2 长上下文任务性能随token增加显著下降 [7] Meta 面临竞争压力与战略失误 - 面临GPT-4o、Claude-3.7等闭源模型在多模态和代码能力上的领先优势 同时受到DeepSeek V3等开源后起之秀的冲击 [6] - 扎克伯格设定4月截止日期强迫研发团队仓促发布 导致测试周期压缩和模型未达预期即上线 [6] - 技术路线依赖传统DPO方法和参数堆叠 缺乏对多模态底层架构的创新探索 [6] - 前期建立的AI生态面临开发者流失风险 可能影响与微软Azure等云计算合作伙伴关系 [13] 开源商业模式分析 - 开源模型通过免费基础服务吸引开发者 通过高性能API服务收费 DeepSeek-R1 API定价为每百万输入Token 1元 输出Token 16元 [8] - 私有化部署服务面向政企客户 大模型底座建设费用基本千万起步 某厂商最新模型部署起价2000万 [9] - 采用开源与闭源双轨并行策略 开源基础版建立生态 闭源高级版服务付费市场 如智谱开源ChatGLM-6B同时推出收费的GLM-130B [10] - 通过开源构建开发者生态 衍生云服务、广告、配套AI产品等盈利渠道 [12] 行业发展趋势与战略建议 - 国内大模型公司加速开源进程 百度宣布2025年6月全面开源文心4.5系列 [16] - 突破性能依赖架构创新 DeepSeek通过MoE架构降低成本提升效率 而非单纯参数堆叠 [17] - 企业需结合自身基因制定变现策略 阿里通过全模态开源推动云服务 智谱采用开源闭源双轨策略 [18] - 开源模型存在许可证限制 Meta Llama2禁止月活超7亿公司使用 且部署需要昂贵计算资源 [19]