Workflow
闭源模型
icon
搜索文档
Meta CEO X 微软 CEO 对话解读:「蒸馏工厂」为何成为开源的魅力之源?
机器之心· 2025-05-23 23:30
AI 正在让文档、应用程序和网站之间的界限消失 - Meta CEO Mark Zuckerberg 和微软 CEO Satya Nadella 在 LlamaCon 2025 闭幕会议上探讨 AI 对技术平台和生产力提升的影响 [1] - Nadella 认为 AI 时代文档、应用和网站界限模糊化 传统计算机系统将人类连续需求割裂为独立功能 不符合人类认知 [2-2] - 微软 90 年代 OLE 技术尝试打破应用障碍 实现复合文档 允许 Word 嵌入 Excel 或 PowerPoint 并保留原功能 [5] - 现代 AI 作为通用转换器 能理解用户意图而非机械执行命令 可提供信息、组织文档甚至生成可执行代码 [6] - AI 推动从面向工具计算到面向意图计算的范式迁移 信息形态由使用场景动态决定 用户体验回归自然思维流程 [6] - Nadella 将 AI 浪潮定位为继客户端服务器、互联网和云计算后的重大技术平台变革 需重构整个技术栈 [7] - 微软内部 20%-30% 代码由 AI 生成 AI 应用扩展至代码补全、聊天功能、智能体工作流和代码审查等领域 [7] - Meta 预计到 2026 年一半开发工作将由 AI 完成 [8] 开源与闭源模型的战略价值 - 微软采取灵活策略 同时支持开源和闭源模型 开放权重模型在企业蒸馏和定制化有优势 闭源模型有特定场景 [9] - Azure 云平台同时支持两类模型 为开发者提供多样化选择 [10] - Meta 通过 Llama 系列开源模型实践 推动社区协作演进 [10] 蒸馏工厂概念及其对 AI 生态系统影响 - 两位 CEO 认为建立支持模型蒸馏的基础设施和工具链是未来关键发展方向 [10] - Nadella 强调多模型应用趋势 标准化协议对实现多智能体多模型协作至关重要 [10] - Zuckerberg 提出蒸馏工厂概念 认为微软在多模型协同基础设施有独特优势 [10] - Nadella 将蒸馏工厂描述为开源最大魅力之一 是开源模型能发挥巨大作用的领域 [11]
Z Potentials|沈振宇,一个潮玩公司如何做出世界第一的AIGC模型平台
Z Potentials· 2025-03-26 11:49
核心观点 - AI技术将像水电一样普及,未来所有公司都将成为AI公司,不再有AI与非AI公司的区别 [2][4] - 开源模型将主导未来AI发展,技术秘密正在加速流动,闭源模式难以长期维持技术壁垒 [1][12][13] - TensorArt通过构建"模型规模"和"创作者规模"双重护城河,已成为全球最大开源图像视频模型平台 [1][19][20] - AI行业分为三层:底层算力和基座模型、中层平台、上层应用,TensorArt选择专注平台层 [10] - 低价策略带来规模效应是核心商业哲学,TensorArt会员费仅9.9美元,算力价格比竞品便宜5倍 [17][29] 创业历程 - 创始人沈振宇北大计算机系毕业,曾创立图虫被字节收购,亲历字节崛起全过程 [3][6] - 第二次创业选择潮玩赛道切入年轻人兴趣社区,现已覆盖数十个品类数千个IP [5] - 从字节学到"以终为始"思维方式和组织建设方法论,影响后续所有决策 [6][7] - 创业动机包含商业和情怀双重因素,看好小众兴趣大众化趋势 [4][5] TensorArt战略 - 定位为AI模型托管平台和分享社区,目前用户超200万,模型超50万,日生成图片超200万张 [9] - 核心优势在于强大的推理功能、高性能低价格的算力服务、完善的创作者商业化机制 [17][18] - 视频生成领域布局积极,已是支持最多基座模型的视频生成平台 [22][23] - 商业模式以会员订阅为主,50%收入来自额外算力包,海外用户付费意愿显著高于国内 [24] - 明确不做自有模型,专注开源模型基础设施,已赞助多个流行开源模型训练 [16] AI行业洞察 - 单一大模型能力有限,需要大量微调模型解决细分场景问题 [2][12] - 技术壁垒难以长期维持,Transformer原理已可被普通大学生理解 [13] - 95%模型训练师不会写代码,普通人也能参与AI创新 [2][14] - ChatBot和当前Agent都不是AI应用的最终形态,未来交互将更碎片化 [4][25] - AI工作流将成为重要方向,通过组合多个模型解决复杂问题 [26][27] 商业理念 - 坚持"低价带来规模"策略,定价贴近成本,通过规模效应盈利 [29] - 全球市场定位明确,模型开发者追求全球影响力而非局限国内 [21] - 借鉴小米科技普惠理念,让更多人能使用AI技术 [29] - CEO需要克服ego干扰,保持冷静判断市场情绪 [28][32]
喝点VC|Greylock解读DeepSeek-R1,掀起AI革命和重构经济秩序
Z Potentials· 2025-03-04 13:33
开源与闭源模型 - DeepSeek-R1 缩小了开源模型与闭源模型的差距 在关键推理基准测试中与 OpenAI 最新模型持平 尽管其规模更小 [2] - 开源模型在质量上已与最先进的闭源模型持平 标志着开源将模型层商品化的转折点 [2] - 开源模型的进步将推动 LLM 市场的竞争 企业将拥有多样化的实用选项 在计算能力、成本和性能之间进行权衡 [2][3] AI 基础设施与开发者使用 - DeepSeek-R1 利用强化学习(RL)提升推理能力 采用广义策略优化强化学习(GRPO)技术 是首个成功大规模实施并取得可测量增益的开源模型 [3] - 强化学习的突破被视为游戏规则的改变者 但当前 AI 工具尚未完全支持这一新范式 [3] - 开源模型的普及消除了“最大最好模型必须封闭”的护城河 企业可以完全掌控前沿模型 [4] 新应用与行业影响 - DeepSeek 增强的推理能力开启新应用浪潮 包括自主 AI 代理、专业规划系统和企业 AI 助手 [5] - 高度监管行业将受益于开源模型 因为企业可以完全控制数据的使用方式和发送目的地 [6] - 数据质量仍是关键优势 特定领域的标注和奖励函数对模型性能至关重要 [6] GenAI 经济学 - DeepSeek 降低了推理和训练成本 改变了 GenAI 部署的经济性 企业将更多地使用 AI 并部署多个特定领域模型 [7] - 开源模型的成本比使用 OpenAI 或 Anthropic 便宜多达 7 倍 解锁了更多经济上不可行的案例 [7] - 生成器的商品化趋势将推动标注技术的进步 包括 RLHF 和奖励函数等方法的优化 [8] 行业展望 - DeepSeek 标志着开源模型首次真正达到与专有替代品竞争的水平 开启了 AI 发展的新时代 [8] - 高质量、特定领域的数据和标注仍是 AI 未来的关键 尽管 DeepSeek 代表了有意义的进展 [8]