开源技术
搜索文档
麦肯锡 & Mozilla:2025 人工智能时代下的开源技术研究报告
欧米伽未来研究所2025· 2025-04-24 19:53
开源AI的应用现状 - 开源AI技术在企业AI技术栈的七个关键领域(数据、模型、托管/推理计算、修改、API与提示处理、工具、用户体验/应用)中实现显著渗透,超过半数受访者在数据、模型和工具领域使用开源技术[3] - 模型层面,Meta的Llama系列、Google的Gemma系列、艾伦人工智能研究所的OLMo系列等开源或部分开源模型性能快速提升,部分超越专有模型[4] - 开源应用存在结构性差异:模型修改和托管/推理计算领域采用率较低,可能因相关开源项目较新(如推理引擎vLLM于2024年4月推出)或企业偏好内部工具[4] - 行业差异显著:科技、媒体和电信(TMT)行业开源AI使用率达70%,印度(77%)和英国(75%)地域采用率最高[4] - 技术成熟度影响采用:经验丰富的开发者使用开源技术的可能性高出40%[4] 开源AI的价值驱动 - 成本优势突出:60%受访者认为开源AI实施成本低于专有方案,46%认为维护成本更低,51%认为软件工具成本更低[5] - 性能与易用性获认可:多数受访者对开源AI模型满意度高(满意者数量为不满意者的近十倍),高性能和易用性是主要驱动因素[5] - 开发者价值显著:81%开发者认为开源工具经验受市场重视,66%认为开源对工作满意度至关重要[5] - 价值实现时间短板:48%受访者认为专有工具更快带来价值,仅33%认为开源工具更优[5] 未来发展趋势 - 增长预期强劲:75%受访者预计未来几年将增加开源AI使用,反映市场对其价值的广泛认可[6] - 混合模式成主流:超70%受访者表示将在AI技术栈各层面灵活组合开源与专有技术[6] - 里程碑事件推动:2024年Meta Llama 3、DeepSeek-V3等开源模型表现优异,苹果、微软等巨头加大开源投入[6] 风险管理措施 - 主要风险领域:网络安全(62%受访者担忧)、法规遵从性(54%)、知识产权问题(50%)[7] - 风险缓解策略:建立自动化内容过滤等"护栏"机制、第三方评估(如私有基准测试)、文档管理(软件物料清单SBOM)、强化网络安全实践(可信执行环境TEE、差分隐私等)[8] - 贡献率低问题:仅13%受访者为开源项目贡献过,50%不确定未来是否参与,可能影响生态系统长期发展[8] 战略建议 - 开源AI已成为驱动创新、降低成本、吸引人才的核心要素,企业需将其纳入整体AI战略[9] - 建议采用混合策略,根据业务需求在开源与专有方案间灵活组合,同时建立完善风险管理框架[9] - 鼓励企业积极参与开源社区贡献,促进生态系统健康发展[9]
麦肯锡 & Mozilla:2025 人工智能时代下的开源技术研究报告
欧米伽未来研究所2025· 2025-04-24 19:53
开源AI的应用现状 - 开源AI技术在企业AI技术栈的七个关键领域实现显著渗透,超过半数受访者在数据、模型和工具三个核心领域利用开源技术[4] - 在模型层面,Meta的Llama系列、Google的Gemma系列、阿里巴巴的Qwen 2.5-Max等开源或部分开源模型性能快速提升,正在追赶甚至超越部分专有模型[5] - 开源技术应用存在结构性差异,模型修改和托管/推理计算领域采用率相对较低,可能与企业更倾向使用内部开发工具包有关[6] - 科技、媒体和电信(TMT)行业开源AI使用率高达70%,印度(77%)和英国(75%)的受访者报告的开源AI模型使用率最高[7] 开源AI的价值驱动因素 - 60%受访者认为开源AI实施成本低于专有方案,46%认为维护成本更低,51%认为相关软件工具成本更低[8] - 绝大多数受访者对使用的开源AI模型表示满意,高性能和易于使用是驱动满意度的首要因素[8] - 81%开发者表示拥有开源工具经验在其领域受到高度重视,66%认为使用开源工具对工作满意度至关重要[9][10] - 48%受访者认为专有工具能更快带来价值,仅33%认为开源工具在这方面表现更好[9] 开源AI的未来发展趋势 - 75%受访者预计其组织将在未来几年增加对开源AI技术的使用[11] - 2024年开源AI领域里程碑事件包括Meta的Llama 3基准测试表现优异,DeepSeek-V3推理速度媲美顶级专有系统[11] - 超过70%受访者在AI技术栈各层面对采用开源或专有技术持开放态度,未来可能形成混合式AI解决方案[11] - 企业正在采取建立"护栏"、第三方评估、加强文档管理和监控等措施应对开源AI风险[14][15] 开源AI的行业影响 - 开源AI正在成为企业构建AI能力、驱动创新、寻求竞争优势的核心组成部分[3] - 开源模式通过降低创新门槛促进技术普及与迭代,打破了传统商业软件的封闭模式[1] - 理解并战略性地运用开源AI已成为企业在智能化时代生存和发展的必修课[3] - 企业需要将开源AI视为整体AI战略不可或缺的一部分,采取务实灵活的混合策略[17]
DeepSeek披露,一天成本利润率为545%
华尔街见闻· 2025-03-01 19:17
成本利润率披露 - 公司首次披露成本利润率关键信息 假定GPU租赁成本为2美元/小时 日总成本为87072美元 若所有tokens按DeepSeek-R1定价计算 理论日收入达562027美元 成本利润率为545% [1][3] - 实际收入低于理论值 因V3定价更低且存在夜间折扣 收费服务仅占部分负载 [4] 资源利用与定价策略 - 最近24小时节点占用峰值278个 平均22675个 定价策略为014美元/百万输入tokens(缓存命中) 055美元/百万输入tokens(缓存未命中) 219美元/百万输出tokens [3] - 采用弹性资源调度 白天全节点部署推理 夜间释放节点用于训练/研究 优化目标为提升吞吐量与降低延迟 [4][5] - 公司强调定价原则为"不贴钱也不赚暴利" 在成本基础上保持适度利润 此前员工透露API服务利润率超50% [5] 行业争议与回应 - 潞晨科技创始人尤洋曾称DeepSeek API业务月亏4亿元 主要因测试速度与实际场景差距 机器利用率波动及不稳定性 [2][5] - 公司通过公开资源利用数据间接回应质疑 证明弹性伸缩可避免资源空置 [5] - 业内人士认为在线推理领域需持续吸引用户并保持技术领先才能盈利 商务付费能力与应用场景同样关键 [6] 开源周技术成果 - 公司结束为期5天的开源周 累计开源5个代码库 包括FlashMLA(Hopper GPU优化解码内核) DeepEP(MoE模型训练推理通信库) DeepGEMM(支持密集与MoE布局的即时编译库) Optimized Parallelism Strategies(大规模训练效率优化)及Fire-Flyer文件系统(3FS)与Smallpond数据处理框架 [7][8][9][10][11] - 开源技术被评价为从"运营驱动"转向"价值驱动" 推动智能未来创新 [12] 用户规模与行业影响 - DeepSeek App累计下载量超11亿次 周活跃用户峰值近9700万 [12] - 开源生态发展被视为中国技术创新的关键力量 公司实践展示开源硬件对技术自由的促进作用 [12]
AI 领域的“斯普特尼克时刻”:中国开源模型DeepSeek的逆袭!
未可知人工智能研究院· 2025-01-31 17:00
AI领域的"斯普特尼克时刻":DeepSeek的崛起 - 2023年中国开源模型DeepSeek横空出世,性能与OpenAI顶级模型相当但训练成本仅600万美元,不到OpenAI的十分之一,被比作AI领域的"斯普特尼克时刻"[1] - DeepSeek的出现打破了美国在AI领域的主导地位,标志着中国在人工智能领域的崛起已不可阻挡[3] DeepSeek的技术突破 - 核心模型R1采用全新训练方法,减少对人类标注数据的依赖,通过自我学习和强化学习提升性能,大幅降低训练成本[6] - R1模型在解决复杂数学问题和编程任务时表现优异,某些方面超越OpenAI模型[6] 开源策略的竞争优势 - DeepSeek采用完全开源策略,公开模型权重,降低使用门槛并促进全球技术交流创新[7] - 与美国科技巨头普遍采用的闭源策略形成对比,开源加速了技术传播和创新速度[7][8] 行业竞争格局变化 - 全球AI模型排名显示DeepSeek-R1和DeepSeek-V3分别位列第5和第9位,采用MIT和DeepSeek许可证,与谷歌、OpenAI的专有模型形成竞争[9] - 开源模型崛起正在改变AI领域竞争格局,推动全球科技生态发展[18] 成本效率优势 - DeepSeek的低成本(600万美元)和高效率让全球看到开源模型的可能性[1][20] - 与闭源模型相比,开源模型更便宜灵活,能更好适应不同场景需求,已在某些领域实现超越[20] 全球影响与行业应用 - DeepSeek模型被印度初创公司用于开发产品,如智能农业管理系统帮助提高农民产量和收入[24] - 教育机构利用DeepSeek开发智能教育平台,实现个性化学习方案[27] 未来发展趋势 - 开源与闭源结合将成为主流趋势,科技公司需在保护知识产权同时拥抱开源[21][29] - 开源技术普及推动AI平民化,使更多中小企业和个人开发者能够利用AI技术[27][29]