闭源模型

搜索文档
互联网女王报告揭秘硅谷现状:AI指数级增长,中国厂商在开源竞争中领先 | 企服国际观察
钛媒体APP· 2025-06-11 10:33
人工智能发展速度 - ChatGPT仅用17个月突破8亿用户,远超互联网时代任何产品的增长速度 [3] - ChatGPT不到三个月达到1亿用户,截至今年4月每周用户量达8亿,每年处理超过3650亿次搜索 [8] - 人工智能相关职位空缺自2018年起增长448%,显示行业对人才的强劲需求 [19] 技术成本与效率 - 模型训练成本高达10亿美元,但推理成本在两年内下降99%(按每百万token计算) [4] - 2022年至2024年期间,运行大语言模型的每个token成本下降99.7% [17] - 英伟达2024年Blackwell GPU的单位功耗较2014年Kepler GPU降低10.5万倍 [4][14] 开源与闭源模型竞争 - 闭源模型(如GPT-4、Claude)性能卓越但缺乏透明度,受企业和政府机构青睐 [6] - 开源模型(如Llama、Mixtral)低成本且功能增强,推动主权AI和本地语言模型发展 [10][13] - 中国在开源竞赛中领先,2025年将发布DeepSeek-R1、阿里巴巴Qwen-32B和百度Ernie 4.5 [12] 市场与应用 - 印度成为AI平台重要市场,贡献ChatGPT移动应用用户的13.5%,超过美国的8.9% [10] - AI应用拓展至汽车驾驶、工厂机器人、医疗保健等领域,成为职业"副驾驶" [18] - 行业从垂直SaaS转向横向整合,如微软集成Copilot、Zoom和Canva融入生成式AI [21] 基础设施与投资 - 云端芯片(谷歌TPU、亚马逊Trainium)规模化开发推动AI基础设施快速迭代 [7] - 风险投资加速流入AI领域,但企业与云服务商仍需高额基础设施投入 [7] - 全球范围内针对芯片、数据中心的争夺战激烈,堪比冷战时期太空竞赛 [21]
Bonus独家|智谱COO张帆即将离职,智谱会是下一个商汤吗?
36氪· 2025-06-04 21:09
36氪「职场Bonus」(ID:ZhiChangHongLi) 大模型企业频繁被质疑的商业化问题正愈加凸显。从创始之初就对标OpenAI,商业化方向直指B端、G端的智谱AI,如今正面临这样的难题。 《职场Bonus》独家获悉,智谱AI COO张帆 [1] 将于6月底离职,在AI Agent领域继续创业。今年年初,智谱商业化部门曾发生过一次变化:进行了小规 模的"人员流动",张鹏和张帆虽仍共同负责商业化,但各自手下管理的业务经历了打散重组,具体划分方式不再按照ToB/ToG的逻辑。 针对张帆离职创业一事,《职场Bonus》向智谱AI求证,其公关回应称:"张帆离开后的创业项目也是智谱MaaS(模型即服务)平台生态的一份子,帮助 智谱模型完成最后一公里的转化,其新项目已获得智谱的投资支持。智谱目前将训练下一代基座模型视为最高优战略,专注于持续提升模型性能,并通过 MaaS平台向外输出模型智能及拓展商业化,重点培育MaaS平台的商业应用生态及创新的Agent生态。" 除了商业化侧的人事变动外,有信源指出智谱AI院负责人东昱晓 [2] 已于去年年底离职,且智谱AI院从按照大团队的整体技术规划,变成了以各自小单元 博士生 ...
最新必读,互联网女皇340页AI报告解读:AI岗位暴涨,这些职业面临最大危机
36氪· 2025-06-03 21:32
AI行业趋势 - ChatGPT仅用2个月达到1亿用户,17个月后月活增至8亿,订阅用户超2000万,年营收近40亿美元,成为商业化速度最快的AI产品[5][6] - 2024年AI相关资本支出达2120亿美元,同比增长63%,为十年内最高[6][11] - AI模型训练成本8年内暴涨2400倍,单个模型训练成本可能在2025年达10亿美元,未来或突破100亿美元[6][20] - 开源模型如DeepSeek、Qwen等在推理和编程能力上已逼近顶级闭源模型[36][37] 基础设施投资 - 苹果、英伟达、微软、Google、亚马逊、Meta等科技巨头2024年AI相关资本支出达2120亿美元[11] - 英伟达占据数据中心投资预算的25%,成为AI浪潮最大受益者[12] - 英伟达GPU推理单个Token能耗10年间下降约105000倍,有利于规模化部署[27] 技术发展 - AI在图灵测试中表现超越人类,GPT-4.5被73%测试者误认为人类[43][46] - Midjourney图像生成质量从v1到v7显著提升,达到商品级水平[50] - ElevenLabs语音克隆技术月访问量从0飙升至2000万,音色克隆+实时翻译趋近商用级别[57] 应用场景 - Waymo自动驾驶出租车在旧金山市场份额已达1/3[59] - AI相关岗位2018-2025年增长448%,传统IT岗位需求下降9%[67][69] - AI Agent成为新型数字劳动力,能执行多步骤任务如在线购物、界面导航等[72][74] 区域发展 - 美国发布超100个训练计算量超10²³ FLOPs的大语言模型,中国紧随其后不断缩小差距[40] - ChatGPT北美之外用户普及率超90%,呈现全球同步爆发特征[9]
Meta CEO X 微软 CEO 对话解读:「蒸馏工厂」为何成为开源的魅力之源?
机器之心· 2025-05-23 23:30
AI 正在让文档、应用程序和网站之间的界限消失 - Meta CEO Mark Zuckerberg 和微软 CEO Satya Nadella 在 LlamaCon 2025 闭幕会议上探讨 AI 对技术平台和生产力提升的影响 [1] - Nadella 认为 AI 时代文档、应用和网站界限模糊化 传统计算机系统将人类连续需求割裂为独立功能 不符合人类认知 [2-2] - 微软 90 年代 OLE 技术尝试打破应用障碍 实现复合文档 允许 Word 嵌入 Excel 或 PowerPoint 并保留原功能 [5] - 现代 AI 作为通用转换器 能理解用户意图而非机械执行命令 可提供信息、组织文档甚至生成可执行代码 [6] - AI 推动从面向工具计算到面向意图计算的范式迁移 信息形态由使用场景动态决定 用户体验回归自然思维流程 [6] - Nadella 将 AI 浪潮定位为继客户端服务器、互联网和云计算后的重大技术平台变革 需重构整个技术栈 [7] - 微软内部 20%-30% 代码由 AI 生成 AI 应用扩展至代码补全、聊天功能、智能体工作流和代码审查等领域 [7] - Meta 预计到 2026 年一半开发工作将由 AI 完成 [8] 开源与闭源模型的战略价值 - 微软采取灵活策略 同时支持开源和闭源模型 开放权重模型在企业蒸馏和定制化有优势 闭源模型有特定场景 [9] - Azure 云平台同时支持两类模型 为开发者提供多样化选择 [10] - Meta 通过 Llama 系列开源模型实践 推动社区协作演进 [10] 蒸馏工厂概念及其对 AI 生态系统影响 - 两位 CEO 认为建立支持模型蒸馏的基础设施和工具链是未来关键发展方向 [10] - Nadella 强调多模型应用趋势 标准化协议对实现多智能体多模型协作至关重要 [10] - Zuckerberg 提出蒸馏工厂概念 认为微软在多模型协同基础设施有独特优势 [10] - Nadella 将蒸馏工厂描述为开源最大魅力之一 是开源模型能发挥巨大作用的领域 [11]
Z Potentials|沈振宇,一个潮玩公司如何做出世界第一的AIGC模型平台
Z Potentials· 2025-03-26 11:49
核心观点 - AI技术将像水电一样普及,未来所有公司都将成为AI公司,不再有AI与非AI公司的区别 [2][4] - 开源模型将主导未来AI发展,技术秘密正在加速流动,闭源模式难以长期维持技术壁垒 [1][12][13] - TensorArt通过构建"模型规模"和"创作者规模"双重护城河,已成为全球最大开源图像视频模型平台 [1][19][20] - AI行业分为三层:底层算力和基座模型、中层平台、上层应用,TensorArt选择专注平台层 [10] - 低价策略带来规模效应是核心商业哲学,TensorArt会员费仅9.9美元,算力价格比竞品便宜5倍 [17][29] 创业历程 - 创始人沈振宇北大计算机系毕业,曾创立图虫被字节收购,亲历字节崛起全过程 [3][6] - 第二次创业选择潮玩赛道切入年轻人兴趣社区,现已覆盖数十个品类数千个IP [5] - 从字节学到"以终为始"思维方式和组织建设方法论,影响后续所有决策 [6][7] - 创业动机包含商业和情怀双重因素,看好小众兴趣大众化趋势 [4][5] TensorArt战略 - 定位为AI模型托管平台和分享社区,目前用户超200万,模型超50万,日生成图片超200万张 [9] - 核心优势在于强大的推理功能、高性能低价格的算力服务、完善的创作者商业化机制 [17][18] - 视频生成领域布局积极,已是支持最多基座模型的视频生成平台 [22][23] - 商业模式以会员订阅为主,50%收入来自额外算力包,海外用户付费意愿显著高于国内 [24] - 明确不做自有模型,专注开源模型基础设施,已赞助多个流行开源模型训练 [16] AI行业洞察 - 单一大模型能力有限,需要大量微调模型解决细分场景问题 [2][12] - 技术壁垒难以长期维持,Transformer原理已可被普通大学生理解 [13] - 95%模型训练师不会写代码,普通人也能参与AI创新 [2][14] - ChatBot和当前Agent都不是AI应用的最终形态,未来交互将更碎片化 [4][25] - AI工作流将成为重要方向,通过组合多个模型解决复杂问题 [26][27] 商业理念 - 坚持"低价带来规模"策略,定价贴近成本,通过规模效应盈利 [29] - 全球市场定位明确,模型开发者追求全球影响力而非局限国内 [21] - 借鉴小米科技普惠理念,让更多人能使用AI技术 [29] - CEO需要克服ego干扰,保持冷静判断市场情绪 [28][32]
喝点VC|Greylock解读DeepSeek-R1,掀起AI革命和重构经济秩序
Z Potentials· 2025-03-04 13:33
图片来源: greylock 在快速发展的 AI 世界中, DeepSeek-R1 的到来标志着一个关键转折点。 最好的情况下,工程团队将拥有多样化的实用选项,每个选项在计算能力、成本和性能之间都有权衡,使他们能够解决极其广泛的问题。无论如何,我认 为世界都将从这一进步中受益。" Ratner 呼应了上述关于开源和模型多样性的观点,强调这为企业加速定制自己的 AI 提供了巨大动力:"我们一直认为开源模型紧随其后——算法和模型架 构很少能长期保密,这只是时间问题。 然而,它突显了一个激动人心的现实,即企业将拥有大量高性能且成本低廉的 LLM 选项。 随后可以根据其数据和专业知识进行评估和定制,以满足其独 特的使用场景。我预计 DeepSeek 将极大地加速这一企业 AI 定制化的趋势。" AI 基础设施与开发者使用:强化学习革命 我们联系了 Greylock 投资组合中五家领先 AI 基础设施公司的创始人—— Devvret Rishi ( Predibase )、 Tuhin Srivastava ( Baseten )、 Ankur Goyal ( Braintrust )、 Jerry Liu ( Lla ...