Llama

搜索文档
企业级LLM:性能为王,开源采用趋于平缓 | Jinqiu Select
锦秋集· 2025-08-03 12:31
在性能至上的铁律下,多数人眼中"开源"的未来正面临前所未有的挑战。 Me n l o Ve n t u r e s最新发布的2 0 2 5年中期报告基于对1 5 0家以上企业及初创公司的技术决策 者调查揭示了一个令人震惊的行业转向: 当市场沉迷于开源模型的成本优势时,企业级LLM API支出却在过去六个月内从3 5亿美元 增长至8 4亿美元,实现翻倍增长,而闭源模型正在这个价值千亿的市场中建立难以逾越的 性能护城河。 这份报告的核心观点如下: 锦 秋 基 金 ( 公 众 号 : 锦 秋 集 ;ID : j q c a p it a l ) 认 为 , 虽 然 Me n l o Ve n t u r e s 是 An t h r o p i c 的 投资人,可能立场上有倾向,但这篇报告在一定程度上反映了企业用户对AI产品采购的核 心考量与实际偏好,因此也做了编译。 " 企 业 级 市 场 中 , 开 源 模 型 的 采 用 率 趋 于 平 稳 , 因 其 性 能 仍 落 后 闭 源 模 型 9 到 1 2 个 月。" 尽 管 开 源 模 型 具 备 成 本 和 定 制 优 势 , 但 性 能 差 距 、 部 署 ...
扩散架构 or「NoThinking」,AI 对话的「1Hz 壁垒」如何突破?
机器之心· 2025-08-03 09:30
1. 扩散架构 or「NoThinking」,AI 对话的「1Hz 壁垒」如何突破? Eric Jang 的「智能频谱」如何解释 AI 能力?什么是 AI 的「1Hz 壁垒」? 不同类型的 AI 应用分别需要多快的反映速度?扩散 架构和「NoThinking」路线能解锁怎样的速度层级?具备「Ultra Instinct」的智能体需要哪些先决条件?通用智能体为何要具 备跨越 0.1Hz - 50Hz 的能力?... 机器之心PRO · 会员通讯 Week 31 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- 2. Demis Hassabis 深度对话:AI 的瓶颈在于「品味」的缺失? 什么是「可学习自然系统」?物理规律不是非得靠「交互」才能学习?AI 的「品味」缺失如何体现?下一代 AI 最大机会在于构 建真正的开放式世界?... 本期完整版通讯含 2 项专题解读 + 30 项 AI & Robotics 赛道要事速递,其中技术方面 8 项,国内方面 14 项,国外方面 8 项。 ② 在频谱另一端「极快的智能」对应频率极高的决策行为,如人类在翻书时,手指施加的力量和摩 擦 ...
别再乱选AI课程了——这些书才是你的正解
36氪· 2025-08-03 08:03
编程与软件工程 - 编程能力与软件工程技能是进入AI领域的必备基础,OpenAI首席技术官Greg Brockman支持这一观点 [1] - AI领域最具影响力的人往往是同时精通软件工程与机器学习的专家,优秀软件工程师在AI领域潜力非凡 [1] - Python凭借易用性和完善生态成为AI领域首选语言,但热门AI工程师岗位可能需要掌握Java/GO/Rust等后端语言 [1] - 建议从Python入门,但未来可能需要转向其他语言,持续实践是掌握编程技能的最佳方式 [2] - 推荐Python学习资源包括4小时启蒙课、全网最受推崇的体系课程、面试刷题平台和哈佛CS50计算机导论 [5] 数学与统计学 - 成为顶尖AI从业者需理解模型底层原理,推荐资源包括《数据科学实用统计学》和《机器学习数学基础》 [9] - DeepLearning.AI推出的数学专项课程涵盖微积分、线性代数、统计概率等核心内容,专为AI/ML设计 [9] 机器学习 - 当前主流AI指生成式AI(GenAI),属于机器学习分支,但AI概念可追溯至上世纪50年代神经网络诞生时 [6][8] - 推荐机器学习资源包括《Scikit-Learn、Keras与TensorFlow机器学习实战》和机器学习专项课,后者新增推荐系统与强化学习内容 [12] - 《统计学习导论》是掌握机器学习根基的绝佳教材,传授学科精髓 [12] 深度学习与大语言模型 - 深度学习是AI的子集,当前所有生成式AI算法源于此领域,包括大语言模型、扩散模型和Transformer架构 [10] - PyTorch是深度学习框架首选,2021年77%研究论文采用该框架,HuggingFace平台92%模型为其专属 [13] - 推荐资源包括深度学习专项课、Andrej Karpathy的《大语言模型入门》和《神经网络:从零进阶》 [13] 人工智能工程 - AI工程师的核心工作是运用基础GenAI模型开发产品,工作性质更接近传统软件工程而非机器学习工程 [11] - 《实用MLOps指南》是模型部署领域必备书,覆盖容器化、脚本编写、云系统和模型监控等全流程 [11] - 《人工智能工程实践》是当红教材,作者Chip Huyen是生产环境ML/AI系统权威专家 [14]
扎克伯格发文正式告别“默认开源”!网友:只剩中国 DeepSeek、通义和 Mistral 还在撑场面
AI前线· 2025-08-02 13:33
Meta的AI战略调整 - 扎克伯格提出"个人超级智能"愿景,目标是让每个人借助AI实现个人目标 [2] - 公司正在调整AI模型发布策略,从激进开源转向谨慎选择性开源,强调需管理超级智能带来的安全挑战 [3][6] - 此前Meta将开源视为核心优势,承诺打造性能媲美闭源的先进开源模型(如Llama系列),但最新表态显示开源不再是默认选项 [5][6][8] 开源策略的转变与行业影响 - 2024年扎克伯格曾明确表示"Meta致力于开源AI",并预测Llama后续模型将成为业内最先进 [6] - 2025年立场变化:不再承诺开源所有成果,尤其涉及"能力质变"的模型可能闭源 [7][8] - 这一转变使DeepSeek、通义千问和Mistral成为全球少数坚持开源最先进模型(SOTA)的公司 [9][10] 商业化与资源投入 - Meta斥资143亿美元投资Scale AI并重组AI部门为"Meta Superintelligence Labs",集中资源开发闭源模型 [11][12] - 公司暂停开源模型"Behemoth"测试,转向闭源开发,高薪组建独立团队推进AGI研究 [11][12][14] - 商业化路径明确:通过AR眼镜、VR头显等硬件产品推广"个人超级智能"服务 [14] 竞争格局与行业动态 - Meta认为开源不影响其广告核心收入,但闭源竞争对手(如OpenAI)依赖模型访问权限销售 [11] - Llama3开发期间,公司为超越GPT-4逐渐改变策略,最终转向闭源冲刺AGI [11] - 中国公司如DeepSeek-R1的成功激励行业坚持开源,而Meta的退出可能强化中国在开源领域的影响力 [10][17]
基模下半场:开源、人才、模型评估,今天的关键问题到底是什么?
Founder Park· 2025-07-31 22:57
中国开源模型的崛起 - 中国开源模型如Kimi、Qwen、智谱GLM-4.5等近期密集发布,Hugging Face热门榜几乎被中国模型垄断[1][3] - 中国模型发展速度惊人,一旦模式被验证可行,中国擅长集中资源快速工程化实现[5][8] - 中国开源模型可能成为发展中国家的模型标准,尤其在"全球南方"市场占据优势[6][7] 中美AI竞争格局 - 大模型竞争已演变为中美之间的比拼,开源标准可能转向中国模型[3] - 美国如Meta等公司正加大投入,但中国在公私合作和资源投入方面更具优势[8][10] - 中国机构如清华大学已拥有先进语言模型,而美国部分高校资源相对不足[8][10] 模型训练与人才 - 不同机构间人才差异并不显著,模型好坏更多取决于资源利用效率[15][16] - 顶尖实验室内部普遍存在混乱,但关键在于能否产出有效模型[19][20] - 实验速度和基础设施比单纯追求"天才"更重要,需要重视团队协作价值[21][22] 模型评测与基准测试 - 当前更需要好的基准测试来评估模型能力,而非仅关注技术细节[3][24] - 制作高质量评测的门槛越来越高,但可能带来新的话语权[24][25] - 评测领域存在巨大蓝海机会,定义新任务不需要庞大算力[26] 强化学习与推理技术 - RL无法泛化到数学和代码之外的说法被夸大,这些领域只是更容易验证[32] - GSPO算法通过分组序列策略优化显著提升样本效率[28][29] - 模型推理研究进展有限,蒸馏小模型比RL更实用[27] 未来挑战与趋势 - 验证难度将越来越大,特别是在科学发现等复杂领域[36][37] - 智能体相关能力可能成为未来关键基准,参数规模扩张不再是主要路径[23] - 行业需要改变模型优势的传达方式,超越单纯基准测试分数[24]
刚刚,扎克伯克发文正式告别“默认开源”!网友:只剩中国 DeepSeek、通义和 Mistral 还在撑场面
猿大侠· 2025-07-31 12:09
Meta的AI战略转向 - 公司调整AI模型发布策略,从"默认开源"转向"选择性开源",以推动"个人超级智能"愿景[1][6] - 扎克伯格强调需谨慎管理超级智能带来的安全挑战,并慎重考虑开源内容[1][4] - 公司此前曾承诺开源Llama后续模型,但2025年表态显示开源不再是尖端模型的默认选项[2][6] 开源策略的演变 - 2024年公司立场为"开源AI对行业至关重要",2025年转变为"严谨应对风险,选择性开源"[2][6] - 公司未承诺开源所有成果,若模型能力质变且开源不负责任则保留闭源权利[4] - Llama系列此前被视作区别于OpenAI等对手的关键优势,但最新表态削弱了这一定位[1][6] 商业与竞争动态 - 公司斥资143亿美元投资Scale AI并重组AI部门为"Meta Superintelligence Labs",集中资源开发闭源模型[11][12] - 闭源策略部分源于竞争压力,公司为击败GPT-4而暂停开源模型Llama Behemoth的开发[12][13] - 主要收入依赖广告而非模型销售,此前认为开源不影响营收,但竞争落后促使策略调整[12] 技术布局与产品方向 - 新组建的超级智能团队在隔离办公区研发闭源模型,目标直指AGI[13][14] - 计划通过AR眼镜、VR头显等硬件推广"个人超级智能",强调情境感知设备的计算主导地位[14] - 发言人表示未来将并行训练开源与闭源模型,但最先进模型可能不再开源[14][15] 行业影响 - Meta态度转变导致全球开源SOTA模型主力转向中国公司如DeepSeek、通义千问和Mistral[9][10] - DeepSeek-R1的成功激励中国公司坚持开源,而Llama4失利促使Meta降低开源优先级[9] - 行业不确定性增加,闭源模式因商业控制力受竞争对手青睐,开源阵营期待中国公司填补空缺[6][9]
速递| 一年估值涨7倍,华人AI初创Fireworks AI冲刺40亿美元估值,直面英伟达竞争
Z Potentials· 2025-07-29 18:11
公司估值与融资 - 公司正以40亿美元估值进行融资谈判 较一年前增长逾七倍 [1] - 光速创投与Index Ventures洽谈领投本轮融资 此前已通过红杉资本和Benchmark融资7700万美元 [2] - NVIDIA AMD Databricks Ventures和MongoDB Ventures也是公司投资者 [2] 财务表现与增长 - 年化收入突破2亿美元(月均1700万) 预计年底达3亿美元 [3][5] - 毛利率约为50% 与同业持平但低于订阅软件业务70%的水平 [3][5] - 计划通过GPU优化将毛利率提升至60% [5] 商业模式与竞争优势 - 通过API出租搭载NVIDIA/AMD芯片的服务器 提供开源AI模型访问 [4] - 帮助企业比传统云服务商更快更经济地运行开源模型 [3] - 客户包括Cursor和Perplexity等快速增长的公司 [3] 行业竞争格局 - 主要竞争对手包括Together AI(估值30亿/年收1.5亿)和Baseten [4] - NVIDIA收购Lepton后推出GPU云市场 形成直接竞争 [4] - 面临CoreWeave等头部服务商的价格竞争压力 [5] 技术与发展战略 - 由6位Meta前PyTorch开发者和1位Google AI前工程师创立 [2] - 专注于GPU资源使用效率优化 [5] - 提供工具帮助客户定制模型并提升推理质量 [5] 行业趋势 - 云GPU转售商可能成为大型云服务提供商的收购目标 [5] - 行业普遍面临服务器容量闲置和低价竞争挑战 [5]
Elad Gil:AI 应用进入收敛期,比模型跑得快才能抓住红利
Founder Park· 2025-07-28 23:33
AI商业格局的成型 - 过去四年AI领域从"技术迷雾"进入"商业马拉松"阶段,模型能力提升推动应用场景验证,市场格局初定[1] - GPT-3发布后市场预见变革,早期GenAI公司如Harvey、Perplexity等获得融资,当时OpenAI是唯一明确的基础模型公司[3] - 2022年代码/AI驱动软件开发重要性显现,但胜出者未定,直到2023-2024年Cursor、Codium等产品陆续上线[4] 已被验证的市场机会 基础模型LLMs - LLM领域资本壁垒达数十亿美元级别,核心玩家包括Anthropic、Google、Meta、Microsoft等,与云服务商深度合作[6] - 中国开源LLM如Deepseek、Qwen等在测试中表现强劲,但新玩家难以突破资本护城河[12] - 基础模型公司营收从0到数十亿美元仅用3年,云厂商AI季度支出达数十亿美元规模[6] Coding领域 - GitHub Copilot 2021年推出后营收快速攀升,部分企业两年内达5000万-5亿美元[14] - Figma和Canva推出vibe coding工具,未来可能出现更多类似产品[15] - 基础模型公司可能通过coding生成能力直接切入该市场,因其经济价值和AGI路径重要性[15] 法律领域 - Harvey和CaseText成为法律市场领先者,Legora已被250家律所采用[17][19] - 法律全流程自动化仍处早期,但Harvey等已构建完整处理系统,可能扩展至其他专业服务领域[19] 医疗记录整理 - Abridge、Ambience等公司主导医疗记录市场,未来可能被整合进头部企业或拓展至医疗体系其他环节[20] 客户服务 - Decagon和Sierra主导美国市场,商业模式从"seat-based"转向按任务计费[21] - Agentic操作取代人类工作角色,推理模型进步加速这一转变[21] 搜索重构 - Perplexity作为少数初创企业,与Google、OpenAI等巨头竞争,推出Comet浏览器集成代理功能[22][23] 潜在AI重构领域 - 会计、合规、金融工具、销售代理、安全等领域适配GenAI,已有早期公司探索[24][25] - 部分市场因模型能力不足尚未成熟,需等待技术拐点[26] GPT Ladder概念 - 模型能力跃迁解锁新场景,如GPT-4推动法律工作流爆发,Claude 3.5提升coding工具可用性[27] - GPT-5等未来版本可能开启目前无法实现的应用场景[28] AI Agent趋势 - 从chatbot向agentic workflows演变,Devin、Decagon等代表早期应用[32] - 软件商业模式从"seat-based"转向按认知能力计费,重塑企业预算逻辑[33] 行业整合趋势 - GenAI驱动并购整合,直接收购公司可加速AI采纳并提高经济回报[34] - 头部初创合并或与传统企业整合将成为重要策略,市场进入整合期前夜[35][36] 市场阶段总结 - 代码生成、法律服务等早期应用领域领先者已确立,新市场处于颠覆临界点[37] - GenAI进入市场格局明朗、竞争收敛的新阶段[37]
Meta chief AI scientist Yann LeCun clarifies his role after the company hires another chief AI scientist
Business Insider· 2025-07-27 03:50
The more the merrier at Meta. The AI talent wars took another turn on Friday when Meta CEO Mark Zuckerberg announced that Shengjia Zhao, co-creator of ChatGPT and the former lead scientist at OpenAI, is now the chief scientist at Meta's Superintelligence Labs."In this role, Shengjia will set the research agenda and scientific direction for our new lab working directly with me and Alex," a statement shared to Zuckerberg's Threads account said. "Shengjia co-founded the new lab and has been our lead scientist ...
硅谷华人能不能站起来把钱挣了?
虎嗅APP· 2025-07-25 09:01
美国AI行业现状 - 近期美国AI领域热点从AGI转向SSI(超级人工智能),Meta重组AI团队并高薪挖人,同时马斯克的XAI发布Grok4但编程能力仍有局限[3] - Meta的Llama系列开源模型表现下滑,Llama4因中国DeepSeek竞争被迫调整训练计划导致性能不佳,中国开源模型在技术上已实现赶超[5] - Meta AI团队44名核心成员中至少50%为华人,且普遍具备AI大厂经验,反映美国AI企业对华人技术依赖度高[5][6] 中美AI竞争格局 - 美国AI企业转向闭源策略以保护商业利益,而中国以DeepSeek为代表推动开源模型发展,削弱美国闭源模型的垄断利润空间[17][18] - DeepSeek R1公开推理过程打破技术神秘化,Kimi K2通过编程和AI代理功能冲击美国巨头生态,中国开源模式更符合基础设施普惠理念[18][22] - 美国政治界持续渲染"中国抄袭论",但实际华人占美国AI顶会参与者的50%以上,技术突破高度依赖华人贡献[10][20] 行业技术动态 - Meta原首席科学家Yann LeCun因质疑当前大模型架构被替换,反映资本更倾向可量化的数据/算力投入而非架构创新[7] - 数据标注公司Scale AI的华人高管Alexander Wang接管Meta AI研发引发质疑,其业务模式依赖第三世界人力且缺乏模型训练经验[8] - 美国AI炒作概念从AGI转向SSI存在商业动机,通过无限回报承诺合理化指数级投入,而中国开源模型迫使行业重新评估技术路径[17][18] 人才与地缘政治 - 英伟达等美国芯片企业承认依赖华人人才,但华人从业者在美仍面临系统性歧视,部分通过"反华表态"获取认同[10][24] - 美国收紧芯片出口管制并强调"保持AI领导地位",但技术实际进展与政治叙事脱节,闭源策略可能阻碍创新效率[9][23] - 硅谷华人群体普遍缺乏政治话语权,特朗普签证政策影响华人学者时未获声援,反映结构性地位失衡[10][20]