开源与闭源之争
搜索文档
马斯克用恐怖算力,堆出6万亿参数性能怪兽Grok 5,剑指AGI
36氪· 2025-11-17 10:54
文章核心观点 - 埃隆·马斯克对其AI初创公司xAI及其旗舰产品Grok的雄心和展望进行了分享,预言到2030年AI的整体能力可能会超过全人类之和 [1][3][57] - xAI通过快速迭代Grok模型、整合X平台数据与特斯拉算力资源、采取差异化产品定位和有限开源策略,在AGI竞赛中急追猛赶 [11][20][36][48] Grok模型的迭代与发展 - Grok自2023年11月首版Grok-1问世以来迭代飞快,在一年内完成了四次跃迁 [4][5] - 2024年春发布Grok-1.5,强化推理能力并将上下文长度提升至128k词元 [6] - 2024年4月宣布具备视觉理解能力的Grok-1.5V版本,可处理文件、图片等多模态信息 [7] - 2024年8月Grok-2亮相,性能大涨并引入图像生成等新技能,同时推出精简版Grok-2 mini [8] - 2025年2月发布Grok-3,主打复杂推理和高级问题求解 [9] - 近期推出的Grok-4,官方宣称其综合智能已跻身业界顶峰 [10] 团队构成与研发哲学 - xAI汇聚了来自DeepMind、OpenAI、特斯拉等公司的顶尖人才 [12] - 团队追求「深入理解宇宙真相」的使命,给Grok设定的目标是成为「最大程度追寻真相」的AI [12][16] - 下一代模型训练将采用独特思路:利用AI生成「合成数据」来重构知识体系,通过推理能力研读人类知识库并自动辨别真伪 [17][19] 产品定位与风格 - 与竞品相比,Grok定位为「敢说真话、幽默风趣」的另类AI,设计上受《银河系漫游指南》启发,风格「有点叛逆,喜欢讽刺幽默」 [13][14] - 可以回答其他聊天机器人因「政治正确」而拒答的尖锐问题,并以顽皮口吻回应,例如早期演示中对「制备非法物质」请求的荒诞回答 [15] - 马斯克批评ChatGPT过于「清醒」且有偏见,宣称Grok要做「不偏不倚、寻求真理」的AI [40] 平台整合与资源优势 - X平台的海量实时数据为Grok提供了巨大优势,Grok能实时访问X平台信息进行学习和回答 [20][21][22] - xAI训练Grok掌握高级搜索技能,可自主生成查询深挖X内部信息,提升答案的时效性和准确度 [23] - Grok深度绑定X平台,为X Premium+会员提供独家AI服务,构建「X生态系统」实现双向赋能 [24] - 特斯拉的算力为xAI保驾护航,采取「双芯战略」发展AI,下一代AI5芯片设计即将完成,性能相较AI4提升高达40倍 [25] - 特斯拉现有车型搭载自研AI4芯片,全自动驾驶安全性比人类驾驶高出2-3倍,随着AI5和软件升级,优势有望提高到10倍 [25] 算力基础设施 - 2024年底在美国孟菲斯市以122天极速建成名为「Colossus」的超算数据中心,初始部署10万块英伟达H100 GPU,3个月内规模翻番至20万块 [26][28] - Colossus的算力立即用于训练Grok-4,并将在近期投入Grok-5的研发 [29] - 20万块H100 GPU的集群算力达每秒近10亿亿次运算,使xAI在硬件投入上仅次于谷歌 [36] - 公司深信在AGI竞赛中「算力即真理」,根据规模定律,计算资源每增加10倍,模型智能水平大约能提升一倍 [31] 跨领域整合 - Grok将进入特斯拉汽车,计划通过车机系统为新款Model S/X/3/Y以及Cybertruck车主提供车载AI助手服务 [32] - 所有2025年7月12日后交付的新车预装Grok AI,老车型升级最新固件并订阅高级套餐也可使用 [33] - 特斯拉车主可在车内与Grok语音对话,使其成为全球首批将强大聊天AI嵌入车辆的汽车品牌之一 [34][35] AGI竞赛格局与公司定位 - 当前OpenAI、Anthropic、谷歌DeepMind在通用AI领域领跑,但马斯克认为xAI将很快超越除谷歌以外的所有公司,最终甚至会赶超谷歌 [36] - xAI凭借高强度投入和执行力急追猛赶,在模型研发迭代速度上,团队不到一年时间连跳四级推出Grok-4 [36] - 在减少过滤与追求真实性之间面临平衡难题,Grok曾因发布含反犹主义暗示内容陷入争议旋涡 [42][44][45] - 公司尝试建立安全阀,包括及时调整模型行为、增加对敏感话题的监控,将动态调整视为AI走向成熟的必经之路 [47] 开源策略与行业态度 - 马斯克呼吁行业提高AI透明度,避免由少数公司垄断AI技术,xAI开源了去年最强的Grok-2.5模型,并计划在大约半年后开放Grok-3 [48][50] - xAI采用定制的「社区许可协议」,附带一定反竞争条款,是一种有限度的开放,既争取开源社区支持,又防止商业对手直接牟利 [51][52] - 这一举动被视为推动开放生态的信号,相信代码透明能够增强公众信任并提升AI安全 [53][54][55] 全球竞争视角与AGI影响 - 马斯克认识到中国在AI领域的快速追赶,包括百度、商汤等公司,以及充沛的电力供应和政府的2030赶超战略 [56] - 认为AI是「提升整个人类智能过程的重要组成部分」,在人口增长推动人类总智力的时代结束的背景下,AGI是保持文明进步的不二法门 [57] - 预计到2030年AI的总体能力可能超越全人类,一方面称AI是对人类「最大威胁」之一,另一方面义无反顾地推进xAI以塑造对人类友好的AGI [57][58]
大模型落地企业端:开源闭源之争未终结 | 海斌访谈
第一财经· 2025-08-08 16:53
行业应用与商业化进展 - 2025年上半年大模型行业应用呈现爆发式增长,DeepSeek在企业层面完成AI技术"扫盲",但阿里巴巴、阶跃星辰、百度等企业在商业化进程中领先,已跑通业务流程 [1] - 企业端对大模型需求敏感,10%效率提升可显著影响企业竞争力,企业管理层已形成付费意愿 [5] - 亚信科技2025年上半年AI大模型应用与交付业务收入达2600万元,同比增长76倍,已签订单金额7000万元,同比增长78倍 [3] - 阿里巴巴AI相关产品收入连续七个季度三位数增长,公共云收入受AI需求带动加速 [3] - 阶跃星辰2025年商业化收入目标冲击10亿元,主要收入来自企业端,合作方覆盖头部手机企业(50%市占率)及汽车企业如吉利 [4] 开源与闭源模式对比 - 开源模型在中国形成风潮(阿里巴巴、百度等均有开源模型),但企业落地时仍面临开源与闭源路线之争 [1][7] - 开源模型免费但缺乏原厂支持,迭代速度慢,企业私有化部署时需自行适配业务场景,成功率低(30%-60%放弃率) [8] - 闭源模型迭代速度快且提供原厂支持,阶跃星辰副总裁认为闭源才能支撑健康商业模式 [8] - 阿里巴巴同时布局开源与闭源,拥有中国最大开源模型家族,客户包括宝马、中国联通等 [3] 商业模式与竞争格局 - 定制化交付模式被阶跃星辰视为不健康,AI 1.0时代定制化项目技术复用性低且成本线性增长,大模型价格战加剧该问题(单项目报价从1000万降至20万) [8][9] - 科技大厂通过低价API策略(如买云送模型)挤压初创企业生存空间,token收费模式难以为继 [9][10] - 阶跃星辰采用"超级模型+超级应用"双轨策略,认为模型能力决定应用上限,应用反哺模型迭代 [4] - 亚信科技通过行业解决方案(能源电力、工业制造等)构建标杆案例,与阿里云累计共建近百个项目 [3]
李开复:中美大模型竞争关键在于开源与闭源之争
格隆汇APP· 2025-07-17 19:06
生成式AI与AI 2.0 - 生成式AI驱动的AI 2.0是未来5到10年最重要的技术领域,将快速走出实验室并赋能千行百业[3][8] - AI 2.0时代全球GDP增长幅度将超过PC和移动互联网时代[4] - 大模型智能每年提升30个百分点,推理成本每年下降10倍,为AI-First应用爆发奠定基础[8] 技术范式转变 - 预训练Scaling Law已失效,万张GPU集群算力提升仅2倍,高质量训练数据面临瓶颈[9] - 推理阶段Scaling Law成为新范式,推动大模型智力加速成长[10] - DeepSeek开源慢思考推理模型性能媲美顶级闭源模型[11] 中美AI竞争格局 - 中国在开源模型路径上赶超美国,工程能力和创业者拼劲突出[13][15] - 竞争核心是开源与闭源路线之争,中国选择开源可能带来全球生态红利[16][17] - 美国在2B/2C付费能力上占优,但闭源路线可能使其失去竞争优势[14][16] 投资标的分析 - 英伟达仍是稳妥投资标的,其芯片技术对预训练和无人驾驶等领域不可或缺[19][20] - 微软是美国科技七巨头中优选,因其创新投入和清晰的盈利模式认知[22] - 英伟达面临中国市场准入等潜在风险,微软增长空间受限于大体量[21][22]
图灵奖得主杨立昆:中国人并不需要我们,他们自己就能想出非常好的点子
AI科技大本营· 2025-06-02 15:24
大语言模型的局限性 - 当前大语言模型仅擅长信息检索和已有解决方案的复述 无法进行真正的抽象思考、推理和规划 [3][5][6] - 模型通过统计规律生成答案 本质是模式匹配游戏 无法创造新事物或提出正确问题 [5][6][18] - 训练数据已达边际效益递减 天然文本数据接近耗尽 合成数据成本高且回报有限 [11][13][14] AI发展的新范式方向 - 未来AI系统需具备理解物理世界、持久记忆、推理和规划四大核心能力 [29][37][38] - JEPA架构通过非生成式方法学习世界抽象表征 可预测物理规律并实现真正规划 [44][47][49] - 视频数据训练比纯文本更高效 儿童通过10^14字节视觉数据即可掌握基础物理规律 [36][37] 开源与闭源竞争格局 - 开源生态创新速度显著快于闭源 全球协作可加速技术突破 [50][53] - DeepSeek案例证明中国团队具备独立创新能力 2015年ResNet论文成为全球被引最高单篇论文 [3][53] - 实际部署中开源模型成本更低且可控 Llama等开源引擎正被广泛采用 [51] 行业投资与商业化前景 - 当前AI投资主要用于推理基础设施扩建 而非短期技术突破 [19][20] - 消费级AI应用已获验证 Meta AI用户达6亿 但企业级部署仍面临可靠性挑战 [21][24] - 专家系统历史表明AI需避免过度炒作 新范式需3-5年才能成熟应用 [25][30]