Workflow
开源模型
icon
搜索文档
AI不抢工作反而抢人?黄仁勋首次亮相达沃斯:它掀起了人类最大规模基建潮
36氪· 2026-01-22 20:24
AI产业体系与平台迁移 - AI是一次平台迁移,正在重造整个计算栈,历史上每次平台迁移都会带来新的应用生态,从大型机到PC,从PC到互联网,从互联网到移动与云计算[3][4][5] - AI产业体系可分为五层:最底层是能源,第二层是芯片和计算基础设施,第三层是云基础设施与云服务,第四层是AI模型,第五层是模型之上的应用层[7][8][9][10] - 应用层是最重要的一层,是真正产生经济收益的层级,其爆发得益于模型层的快速进步,应用层覆盖金融服务、医疗健康、制造业等领域[10][11] AI模型层的关键进展 - 2025年AI模型层发生了三件颠覆性大事:第一是Agentic AI,语言模型演化为能进行推理、制定计划并执行任务的智能体系统[14] - 第二是开源模型的突破,以DeepSeek为代表的开源推理模型出现,使各行业公司能够以此为基础开发领域专用模型[14] - 第三是物理AI的巨大进展,AI开始理解物理世界,在理解蛋白质结构、化学物质及物理规律方面进步迅速,正推动制造业和药物发现等领域取得显著突破[15] AI驱动的投资与基础设施建设 - AI正在驱动人类历史上规模最大的基础设施建设浪潮,目前仅投入几千亿美元,而真正需要的是数万亿美元级别的投入[11][12] - 芯片和计算基础设施层增长迅速,具体表现为台积电宣布新建20座晶圆厂,富士康、纬创、广达在建设数十座计算机工厂,存储厂商美光、SK海力士、三星全面扩张[13] - 2025年是风险投资规模最大的年份之一,全球风险投资超过1000亿美元,其中大部分资金投向了AI原生公司[13][32] AI对就业市场的影响 - AI不会导致失业潮,反而可能因大规模基础设施建设创造大量工作,特别是需要水管工、电工、建筑工、钢铁工人、网络技术员等技工岗位,在美国这些岗位薪资已接近或超过六位数[17] - 判断AI对工作的影响应区分工作目的与具体任务,自动化任务可能强化工作目的,例如放射科医生和护士的核心目的是照护病人,AI辅助提升效率后,相关从业人数反而增加[18][19][21] - 以医疗行业为例,AI提升影像分析效率后,医院接诊能力和收入提升,从而雇佣了更多放射科医生,AI辅助病历记录则让护士能更专注于病人照护,提升了医院运转效率,进而可能雇佣更多护士[18][19] AI的全球影响与行业机会 - AI对新兴经济体是缩小鸿沟的机会,AI本身是一种基础设施,开源模型降低了训练门槛,语言和文化成为国家的“自然资源”[22][23] - AI是人类历史上最容易使用的软件,用户规模在短短两三年内已接近10亿人,极大降低了技术门槛,使更多人能参与数字经济[23][25] - 对欧洲而言,AI与工业制造、机器人及物理世界建模深度融合是关键机会,欧洲有望在Physical AI/Robotics时代实现跃迁,但需增加能源供给和基础设施投资[26][28] AI发展现状与未来展望 - AI发展并非泡沫,而是尚未投入足够的长期建设周期,GPU租赁的现货价格(包括最新一代和两代前的产品)正在上涨,反映了AI公司数量和研发预算的增长[30] - 越来越多公司的研发预算正转向AI,例如Eli Lilly在三年前研发预算几乎全在湿实验室,现在则投入了大型AI超级计算机和AI实验室[30] - 参与AI世界成长对全球养老金而言是一笔很好的投资,这是人类历史上最大的基础设施机会之一,需确保普通储蓄者和公众能分享增长[34][35]
AI不抢工作反而抢人?黄仁勋首次亮相达沃斯:它掀起了人类最大规模基建潮
AI前线· 2026-01-22 18:23
文章核心观点 - AI是一次平台迁移,正在重建整个计算栈,并催生新的应用生态 [7][8] - AI产业体系可分为五层,其中应用层是创造经济价值的关键,且其爆发依赖于下层基础设施的同步大规模建设 [12][14][15][16] - 2025年AI模型层发生了三件颠覆性大事:Agentic AI、开源模型的突破、物理AI的巨大进展 [22][23][24][26] - AI不会导致大规模失业,反而会通过提升效率、扩大产业规模创造大量工作机会,甚至可能造成劳动力短缺 [27][28][32] - AI是全球性的历史机遇,能降低技术门槛,帮助新兴经济体发展,并可能重塑欧洲的工业竞争力 [36][40][42][44] - 当前AI投资并非泡沫,而是长期基础设施建设周期的一部分,投资规模仍需扩大以支撑各层发展 [45][46][47][48] AI产业体系与平台迁移 - AI被视为一次“平台迁移”,类似于从大型机到PC、到互联网、再到移动与云计算的转变,计算栈被重新发明 [7][8][10] - 新计算范式从处理结构化信息的“预录制”软件,转变为能实时理解并处理非结构化信息与意图的智能系统 [9][11][17] - AI产业是一个五层结构:能源层、芯片与计算基础设施层、云基础设施与服务层、AI模型层、以及最顶层的应用层 [12][18] - 应用层是产生经济收益的关键,其爆发依赖于下层模型的快速进步,目前已在金融服务、医疗健康、制造业等领域展开 [14][15][18] - 支撑这五层需要人类历史上最大规模的基础设施建设,目前投入仅数千亿美元,未来需要数万亿美元级别 [15][16] - 芯片工厂、计算机工厂、AI工厂正在全球同步建设,芯片层增长迅速 [19][25] 2025年AI模型层的三大进展 - **Agentic AI**:语言模型进化为能进行规划、分步推理和执行任务的智能体系统,变得更扎实、更有依据 [23] - **开源模型的突破**:以DeepSeek为代表的开源推理模型出现,降低了企业、研究机构和初创公司使用和定制AI模型的门槛 [24] - **物理AI的巨大进展**:AI开始理解物理世界,如蛋白质结构、化学物质、流体力学等,在制造业和药物发现等领域取得突破 [26] - 与制药公司Eli Lilly的合作表明,AI在理解蛋白质和化学结构方面进步巨大,有望带来重大突破 [26] AI对就业与社会的影响 - AI基础设施建设将创造大量与技工技能相关的工作岗位,如水管工、电工、建筑工、网络技术员等,在美国这些岗位薪资已接近或超过六位数 [28][29] - 以放射科为例,AI辅助影像分析提升了医生效率和服务能力,反而导致放射科医生人数增加 [30] - 以护士为例,AI接管病历记录等行政工作后,提升了护理效率和医院接诊能力,导致对护士的需求增加,美国目前仍短缺约500万护士 [31][32] - 分析AI对工作的影响,应区分工作的“目的”和“任务”,自动化任务往往能强化和放大工作的核心目的 [33][34] - AI是人类历史上最容易使用的软件,用户规模在短短两三年内已接近10亿人,极大降低了技术门槛,使更多人能参与数字经济 [37][40] 全球机遇与投资前景 - 对于新兴经济体,AI是一种应像道路和电力一样普及的基础设施,开源模型和低使用门槛为其提供了缩小数字鸿沟的机会 [36][37] - 对于欧洲,其强大的工业制造基础与AI、机器人技术结合,有望在物理AI/机器人时代实现跃迁,但需增加能源和基础设施投资 [42][44][45] - 当前AI投资热潮并非泡沫,而是支撑各层基础设施建设的必要长期投入,投资规模仍需扩大 [45][46][47] - GPU租赁现货价格(包括前两代产品)正在上涨,反映出AI公司数量和研发预算在持续增长 [47] - 2025年是风险投资规模最大的年份之一,全球超过1000亿美元,大部分流向了AI原生公司 [21][49] - 参与AI基础设施建设被视为人类历史上最大的投资机会之一,应让普通储蓄者和养老金也能分享增长 [51]
月之暗面总裁张予彤:Kimi仅使用美国顶尖实验室1%的资源,最新模型将很快发布
新浪财经· 2026-01-22 16:52
公司核心战略与成就 - 公司仅使用美国顶尖实验室1%的资源,就开发出Kimi K2、Kimi K2 Thinking等全球领先的开源模型 [1] - 公司在部分模型性能上已超越美国的顶尖闭源模型 [1] - 公司从创业第一天起就意识到中国初创公司没有随意堆砌算力的条件,这迫使公司通过大量基础研究创新来换取极致效率 [1] 公司研发与运营模式 - 公司投入大量精力将工程化思维引入研究环节,确保所有算法创新都能在生产系统中大规模稳定运行 [1] - 公司最新模型将很快发布 [1] 行业背景与公司定位 - 公司总裁在瑞士达沃斯举行的世界经济论坛2026年年会上发表观点,显示其全球行业影响力 [1]
黄仁勋谈过去一年AI模型的三大突破
第一财经· 2026-01-21 22:40
AI模型技术的三大突破 - 代理式AI取得突破 模型从存在幻觉发展到能够进行推理、计划和回答研究领域问题 实现应用[1] - 开源模型取得重大突破 首个开源推理模型DeepSeek推出 繁荣了开源推理模型生态 使众多公司、研究机构、教育从业者得以利用[1] - 物理AI取得巨大进展 AI不仅能理解语言 还能理解物理世界 例如生物蛋白质、化学、物理、流体动力学、粒子物理和量子物理[1] AI应用与投资趋势 - AI已在金融服务、医疗保健、制造业等场景应用并产生经济利益[3] - 2025年是风险投资规模最大的年份之一 大部分资金流向了AI原生公司 包括医疗保健、机器人、制造业和金融服务公司[3] AI基础设施建设热潮 - 人类历史上最大规模的AI基础设施建设正在进行 已投入几千亿美元 还有数万亿美元的基础设施需要建设[3] - 基础设施建设热潮带动相关产业 台积电宣布建设20座新芯片工厂 富士康、纬创、广达将建设30座新计算机工厂 美光等内存厂商也在投资[3] - AI产业在芯片层面的增长令人难以置信[3] AI对就业市场的影响 - AI基础设施建设将创造大量就业机会 例如需要水管工、电工、建筑工人、网络技术人员[3] - AI不会简单取代工作 而是提高效率并创造新需求 例如放射科医生数量因AI辅助而增加 医院接待能力提升[4] - AI提高了护士工作效率 有助于解决美国护士人数短缺的问题[4] AI的普及与易用性 - 每个国家都应参与AI基础设施建设 AI的易用性可能缩小技术鸿沟[4] - 结合开源模型与各地专有知识可创建有用模型 使用AI变得容易 没有计算机学位的人也能成为程序员[4] - 发展中国家的人们和学生群体应学习使用、指导和评估AI[4] AI产业需求与市场状况 - 评估AI泡沫可观察GPU使用情况 英伟达有数以百万计的GPU支撑云计算 租用GPU并非易事[4] - 在需求带动下 GPU租赁价格正在上涨 价格上涨不仅限于最新版本GPU[4] - 计算需求增加的原因是AI公司数量正在增加 且一些公司有大量经费投入AI[4]
DeepSeek新模型“MODEL1”曝光
第一财经· 2026-01-21 16:56
新模型“MODEL1”的技术进展与行业推测 - 在DeepSeek-R1发布一周年之际,其开源社区GitHub上更新了一系列FlashMLA代码,项目文件中数十处提到了此前未公开的“MODEL1”大模型标识符 [3] - “MODEL1”标识符与已知的现有模型“V32”(即DeepSeek-V3.2)被并列提及,根据代码上下文,“MODEL1”很可能代表一个不同于现有架构的新模型 [4] - 行业对新模型的具体身份有不同看法,可能是V4模型、推理模型R2,或是V3系列的终极版 [4] - FlashMLA是公司独创的、针对英伟达Hopper架构GPU深度优化的软件工具,是实现模型低成本、高性能的关键技术之一 [4] - 开发者分析指出,“MODEL1”与“V32”在键值(KV)缓存布局、稀疏性处理方式以及对FP8数据格式的解码支持等关键技术方面存在区别,表明新架构可能在内存优化和计算效率上进行了针对性设计 [4] - 结合模型文件结构来看,“MODEL1”很可能已接近训练完成或推理部署阶段,正等待最终的权重冻结和测试验证,意味着新模型上线时间越来越近 [4] 公司近期技术动态与市场传闻 - 此前有报道称,DeepSeek将于2月发布新一代旗舰模型DeepSeek V4,且内部初步测试表明,V4在编程能力上超过了市场上的其他顶级模型 [5] - 近一个月里,公司团队陆续发布了两篇技术论文,介绍了名为“优化残差连接(mHC)”的新训练方法,以及一种受生物学启发的“AI记忆模块(Engram)”,业内猜测新模型可能会整合这些最新研究成果 [6] - 公司在2024年12月推出旗舰模型V3,凭借高效的MoE架构确立了强大的综合性能基础,随后在2025年1月发布了推理模型R1,基于强化学习,在解决数学问题、代码编程等复杂推理任务上表现卓越 [6] 行业影响与全球开源生态格局 - 海外开源社区Hugging Face发布博客《“DeepSeek时刻”一周年》,回顾了中国AI力量在过去一年如何重塑全球开源生态 [6] - 文章指出,DeepSeek-R1是Hugging Face上获赞最多的模型,其开源降低了推理技术、生产部署与心理三个门槛,并推动了国内公司在开源方向上形成非协同但高度一致的战略走向 [8] - 过去一年,百度、阿里巴巴、腾讯等巨头及月之暗面等初创公司大幅增加开源投入,中国模型在Hugging Face上的下载量已超越美国 [8] - 尽管西方寻求替代方案,但全球众多初创企业和研究人员正逐渐依赖中国开发的开源模型作为基础,中国AI已深度嵌入全球供应链 [8]
DeepSeek新模型真的要来了?“MODEL1”曝光
第一财经资讯· 2026-01-21 15:00
新模型“MODEL1”的发现与推测 - 在DeepSeek-R1发布一周年之际,其官方GitHub代码库中出现了数十处提及此前未公开的“MODEL1”大模型标识符 [1] - “MODEL1”标识符与已知的现有模型“V32”(即DeepSeek-V3.2)在项目中被并列提及 [2] - 根据代码上下文,行业认为“MODEL1”很可能代表一个不同于现有架构的新模型,具体可能是V4模型、推理模型R2或V3系列的终极版 [2] 新模型的技术特征与进展 - “MODEL1”与“V32”在关键技术上存在区别,主要体现在键值(KV)缓存的布局、稀疏性处理方式以及对FP8数据格式的解码支持等方面 [3] - 这些技术差异表明新架构可能在内存优化和计算效率上进行了针对性设计 [3] - 结合模型文件结构来看,“MODEL1”很可能已接近训练完成或推理部署阶段,正等待最终的权重冻结和测试验证,意味着新模型上线时间越来越近 [3] DeepSeek的技术发展背景与行业影响 - 此前有报道称,DeepSeek将于2月发布新一代旗舰模型DeepSeek V4,且内部初步测试表明V4在编程能力上超过了市场上的其他顶级模型 [4] - 在近一个月里,DeepSeek团队陆续发布了两篇技术论文,介绍了名为“优化残差连接(mHC)”的新训练方法,以及一种受生物学启发的“AI记忆模块(Engram)”,业内猜测新模型可能会整合这些最新研究成果 [4] - DeepSeek在2024年12月推出旗舰模型V3,凭借高效的MoE架构确立强大综合性能基础,随后在2025年1月发布了在复杂推理任务上表现卓越的推理模型R1 [4] - DeepSeek-R1是Hugging Face上获赞最多的模型,其开源推动了国内公司在开源方向上形成非协同但高度一致的战略走向 [7] - 过去一年,百度、阿里巴巴、腾讯等巨头及月之暗面等初创公司大幅增加开源投入,中国模型在Hugging Face上的下载量已超越美国 [7] - 全球众多初创企业和研究人员正逐渐依赖中国开发的开源模型作为基础,中国AI已深度嵌入全球供应链 [7]
谷歌前CEO:欧洲不投钱,就用中国的喽
观察者网· 2026-01-21 09:36
全球AI竞争格局与欧洲的挑战 - 谷歌前CEO施密特警告,若欧洲不投资建设自己的开源AI实验室并解决高能源价格问题,将很快发现自己依赖中国模型[1] - 施密特指出,美国公司多转向闭源模型(如谷歌Gemini和OpenAI的ChatGPT),而中国企业主要采用开放权重、开源的方式[1] - 彭博社指出,在AI科技竞赛中,欧洲基本被美国和中国甩在身后[4] 欧洲AI产业的现状与差距 - 法国Mistral AI初创公司在欧洲领先,去年在一轮融资中估值达到137亿美元,但这与OpenAI超5000亿美元的估值相比差距巨大[4] - 欧盟委员会于2024年9月宣布就建立AI工厂发起招标,并发布了旨在提升竞争力的“德拉吉报告”[5] - 德意志银行研究报告显示,截至2024年9月4日,“德拉吉报告”的建议中仅11.2%已得到全面落实,即便将部分推进的内容计算在内,实施进度也不到三分之一[6] 欧洲为提升AI竞争力采取的行动 - 欧盟委员会计划提出“应用AI战略”以推广欧洲本土的AI工具,提供“安全性和韧性”[5] - 德国总理默茨于2023年10月宣布启动“德国高科技议程”,强调欧洲不能让美国和中国独自决定技术未来[5] - 欧洲正在调集资源建设数据中心并部署技术,试图改变当前“依赖美国、不如中国”的AI发展现状[4] AI发展面临的基础设施挑战 - 施密特指出,要在全球AI竞赛中保持竞争力,欧洲还需解决高能源价格问题,并建设更多可用于训练技术的数据中心[2] - 施密特同时对AI对美国电力供应的影响表示担忧,他此前联合创办了一家数据中心公司以应对巨大的能源需求[2] - 英伟达CEO黄仁勋2024年曾直言,欧盟在AI投资方面远远落后于美国和中国,必须加快发展人工智能[6]
PPIO创始人姚欣:闲置率高达八成的国产GPU,如何盘活成「真算力」?丨智算想象力十人谈
雷峰网· 2026-01-20 18:50
公司发展历程与战略选择 - 公司于2018年边缘算力与CDN市场竞争白热化时成立,毅然切入边缘云领域[3] - 创始团队拥有PPTV分布式平台的成功经验,其创业逻辑是将C端算力整合经验应用于B端[3] - 初期在“先找供给”与“先找需求”间徘徊,商业难以闭环,直至2020年疫情导致线上流量激增,才跑通增长曲线[3] - 2023年,在GPU贸易利润暴涨时,公司拒绝“稳赚不赔”的算力倒卖生意,选择聚焦AI推理市场[3] - 公司营收实现指数级增长,2024年营收已达5.58亿[4] - 2024年7月,公司在世界人工智能大会上成为国内首个推出兼容E2B的Agent沙箱的公司[4] 技术演进与业务布局 - 2022年进入GPU领域,最初服务于云游戏和云渲染的分布式GPU架构[9] - 2023年帮助国内头部模型厂商搭建了第一代推理平台服务,成为首个推理Infra客户[9] - 2024年重点聚焦出海,集成大量开源模型,推出一整套MaaS平台[10] - 2024年初,业务再向上延伸至PaaS层,推出为AI Agent场景设计的Agent沙箱[11] - 公司已从边缘云、GPU推理平台发展到Agent沙箱,成为具备全栈技术能力的AI云服务商[6] - 技术路线的核心挑战是“为看不见的需求做技术”,需为未来可能达十亿、百亿规模的市场提前进行技术储备和研发[5][12] 商业模式与核心能力 - 公司价值观强调“价值创造”,不做单纯的算力贸易,而是致力于做有技术附加值的东西[15] - 商业模式是整合汇聚大量闲置的分布式算力,并将其转化为云服务,技术附加值体现在将闲置算力token化[15] - 整合的算力资源包括:游戏显卡(如4090、3090)、上一代训练GPU(如被H100替换的A100)、以及利用率仅10%-20%的国产GPU智算中心[16] - 选择聚焦推理市场而非训练,因为推理追求极致的成本性价比,这与公司整合分布式闲置资源以降低算力使用门槛的能力相匹配[17] - 公司拥有独特的分布式云技术栈,建立在分散、碎片、异构的基础设施上,与传统云厂商基于集中式、标准化数据中心的架构完全不同[27] 市场定位与竞争策略 - 公司目标客户群体是AI初创公司和开发者,过去两年主要为此两类人群提供服务[24] - 观察到新的AI应用消耗量巨大,其token消耗可能比上一代应用直接提升10倍甚至100倍[25] - 以海外对标公司E2B为例,其在硅谷的用量一年内增长了400多倍,从4万多增长到1600多万[21] - 认为在Agent Infra层面,云大厂的影响力相比PC和移动时代已大幅削弱,原因在于:GPU Infra架构是近三年新兴领域,大厂先发优势不明显;AI成本高促使开发者追求跨云、多云架构,避免厂商锁定[22][23] - 竞争策略强调“不绑定+开源”,与国内四五十款主流开源框架对接合作,基于开源和可迁移性方便开发者,不将GPU与CPU捆绑销售[23] 运营现状与未来展望 - 公司平台拥有4000多个节点,这些节点多为零售型IDC,可在闲置期将机器托管至平台供调用[28] - 调度策略灵活,对延迟敏感的应用就近调用,对成本敏感的应用可调度至电价更低的地区(如新疆电费是北京的1/3)或利用全球时差进行跨区域调度[29] - 过去一年,公司平台上的token消耗增长了一百倍以上[35] - 未来的挑战在于需求侧,需等待大规模爆发的需求出现,尤其是对时延敏感的需求[32] - 公司战略判断领先,2023年即提出“聚焦推理、聚焦开源、海外优先”,这使其抓住了后续的DeepSeek等机会[37]
智谱GLM-4.7-Flash正式发布并开源 供免费调用
证券日报· 2026-01-20 08:40
公司产品发布 - 智谱于1月20日正式发布并开源其新一代模型GLM-4.7-Flash [2] - GLM-4.7-Flash被定位为30B(三百亿)参数级别的轻量化模型,旨在为部署提供兼顾性能与效率的新选择 [2] - 该模型即日起在智谱开放平台BigModel.cn上线,替代前代GLM-4.5-Flash,并供用户免费调用 [2] 产品性能表现 - 在SWE-bench Verified、τ²-Bench等主流基准测试中,GLM-4.7-Flash的综合表现超过gpt-oss-20b和Qwen3-30B-A3B-Thinking-2507模型 [2] - 在相同和近似尺寸模型系列中,GLM-4.7-Flash取得了开源SOTA(State-Of-The-Art)分数 [2] - 在公司内部的编程实测中,GLM-4.7-Flash在前端和后端开发任务上均表现出色 [2] 产品应用场景 - 除编程场景外,该模型亦适用于中文写作、翻译、长文本处理、情感分析及角色扮演等通用场景 [2]
没有商业模式--DeepSeek最坚固的“护城河”
华尔街见闻· 2026-01-19 17:46
文章核心观点 - DeepSeek的长期优势与核心竞争力在于其独特的“零外部融资、无商业化压力”模式 这使得公司在全球AI实验室中成为异类 能够不计成本、不看投资人脸色、专注于AGI研究 这种由母公司幻方量化利润支撑的“自筹资金”模式 构成了其最坚固的护城河 [2][3][8] 市场预期与竞争格局 - 市场对DeepSeek在“DeepSeek时刻”一周年(1月27日)发布新模型抱有高期待 但作者认为其难以再次像去年那样震惊世界 因为开源模型市场已趋于饱和 [3][4] - DeepSeek虽以MIT License打响了开源模型第一枪 但已不再是唯一或最开放的玩家 例如未开源其训练数据集和主代码库 [3][5] - 根据Artificial Analysis数据 当前全球开放程度排名前三的模型分别来自NVIDIA(Nemotron 3)、Allen Institute(Olmo 3)和穆罕默德·本·扎耶德人工智能大学(MBZUAI,K2-V2) [5] - DeepSeek模型在开放模型中 已不再是最强、最便宜或最开放的 [8] 独特的“零融资”商业模式 - DeepSeek是全球顶尖AI实验室中唯一坚持“零外部融资”的异类 创始人梁文锋将控制权置于融资之上 [3][9] - 公司由梁文锋创立的量化基金“幻方量化”提供资金支持 该基金在去年以53%的回报率创造了超过7亿美元(约50亿人民币)的利润 这些利润被直接用于购买GPU和招聘人才 [3][10] - 2023年公司成立初期曾尝试融资 但因中国VC的短视和风险厌恶而失败 这反而成为“塞翁失马” 使其避免了商业化KPI压力 [3][9] - 即便在获得全球知名度后 公司依然拒绝外部融资 以保持对AGI研究路线的完全控制权 [11][12] 自筹资金模式带来的组织优势 - **无资源内耗与组织扁平化**:由于没有外部估值、股票期权和商业化压力 公司内部不存在为争夺算力资源而进行的官僚主义、内斗或权力斗争 组织保持极度扁平 [3][14][15] - **专注研究品味而非堆砌算力**:引用前OpenAI研究员Ilya Sutskever的观点 颠覆性创新(如Transformer架构)最初仅需8到64张GPU 并非无限堆算力 自筹资金模式使团队能专注于研究品味而非被迫消耗预算 [3][13] - **避免“大公司病”与浮夸文化**:对比其他资金充裕的实验室(如Thinking Machines Lab定制品牌杠铃片) DeepSeek避免了因“纸面富贵”和膨胀自我价值感产生的有毒文化 以及对人才的恶性挖角 [3][15][17] 行业融资背景下的对比 - AI行业已成为“销金窟” 几乎所有前沿实验室都在进行大规模融资 例如马斯克的xAI近期完成了高达200亿美元的E轮融资 [3][10] - 一批由明星研究员领导、风投支持的“AI新实验室”涌现 如Thinking Machines Lab、SSI(Ilya Sutskever)和AMI Labs(Yann LeCun) [10] - 即便通过特殊公司治理(如创始人超级投票权)获得控制权 接受风险投资后 大规模商业化的预期迟早会出现 而DeepSeek完全不受此束缚 [12] 投资者的悖论与公司特质 - 从投资者角度看 DeepSeek是极具吸引力的投资标的 但作者也指出 一旦公司接受外部投资 其“纯粹为AGI研究而实现内部最大化对齐”的核心特质将不复存在 [3][18] - 公司的核心优势源于其“无商业模式” 这使其能够长期专注于AGI梦想 而无需对财报负责 [8][12][18]