开源模型
搜索文档
Hugging Face曾拒绝英伟达5亿美元投资:不想看单一巨头脸色
搜狐财经· 2026-01-29 20:38
核心事件与公司立场 - 英伟达于去年年末向Hugging Face提出5亿美元的投资意向 但该公司拒绝了这笔交易[1] - 该交易本可将Hugging Face的估值推高至70亿美元 超过其过去十年融资总额[3] - 公司拒绝的主要原因是希望避免出现单一主导投资者来左右其决策[3] - 公司联合创始人兼首席执行官克莱姆·德朗格表示 开源模型有助于推动AI民主化 对抗权力集中 并认为权力集中是AI领域最大的风险[4] 商业模式与财务状况 - 公司运营一个托管250万个公开AI模型和70余万个公开数据集的平台 用户可自由下载[3] - 平台拥有全球1300万用户 致力于推广面向开发者免费开放的开源模型[3] - 采用“免费增值”商业模式 约3%的客户(通常为大型企业)会为额外功能付费[4] - 公司2025年已实现盈利 但因投资数据集 今年第一季度出现亏损[4] - 公司累计融资4亿美元 2023年估值为45亿美元 目前账面上仍留存半数资金[4] - 公司并不追求收入最大化 而是鼓励开发者为文本、图像和视觉模型提供开源替代方案[4] 行业定位与竞争格局 - Hugging Face的模式与OpenAI、谷歌、Anthropic等硅谷主流玩家背道而驰 后者专注于构建闭源专有模型[3] - 公司正处于一场关于人工智能应如何构建、共享与拥有的地缘政治和商业博弈的中心[3] - 公司联合创始人兼首席科学官托马斯·沃尔夫认为 DeepSeek等中国企业的崛起正成为Hugging Face的利好 证明了开源模型的威力[4] - 2022年 公司曾推出多语言AI模型BLOOM 但此后为控制成本、避免与平台托管的模型竞争 已逐步退出自研模型领域[5] - 公司转而投资机器人、数据集和科学研究AI领域 并于去年以未公开金额收购了机器人公司Pollen[5] 公司治理与人才战略 - 公司员工可在全球任何地方远程办公 在美国、英国、法国和瑞士设有办公室[5] - 这种通过Slack沟通的全球化布局 让部分前员工感到在重大战略决策上被边缘化[5] - 近几个月已有员工因感觉自身工作与快速变化的公司优先级不符而离职[5] - 公司给研究人员的年薪通常在10万至20万美元之间 远低于科技巨头顶尖AI研究员的百万美元级别 但基本与初创公司持平[5] - 作为薪酬的补偿 公司为研究人员提供了明确的使命——对抗硅谷霸权 并允许他们追求感兴趣的研究方向[5] - 与大型科技公司不同 Hugging Face允许员工公开谈论工作 但这也导致员工不断收到挖角邀请[6] - 公司首席伦理科学家玛格丽特·米切尔曾拒绝年薪超百万美元的工作机会 以坚守公司“反硅谷”的理念[6]
刚刚,创智+模思发布开源版Sora2,电影级音视频同步生成,打破闭源技术垄断
机器之心· 2026-01-29 18:26
文章核心观点 - 上海创智学院OpenMOSS团队与模思智能联合发布了中国首个高性能开源端到端音视频生成模型MOVA,实现了“音画同出”,并选择全栈开源,旨在打破当前顶尖音视频生成技术普遍闭源造成的技术垄断,推动开源社区发展 [1][2][4][55] 产品发布与定位 - 模型名称为MOVA,是端到端音视频生成模型,能生成长达8秒、最高720p分辨率的视听片段 [1] - 模型在多语言口型同步、环境音效契合度上展现了极高的工业水准,生成效果具有身临其境的真实感 [1][3] - 在Sora 2和Veo 3等顶尖技术走向闭源的背景下,MOVA选择将模型权重、训练代码、推理代码及微调方案全栈开源 [2][4] 技术架构与创新 - MOVA是一个规模约320亿参数的模型,采用MoE架构,推理时激活180亿参数 [19] - 模型采用异构双塔架构,结合了14B参数的Wan 2.2 I2V作为视频骨干网络和1.3B的文本到音频扩散模型作为音频骨干网络,并通过双向桥接模块实现模态融合 [22][24] - 为解决音视频时间轴对齐问题,团队设计了Aligned ROPE机制 [24] - 训练策略上采用三阶段由粗到细的策略:360P训练、360P退火训练及720P训练,并引入了Dual Sigma Shift创新 [31][32][33] - 在推理中引入了双重Classifier-Free Guidance公式,允许用户在文本引导和音画同步间调整权重,并内置LUFS响度归一化算法确保音频质量 [42][44] 性能表现 - 在口型同步任务中,开启Dual CFG模式后,MOVA-720p的LSE-D得分为7.094,LSE-C得分为7.452,展现出优势 [48] - 在语音准确度指标cpCER上,MOVA也取得了最佳结果 [48] - 在人为主观竞技场评估中,MOVA的ELO评分达到1113.8,显著高于基线模型,并对战OVI和级联系统的胜率超过70% [49] 数据处理与工作流 - 构建了一套三阶段精细化数据处理管线,处理720p分辨率、24fps帧率、8.05秒时长的视频片段,并通过细粒度标注提升模型泛化能力 [28] - 设计了三阶段Agent工作流,通过视觉解析、提示词重构和双重条件生成,提升首帧一致性与指令遵循能力,降低用户素材门槛 [36][38][40][41] 行业意义与生态影响 - MOVA补全了音视频生成基础模型的开源拼图,改变了“领先技术不开源”的现状 [4][54][55] - 其360p版本面向较低硬件门槛,使音视频生成不再仅限于GPU集群 [56] - MOVA已成为昇腾首个支持的开源多模态音视频一体生成模型,获得了全栈算力支撑 [56] - 模思智能正快速构建其多模态基础模型版图,从语音识别到音视频生成,环环相扣 [57] 研发模式与人才培养 - MOVA是上海创智学院与模思智能在“研创学”模式下的成功实践,融合了学术深度与产业落地敏锐度 [59] - 学生在千卡级规模的工业级基模训练中承担核心任务,积累了解决大规模训练、数据处理、模型设计等硬核工程问题的实战经验 [59] - 这一模式重塑了AI顶尖人才培养路径,为未来AGI竞争储备力量 [60]
MoltBot作者被Claude刁难后:MiniMax M2.1是最优秀的开源模型
量子位· 2026-01-29 13:03
文章核心观点 - 开源AI智能体项目Moltbot(原名Clawdbot)凭借其强大的自主编程与任务执行能力,在开发者社区引发巨大热潮,展示了个人持久化智能体的巨大潜力和市场需求 [1][12][36] - 项目创始人Peter Steinberger认为,该项目的成功揭示了AI智能体开发的新范式:通过构建面向智能体的开发体系,个人开发者能以前所未有的效率创造个性化工具,这可能导致传统应用生态发生根本性变革 [31][37][49] - 尽管面临安全挑战、品牌更名压力以及商业化诱惑,创始人目前更倾向于以社区和非营利模式推进项目发展,旨在让工具人人可及,并推动相关技术研究 [55][56][58] 开发者社区反响与用例 - 开发者解锁多种创新玩法:有开发者设置Moltbot在其睡眠时自动编写工具优化工作流,智能体甚至自主开发了语音功能,令开发者感到惊喜 [2][3] - 实用价值被充分挖掘:有从业者将Moltbot与Notion、Toggl、谷歌搜索控制台及谷歌分析打通,实现自动撰写博客、记录工时、生成并发送定制化数据报告等功能 [4] - 项目热度极高,带动硬件需求:非科技圈人士也因该项目前往苹果店购买Mac Mini,项目在GitHub上的星标数增长曲线呈“一条笔直向上的直线” [23] 云服务商跟进与竞品动态 - 主流云服务商迅速上线支持:阿里云轻量应用服务器提供了Moltbot应用镜像(版本v2026.1.25),最低配置为每月56元,提供2 vCPU、2 GiB内存 [7][8] - 腾讯云轻量应用服务器Lighthouse同步上线了Clawdbot应用模板,提供一键安装,帮助开发者快速搭建和观测智能体 [8] - 竞品涌现:市场出现一站式AI业务搭建工具等竞品,其团队刚刚完成了1000万美元种子轮融资 [9][10] 项目创始人与开发理念 - 创始人背景:Peter Steinberger曾运营软件公司13年并在4年前出售公司,经历低谷后于去年四月重燃热情进入AI领域 [15][16] - 开发动机:项目始于个人兴趣与学习需求,核心宗旨是“图个开心”,旨在通过实践探索AI智能体的可能性 [23][34] - 关键洞察:给智能体足够权限后,其解决问题的聪明程度令人惊讶,例如能通过识别文件头、调用外部API等方式处理未预设的语音消息 [29][30] 技术实现与行业影响 - 开发秘诀:关键在于打造一套让智能体以最优方式做软件开发的体系,并按照模型的思维方式进行“面向智能体的开发” [27][31][32] - 效率革命:熟练掌握工具并理解模型逻辑后,个人开发效率极高,“现在一个人能做出的东西,抵得上去年一整个公司的开发成果” [37] - 模型兼容性:项目设计初衷之一是实现所有模型(包括本地模型)的兼容,将其作为巨大的实验场 [37] 模型能力对比与品牌更名 - 模型各有优势:Anthropic的Opus在拟人交互上领先,交互方式极具人类感;OpenAI的模型更稳定可靠;Codex在处理大型代码库和开发效率上更高 [38] - 被迫更名:因品牌混淆风险,应Anthropic要求将项目名从Clawdbot改为Moltbot,更名过程遭遇账号被恶意抢注等挑战 [39][40] - 本地运行体验:创始人在512G顶配Mac Mini上运行本地模型如MiniMax M2.1,认为这是当下最优秀的开源模型之一,但单台设备体验不足,未来需要多台协同 [43][45] 行业未来展望 - 应用生态变革:智能体的普及可能使一大批应用程序被淘汰,人与服务的交互将简化为与智能体的自然对话,大多数应用将退化为API [49][50] - 用户门槛降低:非技术背景用户(如设计公司从业者)也能通过对话让智能体完成开发工作,公司已用其搭建了25个网络服务 [50][51] - 本地与云端模式:本地智能体需求将推动行业变革,例如帮助企业绕开繁琐的官方API审批流程;但并非所有人都会为运行智能体而购置硬件 [45][46] 项目现状与未来规划 - 安全挑战凸显:项目最初为可信环境设计,现被用于非信任环境,暴露出大量安全隐患,创始人正面临梳理上百个安全问题的压力 [54][55] - 筹备组建团队:因个人精力已达极限,创始人开始筹备组建团队,并希望吸引开源贡献者参与项目维护 [55][59] - 组织与商业化倾向:相比成立公司,创始人更倾向于成立非营利组织;采用MIT等宽松开源协议,核心策略是把开源版本做得足够好以削弱商业化改版的动力 [56][58]
青云科技20260128
2026-01-29 10:43
公司概况与业务现状 * 公司为青云科技,在A股市场定位为AI智算或AI基础设施厂商[4] * 公司创始人技术背景深厚,曾为IBM云实验室联合创始人及首席架构师[4] * 核心产品包括容器平台、全系列存储产品以及AI基础设施产品[4] * 主要业务线为云计算、容器计算和智算[4] * 运营全球排名前二的容器平台社区,并提供公有云、私有云和混合云服务[4] * 运维开源社区Kubernetes,专注于容器平台[4] * 客户积累深厚,涵盖大量金融行业客户、能源类客户、制造业客户以及科研机构[4] 2025年财务表现与2026年展望 * 2025年公司收入有所下滑[2] * 收入下滑主要原因是主动放弃了垫资业务以及硬件占比较高的集成类业务[7] * 尽管收入下滑,但毛利率有所好转[2][7] * 预计2026年收入将回升[2] * 收入回升的驱动因素包括新增客户增加、原有客户维系良好、产品认可度提高后客户愿意接受更理性的价格,以及计算业务用户数增长非常快[7] AI智算业务发展 * AI智算领域收入占比不大,2025年仅为几千万级别[5] * 但该领域增长迅速,目前在手订单已经超过去年同期水平[2][5] * 公司理念是“全力服务AI”,致力于集成所有能力服务AI时代[2][5] * 自有算力卡数量有限,包括4,090H20及一些H100机器,总量不到100台,不到千卡[6] * 主要通过提供虚拟化服务,并与国内知名超算中心或智算中心合作进行联合运营来扩展算力资源[2][6] 技术趋势与市场机遇 * 多Agent时代将增加对CPU的需求[2] * 开源模型能力相比两年前有显著提升,已非常好用,推动了CPU和GPU的销售收入增长[9] * 开源模型能力提升使得小型代理能够高效开发并落地,例如合同审批等工具,推动了CPU业务增长[9][10][11] * 个人小工具也会占用大量机器资源,部署在云上更为方便[9][11] * 未来各类应用程序可能都会被大模型重新设计,应用中的众多代理将运行在云上沙盒中,进一步增加对CPU和GPU的需求[9][11] * 预计2026-2027年,GPU的消耗量仍然较大[2][12] * 预计到2028年左右,当各类应用程序被Agent重做后,CPU业务量将呈指数级增长[2][12] 产品与服务策略 * 面对多Agent时代,青云公有云可以既提供超算也提供智算服务,为用户提供快速开发环境和生产环境,实现瞬间扩容[8] * 通过秒级计费形式提高资源利用效率[9] * 通过沙盒技术确保各家公司的知识产权安全性,实现强隔离性[9] * 针对AI Agent沙箱环境,采用按需计费模式,包括秒级计费和按小时计费[13] * 目前上线的一小时费用为0.17元人民币,有一核和两核配置可供选择[13] * 存储部分按容量计费[13] * 多Agent时代对多核处理器有需求,具体核心数取决于业务场景[13] 行业竞争与定价策略 * 云行业面临涨价压力,主要受能源问题、硬件成本上涨以及服务能力提升带来的成本增加等因素影响[3][14] * 公司内部尚未决定涨价,仍采用现有定价模式以吸引新客户并巩固基础客户群[3][15] * 密切关注行业内其他公司的涨价趋势[3] * 将行业内公司分为三类:超大规模云厂商、与自身类似的中小型云平台厂商、以及更小的厂商[15] * 认为自身拥有全栈能力,在产品上线、迭代和响应客户需求方面速度更快[15] 其他观察 * 春节期间云服务需求是否增加尚不确定,但存在可能性[17] * 近期由于一些代理商落地,接触了许多CPU客户并在洽谈合作[17] * 预计Deepseek可能像去年春节一样发布新模型,这可能带动一定程度上的需求增长[17]
Kimi K2.5发布24小时登顶全球开源榜单
第一财经· 2026-01-28 19:53
公司动态 - 月之暗面Kimi于27日发布K2.5模型 [1] - Kimi K2.5模型上线一天后已登顶全球多个榜单 [1] 模型性能表现 - 在权威榜单LMarena上,Kimi K2.5仅次于Claude opus 4.5、Genimi3 Pro等闭源模型,位居开源模型榜首 [1] - 在著名独立评测机构Artificial Analysis的榜单中,Kimi K2.5位列第5,在所有开源模型中排名最高 [1]
AI周报丨DeepSeek新模型曝光;马斯克炮轰ChatGPT诱导自杀
第一财经· 2026-01-25 09:31
大模型技术进展与发布 - DeepSeek官方代码更新中多次提及未公开的“MODEL1”大模型标识符 该标识符与已知的DeepSeek-V3.2并列 行业推测其可能代表一个不同于现有架构的新模型 可能是V4、推理模型R2或V3系列终极版 根据模型文件结构判断 该模型很可能已接近训练完成或推理部署阶段 [1] - 英伟达CEO黄仁勋总结过去一年AI大模型的三大突破 第一是模型能在未受训领域进行推理、计划并回答问题 出现了代理式AI 第二是开源模型取得重大突破 首个开源推理模型DeepSeek的推出对大多数行业和公司而言是重大事件 第三是物理AI取得巨大进展 其不仅能理解语言还能理解物理世界 [7] - Meta新设立的超级智能实验室团队已在本月向公司内部交付了首批AI模型 该团队成立约六个月 交付的模型表现“非常好”并展现出“很多潜力” 但技术尚未完成 距离交付给内部业务和普通消费者仍有大量工作要做 [9] 行业竞争与商业化动态 - OpenAI仅靠API业务在上个月就新增了超过10亿美元的年度经常性收入 公司首席财务官披露2025年公司年化收入突破200亿美元 同比增长超230% 公司近期加快了商业化进程 并将在美国测试ChatGPT广告以带来额外收入 [4] - 美国AI公司Anthropic正在进行一轮总额超过250亿美元的融资 预计估值将提升至约3500亿美元 较去年9月的1700亿美元估值实现翻倍 此轮融资重要部分来自微软与英伟达已宣布的投资 红杉资本计划首次投资并可能领投 公司年化营收自去年夏天以来已翻倍 截至2025年底已超过90亿美元 [8] - 百度新设个人超级智能事业群组 合并文库和网盘事业部 百度文库目前AI月活用户超9700万 百度网盘AI月活用户超8000万 此次调整旨在整合人才与技术 强化公司在AI应用方面的整体协同创新能力 [5][6] AI安全、伦理与社会责任争议 - 特斯拉CEO埃隆·马斯克在X平台转发帖子称ChatGPT与9起死亡事件有关 其中5起据称是由于其互动导致自杀身亡 受害者包括青少年和成年人 OpenAI CEO山姆·奥尔特曼回应承认运营近十亿用户AI平台的挑战 并提及已有超过50人死于与自动驾驶相关的事故 争论将AI安全伦理、致幻风险及科技巨头社会责任等话题推向风口浪尖 [2] - 针对医生担忧年轻医生过度依赖AI并被误导的观点 百川智能创始人王小川回应称“AI加医生”组合优于单个医生 解决担忧的关键在于转换使用思路 让AI对医生的临床思维进行提醒、对诊疗结果进行校验 实现“AI给医生保驾护航”的模式 [3] - 《启明计划:构建人工智能护栏的全球共识》课题项目在北京大学启动 旨在制定政策蓝图 系统梳理全球AI安全护栏 识别关键趋同与分歧领域 提出建立全球共识的机制 研究涵盖国家政策、跨国组织准则、企业自律规范及学术倡议等多个层面 [15] 硬件、芯片与机器人领域动态 - 国产AI芯片公司燧原科技科创板IPO招股书显示 去年前三季度该公司有71.84%的销售收入来自腾讯及其指定的服务器厂商 腾讯及关联方持有该公司20.26%的股份 2022年至2024年 公司营收分别为0.9亿元、3.01亿元、7.22亿元 亏损分别为11.16亿元、16.65亿元、15.1亿元 三年合计亏损42.9亿元 [12] - 摩尔线程公告预计2025年年度实现营业收入14.5亿元到15.2亿元 同比增长230.70%到246.67% 预计净利润亏损9.5亿元到10.6亿元 亏损同比收窄34.50%到41.30% 公司预计最早可于2027年实现合并报表盈利 [13] - 宇树科技表示2025年公司人形机器人实际出货量超5500台 2025年本体量产下线超6500台 该数据为纯人形机器人数量 不含其他产品 其出货量超过了智元机器人此前透露的截至2025年底整体超5100台的出货量 [14] 开源与算法透明度 - 马斯克旗下社交媒体平台X正式将平台推荐算法开源 该算法由与xAI的Grok模型相同的Transformer架构驱动 系统彻底移除了所有人工设计的特征及绝大多数人为设定规则 几乎完全依赖基于Grok模型承担核心工作 通过预测用户行为对帖子进行排序 [10][11]
学界大佬吵架金句不断,智谱和MiniMax太优秀被点名,Agent竟然能写GPU内核了?!
AI前线· 2026-01-23 17:18
文章核心观点 - 文章围绕“通用人工智能(AGI)能否成为现实”展开了一场深度辩论,两位来自学术界与产业界的一线研究者基于对算力、模型架构、应用落地的不同理解,阐述了各自对AGI定义、发展现状及未来趋势的判断 [6][7] - 尽管对AGI的实现路径存在分歧,但双方均认为,相较于抽象定义,AI技术(尤其是智能体)的实际“实用性”及其对工作方式的变革才是关键,并一致看好小模型、开源模型、新硬件及多元化架构的未来发展 [15][23][55] 关于AGI定义的争论 - **定义视角**:AGI的定义主要有两种主流视角,一种关注模型覆盖的认知任务广度,另一种则从经济角度出发,看其是否引发新的工业革命并改变生产方式 [14][35] - **共识与分歧**:双方达成共识,认为AGI的具体定义并不重要,关键在于它是否改变了人类的工作方式 [15][55]。丹·傅认为,以5-10年前的标准看,当前的语言模型在写代码、生成语言等方面已实现早期设想的AGI,并可能引发软件工程领域的工业革命 [34]。蒂姆·德特默斯则认为,当前关于AGI的狂热预测源于特定社群的信息茧房,缺乏对计算现实的考量 [36] 算力增长的潜力与极限 - **算力极限论**:蒂姆·德特默斯认为“计算是物理的”,内存迁移、带宽、延迟及冯·诺依曼瓶颈决定了算力不可能无限扩张,指数增长终将放缓,Scaling Law也不例外 [10][37]。他指出,从DRAM到HBM等硬件创新已接近物理极限,量化技术(如4位精度)也已发展至尽头,功能和硬件潜力均已被充分挖掘 [40][42][43] - **算力潜力论**:丹·傅认为当前谈“算力见顶”为时过早,现实系统中算力被严重低估和浪费,大量性能消耗在内核调度与系统开销上 [12]。他指出,当前评测的“最强模型”多基于一两年旧的算力集群训练,未能代表当下硬件的真实上限 [12][49]。通过新一代硬件(性能提升约2–3倍)、系统与工程优化(算力利用率提升约3倍)及更大规模集群(规模效应约10倍)三者叠加,理论上可用算力有接近90倍的提升空间 [13][18][46] 智能体(Agent)的发展与应用 - **拐点时刻**:丹·傅指出,2025年6月是Agent发展的关键拐点,当时代码智能体成功攻克了被视为编程领域终极难题之一的“GPU内核编程”,使其个人工作效率提升了5倍,其团队也能快速完成原本需耗时数月的复杂系统开发 [17][20][62][63] - **高度通用性**:蒂姆·德特默斯认为代码Agent本身就是高度通用的Agent,因为代码几乎可以描述和解决所有数字化问题,并断言超过90%的代码和文本本应由Agent生成 [20][66] - **应用与管理范式**:双方将Agent比作“需要精细化管理的实习生”,人类需提供明确背景、拆解任务并设定约束,而将注意力聚焦在方向把控与结果校验上 [21]。丹·傅强调,专业知识越深厚的专家,Agent能为其创造的效率增量就越显著 [21][74] - **必备技能**:蒂姆·德特默斯强调“要么善用Agent,要么被时代淘汰”,使用Agent并有效检查、编辑其输出(约10%的工作)将成为未来核心技能,能带来巨大的生产效率提升 [20][67][68] 人工智能行业未来趋势预判 - **小模型与开源模型**:双方均认为小模型将成为行业新热点,针对特定领域数据训练的小模型部署难度低、性能出色,将更具吸引力 [23][81]。开源模型(如GLM-4.7)的能力将进一步飞跃,并开始媲美最优秀的前沿模型 [23][26][83] - **硬件多元化与专业化**:硬件赛道将走向多元化发展,训练与推理环节的专业化分化会加剧 [23][24]。推理芯片将更侧重在手机、笔记本电脑等终端设备本地运行 [61] - **架构创新**:Transformer架构独霸天下的时代将落幕,状态空间模型(SSM)、线性注意力及各类混合架构等新架构将登上舞台 [25][84][86]。中国团队在架构创新上更敢于探索多种可能性,通过架构创新或极致性能让开源模型脱颖而出 [26][85] - **多模态与端侧AI**:多模态领域(如视频生成)及端侧AI(在笔记本电脑、手机等设备上运行的AI)预计将有进一步发展 [23][83] - **中美发展路径差异**:相比美国“先做出最强模型,再等待应用出现”的思路,中国模型团队的发展思维更务实,更关注模型能否真正落地并在现实场景中产生价值 [26][55]
中国AI落后?“美国人压力太大,在说梦话”
观察者网· 2026-01-23 09:45
文章核心观点 - Mistral AI公司CEO反驳中国AI技术落后论 认为中国在开源技术方面领先 可能给美国公司带来压力[1] - AI成为重要地缘政治力量 市场由美国和中国主导 欧洲寻求差异化发展[1] - 关于中国AI发展水平的观点在西方科技领袖中存在分歧[3] 行业格局与竞争态势 - AI市场由美国和中国主导 欧洲寻求差异化发展路径[1] - 许多美国AI模型如谷歌Gemini和OpenAI的ChatGPT为闭源 中国在开源模型开发上处于领先地位[5] - 开源模型提供更高透明度 闭源模型通常成本更高且灵活性较差[5] - 企业和国家正投入数十亿美元建设AI基础设施和能力 英伟达CEO表示这将耗资数万亿美元[1] 公司动态与战略 - Mistral AI公司CEO预计公司到今年年底营收应超过10亿欧元[1] - 公司今年可能在高性能计算机芯片及相关基础设施上投入大致相同的金额(约10亿欧元)用于开发和运行AI模型[1] - 公司正在考虑一些收购机会 但未透露具体业务领域和地点[1] - Mistral公司在欧洲处于领先地位 去年在一轮融资中估值达到137亿美元 荷兰芯片制造巨头ASML是其主要投资者[1] - 与美国科技巨头数千亿美元的估值相比 Mistral公司的估值仍相去甚远[1] 技术发展路径分歧 - 谷歌DeepMind CEO认为中国在前沿模型开发上落后西方约六个月[3] - Anthropic CEO认为美国出口限制成功减缓了中国AI发展 并称放行英伟达H200 AI芯片对华出口是个错误[3] - 谷歌前CEO施密特指出 美国公司多转向闭源 而中国企业主要采用开放权重、开源的方式[3] - 施密特认为 除非欧洲愿意为欧洲AI模型投入巨资 否则欧洲最终会使用中国模型[3]
32岁程序员猝死:底薪3千24小时待岗,抢救时被拉入工作群;大清洗!大众裁员3.5万人,包括1/3高管;阿里旗下芯片公司平头哥拟独立上市
雷峰网· 2026-01-23 08:28
大众汽车战略重组与成本削减 - 大众汽车核心品牌集团计划到2030年节约10亿欧元,其中人力成本节约6亿欧元,生产效率节约4亿欧元 [4][5] - 公司计划在2026年夏季前将董事会成员数量减少约三分之一,从29个减少到19个 [4] - 为应对工业放缓与中国竞争,大众汽车到2030年将在德国削减3.5万个工作岗位 [5] - 公司计划将20多家全球工厂整合成五个生产区域,并精简管理结构以构建更敏捷的运营模式 [4][5] 国内科技行业动态与融资 - 阿里巴巴旗下芯片公司平头哥被传拟独立上市,该公司已布局数据中心全栈芯片及端侧IoT芯片 [11] - 国产GPU公司燧原科技科创板IPO获受理,拟融资60亿元,用于第五代和第六代AI芯片研发 [17] - 燧原科技2022至2024年营收分别为9010.38万元、3.01亿元、7.22亿元,但同期净亏损分别为11.16亿元、16.65亿元、15.1亿元 [18] - GPU芯片公司曦望完成近30亿元战略融资,资金将用于下一代推理GPU研发与量产 [27] - 3D打印公司原子重塑完成超亿元新一轮融资,计划全面打开桌面级制造市场 [25] 人工智能与模型进展 - 月之暗面总裁张予彤透露,Kimi仅使用美国顶尖实验室1%的资源开发出全球领先的开源模型,新模型即将发布 [16] - Kimi通过工程化创新提升效率,例如全球首个在大型语言模型训练中跑通Muon优化器,自研线性注意力机制处理速度超越传统系统 [17] - 美图公司2025上半年总收入18亿元,同比增长12.3%,经调整后净利润4.67亿元,同比增长71.3%,增长主要得益于AI应用突破与付费用户提升 [28] - 苹果计划在iOS 27首发全新Siri聊天机器人,将采用基于谷歌Gemini的定制模型,并计划向用户收费 [35][36] 消费电子与硬件产品 - OPPO Find N6折叠屏手机入网,将搭载高通骁龙8E5平台,成为行业首款该平台大折叠旗舰,配备6000mAh电池与2亿像素镜头 [29][30] - 京东平台推出最低11299元的黄金手机壳(10g足金)秒售罄,最高配置100g版本标价112299元 [13][14] - 宇树科技澄清其2025年人形机器人实际出货量超5500台,本体量产下线超6500台 [28] - 真我手机宣布将在今年4月全面接入OPPO售后体系,形成战略协同 [30] 国际科技巨头与供应链 - 英伟达首席执行官黄仁勋证实,英伟达已取代苹果成为台积电最大客户,估计占台积电总营收的13% [33] - 台积电将连续四年提高先进制程价格,苹果A20 SoC单价估计将上涨至280美元 [33] - 三星否认内存产品全面涨价80%的市场传言,但消息称其2026年DRAM产能预计仅增长约5%,达到约800万片晶圆 [38][39] - Meta宣布旗下Threads平台月活跃用户突破4亿,并将开始向全球用户推出广告 [42] 自动驾驶与保险创新 - 美国保险公司Lemonade宣布为启用FSD功能的特斯拉车主提供50%保费折扣,马斯克回应称FSD可极大提升驾驶安全性 [39] - Lemonade通过与特斯拉技术合作获取车辆遥测数据来区分FSD与人类驾驶里程,并依据实际风险计算保费 [39] 社交媒体与内容平台 - 腾讯回应要求GitHub下架可导出微信聊天记录的开源项目,称其威胁用户数据隐私且易被黑灰产利用 [12] - 加拿大联邦法院推翻政府要求关闭TikTok业务的命令,允许其继续运营,该应用在加拿大拥有超1400万用户,约占该国人口三分之一 [37] 公司治理与股权纠纷 - 申通快递前总裁奚春阳起诉公司及实际控制人陈小英,诉请确认登记在陈小英名下的4056.85万股申通快递股份中的半数(市值约2.8亿元)归其所有 [12][13] 初创企业动态 - 应用“死了么”(已更名Demumu)登顶苹果付费软件榜后估值近亿元,创始人吕功琛仅愿出让10%股权融资,并拒绝放弃控制权 [22][23] - 该应用由三名95后兼职开发,成本仅1500元,其核心签到功能瞄准1.2亿独居人群痛点 [22] 传统车企动向 - 众泰汽车近期启动大规模招聘,涉及49个岗位,内部人士称已有新新能源车项目立项,为复工复产做准备 [18][19] - 众泰汽车2025年半年报显示其整车业务因缺乏运营资金未能复工复产 [20]
AI不抢工作反而抢人?黄仁勋首次亮相达沃斯:它掀起了人类最大规模基建潮
36氪· 2026-01-22 20:24
AI产业体系与平台迁移 - AI是一次平台迁移,正在重造整个计算栈,历史上每次平台迁移都会带来新的应用生态,从大型机到PC,从PC到互联网,从互联网到移动与云计算[3][4][5] - AI产业体系可分为五层:最底层是能源,第二层是芯片和计算基础设施,第三层是云基础设施与云服务,第四层是AI模型,第五层是模型之上的应用层[7][8][9][10] - 应用层是最重要的一层,是真正产生经济收益的层级,其爆发得益于模型层的快速进步,应用层覆盖金融服务、医疗健康、制造业等领域[10][11] AI模型层的关键进展 - 2025年AI模型层发生了三件颠覆性大事:第一是Agentic AI,语言模型演化为能进行推理、制定计划并执行任务的智能体系统[14] - 第二是开源模型的突破,以DeepSeek为代表的开源推理模型出现,使各行业公司能够以此为基础开发领域专用模型[14] - 第三是物理AI的巨大进展,AI开始理解物理世界,在理解蛋白质结构、化学物质及物理规律方面进步迅速,正推动制造业和药物发现等领域取得显著突破[15] AI驱动的投资与基础设施建设 - AI正在驱动人类历史上规模最大的基础设施建设浪潮,目前仅投入几千亿美元,而真正需要的是数万亿美元级别的投入[11][12] - 芯片和计算基础设施层增长迅速,具体表现为台积电宣布新建20座晶圆厂,富士康、纬创、广达在建设数十座计算机工厂,存储厂商美光、SK海力士、三星全面扩张[13] - 2025年是风险投资规模最大的年份之一,全球风险投资超过1000亿美元,其中大部分资金投向了AI原生公司[13][32] AI对就业市场的影响 - AI不会导致失业潮,反而可能因大规模基础设施建设创造大量工作,特别是需要水管工、电工、建筑工、钢铁工人、网络技术员等技工岗位,在美国这些岗位薪资已接近或超过六位数[17] - 判断AI对工作的影响应区分工作目的与具体任务,自动化任务可能强化工作目的,例如放射科医生和护士的核心目的是照护病人,AI辅助提升效率后,相关从业人数反而增加[18][19][21] - 以医疗行业为例,AI提升影像分析效率后,医院接诊能力和收入提升,从而雇佣了更多放射科医生,AI辅助病历记录则让护士能更专注于病人照护,提升了医院运转效率,进而可能雇佣更多护士[18][19] AI的全球影响与行业机会 - AI对新兴经济体是缩小鸿沟的机会,AI本身是一种基础设施,开源模型降低了训练门槛,语言和文化成为国家的“自然资源”[22][23] - AI是人类历史上最容易使用的软件,用户规模在短短两三年内已接近10亿人,极大降低了技术门槛,使更多人能参与数字经济[23][25] - 对欧洲而言,AI与工业制造、机器人及物理世界建模深度融合是关键机会,欧洲有望在Physical AI/Robotics时代实现跃迁,但需增加能源供给和基础设施投资[26][28] AI发展现状与未来展望 - AI发展并非泡沫,而是尚未投入足够的长期建设周期,GPU租赁的现货价格(包括最新一代和两代前的产品)正在上涨,反映了AI公司数量和研发预算的增长[30] - 越来越多公司的研发预算正转向AI,例如Eli Lilly在三年前研发预算几乎全在湿实验室,现在则投入了大型AI超级计算机和AI实验室[30] - 参与AI世界成长对全球养老金而言是一笔很好的投资,这是人类历史上最大的基础设施机会之一,需确保普通储蓄者和公众能分享增长[34][35]