Workflow
人工智能开源
icon
搜索文档
扎克伯格发文正式告别“默认开源”!网友:只剩中国 DeepSeek、通义和 Mistral 还在撑场面
AI前线· 2025-08-02 13:33
Meta的AI战略调整 - 扎克伯格提出"个人超级智能"愿景,目标是让每个人借助AI实现个人目标 [2] - 公司正在调整AI模型发布策略,从激进开源转向谨慎选择性开源,强调需管理超级智能带来的安全挑战 [3][6] - 此前Meta将开源视为核心优势,承诺打造性能媲美闭源的先进开源模型(如Llama系列),但最新表态显示开源不再是默认选项 [5][6][8] 开源策略的转变与行业影响 - 2024年扎克伯格曾明确表示"Meta致力于开源AI",并预测Llama后续模型将成为业内最先进 [6] - 2025年立场变化:不再承诺开源所有成果,尤其涉及"能力质变"的模型可能闭源 [7][8] - 这一转变使DeepSeek、通义千问和Mistral成为全球少数坚持开源最先进模型(SOTA)的公司 [9][10] 商业化与资源投入 - Meta斥资143亿美元投资Scale AI并重组AI部门为"Meta Superintelligence Labs",集中资源开发闭源模型 [11][12] - 公司暂停开源模型"Behemoth"测试,转向闭源开发,高薪组建独立团队推进AGI研究 [11][12][14] - 商业化路径明确:通过AR眼镜、VR头显等硬件产品推广"个人超级智能"服务 [14] 竞争格局与行业动态 - Meta认为开源不影响其广告核心收入,但闭源竞争对手(如OpenAI)依赖模型访问权限销售 [11] - Llama3开发期间,公司为超越GPT-4逐渐改变策略,最终转向闭源冲刺AGI [11] - 中国公司如DeepSeek-R1的成功激励行业坚持开源,而Meta的退出可能强化中国在开源领域的影响力 [10][17]
超越DeepSeek,中国开源“集团军”重塑全球AI生态
观察者网· 2025-04-27 20:57
中国开源大模型生态发展 - 中国开源大模型形成集团化作战优势,DeepSeek和阿里Qwen等基础模型提升技术上限,中小企业基于其开发垂直模型加速迭代[1] - 昆仑万维推出Skywork-OR1系列模型,性能超越阿里QwQ-32B并开源数据集和训练代码,实现"真开源"[4] - 阿里云通义千问、阶跃星辰、智谱等企业密集开源多模态模型,百度宣布6月30日完全开源文心大模型[5] 中美AI开源策略对比 - 美国AI企业以闭源为主(OpenAI、Anthropic),Meta开源Llama但附加商业限制条款[6][7] - 中国通过政策推动开源生态,2017年《新一代人工智能发展规划》和2021年"十四五"规划明确支持开源[8] - 北京国资联合智谱成立3亿元Z基金支持全球AI开源项目[9] 开源技术商业化路径 - 智谱通过开源吸引开发者生态,向B/G端提供付费定制解决方案,其开源模型累计下载量达4000万次[16][17] - DeepSeek采用"免费基础API+高性能付费API"模式,定价每百万输入Token1元[17] - 阿里通过开源模型绑定云计算基础设施,形成场景闭环变现[17] 开源模型产业应用案例 - 工业领域:宝钢、中煤科工等企业利用开源模型实现生产优化,故障停机时间降低30%[13] - 公益领域:华为昇腾开源三江源物种识别模型,助力雪豹保护效率提升[14] - 海外市场:DeepSeek模型被印尼Ruangguru用于教育优化,阿里Qwen接入新加坡Atlas客服系统[6] 开源生态理论支撑 - 开源模式符合《大教堂与集市》提出的"集市"开发理论,通过群体协作加速创新[15] - 哈佛研究显示开源投入产出比达1:2000,中国正复制这一成功模式[16] - 中国开源战略推动全球AI从"单极霸权"转向"多极共生"[1][18]
智谱三大类模型开源,北京如何布局“开源之都”
贝壳财经· 2025-04-19 21:35
公司核心动态与战略 - 智谱宣布2025年为开源年 并于4月14日开源了32B/9B系列GLM模型 包括基座、推理和沉思三大类 所有模型采用MIT许可协议 免费商用和分发 [2] - 公司近期正式启动IPO辅导 成为“AI六小虎”中首个启动IPO流程的企业 也是第一家正式启动IPO流程的大模型创业公司 [3][16] - 公司今年开年4个月内已累计融资超20亿元人民币 且4轮融资均获国资加持 [3][13] 技术产品与研发进展 - 公司发布了全球首个能一边深度思考一边动手执行的智能体AutoGLM沉思 该智能体可在接到指令后自动执行如打开浏览器、点赞评论等任务 [2][6] - 沉思模型的技术路径为:在GLM-4-Air基座模型上训练出推理模型GLM-Z1 再基于Z1模型结合工具使用和长程推理能力训练出沉思模型Z1-Rumination 最后集成在智能体AutoGLM上 [7] - 公司去年开源的视频大模型CogVideoX-5B被用于生成引发全网数百万人围观的《猫和老鼠》AI短片 [1] - 在速度方面 GLM-Z1-AirX(极速版)最高达到200 tokens/秒 在性价比方面 GLM-Z1-Air是Deepseek-R1模型价格的三十分之一 GLM-Z1-Flash模型则免费调用 [8] - 最新模型上线智谱开放平台bigmodel后 当天就有超过6000家企业和开发者接入 且调用Tokens每天增长超过100% [9] 商业化与市场表现 - 公司C端产品智谱清言App拥有超过2500万用户 年化收入超千万元 公司商业化收入较上一年取得100%以上的增长 MaaS平台的API年收入同比增长超过30倍 [10] - 公司CEO表示 开源对商业化市场有影响 但开源不等于完全免费 后期技术投入和维护成本不低 公司通过提供更好用的工具、平台和解决方案来创造价值 [9] 融资与资本运作 - 公司自成立以来已完成16轮融资 投资方包括高瓴、启明创投、美团、阿里等机构及多地国资 [13] - 近期 北京市人工智能产业投资基金在去年投资基础上 继续追加投资智谱2亿元人民币 [3][15] - 今年3月 公司先后获得来自杭州城投、华发集团、成都高新区三笔总金额超过18亿元的投资 [13] - 华发集团战略投资智谱5亿元 资金将用于推进GLM大模型技术创新与生态发展 双方还将共同搭建首个城市级GLM大模型空间“智谱+珠海华发空间” [14] 开源生态与行业影响 - 公司宣布Z基金将出资3亿元 支持全球范围内AI开源社区发展 任何基于开源模型的创业项目均可申请 [11] - 北京市科委官员表示 包括智谱在内的一批北京企业积极拥抱开源 智谱最新开源系列模型是极具影响力的开源成果 [11] - 北京后续将组织开源RISC-V处理器核、数据集及系列大模型 持续建设开源项目孵化平台 积极打造中国版“HuggingFace” 全面建设全球“开源之都” [12]
OpenAI 的 75 封内部邮件,一堂硅谷创业课
晚点LatePost· 2024-12-24 20:53
OpenAI创立背景与早期发展 - 2015年5月阿尔特曼首次向马斯克提出创建非营利AI研究机构的构想 旨在抗衡Google等科技巨头的AI垄断 [7][9] - 初始治理架构设计为由5位科技领袖组成的委员会 包括马斯克、盖茨和奥米迪亚等 技术成果归属全人类 [11] - 马斯克承诺出资4000多万美元 并建议采用C型公司+非营利组织的混合架构以优化激励机制 [16][17] 人才争夺与团队建设 - 2015年底DeepMind试图高价挖角OpenAI核心团队 公司立即将年薪提高10-20万美元以稳定军心 [30][33] - 创始团队薪酬设为27.5万美元年薪+0.25%YC股权 新员工为17.5万美元年薪+12.5万美元绩效奖金 [46] - 为争夺顶尖人才如Ian Goodfellow 公司不惜匹配其在Google高达76.5万美元的年薪包 [49] - 马斯克强调必须不惜代价吸引顶级人才 "要么吸引世界最优秀人才 要么被DeepMind打败" [51][52] 技术研发方向 - 首席科学家苏茨克维提出AGI研发路径 强调硬件算力是突破关键 需7-10天完成单个大型实验 [75][77] - 2017年Dota 2 AI击败人类顶级选手 单个实验已需消耗上千个CPU/GPU内核 [74] - 机器人项目取得突破 模拟环境中完成魔方解算 计划9月实现实体机器人操作 [84] - 自我对弈被确定为AGI核心路径 多智能体环境能自发产生复杂行为模式 [76] 商业合作与融资 - 2016年与微软达成协议 以1000万美元获取价值6000万美元的Azure计算资源 [63][65] - 马斯克强烈反对合作中的营销条款 最终改为无附加条件的5000万美元资源支持 [70] - 2017年考虑通过ICO发币融资 但因安全团队担忧暂缓推进 [125] - 硬件投入需求激增 计划将GPU集群从600块扩至5000块 年运营成本达1200万美元 [82] 控制权之争 - 2017年马斯克要求转型营利架构 主张持有50-60%股权并担任CEO [100][105] - 创始团队担忧马斯克获取AGI绝对控制权 提出分布式治理方案 [110][111] - 谈判破裂后公司保持非营利架构 通过捐赠筹集资金 阿尔特曼确立领导地位 [120][124] - 马斯克于2018年2月退出董事会 但继续提供资金支持 [5][125]