Workflow
Llama系列
icon
搜索文档
马斯克收购OpenAI新计划实锤了:找小扎筹千亿美元,果然敌人的敌人就是朋友…
量子位· 2025-08-23 13:06
马斯克收购OpenAI计划 - 马斯克计划以974亿美元价格收购OpenAI 旨在使其回归开源模式[6][9][11] - 马斯克主动邀请扎克伯格加入收购财团 试图联合对抗OpenAI[4][9][12] - 该计划源于法庭文件披露 但最终被OpenAI拒绝并指责为宣传噱头[8][19] Meta的AI战略调整 - Meta在6个月内进行第4次AI组织架构重组 新成立"Meta超级智能实验室"并拆分为四个团队[23][24] - 团队包括TBD实验室(基础大模型)、产品与应用研究(产品转化)、MSL基础设施(AI基础设施)和FAIR(基础研究)[24][38] - 公司冻结"亿元俱乐部"招聘并禁止跨团队调动 重组后解散了AGI Foundations团队[22][25] 人才竞争动态 - Meta从苹果挖角AI云基础设施负责人Frank Chu 其曾向苹果AI主管John Giannandrea汇报[26][28][29] - 扎克伯格通过上亿美元offer从OpenAI挖走首席研究官Mark Chen 导致OpenAI人才流失[22][34][35] - OpenAI首席人事官Julia Villagra在任职1年半后离职 与人才流失压力相关[33][34][36] 企业竞争格局 - 马斯克与扎克伯格曾因Threads与推特竞争公开矛盾 甚至约战"笼斗"[13][15][17] - Meta的Llama 4项目失败后加速AI战略调整 专注于基础设施和人才建设[21][22][24] - OpenAI与Meta形成直接竞争关系 双方在人才争夺和技术路线上的对抗持续升级[4][19][35]
1700亿美元估值!Anthropic融资50亿,AI独角兽争霸战进入新阶段
搜狐财经· 2025-08-23 12:34
融资动态 - Anthropic正在与Iconiq Capital主导的一轮融资进行谈判,拟融资30亿至50亿美元,估值将达到1700亿美元 [1] - 若交易成功,公司将成为全球估值第三高的未上市AI公司,仅次于OpenAI(约3000亿美元)和SpaceX(约4000亿美元) [1] - 本轮融资由Iconiq Capital牵头,该机构预计出资约10亿美元,以管理科技巨头个人财富而闻名 [1] 估值增长 - 公司估值在四个月内从615亿美元(2024年3月融资时)增长至1700亿美元,增幅近三倍 [1] - 此轮融资速度和规模创AI行业纪录,被硅谷投资人称为“AI历史上最快的估值增长” [1] 财务表现 - 年化收入在2025年上半年增长四倍,已超过40亿美元 [2] - 收入增长轨迹:2023年从零至1亿美元,2024年从1亿至10亿美元,2025年上半年从10亿至超过40亿美元 [15] - 2025年千万级和亿级美元大单数量是2024年的三倍,企业客户平均花费增长五倍 [15] 技术优势 - 核心产品Claude系列采用宪法式AI(Constitutional AI)技术,通过预设原则让AI自我改进,无需人工标注有害输出 [4][5] - Claude上下文窗口达200K tokens(约500页文本),优于GPT-4o的128K tokens,坚持“看完全文再回答”原则 [5] - Claude Sonnet 4编程准确率达72.7%,优于ChatGPT与Gemini,为AI编程工具Cursor提供支持,后者12个月内收入达1亿美元 [7] - 宪法AI框架提供可追溯决策过程,在政府、金融、医疗等监管严格行业具有合规优势 [5][12] 商业化策略 - 专注于企业级市场,客户包括辉瑞、美联航、AIG、Novo Nordisk等行业巨头 [15] - 企业应用案例:Novo Nordisk使用Anthropic技术将监管报告处理时间从15天压缩至10分钟;辉瑞科学家年节约1.6万小时手动工作时间 [15] - 与Amazon Connect合作,助DoorDash在2个月内构建语音操作AI联络中心解决方案 [15] 成本与亏损 - 2025年预计亏损约30亿美元,因训练和运行模型成本高昂 [16] - 毛利率落后于典型云软件公司,推理成本需进一步优化以提升盈利能力 [16] 行业竞争格局 - AI行业形成三足鼎立格局:OpenAI(约3000亿美元)、Anthropic(1700亿美元)、SpaceX(约4000亿美元) [18] - 技术路线分化:OpenAI追求通用人工智能(AGI)和消费级应用;Anthropic专注AI安全与企业级市场;Meta等公司推动开源生态 [19] - 商业模式多样化:API服务(OpenAI、Anthropic)、垂直整合(谷歌、微软)、开源生态(Meta) [19] 估值合理性分析 - 市销率(Revenue Multiple)为60倍,低于OpenAI的80倍与xAI的400倍 [17] - 对比AI应用层公司Figma AI(上市估值680亿美元,市销率54倍,营收增长46%),估值被认为在合理范围内 [17] - 技术优势与安全定位在政府和企业客户中具不可替代性,但高估值依赖收入高速增长,若增长放缓可能面临回调风险 [17] 地缘政治因素 - Anthropic首席执行官正逆转对中东资金态度,认为需利用海湾主权财富基金以保持技术前沿地位 [19] - OpenAI也在寻求中东市场,计划融资400亿美元(其中300亿美元待募),与阿联酋企业G42合作在阿布扎比建设数据中心 [19] - 中东主权基金成为AI全球扩张的重要资金后盾 [20] 技术对比(Claude vs GPT-5) - 上下文窗口:GPT-5以400K tokens领先,适合超长文档处理;Claude在输出长度上更灵活 [9] - 编程能力:GPT-5工具调用准确率96.7%,在复杂编程任务中领先;Claude以保守可靠风格受企业开发欢迎 [10] - 事实准确性:GPT-5错误率比前代降低80%,适用于高准确性专业领域;Claude通过宪法AI框架提供可追溯决策 [12] - 定价策略:GPT-5分层定价(输入1.25美元/百万tokens至输出10美元/百万tokens);Claude输入成本极低(Claude 3.5 Sonnet输入免费),输出成本适中 [13]
小扎“亿元俱乐部”车门焊死!被曝冻结招聘,禁止内部人员流动
量子位· 2025-08-22 08:59
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 招聘热潮带来的内部矛盾 虽然说所有顶级AI公司今年都在大举招聘,但Meta的动作最引人瞩目。 截至8月中旬,Meta已从OpenAI招聘了20多名研究人员和工程师,其中至少13名来自谷歌,3名来自苹果 ,3名来自 xAI,2名来自 Anthropic, 总共50多名新员工 。 | Name | | Tenure @ Meta YoE | | Current Job | Prior Roles | Expertise | Advanced Degree | Undergrad Degree | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | Nat Friedman | American | 18 days | 26 | VP, Meta Superintelligence | NFDG; CEO, Github | Developer ecosystems | | BS, MIT (CS) | | Daniel Gross | Israeli | 18 days | | 15 VP Pro ...
小扎“亿元俱乐部”刚组就被拆!千人AI团队面临裁员,高管也得走
量子位· 2025-08-20 09:13
公司AI部门重组 - Meta在6个月内进行第4次AI部门重组 将AI部门Meta Superintelligence Labs拆分为四个子部门 [2][3] - 新架构包含TBD实验室(负责人Alexandr Wang)、产品与应用研究(负责人Nat Friedman)、基础设施(负责人Aparna Ramani)和基础人工智能研究FAIR(负责人Robert Fergus) [3] - 重组后公司股价连续两日下跌4.29% 一度成为美股科技七巨头中跌幅最大 [3] 组织架构调整细节 - Alexandr Wang担任首席人工智能官并主导重组 直接负责TBD实验室 该部门名称"待定"体现其探索性定位 [7][8][9] - 赵晟佳担任首席AI科学家 老员工需通过其面试以在新架构中定位 [11][12] - 原AGI Foundations Group被解散 其负责人转向Wang汇报 原AI产品组负责人Connor Hayes调任管理Threads [21][23] 人力资源与战略调整 - 重组伴随高管离职和规模缩减 数千人团队面临洗牌 可能裁员或转岗 [24][25][27] - 新老员工存在摩擦 新人获天价薪酬包 老员工面临调整 [28][29] - 公司探索使用第三方AI模型支持产品 包括开源模型和闭源授权 [29] 行业竞争与战略定位 - 频繁重组反映公司在AI军备竞赛中追求速度 通过快速迭代寻找最优解 [4][6] - FAIR实验室多次调整定位 从元宇宙到生成式AI再到AGI 图灵奖得主Yann LeCun从公司首席科学家降级为FAIR部门首席科学家 [30][31]
大模型究竟是个啥?都有哪些技术领域,面向小白的深度好文!
自动驾驶之心· 2025-08-06 07:32
大语言模型(LLM) - 大语言模型是基于海量文本数据训练的深度学习模型,核心能力在于理解并生成自然语言文本,参数量通常达数十亿至数千亿级别,训练数据量可达TB级[3] - 现代LLM核心特征包括大规模参数(如GPT-3有1750亿参数)、Transformer架构、预训练+后训练范式以及多任务适应性[6] - LLM核心能力包括理解和生成两方面,技术基础是Transformer神经网络架构特别是自注意力机制[6] Transformer架构 - Transformer是LLM核心技术基础,由Google于2017年提出,包含Encoder和Decoder两部分,关键创新是自注意力机制[9] - Encoder-only架构仅保留编码器部分,典型代表是BERT模型,适合文本理解任务[10] - Decoder-only架构是现代LLM主流选择,如GPT系列、Llama系列,适合文本生成任务[11] LLM核心能力 - 文本生成与创作:如GPT-4可生成技术文档,Claude 4在工程文档生成方面比GPT-4.1高42%[12] - 代码生成与辅助编程:Claude 4 Opus在SWE-bench测试中得分80.2%,Qwen2.5-Max中文代码采纳率达82%[12] - 知识问答与推理:Gemini 2.5 Pro凭借200万token上下文窗口在实时数据分析中表现优异[12] - 文本理解与转换:Llama 3.1 8B在德语医疗文本结构化任务中准确率达89.3%[13] - 多模态处理:前沿模型如Gemini 2.5 Pro支持文本、图像、视频多模态输入输出[14] 代表性LLM工作 - GPT系列:由OpenAI开发,GPT-3有1750亿参数,GPT-5预计将具备2000万token上下文窗口[15][16][20] - Llama系列:由Meta开发的开源模型,Llama 4首次采用MoE架构,包含三个版本[17][21] - Qwen系列:阿里巴巴开发的中国最具影响力开源大模型,已开源200多款模型[18][22] - DeepSeek系列:以创新架构设计和高效推理著称,DeepSeek-V3采用MoE架构[19][23] 视觉基础模型 - 视觉基础模型是通过大规模数据预训练、具备通用视觉理解或生成能力的深度学习模型[25] - 主流架构包括视觉Transformer(ViT)、CNN与Transformer混合架构如ConvNeXt和MobileViT[26][27] - 核心任务包括图像分类与识别、跨模态理解、目标检测与定位、图像分割等[27][29] 语音大模型 - 语音大模型是经过大规模语音数据预训练的大型神经网络模型,参数规模庞大,训练数据量达百亿甚至万亿级别[31] - 主流架构以Transformer为主,采用序列到序列结构,如Whisper模型[32] - 适用任务包括语音识别、语音翻译、语音到语音翻译、文本到语音合成等[36] 多模态大模型(MLLM) - 多模态大模型能同时处理和理解文本、图像、语音、视频等多种模态信息[39] - 主流架构为"预训练模态编码器+可训练模态连接器+大语言模型+模态解码器"组合模式[40] - 适用任务包括视觉问答、图文生成、跨模态检索、视觉定位与分割等[41] - 代表性工作包括LLaVA、Qwen2.5-VL、GPT-4o等[41][42] 推理大模型 - 推理大模型聚焦于通过优化提示方式、引入外部知识或改进推理流程提升大模型推理能力[43] - 主流架构以"基础模型+增强模块"为核心,不改变原模型主干结构[45] - 核心技术方向包括提示工程、上下文学习、思维链与慢思考、检索增强生成等[46] - 代表性工作包括自动提示优化(OPRO)、思维链(CoT)、DeepSeek-R1等[47][48]
腾讯研究院AI速递 20250801
腾讯研究院· 2025-08-01 00:01
GPT-5泄露与功能曝光 - 大量用户在ChatGPT、MacOS应用、Cursor、微软Copilot及OpenAI API平台发现GPT-5痕迹,预计最快下周发布 [1] - GPT-5将整合GPT系列和o系列,实现多模态和推理能力大一统,包括主模型(代号"nectarine"或"o3-alpha")、mini版(代号"lobster")和nano版(代号"starfish") [1] - GPT-5将支持100万tokens上下文窗口、MCP协议与并行工具调用,其中mini版本Lobster特别强化编程能力 [1] DeepSeek R2核心技术突破 - DeepSeek与北京大学联合完成的《Native Sparse Attention》论文获ACL最佳论文奖,实现模型处理长文本速度提升11倍 [2] - 首创"原生稀疏注意力"机制,将模型从"割裂拼接"推向"有机融合",在不牺牲性能的情况下大幅提升效率 [2] - NSA技术已完成27B、MoE架构上的完整预训练验证,通过三种阅读策略(压缩块、选择性精读、滑动窗口)和门控机制 [2] 谷歌AlphaEarth基础模型 - Google DeepMind推出AlphaEarth Foundations,将多源地球观测数据整合为统一数字表征,实现10米级精度地球观测 [3] - 系统整合卫星图像、雷达扫描、3D激光测绘等多种数据,以10×10米网格分析全球陆地及近海,所需存储空间仅为同类AI系统的1/16 [3] - 多项技术创新包括自适应解码架构、空间密集型时序瓶颈和地理文本精准对齐 [3] Moonvalley视频生成技术 - AI视频生成公司Moonvalley宣布旗舰模型Marey正式支持Sketch-to-Video功能,用户可通过手绘草图一键生成电影级视频 [4] - 该功能支持人物动作或摄像机运动路径定义,自动生成连贯视频 [5] - 目前支持1080p@24fps输出,订阅价格14.99美元/月起 [5] Ollama可视化界面升级 - Ollama 0.10.1版本正式上线可视化图形界面,同步支持Mac和Windows [6] - 新版本提供全新对话界面,支持下载模型、与PDF和文档对话、多模态交互和文档编写功能 [6] - 内置新的多模态引擎,支持发送图片给大语言模型 [6] 1688 AI版转型 - 1688推出全新AI版App,上线免费企业查询工具"88查"和全新商家数字人Agent [7] - 1688 AI版聚焦创业与拿货场景,集成AI搜索、选品、创款、图搜、查企等功能 [7] - 商家数字人已有40万商家使用,带动平台GMV和询盘增长18% [7] 逐际动力人形机器人 - 逐际动力推出LimX Oli全尺寸人形机器人,身高165cm、拥有31个主动自由度 [8] - 该机器人软硬件设计贯彻"模块化"与"全开放"理念,提供完整SDK系统 [8] - 推出Lite、EDU及Super三个版本,起售价15.8万元 [8] Meta超级智能愿景 - Meta CEO扎克伯格发布公开信,表示已开始看到AI系统自我改进迹象 [9] - Meta正改变AI模型发布策略,暗示Llama系列不再全部开源 [9] - Meta在第二季度财报中宣布将于2025年斥资高达720亿美元用于AI基础设施建设 [9] a16z AI投资新标准 - a16z合伙人Martin Casado认为AI投资不再看模型性能,而是平台是否能持续交付业务结果 [10] - 平台竞争分化的三要素为组织模式、资源配置与产品策略 [10] - AI估值逻辑回归具体场景,基于悲观、中性、乐观三种场景进行拆解模拟 [10]
特朗普造访美联储:手里一本账,心里一本账;清华校友赵晟佳出任Meta超级智能首席科学家;泰柬边境冲突已致双方共32人死亡 | 一周国际财经
搜狐财经· 2025-07-26 13:22
美联储与特朗普会面事件 - 特朗普成为近20年来首位造访美联储的美国总统,打破白宫与美联储保持距离的惯例 [5][6] - 特朗普与鲍威尔就25亿美元装修预算超支事件交锋,美联储解释成本上涨因关税和材料价格上涨 [7][9] - 特朗普重申降息诉求但否认有意罢免鲍威尔,估算降息3个百分点可为美国节省1万亿美元 [9] - 市场反应显示美联储7月维持利率不变概率高达97.4%,9月降息概率仅62.1% [10] - 法律层面罢免鲍威尔面临重大障碍,美联储历史上从未有主席在任期内被罢免 [12] Meta人事变动 - Meta任命清华校友赵晟佳为超级智能实验室首席科学家,直接向扎克伯格汇报 [20] - 赵晟佳曾深度参与OpenAI GPT系列开发,Meta计划在AI领域投入数千亿美元 [21] - 扎克伯格强调赵晟佳已取得多项突破性成果,将推进下一代基础模型研发 [21] 泰柬边境冲突 - 泰柬边境冲突已致双方共32人死亡,包括19名泰国人和13名柬埔寨人 [22][24] - 双方互相指责对方率先开火,马来西亚调解努力因泰国改变立场而失败 [24][25] - 冲突导致柬埔寨西北部奥多棉吉省至少8名平民死亡,50人受伤 [24] 美欧贸易关系 - 美欧首脑计划7月27日会晤讨论贸易合作及争议问题 [25][27] - 特朗普威胁对欧盟商品征收新关税,欧盟准备对931亿欧元美国产品加征反制关税 [27] - 若8月7日前无法达成协议,欧盟反制关税将正式生效 [27] SpaceX星链中断 - SpaceX星链系统发生故障导致全球约6.1万用户断网2.5小时 [29] - 故障由"运行核心网络的关键内部软件服务"问题导致,马斯克公开致歉 [29] - 业内猜测原因包括软件缺陷、更新失误或黑客攻击 [29] 金融市场表现 - 美股三大指数齐涨,标普500和纳指创新高,道指涨1.26% [30][35] - 现货白银价格突破39美元/盎司创14年新高,年内涨幅32%超过黄金 [32] - 美元指数本周下跌约0.8%,报97.67 [32][35] 全球公司动态 - 谷歌A本周上涨4.39%,亚马逊涨2.35%,特斯拉跌4.12% [31][37] - 礼来股价达812.95美元,博通报290.18美元 [37] - 软银创始人孙正义财富增加35亿美元,农夫山泉董事长钟睒睒财富增加42亿美元 [39][40]
2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高
Founder Park· 2025-07-09 14:11
大模型API市场总览 - 2025年第一季度OpenRouter总Token使用量环比增长4倍,之后稳定在每周2T Token水平[7] - 谷歌以43.1%市场份额居首,DeepSeek和Anthropic分别占19.6%和18.4%[8] - 其他模型合计份额不足10%,Llama系列已萎缩至峰值1/5[11] 头部模型表现 - Gemini-2.0-Flash凭借0.4美元/百万Token低价稳居前三,Gemini-2.5-Flash有望接替其位置[7] - DeepSeek-V3发布后持续Top 10,用户留存率极高,合并免费/付费版使用量可达第二[3][7] - Claude-Sonnet-4接替旧版但增长停滞,OpenAI无稳定Top 10模型[7][8] 细分领域格局 编程领域 - Claude-Sonnet-4占据44.5%绝对优势,Gemini-2.5-Pro以17.6%居次[14] - 前20名中GPT-4o-mini增速达139%,Qwen2.5 Coder增速107%[15] 文本翻译 - Gemini-2.0-Flash以45.7%领跑,前10名中7款为谷歌模型[17] - 第二名"Others"类别占比20.1%,显示长尾需求显著[17] 角色扮演 - 市场高度碎片化,26.6%份额由小众模型占据[21] - DeepSeek-V3以25.2%居首,Gemini-2.0-Flash占18.5%[21] 营销领域 - GPT-4o以32.5%绝对领先,Llama-3.3-70B增速达1,454%[23][24] 技术接口趋势 - 代码编写工具主导接口使用,Cline和RooCode位列前二[25] - liteLLM路由库排名第三,反映开发者生态活跃[25] 厂商战略差异 - 谷歌通过多价位产品矩阵覆盖全场景,Gemini系列价格优势明显[26] - Anthropic专注编程领域实现版本平稳过渡[26] - OpenAI因准入限制和定价问题市场表现弱势[26] - DeepSeek-V3因响应速度优势超越R1版本[26]
Meta挖角OpenAI核心研究员 强化AI推理模型布局
快讯· 2025-06-27 00:31
Meta挖角OpenAI核心研究员 - Meta聘请OpenAI研究员Trapit Bansal加入其新成立的AI超级智能部门 从事AI推理模型相关工作 [1] - Bansal的加入可能为Meta的AI超级智能实验室带来重要助力 该实验室已汇聚多位行业领军人物 包括前ScaleAI首席执行官Alexandr Wang 前GitHub首席执行官Nat Friedman以及Safe Superintelligence联合创始人Daniel Gross [1] - Meta目前尚未在其开源模型家族Llama系列中公开推出任何AI推理模型 [1] - 近几个月来 扎克伯格正通过高薪密集招募人才 以组建Meta全新的AI团队 据传为顶级研究员提供的薪酬方案高达1亿美元 [1] - Bansal此次加盟的具体薪资待遇尚未对外披露 [1]
AI商业本周必读|149亿美金创纪录收购!3D创作提速40倍!国产算力突破300%!
混沌学园· 2025-06-13 18:16
本周核心趋势 - 基建垄断成趋势:硅谷巨头转向算力+数据基建并购,竞争从模型层下沉到基础设施层 [2] - 工具大众化加速:AI工具降低门槛,解放非专业用户生产力,扩大市场规模 [3] - 国产基础设施优化:国产AI从"可用"到"好用",工具链和算力成关键突破点 [4] - AI突破数字边界:AI从数字世界向物理世界扩展,催生机器人等新应用场景 [5] 全球AI开源贡献榜 - 阿里通义千问在Hugging Face全球AI开源贡献榜中位列全球第五、中国第一,超越Meta的Llama系列 [10] - Qwen3单月下载量突破1250万次,衍生模型数量达13万+ [10] 硅谷AI竞争动态 - OpenAI与谷歌达成云服务协议,结束与微软独家合作,谷歌股价上涨2.1%,微软下跌0.6% [11] - Meta斥资149亿美元收购Scale AI 49%股权,创AI领域单笔最高投资纪录 [12][13] - Scale AI数据标注错误率仅0.3%,远低于行业平均5% [14] 模型与技术升级 - 字节跳动豆包大模型升级至1.6版,视频生成模型Seedance 1.0 Pro登顶全球文生视频榜单 [14] - AIME数学测评得分86.3分,较1.5版提升12.3分 [15] - 语音播客模型实现秒级生成双人对话播客,支持自然交互 [15] AI领军人物与融资 - AI关键人物Ilya Sutskever重返多伦多大学获荣誉学位,提出AI将能完成人类所有事情的观点 [16] - 3D大模型公司VAST获数千万美元Pre-A+轮融资,发布Tripo Studio将3D创作效率从15小时缩短至4小时 [17][18] AI编程工具发展 - AI编程工具Cursor上线20个月实现1亿美元年收入,两年内增至3亿美元 [19] - 通过自研模型预测"下一步编辑行为",重新定义开发者交互界面 [19] 国产AI算力突破 - 硅基流动完成数亿元A轮融资,自研高性能推理引擎提升芯片计算效率,填补国内AI工具链空白 [22] AI物理世界交互 - 智源研究院发布"悟界"系列大模型,涵盖多模态世界模型、脑科学、具身智能和微观生命模型四大方向 [23] AI视频工具创新 - 海外AI视频工具PixVerse国内版"拍我AI"上线,集成V4.5版本特效引擎,全球用户超6000万 [25][26] - 与百度智能云、科大讯飞等达成合作,2025年5月跻身美国iOS免费应用榜第4 [26]