开源模型

搜索文档
关于OpenAI,这是美国机构最关心的问题
华尔街见闻· 2025-08-13 20:42
关于最新发布的GPT-5影响,见闻此前文章提及,OpenAI商业价值大于技术价值,很快要成"全球最值 钱非上市公司"。除此之外,摩根大通最新报告中,解答了投资者当下最关注的五个问题。 据追风交易台消息,摩根大通在报告中表示,AI浪潮中缺乏用户护城河的软件公司最容易被颠覆,专 有模型在短期内仍将保持领先地位。 此外,资本需求和人才成本飙升,新进入者面临前所未有的门槛,OpenAI短期来看面临四大催化剂。 投资者普遍担心资本支出是否已成为新LLM开发者进入市场的压倒性障碍。基于扩展定律的影响和当 前前沿训练算力集群的规模,新竞争者进入该领域将面临极大困难。 行业正进入数据和客户积累阶段的三大信号包括: 加之人才获取成本持续上升以及公司投资更大算力集群的需求,预计企业需要大量资本才能在该领域成 功竞争。 人才争夺战:算力成为关键筹码 人才保留挑战日益严峻,The Information报道显示,OpenAI将向约1000名技术员工发放从数十万到数百 万美元不等的奖金。 AI颠覆浪潮:哪些公司面临生存威胁? 投资者最关心的问题是"谁将被颠覆?"GPT-5的"氛围编程"演示为这一担忧提供了具体答案。仅凭几句 自然语言就 ...
百度AI为何“起大早、赶晚集”
观察者网· 2025-08-13 15:27
公司战略反思 - 创始人李彦宏内部演讲系统反思组织文化 直指公司最大问题为不聚焦 导致无法打赢仗和起大早赶晚集 [1] - 公司早期资源分散于搜索 无人驾驶和云服务等多线作战 导致在大模型时代无法快速迭代 [4] - 管理层决定减少对部分AI产品投入 包括C端通用AI智能体心响和AI社交应用月匣 心响公测支持超200种功能但不到一季度面临资源缩减 月匣因功能滞后和市场竞争激烈被合并 [7] 业务表现与挑战 - 文心一言作为首个加入全球竞争的中国大模型未能引爆C端用户 市场关注度大幅落后于豆包和DeepSeek App Store免费应用榜排名下滑 [1] - 外卖业务份额曾达33% 但2017年被饿了么收购 成立4年的百度外卖彻底退出市场 [1] - 造车事业黯然落幕 与吉利合作的极越汽车仅卖1.4万辆后原地解散 [1] - 2024年当季财报显示公司营收下滑1% 反映训练成本高和变现难 [5] AI技术布局与竞争 - 公司2013年起大力投入AI 成立深度学习研究院并招聘吴恩达等国际专家 试图构建全栈AI能力 [4] - 早期在人才争夺中曾吸引全球顶尖人才 如2013年竞标辛顿初创公司但被谷歌以更高报价抢走 未能将优势转化为长期竞争力 [3] - 开源策略出现误判 创始人多次强调开源模型会越来越落后 但DeepSeek等开源模型崛起导致用户流失 [5] - 受DeepSeek启发后从闭源转向开源 一次性开源10款文心大模型4.5系列 但4.5 Turbo系列仍闭源保留商业化壁垒 [5] - 2024年AI开发者大会发布文心大模型4.0工具 强调开发AI原生应用需注重反馈驱动 [4] 云业务与生态竞争 - 公司应通过外部化AI能力创建第二增长引擎 将云业务作为与搜索互补的平台模型 [9] - 云业务是赢家通吃业务 中国市场将由阿里巴巴 腾讯 百度和华为主导 竞争关键在于生态系统构建 [9] - 阿里云在AI优势上明显拉开差距 2025年报告显示DeepSeek和阿里已接近前沿 但公司在MoE模型应用上落后 [10] - 算力差距明显 昆仑芯片性能与生态成熟度落后于华为Ascend系列 2023年曾订购1600个Ascend 910B芯片用于200个数据中心服务器 [10] - 算力集群专注于文心大模型训练推理 但在超大规模集群支持万亿参数模型方面华为CloudMatrix架构更强 [11] 组织与文化调整 - 创始人呼吁管理层加强自我批评和团队协作 承认能力边界并放弃非核心领域投入 [6] - 提出传球意识概念 当任务超出自身能力时主动交由更适合团队完成以实现整体效率最大化 [6] - 部分业务资源调整存在举棋不定迹象 管理层对心响和月匣应用决定再观望一两个季度 关注月活指标 [7]
288亿独角兽即将诞生!复旦才女创业,被黄仁勋和“苏妈”同时看中
创业邦· 2025-08-13 11:46
公司估值与融资进展 - 公司正计划启动新一轮融资,目标估值达40亿美元(约合288亿元人民币)[2] - 若融资顺利达成,公司估值将在一年内实现超7倍飞跃[3] - 公司已获得红杉资本、Benchmark、英伟达、AMD、Databricks Ventures和MongoDB Ventures等顶级投资机构及产业资本的投资[3][25] - 公司成立至今已完成共计7700万美元的两轮融资,B轮融资后估值达5.52亿美元(约合40亿元人民币)[25] 创始人背景与团队构成 - 创始人乔琳(Lin Qiao)为复旦大学计算机本硕连读毕业生,拥有加州大学圣巴巴拉分校计算机博士学位[5] - 职业经历包括IBM研究职位、LinkedIn技术主管及Meta AI平台架构关键负责人,曾领导超过300人的工程师团队主导PyTorch框架研发及部署[5] - 创始团队由六位参与过Meta PyTorch项目的资深工程师与一位前谷歌AI专家组成核心技术班底[7] 商业模式与技术优势 - 公司定位为推理服务提供商(inference provider),帮助企业低成本、高效运行和定制开源大模型(如DeepSeek、Qwen、Llama)[12] - 通过租用第三方英伟达服务器并提供API接口,使开发者无需操心底层服务器即可调用模型推理能力[12] - 自研Fire Attention推理引擎等技术对GPU资源深度优化,提升模型推理速度并降低客户使用成本[12] - 核心产品Fire Optimizer工具可根据用户需求(质量、速度、成本)自动调整模型配置和部署方案[16] 财务表现与客户基础 - 公司近期年化收入突破2亿美元(约合14亿元人民币),即每月近1700万美元(约合1.22亿元人民币),预计年底增至3亿美元(约合22亿元人民币)[19] - 客户包括AI编程独角兽Cursor、AI搜索独角兽Perplexity等快速崛起的AI原生应用公司[19] 技术实现与案例应用 - 通过量化技术(如8位或4位精度运行模型)、推测执行(一次预测多个答案)及模型组合(小模型快速响应+大模型确认)优化推理效率[18][19] - 为Cursor提供底层技术支持,通过推测解码技术使其模型速度达每秒1000个token,比普通推理快13倍,比GPT-4版本快9倍[20][21] 行业竞争与挑战 - 直接竞争对手包括Together AI(年化营收1.5亿美元)和Baseten[23] - 英伟达收购推理服务商Lepton后直接切入公司核心业务领域[23] - 公司毛利率约50%(低于订阅制软件70%水平),主要因需预留大量服务器应对需求峰值及承受GPU云商家低价竞争[23] - 公司正通过优化GPU资源效率提升毛利率至60%[23] 战略方向与行业趋势 - 未来一年核心战略为强化Fire Optimizer系统,特别侧重推理质量个性化定制能力[26][27] - 创始人预测2025年将成为"Agent年"和"开源模型年",各行业将涌现垂直AI智能体及开源模型井喷发展[28][29] - 公司重点解决AI智能体与开源模型结合的质量优化问题,简化开发者工作流程[30]
昆仑万维发布并开源Matrix-Game 2模型
新浪财经· 2025-08-12 09:14
公司技术发布 - 昆仑万维于8月12日发布并开源自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本"Matrix-Game 2.0" [1] - 新版本能够生成跨场景的长时视频并保持动作和视觉的时序一致性 [1] - 模型支持用户在交互过程中的连续指令输入 [1]
智谱:视觉推理模型GLM-4.5V正式上线并开源
第一财经· 2025-08-11 21:38
模型发布 - 公司推出开源视觉推理模型GLM-4.5V 总参数106B 激活参数12B [1] - 模型基于新一代旗舰文本基座模型GLM-4.5-Air 延续GLM-4.1V-Thinking技术路线 [1] 性能表现 - 在41个公开视觉多模态榜单中综合效果达到同级别开源模型SOTA性能 [1] - 涵盖图像 视频 文档理解以及GUI Agent等常见任务 [1] 开源平台 - 同步在魔搭社区与Hugging Face开源 [1]
三位90后,估值700亿
36氪· 2025-08-11 07:32
公司融资与估值 - Mistral AI正在进行新一轮10亿美元融资 估值将达到100亿美元 较成立时估值增长近50倍[1] - 公司成立一个月时完成1.13亿美元种子轮融资 估值2.6亿美元 创欧洲种子轮纪录[7] - 2023年底完成4.15亿美元A轮融资 估值20亿美元 6个月内估值增长7倍[9] - 2024年6月完成6.4亿美元B轮融资 估值60亿美元[9] - 最新融资由中东基金MGX领投 投资方还包括阿布扎比主权基金穆巴达拉和G42[10] 创始团队与技术背景 - 三位90后创始人Arthur Mensch、Guillaume Lample和Timothée Lacroix均来自巴黎顶尖学府[2] - Mensch26岁获得机器学习博士学位 曾在谷歌DeepMind担任研究科学家[2] - Lample和Lacroix是Meta人工智能实验室Llama架构核心奠基人[2] - 光速创投合伙人评价全球具备同等经验水平的人才仅80-100位[9] 产品与技术路线 - 2023年9月发布首个开源大模型Mistral 7B 73亿参数规模在多个基准测试优于Llama2[4] - 坚持开源技术路线 与OpenAI和Anthropic的封闭模式形成差异化[4] - 2024年推出聊天机器人Le Chat和推理模型Magistral[5] - Le Chat曾登顶法国iOS下载量榜首 但在国际市场表现平平[5] 行业竞争格局 - DeepSeek年初全球爆红 Mistral创始人称其为"中国版Mistral"[5] - OpenAI时隔六年首次发布最新开源模型[5] - 腾讯、智谱AI、阿里巴巴、月之暗面等中国企业密集推出新一代开源大模型[5] - 开源AI战场竞争日趋激烈[5] 商业合作与收入 - 与微软建立合作伙伴关系并获得1630万美元投资[9] - 与英伟达、三星、Salesforce等科技巨头达成合作[9] - 年收入有望首次超过1亿美元 最近一年增长数倍[5] - 与MGX、法国国家投资银行及英伟达成立合资企业 建立欧洲最大人工智能园区[10] 行业发展趋势 - Perplexity完成1亿美元融资 估值达180亿美元 较去年增长近20倍[12] - Genesis AI完成1.05亿美元种子轮融资 创硅谷具身智能行业纪录[12] - Anysphere完成9亿美元融资 估值90亿美元 半年内估值增长246%[12] - 全球90后创业者集中涌现 包括宇树科技、月之暗面、沐言智语等中国初创企业[13]
AI周报|OpenAI发布大模型GPT-5;谷歌推出可交互的世界模型Genie 3
第一财经· 2025-08-10 12:13
OpenAI发布GPT-5 - OpenAI推出GPT-5,强调其幻觉率下降且减少对人类的"阿谀奉承" [1][2] - GPT-5在编程、数学、写作、健康、视觉智能等领域具备最先进性能,内置思维能力可提供专家级智能 [2] - 模型知道何时快速响应或长时间思考,免费用户需等待几天才能使用完整推理功能 [2] - 基准测试显示GPT-5得分超过o3和o4-mini,但与前代差距不大 [2] - 特斯拉CEO马斯克称Grok 4在ARC-AGI基准测试中击败GPT-5 [2] OpenAI开源策略转变 - 公司时隔六年再次开源gpt-oss-120b(1170亿参数)和gpt-oss-20b(210亿参数)两款MoE架构模型 [3] - gpt-oss-120b可在单张80GB GPU运行,gpt-oss-20b适配16GB内存消费级设备 [3] - 公司倾向于旗舰模型闭源策略,但承认强大开源模型的重要性 [3] Anthropic更新Claude模型 - Claude Opus 4.1在代理任务、现实世界编码和推理方面升级,擅长处理复杂多步骤问题 [4] - 公司转向渐进式更新策略,未来几周将推出更多迭代 [4] - 新版本在代码编写和代理能力方面有实用改进 [4] 谷歌发布Genie 3世界模型 - Genie 3支持实时交互,可模拟水、光等自然现象及生态系统 [5] - 能以24帧/秒速度生成720p动态世界,视觉记忆追溯达1分钟 [5] - 模型存在动作空间有限、多智能体交互模拟困难等局限性 [5] 小红书开源多模态模型 - dots.vlm1基于DeepSeek V3打造,配备自研12亿参数视觉编码器NaViT [7] - 在视觉评测集表现接近Gemini 2.5 Pro等领先模型 [7] - 具备图文图表理解、表情包解析、产品配料表分析等能力 [7] xAI将开源Grok 2模型 - 马斯克宣布下周开源Grok 2,该模型以复杂问题处理和逻辑推理见长 [8] - 相比第一代在多个方面实现显著提升 [8] - X平台同步为订阅用户推出图片生成新功能 [8] AI应用市场格局 - 2025上半年AI搜索引擎(MAU 6.85亿)和AI综合助手(6.12亿)构成第一梯队 [9] - AI社交互动(1.26亿)和AI专业顾问(1.11亿)组成第二梯队 [9] - 近七成原生APP月活负增长,手机厂商预装助手和中长尾玩家增长乏力 [9] - DeepSeek月活从1.93亿降至1.62亿,流失用户主要转向百度(56%)和QQ浏览器(42.1%) [9] AMD季度财报 - Q2营收76.85亿美元(同比+32%),净利润8.72亿美元 [10] - 数据中心收入32亿美元(同比+14%)未达预期 [10] - 贸易政策导致8亿美元库存及相关费用损失 [10] - 剔除影响后非GAAP毛利率为54%,AI收入预计将同比增长 [10] 谷歌AI搜索影响 - 公司否认AI搜索导致网站流量下滑,称总体点击量保持相对稳定 [11][12] - 反驳第三方报告关于流量急剧下降的结论,认为其方法存在缺陷 [12]
硅谷AI大神“前台打架”,中国校友“幕后练兵”
阿尔法工场研究院· 2025-08-08 08:07
硅谷AI巨头最新动态 - OpenAI时隔6年首次推出开放权重大语言模型gpt-oss-120b(1170亿参数)和gpt-oss-20b(210亿参数),采用Transformer架构和MoE设计,支持128k上下文,性能接近其商业模型o4-mini和o3-mini [13][21][23] - 谷歌发布文生虚拟世界模型Genie 3,可生成720p/24fps可交互3D世界,实现多分钟实时互动,技术突破可能影响VR、游戏和机器人领域 [6][29][32] - Anthropic升级Claude Opus至4.1版本,AI编程能力提升2%,在Agentic coding等关键指标上保持领先(74.5%),巩固其AI编程赛道优势地位 [38][40][43] 技术参数与性能对比 - gpt-oss-20b在RTX5090上运行速度达160-180 tokens/秒,本地部署性能获用户正面反馈 [23][24] - Genie 3相比前代产品显著提升:分辨率达720p,交互时长扩展至数分钟,延迟实现亚秒级响应 [35][56] - Claude Opus 4.1在多项基准测试中领先:Agentic tool use 82.4%,Graduate-level reasoning 80.9%,Multilingual Q&A 89.5% [40] 行业竞争格局 - OpenAI通过开源模型补足本地部署市场短板,但商用限制条款(年收入>1亿美元或DAU>100万禁用)保持商业策略 [21] - 谷歌凭借持续投入保持技术领先地位,Genie 3是其多年迭代成果,体现大公司研发优势 [34][35] - Anthropic采取差异化竞争策略,专注提升AI编程能力以应对OpenAI和谷歌的全面竞争 [43][44] 华人技术贡献 - OpenAI gpt-oss模型核心团队包含北大校友任泓宇(训练优化专家)和上海交大校友Wang Xin(后训练专家) [48][50][52][53] - 谷歌Genie 3项目有上海交大校友Emma Wang参与,其优化使模型延迟降低10倍,实现24fps流畅度 [56] - 三大巨头研发团队中华人科学家占比显著,体现其在AI领域的技术影响力 [10][46]
OpenAI推出开源模型gpt-oss抗衡中企
日经中文网· 2025-08-07 16:00
OpenAI发布开源模型gpt-oss - OpenAI于8月5日宣布提供名为gpt-oss的开源AI模型 允许开发者免费使用和修改 这是自2019年11月GPT-2以来时隔5年9个月再次开源大规模语言模型 [2] - 公司准备了两种规模不同的模型 相比ChatGPT所用模型 新模型能以更少计算资源高效运行 小型模型甚至适用于笔记本电脑和智能手机 [4] - CEO山姆·奥特曼宣称这是"世界最优秀且最好用的开源模型" 新模型在数学和编程等需要逻辑思维的领域表现优异 [4] 开源战略背景 - OpenAI创立初期采用开源模式 但随着行业竞争加剧逐渐减少信息公开 [5] - 中国企业的崛起成为重要转折点 特别是DeepSeek在1月开源逻辑思维模型R1 被认为能以低成本实现高性能 [5] - 中国企业如阿里巴巴通义千问和Moonshot AI等新兴公司相继发布开源模型 在开源领域形成强劲势头 [5] 行业竞争态势 - OpenAI此次开源被视为抗衡中国AI企业如DeepSeek的策略 [2] - 开源模型领域正成为中美科技企业竞争的新战场 中国企业近期表现活跃 [5]
为了不被挤下牌桌,OpenAI又开源了
搜狐财经· 2025-08-07 12:59
OpenAI战略转向开源 - OpenAI近期开源两款权重模型gpt-oss-120b(1170亿参数)和gpt-oss-20b(210亿参数),分别针对云端高推理与边缘低延迟场景[2] - 这是公司自2019年开源GPT-2后首次重回开源领域,采用Transformer架构和专家混合(MoE)技术[2][7] - 两款模型遵循Apache 2.0开源协议,开发者可本地部署无需API调用,但训练数据和完整训练代码未开源[14][15] 开源模型技术参数 - gpt-oss-120b激活5.1亿参数/token,可在单块英伟达数据中心GPU运行,支持数据中心及高端PC部署[8] - gpt-oss-20b激活36亿参数,仅需16GB内存,适配主流PC设备[8] - 性能测试显示gpt-oss-120b在MMLU达90分,AIME 2025数学竞赛97.9分,接近闭源模型水平[11] 市场竞争格局 - ChatGPT周活用户达7亿(同比+4倍),付费用户500万,Pro会员贡献超60%收入[3] - 企业级市场面临Anthropic(预计35%份额)和谷歌(20%)的竞争压力[3] - 中国开源模型崛起,阿里Qwen系列全球下载量超4亿次,衍生模型14万个,Hugging Face榜单前10中占8席[17][18][22] 开源商业模式 - 开源模型通过云平台(如AWS)扩大影响力,但企业只需支付算力费用不直接向OpenAI付费[17][19] - OpenAI年度经常性收入达120亿美元,远超Anthropic的50亿美元,具备开源商业基础[19] - 行业趋势显示头部企业将采取"开源基础模型+闭源核心模型"的双轨策略[18] 行业发展趋势 - 开源模型性能差距缩小,中国DeepSeek-R1和阿里Qwen 3系列打破闭源优势认知[17] - 开源生态价值在于构建开发者网络,全球反馈加速模型迭代[18] - 当前开源领域更易形成"赢家通吃",但长期竞争格局仍存变数[22]