Workflow
开源模型
icon
搜索文档
马斯克终于开源Grok-2,称“中国公司将是最强大的对手”
第一财经资讯· 2025-08-24 17:45
公司动态 - xAI于北京时间8月24日开源Grok-2模型 并宣布Grok-3将在约6个月内开源 [1] - xAI允许非商业与合规商业使用开源模型 但禁止用于训练其他基础模型 仅当年收入低于一百万美元的公司可商业使用 超过需单独许可 [5] - Grok-2开源文件共42个 总大小约为500GB 运行需8个GPU 每个显存超过40GB [5] - OpenAI于8月6日推出开源权重语言模型gpt-oss-120b与gpt-oss-20b 性能堪比o4-mini和o3-mini 可在高端笔记本和手机上运行 [6] 技术进展 - Grok-2在编码、复杂问题和数学方面表现出色 支持生图识图 性能曾比肩GPT-4o [2] - Grok-4训练量是Grok-2的100倍 于今年7月发布 [5] - xAI计划今年8月发布编程模型 9月发布多智能体 10月发布视频生成模型 [5] - 根据Artificial Analysis基准测试 Grok-2排名在20名开外 当前智能指数前列为GPT-5(69分)、Grok-4(68分)、o3(67分) [2] 行业竞争 - 马斯克表示xAI将很快超越除谷歌外的任何公司 并最终超越谷歌 但中国公司因电力资源丰富和硬件建设能力强成为最强劲竞争对手 [1] - OpenAI CEO山姆·奥尔特曼提及中国AI竞争 尤其是DeepSeek等开源系统的出现 是OpenAI决定推出开放权重模型的重要原因之一 [6] - 相比xAI的严苛开源协议 国内通义千问、DeepSeek及海外微软、OpenAI均采用MIT或Apache 2.0等限制更宽松的开源许可 [5]
钢铁侠的AI帝国崛起?马斯克“掀桌”开源Grok 2.5,明年Grok 3!
搜狐财经· 2025-08-24 14:01
公司动态 - xAI开源Grok 2.5模型并计划约六个月后开源Grok 3模型 [1] - 开源内容包括Grok-2的模型权重和架构等核心部分共42个文件总大小约500GB [1] - 开源许可允许非商业与合规商业使用但商业使用仅限年收入低于100万美元的公司且禁止用于训练其他基础模型 [1] - xAI每月运营成本高达10亿美元 [3] - xAI正计划启动新一轮融资目标估值或达2000亿美元若成功将成为全球估值最高人工智能公司之一 [3] - Grok AI面临隐私争议超过37万条AI聊天记录被泄露并被搜索引擎索引 [3] 技术进展 - Grok 2在编码、复杂问题和数学方面表现出色并能生图识图性能比肩GPT-4o [1] - xAI去年已开源Grok1模型 [1] - Grok 4模型已于今年7月推出Grok 5模型计划年底前问世 [1] 行业竞争 - Meta的Llama系列一直是开源模型的先驱之一在开放许可下推出所有四种模型 [2] - OpenAI今年早些时候宣布推出两个新的开源模型 [2] - 中国初创公司如DeepSeek因开源特性声名鹊起 [2] - 马斯克宣称xAI将很快超越除谷歌外的任何公司并最终超越谷歌但中国公司才是最大对手 [2]
走进办公室,美国投资巨头合伙人惊讶:都在用中国AI?
观察者网· 2025-08-22 15:28
中国AI开源模型全球影响力 - 中国初创企业深度求索(DeepSeek)于2024年1月免费开放低成本开发的先进AI模型 引发全球股市震动[1] - 中国科技巨头阿里巴巴及其他公司的AI模型在海外获得持续增长关注度[1] - 硅谷风投公司a16z合伙人评估其投资初创企业使用中国开源AI模型的概率达80%[1] 中美AI开发战略差异 - 中国企业聚焦开源模型竞争 被斯坦福专家称为"达尔文式生死之争"[1] - 美国企业如OpenAI转向专有模型销售 2020年后拒绝完全开源技术[4] - 中国开源模型在2024年各类智能测试中表现优于Meta等美国同类产品[2] OpenAI战略调整与市场反应 - OpenAI首席执行官承认中国开源竞争带来巨大压力 促使公司改变模型发布策略[2] - 2024年8月推出两款开放权重模型gpt-oss-120b与gpt-oss-20b 系2019年来首次发布开源模型[5] - 新开源模型被批评缺乏核心功能 同期发布的GPT-5专有模型遭遇口碑滑铁卢[5] Meta战略转向与行业影响 - Meta宣布对开放内容选择更谨慎 致力于开发"超级智能"系统[7] - 以高达上亿美元薪酬挖角OpenAI/谷歌/苹果等公司顶尖研究员[7] - 新实验室负责人计划放弃开源模型Behemoth 转向开发闭源模型[7] 开源与专有模型商业价值对比 - 美国专有模型创造营收远超中国开源模型[10] - 开源模型支持企业/政府/研究人员适配细分场景 支持本地化运行无需云端依赖[10] - 通过定制化支持等辅助服务 开源模型开发商仍可实现盈利[10] 全球开源竞争格局变化 - 美国学者指出美国基本退出前沿开源大语言模型竞争 欧洲仅存一个竞争者 中国市场占主导地位[8] - 艾伦人工智能研究所专家承认美国在开源领域已经落后[10] - 中国厂商全力以赴公开优质模型 美国企业将技术作为专有资产保留[10]
惹怒7亿用户的GPT-5,暴露了OpenAI的全部焦虑
新财富· 2025-08-19 16:05
GPT-5技术评价与市场反应 - GPT-5未带来颠覆性技术突破,仅实现渐进式升级,未达行业对"新范式"的预期 [2] - 性能提升集中在代码编程和Agent工具调用领域,普通用户难以感知差异 [3] - 在专业领域与竞品Claude Opus 4.1差距不明显 [4] OpenAI运营危机与用户反弹 - 强制下架GPT-4o等旧版本引发大规模用户抗议,Reddit形成"复活GPT-4o运动" [7][10] - 用户不满GPT-5在回答速度、准确性和人情味上逊于GPT-4o [10] - 公司因退订压力迅速恢复旧版访问,但限制为付费用户专享 [16] 竞争格局变化 - 中国开源模型DeepSeek-R1冲击OpenAI技术护城河,引发CEO承认"站在历史错误一方" [19] - AI编程赛道崛起,Cursor年化营收达5亿美元,估值99亿美元,依托Claude技术优势 [25][27] - Anthropic在API收入超越OpenAI,60%营收来自API调用 [28] 战略调整与商业布局 - 发布开源模型GPT-oss系列,采用Apache 2.0许可试图重建生态标准 [35] - 深化政府合作,签署2亿美元国防合同和1美元企业版协议 [37] - 推出"统一模型系统"GPT-5,通过路由选择降低算力成本并挖掘用户数据价值 [39][42] 商业模式挑战 - 免费用户占比超90%,算力成本压力巨大 [41] - 订阅费占营收42.5%,5000亿美元估值依赖7亿周活用户增长 [14] - 计划通过精准广告和数据变现探索新盈利路径 [42] 组织与竞争压力 - 核心团队遭Meta高薪挖角,首席研究官公开指责 [33] - 收购Windsurf计划被谷歌截胡,错失AI编程领域关键资源 [32] - 面临开源阵营、专业领域竞品和用户期待的三重夹击 [33][35]
关于OpenAI,这是美国机构最关心的问题
华尔街见闻· 2025-08-13 20:42
AI颠覆风险与潜在受害者 - GPT-5的“氛围编程”演示引发市场对颠覆的担忧,例如语言学习应用Duolingo股价在15分钟内下跌8% [2] - 高风险领域集中在缺乏用户护城河的软件公司、单一功能用例或工作流程分散的领域 [2] - 具体受威胁的垂直领域包括生产力工具、客户服务、内容创作和数据分析等 [2] 技术路线与市场竞争格局 - 尽管开源模型快速发展,但专有模型在短期内仍将保持领先地位 [3] - 算力规模是训练更强大模型的关键,且GPT-5的API定价策略显示专有模型在价格上具备竞争力 [3] - 资本支出和人才成本飙升构成新竞争者的巨大进入壁垒,新LLM开发者面临极大困难 [4][5] 人才与算力资源竞争 - 人才保留挑战严峻,OpenAI向约1000名技术员工发放从数十万到数百万美元不等的奖金 [6] - 算力获取成为吸引顶尖人才的核心要素,Meta和Alphabet的CEO均强调提供充足算力资源的重要性 [6] - OpenAI在算力规模上表现强劲,自2024年以来算力规模扩大15倍,在GPT-5发布前60天内构建了超过60个集群 [8] OpenAI的短期催化剂与长期关注点 - 短期催化剂包括:与微软的谈判结果、向公共利益公司(PBC)的转型、GPT-5的采用情况和市场反应、10月6日举行的开发者大会 [9] - 长期关注重点包括:定价动态和市场份额变化、AI监管和诉讼进展、IT支出的宏观变化、Stargate项目进展及竞争对手动态 [9] 市场策略与定价动态 - GPT-5向免费用户开放,谷歌向学生提供免费订阅,ChatGPT企业政府版定价仅为1美元 [7]
百度AI为何“起大早、赶晚集”
观察者网· 2025-08-13 15:27
公司战略反思 - 创始人李彦宏内部演讲系统反思组织文化 直指公司最大问题为不聚焦 导致无法打赢仗和起大早赶晚集 [1] - 公司早期资源分散于搜索 无人驾驶和云服务等多线作战 导致在大模型时代无法快速迭代 [4] - 管理层决定减少对部分AI产品投入 包括C端通用AI智能体心响和AI社交应用月匣 心响公测支持超200种功能但不到一季度面临资源缩减 月匣因功能滞后和市场竞争激烈被合并 [7] 业务表现与挑战 - 文心一言作为首个加入全球竞争的中国大模型未能引爆C端用户 市场关注度大幅落后于豆包和DeepSeek App Store免费应用榜排名下滑 [1] - 外卖业务份额曾达33% 但2017年被饿了么收购 成立4年的百度外卖彻底退出市场 [1] - 造车事业黯然落幕 与吉利合作的极越汽车仅卖1.4万辆后原地解散 [1] - 2024年当季财报显示公司营收下滑1% 反映训练成本高和变现难 [5] AI技术布局与竞争 - 公司2013年起大力投入AI 成立深度学习研究院并招聘吴恩达等国际专家 试图构建全栈AI能力 [4] - 早期在人才争夺中曾吸引全球顶尖人才 如2013年竞标辛顿初创公司但被谷歌以更高报价抢走 未能将优势转化为长期竞争力 [3] - 开源策略出现误判 创始人多次强调开源模型会越来越落后 但DeepSeek等开源模型崛起导致用户流失 [5] - 受DeepSeek启发后从闭源转向开源 一次性开源10款文心大模型4.5系列 但4.5 Turbo系列仍闭源保留商业化壁垒 [5] - 2024年AI开发者大会发布文心大模型4.0工具 强调开发AI原生应用需注重反馈驱动 [4] 云业务与生态竞争 - 公司应通过外部化AI能力创建第二增长引擎 将云业务作为与搜索互补的平台模型 [9] - 云业务是赢家通吃业务 中国市场将由阿里巴巴 腾讯 百度和华为主导 竞争关键在于生态系统构建 [9] - 阿里云在AI优势上明显拉开差距 2025年报告显示DeepSeek和阿里已接近前沿 但公司在MoE模型应用上落后 [10] - 算力差距明显 昆仑芯片性能与生态成熟度落后于华为Ascend系列 2023年曾订购1600个Ascend 910B芯片用于200个数据中心服务器 [10] - 算力集群专注于文心大模型训练推理 但在超大规模集群支持万亿参数模型方面华为CloudMatrix架构更强 [11] 组织与文化调整 - 创始人呼吁管理层加强自我批评和团队协作 承认能力边界并放弃非核心领域投入 [6] - 提出传球意识概念 当任务超出自身能力时主动交由更适合团队完成以实现整体效率最大化 [6] - 部分业务资源调整存在举棋不定迹象 管理层对心响和月匣应用决定再观望一两个季度 关注月活指标 [7]
288亿独角兽即将诞生!复旦才女创业,被黄仁勋和“苏妈”同时看中
创业邦· 2025-08-13 11:46
公司估值与融资进展 - 公司正计划启动新一轮融资,目标估值达40亿美元(约合288亿元人民币)[2] - 若融资顺利达成,公司估值将在一年内实现超7倍飞跃[3] - 公司已获得红杉资本、Benchmark、英伟达、AMD、Databricks Ventures和MongoDB Ventures等顶级投资机构及产业资本的投资[3][25] - 公司成立至今已完成共计7700万美元的两轮融资,B轮融资后估值达5.52亿美元(约合40亿元人民币)[25] 创始人背景与团队构成 - 创始人乔琳(Lin Qiao)为复旦大学计算机本硕连读毕业生,拥有加州大学圣巴巴拉分校计算机博士学位[5] - 职业经历包括IBM研究职位、LinkedIn技术主管及Meta AI平台架构关键负责人,曾领导超过300人的工程师团队主导PyTorch框架研发及部署[5] - 创始团队由六位参与过Meta PyTorch项目的资深工程师与一位前谷歌AI专家组成核心技术班底[7] 商业模式与技术优势 - 公司定位为推理服务提供商(inference provider),帮助企业低成本、高效运行和定制开源大模型(如DeepSeek、Qwen、Llama)[12] - 通过租用第三方英伟达服务器并提供API接口,使开发者无需操心底层服务器即可调用模型推理能力[12] - 自研Fire Attention推理引擎等技术对GPU资源深度优化,提升模型推理速度并降低客户使用成本[12] - 核心产品Fire Optimizer工具可根据用户需求(质量、速度、成本)自动调整模型配置和部署方案[16] 财务表现与客户基础 - 公司近期年化收入突破2亿美元(约合14亿元人民币),即每月近1700万美元(约合1.22亿元人民币),预计年底增至3亿美元(约合22亿元人民币)[19] - 客户包括AI编程独角兽Cursor、AI搜索独角兽Perplexity等快速崛起的AI原生应用公司[19] 技术实现与案例应用 - 通过量化技术(如8位或4位精度运行模型)、推测执行(一次预测多个答案)及模型组合(小模型快速响应+大模型确认)优化推理效率[18][19] - 为Cursor提供底层技术支持,通过推测解码技术使其模型速度达每秒1000个token,比普通推理快13倍,比GPT-4版本快9倍[20][21] 行业竞争与挑战 - 直接竞争对手包括Together AI(年化营收1.5亿美元)和Baseten[23] - 英伟达收购推理服务商Lepton后直接切入公司核心业务领域[23] - 公司毛利率约50%(低于订阅制软件70%水平),主要因需预留大量服务器应对需求峰值及承受GPU云商家低价竞争[23] - 公司正通过优化GPU资源效率提升毛利率至60%[23] 战略方向与行业趋势 - 未来一年核心战略为强化Fire Optimizer系统,特别侧重推理质量个性化定制能力[26][27] - 创始人预测2025年将成为"Agent年"和"开源模型年",各行业将涌现垂直AI智能体及开源模型井喷发展[28][29] - 公司重点解决AI智能体与开源模型结合的质量优化问题,简化开发者工作流程[30]
昆仑万维发布并开源Matrix-Game 2模型
新浪财经· 2025-08-12 09:14
公司技术发布 - 昆仑万维于8月12日发布并开源自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本"Matrix-Game 2.0" [1] - 新版本能够生成跨场景的长时视频并保持动作和视觉的时序一致性 [1] - 模型支持用户在交互过程中的连续指令输入 [1]
智谱:视觉推理模型GLM-4.5V正式上线并开源
第一财经· 2025-08-11 21:38
模型发布 - 公司推出开源视觉推理模型GLM-4.5V 总参数106B 激活参数12B [1] - 模型基于新一代旗舰文本基座模型GLM-4.5-Air 延续GLM-4.1V-Thinking技术路线 [1] 性能表现 - 在41个公开视觉多模态榜单中综合效果达到同级别开源模型SOTA性能 [1] - 涵盖图像 视频 文档理解以及GUI Agent等常见任务 [1] 开源平台 - 同步在魔搭社区与Hugging Face开源 [1]
三位90后,估值700亿
36氪· 2025-08-11 07:32
公司融资与估值 - Mistral AI正在进行新一轮10亿美元融资 估值将达到100亿美元 较成立时估值增长近50倍[1] - 公司成立一个月时完成1.13亿美元种子轮融资 估值2.6亿美元 创欧洲种子轮纪录[7] - 2023年底完成4.15亿美元A轮融资 估值20亿美元 6个月内估值增长7倍[9] - 2024年6月完成6.4亿美元B轮融资 估值60亿美元[9] - 最新融资由中东基金MGX领投 投资方还包括阿布扎比主权基金穆巴达拉和G42[10] 创始团队与技术背景 - 三位90后创始人Arthur Mensch、Guillaume Lample和Timothée Lacroix均来自巴黎顶尖学府[2] - Mensch26岁获得机器学习博士学位 曾在谷歌DeepMind担任研究科学家[2] - Lample和Lacroix是Meta人工智能实验室Llama架构核心奠基人[2] - 光速创投合伙人评价全球具备同等经验水平的人才仅80-100位[9] 产品与技术路线 - 2023年9月发布首个开源大模型Mistral 7B 73亿参数规模在多个基准测试优于Llama2[4] - 坚持开源技术路线 与OpenAI和Anthropic的封闭模式形成差异化[4] - 2024年推出聊天机器人Le Chat和推理模型Magistral[5] - Le Chat曾登顶法国iOS下载量榜首 但在国际市场表现平平[5] 行业竞争格局 - DeepSeek年初全球爆红 Mistral创始人称其为"中国版Mistral"[5] - OpenAI时隔六年首次发布最新开源模型[5] - 腾讯、智谱AI、阿里巴巴、月之暗面等中国企业密集推出新一代开源大模型[5] - 开源AI战场竞争日趋激烈[5] 商业合作与收入 - 与微软建立合作伙伴关系并获得1630万美元投资[9] - 与英伟达、三星、Salesforce等科技巨头达成合作[9] - 年收入有望首次超过1亿美元 最近一年增长数倍[5] - 与MGX、法国国家投资银行及英伟达成立合资企业 建立欧洲最大人工智能园区[10] 行业发展趋势 - Perplexity完成1亿美元融资 估值达180亿美元 较去年增长近20倍[12] - Genesis AI完成1.05亿美元种子轮融资 创硅谷具身智能行业纪录[12] - Anysphere完成9亿美元融资 估值90亿美元 半年内估值增长246%[12] - 全球90后创业者集中涌现 包括宇树科技、月之暗面、沐言智语等中国初创企业[13]