Workflow
AutoGLM 沉思
icon
搜索文档
硬核「吵」了30分钟:这场大模型圆桌,把AI行业的分歧说透了
机器之心· 2025-07-28 12:24
大模型技术演进与发展之路 核心观点 - 大模型技术从预训练为主转向强化学习主导的范式转变 [10][17][19] - 行业面临Transformer架构局限性、数据枯竭、开源闭源博弈等核心挑战 [31][41][59] - Agent应用爆发与基础模型研发需双轨并行 [53][54][55] 训练范式转变 - OpenAI从GPT-4o的预训练主导转向o1的强化学习后训练,提出测试时间扩展新维度 [13][14][15] - 强化学习可解决行为克隆难以建立目标导向推理能力的问题,但需突破自然语言反馈限制 [21][22][23] - 预训练仍是强化学习冷启动的基础,但需解决奖励机制和算力效率挑战 [25][26][27] 模型架构演进 - Transformer面临O(n²)扩展性、显存占用和长期记忆三大瓶颈 [31] - 优化路径包括RoPE位置编码、分组查询注意力等改进,以及Mamba等非Transformer架构探索 [33][34] - 智能体时代可能推动RNN架构回归,需建模无限上下文能力 [37][38] 数据供给挑战 - 高质量语料预计2028年耗尽,合成数据被Anthropic/OpenAI等广泛应用但存在迭代崩溃风险 [41][42][43] - 英伟达提出物理仿真生成边缘案例,需建立真实世界验证闭环 [44][45] - 行业数据未充分挖掘,应建立非敏感数据共享机制提升预训练质量 [46][48][51] 商业化落地路径 - 2025年Agent产品成爆点(如OpenAI Operator、智谱AutoGLM),但基础模型研发仍持续 [53][54] - 大模型当前相当于自动驾驶L3阶段,距AGI仍有差距 [55] - 金融等领域落地需突破大规模数据处理等技术瓶颈 [56][57] 开源生态影响 - DeepSeek等开源模型性能逼近闭源,冲击传统GPU/闭源产业链 [60][61] - 开源推动资源合理配置并形成行业压力,但需解决分叉滥用问题 [63][64][67] - 英伟达支持开源算力引擎,未来可能走向混合模式 [65][66]
90%被大模型吃掉,AI Agent的困局
投中网· 2025-07-25 16:33
通用Agent行业现状 - 通用Agent面临尴尬境地,90%的市场份额可能被大模型吞噬[3][4][8] - Manus等头部公司出现收入下滑和用户活跃度下降,Manus 6月访问量1781万次,较3月峰值2376万次下降25%[5][22] - Genspark发布45天即达3600万美元ARR,但6月MRR环比下跌13.58%至295万美元[20][22] 商业化与竞争格局 - 头部产品商业化表现分化:Manus 5月ARR达936万美元,但6月MRR环比暴跌51.79%至167万美元[20][21] - 国内大厂主导市场,百度、字节等通过免费策略挤压创业公司空间[26][27][29] - 收费模式对比:Manus Pro会员199美元/月限积分制(约10次/天),Claude Opus 4同价但支持不限量使用[9][11] 技术瓶颈与场景困境 - 大模型能力溢出直接冲击Agent价值,用户更倾向使用基础模型API[9][12] - 垂类Agent在企业端优势显著,可对接内部知识库实现精准输出[15][16] - 当前通用Agent核心场景局限在PPT生成、深度研究等办公功能,但存在信息错漏和低价值输出问题[24][32][34] 技术演进方向 - MiniMax采用线性注意力机制支持100万上下文输入,强化法律文书处理能力[35] - 强化学习(RL)成为突破关键,月之暗面Agent模型在HLE测试得分从8.6%提升至26.9%[36][38] - OpenAI最新Agent产品ChatGPT Agent在HLE测试创41.6%的SOTA成绩[38] 市场趋势 - 行业呈现"模型即Agent"趋势,大模型公司直接切入Agent赛道[28][29] - 开发者生态成竞争焦点,阿里、字节等通过平台推广和比赛吸引开发者[26] - 深度研究功能因成本较低成为主流方向,多模态能力成为标配[30][32]
Manus估值36亿了?
投中网· 2025-04-27 14:35
公司融资与估值 - Manus AI背后的公司"蝴蝶效应"获得由Benchmark领投的7500万美元融资,约合5.46亿人民币[2] - 此前已从腾讯、真格基金和红杉中国等投资人处筹集超过1000万美元[2] - 本轮融资使公司估值增长约5倍,达到近5亿美元,约合36.44亿人民币[2] - Benchmark此前还投资过HeyGen和Sema4.ai两个华人AI创业项目[3] 产品与技术 - 3月发布尚在内测中的通用AI Agent,能独立处理简历筛选、行程规划和股票分析等任务[3] - 订阅服务价格为每月39美元,高级版本199美元[3] - 基于开源模型和第三方API构建工程化能力,核心优势在于任务规划与执行框架[8] - 使用Anthropic的Claude 3.5 Sonnet v1和阿里巴巴Qwen模型[12] - 单任务平均成本约2美元,发布后两周内在Claude模型上花费超过100万美元[12] 市场与竞争 - 计划将服务扩展至美国、日本和中东市场[3] - 被《MIT技术评论》评价为中国AI公司积极普及Agent的代表[9] - 字节推出Agent产品"扣子空间",基于自研豆包大模型[13] - OpenAI推出强调Agent能力的o3和o4 mini模型[13] - 智谱发布Agent产品AutoGLM沉思,号称首个集深度研究能力和操作能力于一体的Agent[13] - Genspark发布Super Agent,宣称在GAIA Benchmark上超越Manus[13] 团队背景 - 三位合伙人分别为肖弘、季逸超和张涛[5] - 创始人肖弘曾创立夜莺科技,推出"壹伴助手"和"微伴助手",获腾讯和真格基金投资[5] - 联合创始人季逸超曾创立Peak Labs,开发"中文互联网最大通用知识图谱"Magi系统[5] - 产品合伙人张涛曾任光年之外产品负责人[5] 行业趋势 - 模型推理能力提升使Agent成为2025年最热的AI投资方向[2] - 2025年被称作Agent元年[2] - AI Agent对算力需求巨大,带动相关基础设施投资[10] - CoreWeave上市市值近200亿美元,主营业务为GPU租赁[9]
北京最火独角兽,要IPO了
投中网· 2025-04-15 14:57
智谱AI IPO进展 - 智谱于2025年4月14日在北京证监局办理IPO辅导备案,辅导机构为中金,计划2025年10月完成上市准备 [3] - 2025年3月完成股份改制,由有限责任公司变更为股份有限公司 [3] - 成为国内大模型"六小虎"中首家启动IPO的公司 [3] 公司背景与技术架构 - 源自清华大学知识工程实验室,核心团队为清华系技术专家,包括首席科学家唐杰(主导研发中国首个万亿参数开源大模型"悟道2.0")[5] - 技术对标OpenAI,拥有全栈自研GLM系列模型架构,包括基座大模型GLM-4、代码模型、多模态模型等,2023年3月至今已完成4次重大迭代 [5] - 2025年发布Agent产品AutoGLM沉思,推理模型GLM-Z1-Air性能比肩DeepSeek-R1但速度提升8倍、成本仅1/30 [5] 商业化进展 - 2024年商业化收入同比增长超100%,MaaS平台吸引70万企业及开发者用户,API年收入同比增30倍 [5] - C端产品"智谱清言"2024年三季度上线付费功能后预计年收入超千万元 [5] - 2025年宣布为"开源年",计划发布包括基座模型、多模态模型等在内的全新开源大模型 [5] 融资与资本结构 - 累计融资超100亿元,2023年单年融资37亿元,估值增长6倍至200亿元 [7] - 投资方包括美团、腾讯、小米等产业资本及红杉、高瓴等财务投资人,2025年3月获杭州、珠海、成都国资合计18亿元战略投资 [7][8] - 无控股股东,实际控制人唐杰和刘德兵通过一致行动人安排控制36.9647%表决权,美团为最大外部股东(持股5.5423%)[10] 行业竞争格局 - 国内大模型"六小虎"分化明显:零一万物转向参数适中模型,MiniMax聚焦多模态,百川深耕医疗,月之暗面开发内容社区 [3] - 二级市场反应积极,战略合作方思美传媒在IPO消息公布后股价涨停 [3]
智谱正式启动A股IPO:B、C两端业务齐发力,今日再开源性能顶尖模型
IPO早知道· 2025-04-15 09:18
公司IPO进程 - 公司于2025年3月31日同中金公司签署辅导协议,正式启动A股IPO进程,成为"大模型创业公司"中第一家正式启动上市流程的企业 [3][5] 技术研发与产品迭代 - 公司成立于2019年,致力于打造新一代认知智能大模型,2020年底研发GLM预训练架构,2021年训练完成百亿参数模型GLM-10B并利用MoE架构训练出万亿稀疏模型 [5] - 2022年研发中英双语千亿级预训练模型GLM-130B并开源,2023年推出千亿基座对话模型ChatGLM并两次升级,开源版本ChatGLM-6B支持本地微调和部署 [5] - 2024年1月推出GLM-4,性能大幅提升,6月开源GLM-4-9B及视觉模型GLM-4V-9B,多模态能力媲美GPT-4V,7月推出视频生成模型CogVideoX,推理速度提升6倍 [5] - 2024年8月升级GLM-4-Plus,10月发布GLM-4-Voice和AutoGLM,11月推出GLM-PC探索"无人驾驶"PC技术,12月发布GLM-Zero-Preview擅长数理逻辑和深度推理 [5] - 2025年1月发布GLM-Realtime支持清唱和2分钟记忆,3月推出AI Agent「AutoGLM 沉思」 [5] 产品矩阵与开源策略 - 公司打造对标OpenAI的完整产品矩阵,包括智谱清言、CodeGeeX、CogVLM、CogView等,清言App支持多模态互动 [5] - 践行MaaS理念,通过bigmodel.cn平台提供AI开发资源和企业级解决方案 [5] - 2025年4月15日宣布开源32B/9B系列GLM模型,涵盖基座、推理、沉思模型,推理模型GLM-Z1-32B-0414性能媲美DeepSeek-R1,推理速度达200 Tokens/秒,价格仅为DeepSeek-R1的1/30 [5] - 启用新域名Z.ai整合32B基座、推理、沉思模型,作为最新模型交互体验入口 [7] 融资与战略合作 - 2025年3月连续完成三笔融资:3月3日超10亿元人民币战略融资,3月13日获珠海华发集团5亿元战略投资,3月19日获成都高新区3亿元战略投资 [7] - 联合地方政府打造首个城市级GLM大模型空间和首个省级基座大模型,智能体已接入北京101等十余所学校 [7] - 投资方包括中科创星、达晨财智、君联资本等知名VC,美团、蚂蚁、腾讯等战略投资方,以及北京、杭州、珠海、成都等地国资 [7]
智谱发的「干活Agent」,不用邀请码
36氪· 2025-04-01 21:52
智谱AutoGLM新产品"沉思"发布 - 公司推出具有深度思考能力的AI Agent产品"AutoGLM沉思",免费上线并支持开放式问题探究与操作执行[3][4] - 产品能模拟人类思维过程,完成从数据检索、分析到生成报告的全流程,并支持多模态理解(图文网页)[4][5] - 展示用例包括具身智能行业研究、生成式AI技术影响分析、复古相机推荐等具体场景[4] 产品技术特性与竞品对比 - 相较于Manus强调"行动"可视化,"沉思"更突出思维链展示,展现模型理解-拆解-检索-解决的完整思考过程[9][10] - 当前预览版仅支持研究整理类任务(如输出代码),无法像Manus直接交付可操作成果(如网页游戏),需用户额外执行[12][13] - 技术架构整合三款新模型:GLM-4-Air-0414(语言理解)、GLM-Z1-Air(问题分析)、GLM-Z1(反思验证)[15] 商业化与行业趋势 - 公司提出"沉思大模型"概念,强调动态联网搜索、工具调用、自我验证等能力对突破传统AI局限性的价值[17] - 新模型GLM-Z1-Air推理速度较R1提升8倍,成本降至1/30,并支持消费级显卡运行,三款模型将于4月14日开源[18] - CEO认为未来应用形态将以模型为核心,产品化外壳变薄,模型能力直接决定产品能力[20] 公司战略定位 - 坚持预训练路线,认为强化学习等方法仍依赖基座模型天花板,预训练是必须持续投入的方向[20] - 提出Agent存在类似大模型的Scaling Law,推理计算扩展可提升性能[20] - 拒绝被标签化为To B公司,强调根据场景需求创造价值而非限定客户类型[25]