Agent

搜索文档
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红;AI 幻觉不全是坏处
晚点LatePost· 2025-01-07 22:59
技术进展 - OpenAI训练GPT-5遇阻,已投入20个月和至少10亿美元算力成本,但性能提升未达预期,两次从头训练均未突破博士生水平目标[4] - 数据短缺迫使OpenAI采用人工生成数据(工程师/科学家每日5000字)和模型生成数据(o1模型)补充,但规模仍远低于GPT-4的10万亿字训练量[5] - o3模型在CodeForces编程竞赛得分比o1提升44%,数学测试EpochAI解决25.2%问题(其他模型<2%),但AGI评测得分因数据预训练存在争议[7][9] - 强化学习重要性提升,OpenAI推出RFT微调方法,LangChain报告显示人类反馈强化学习应用增长18倍[5][9] - 世界模型取得突破:DeepMind的Genie 2生成可交互虚拟场景,李飞飞团队实现AI图片转3D场景,CMU/英伟达开源机器人模拟系统Genesis[14] 行业竞争 - Google Gemini 2.0 Flash系列模型抢占Chatbot Arena前三,OpenAI首次失去榜首地位[18][21] - 中国开源模型崛起:DeepSeek-V3以578万美元训练成本逼近GPT-4o性能,Qwen2.5-plus超越Meta Llama 3.1[23][26] - 芯片领域博通市值破万亿美元,2024年AI收入增长220%至122亿美元,为Google/Meta等提供自研芯片方案[29] - 英伟达推出B300 GPU适配o系列模型,算力/显存提升50%,xAI计划将H100算力中心从10万张扩展至100万张[33][34] 应用与商业化 - OpenAI推出12项ChatGPT升级:订阅费最高2000美元/月,集成Sora视频生成、电话交互、生产力工具插件等功能[36] - Agent成为新趋势,Google Gemini 2.0专为Agent优化,YC预测其市场规模将比SaaS大10倍[12][13] - 大模型嵌入传统行业:Salesforce招聘2000人推广AI Agent,微软Phi-4模型(140亿参数)性能超越更大模型[38][12] - AI硬件进展:Meta计划为Ray-Ban眼镜增加屏幕,OpenAI重组机器人团队,中国预计2025年出现"百镜大战"[40] 投融资动态 - 21家AI公司获超5000万美元融资:中国智谱AI获30亿元(估值200亿元),阶跃星辰聚焦多模态模型,Liquid AI开发新型神经网络架构[42][43] - 基础设施领域Databricks融资86亿美元(估值620亿美元),Tenstorrent获7亿美元开发RISC-V架构AI芯片[44] - 应用层公司多成立于ChatGPT前:Zest AI(金融风控)、Tractian(工业设备监测)、Speak(语言学习)等获大额融资[46][47][48] 科学价值 - 大模型"幻觉"被科学家重新定义:加速抗生素研发(MIT)、生成全新蛋白质(诺奖得主Baker实验室获100项专利)[50][51]
为什么我们对 25 年 AI 极度乐观?| 42章经
42章经· 2025-01-06 05:54
AI市场发展回顾与展望 - 23年AI市场爆发初期,互联网从业者和美元基金迅速涌入,投资焦点集中在大模型公司,OpenAI背景人才备受追捧 [1] - 24年上半年一级市场跌至十年最低谷,大模型公司热度消退,Pre Training模式被质疑,具身智能成为新投资关键词 [2] - 24年9月后市场出现三大变化:融资复苏、多模态模型能力突破(图片/语音/视频生成达GPT-3水平)、AI创二代创始人涌现 [3] 技术演进趋势 - 大模型呈现四大趋势:基础设施化、开源快于闭源、多模型混合方案受青睐、产品价值高于技术 [2] - 多模态进展超预期,视频和3D模型发展速度显著快于语言模型,推理模型o1推动Agent落地 [3] - AI Native产品形态可能通过多模态实现突破,NotebookLM展示跨模态内容组织新范式 [13][14] 投资与创业格局 - 25年市场两极分化加剧:美元基金聚焦出海,人民币基金侧重硬科技/国产替代,初创公司首轮估值达3000-5000万美金 [4][5] - 应用落地成为共识方向,生产力工具类产品主导市场,20-30家应用公司估值超5000万美金,头部ARR达1000万美金 [2][6] - 创始人画像迭代:从互联网转型者变为AI创二代(大厂AI负责人/创业公司联创),认知水平和商业模式显著升级 [3] 商业模式变革 - Prosumer(小B大C)模式验证成功:兼具C端传播属性和B端付费能力,预计25年将出现千万美金ARR公司 [6] - Agent商业模式可能颠覆SaaS:按结果付费替代订阅制,销售体系重构,新创企业比现存SaaS公司更具转型优势 [7][8][9] - Perplexity案例显示搜索平台可能演变为任务完成型Agent,成为AI时代核心入口 [12] 未来重点方向 - Agent领域三大机会:2B场景落地、存量SaaS公司AI化、新商业模式创业公司反攻 [11] - 多模态潜在突破点:视频作为内容输出终局、用户从被动接收转向参与式消费、生产关系变革 [15] - 技术-商业协同效应:AI理解能力+多模态组织将重塑产品形态,如NotebookLM的交互式对话设计 [13][14]
为什么我们对 25 年 AI 极度乐观?| 42章经
42章经· 2025-01-05 21:54
市场趋势与行业动态 - 2023 年 AI 创业投资关键词是大模型,2024 年是具身智能,2025 年将是应用落地[2][4] - 2024 年 9 月后融资市场复苏,各种模态模型能力加强,创始人画像改变,市场进步将延续到 2025 年[4] - 2025 年市场环境将进一步变好,但会更加两极分化,资本方向上美元基金和人民币基金分化,创业融资更倾向背景好的人[4] 投资机会与潜在风险 - 2025 年看好应用落地方向,尤其是生产力工具类产品,预计会出现一批千万美金 ARR 的创业公司[4] - 2025 年看好 Agent 和多模态方向,Agent 主要在 2B 领域落地,新商业模式的 Agent 创业公司将冒头反攻现存 SaaS 企业[4][5] - 多模态可能藏着 AI Native 的答案,未来产品组织形态和使用逻辑可能彻底变化[7] 公司财务表现 - 当下市场约 20 - 30 家应用类公司估值超 5000 万美金,多数应用公司 ARR 年收入为 0,少数找到 PMF 的达 100 万美金 ARR,极少数头部项目达 1000 万美金 ARR[2] 技术发展趋势 - 大模型逐渐成为基础设施,开源进展速度超闭源,实际应用落地偏向多模型混合方案[3] - 推理模型能力提升解锁 Agent 可能性,未来各专业人群、垂直领域都有 Agent 机会[4] 商业模式分析 - Agent 若按结果付费,将对现有 SaaS 公司和模式产生颠覆式变化,销售人员管理和组织模式也会改变[5]
智谱CEO张鹏:加速Agent模型产品研发,期待尽快实现一句话操作电脑和手机
IPO早知道· 2024-11-30 10:36
本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,作为最早探索 Agent 的大模型企业之一,智谱于11月29日带来了多个新进展: AutoGLM 可以自主执行超过50步的长步骤操作,也可以跨 A pp执行任务 ; AutoGLM开启「全 自动」上网新体验,支持等数十个网站的无人驾驶 ; 像人一样操作计算机的GLM-PC 启动内测, 基于视觉多模态模型实现通用Agent的技术探索 。 具体来讲,新升级的AutoGLM可以挑战完成复杂任务:1. 超长任务:理解超长指令,执行超长任 务。2. 跨App:AutoGLM 支持跨App来执行任务。3. 短口令:AutoGLM能够支持长任务的自定义 短语。4. 随便模式:AutoGLM可以主动帮你做出决策。 同时 AutoGLM启动大规模内测,并将尽快上线成为面向C端用户的产品。AutoGLM同时宣布启动 「10个亿级App免费Auto升级」的计划,邀请 App 伙伴联合探索自己的Auto新场景。 此外,智谱还带来基于PC的自主Agent——GLM-PC是GLM团队面向「无人驾驶」PC的一次技术 探索,基于智谱的 ...