AGI

搜索文档
杨植麟,一个90后理想主义者的悬浮
虎嗅· 2025-05-28 14:01
杨植麟的学术与创业背景 - 杨植麟在卡耐基梅隆大学攻读博士学位期间发表两篇里程碑式论文Transformer-XL和XLNet 论文引用量超22000次 研究成果被Google PaLM Meta LLaMA等主流产品采用 [6][7] - 创立月之暗面主攻AGI领域 公司名称来源于平克弗洛伊德专辑 会议室以摇滚乐队命名 体现其文艺青年特质 [8] - 月之暗面创立初期获红杉中国和真格基金2亿美元融资 后续获美团阿里腾讯小红书等战投 [10] 月之暗面的发展困境 - 2024年陷入股权纠纷和套现舆论漩涡 循环智能股东提起仲裁诉讼要求获得月之暗面股份 影响公司运营 [12][13] - 2024年3-8月Kimi广告投放达1.4亿元 单月最高5000万元 月活从400万升至1282万 但核心人才流失且产品迭代缓慢 [15][17] - 2024年9月OpenAI推出o1系列模型后 Kimi1.5与DeepSeek R1同日发布但反响悬殊 技术路线受质疑 [18][19] 行业竞争格局 - DeepSeek采用开源低价策略 API价格仅为行业1/5 通过云厂商绑定快速占领市场 上线一个月下载量破亿 [27][23] - Kimi月活从2023年11月3600万腰斩至2024年3月1820万 落后于DeepSeek(1.87亿) 豆包(9980万) 腾讯元宝(2358万) [29] - 行业预测中国市场最终可能仅剩DeepSeek 阿里巴巴和字节跳动三家大模型提供商 [33] 商业模式对比 - Kimi尝试ToC付费和ToB API服务 但技术未形成壁垒 商业化效率低 [26][27] - DeepSeek通过"开源引流 定制收费"模式 在金融游戏等领域实现规模化落地 创始人梁文锋被视作商业实用主义者 [28][31] - 杨植麟坚持AGI长期主义 认为AI是未来10-20年改变世界的机遇 但商业化进程缓慢 [8][25] 行业发展趋势 - 2024年百度字节阿里腾讯频繁迭代模型 微软Google全面押注Agent 加剧行业竞争 [32] - 现有Transformer架构存在幻觉问题 未来可能出现新架构颠覆现有技术 为创业者提供新机会 [36] - 90后创业者尚未形成成熟商业打法 杨植麟曾是最接近成为新一代商业领袖的AI创业者 [32]
仙工智能以18C冲刺港交所:全球最大的以控制系统为核心的智能机器人公司
IPO早知道· 2025-05-28 09:52
公司概况 - 上海仙工智能科技股份有限公司于2025年5月27日正式向港交所递交招股说明书,计划通过18C章程在港交所主板挂牌上市,中金公司担任独家保荐人[2] - 公司成立于2020年,现已成为全球最大的以控制系统为核心的智能机器人公司,基于"机器人大脑"控制系统的技术与市场地位,整合全球供应链资源,为客户提供机器人开发、获得、使用的一站式解决方案[3] - 公司成为第8家以18C赴港上市的特专科技企业[3] 市场地位与产品 - 公司在2023和2024连续两年的全球机器人控制器销量排名第一,并以此为基础构建了全球首家规模化的智能机器人开放平台[3] - 公司2024年机器人控制器销量的市占率为23 6%[3] - 控制系统是智能机器人的核心,包括内置于机器人本体的控制器和运行于云端的软件,控制器负责机器人本体的感知定位、智能决策和运动控制,软件通过多种智能调度和优化算法实现多类型智能机器人高效协同工作[3] - 截至2024年12月31日,公司的控制器适配超过300种零部件,并支持超过1,500家集成商与终端客户[4] 客户与业务覆盖 - 2022年至2024年,公司分别服务了380、587和832家客户[4] - 公司已有超过1,000个机器人款型通过其平台部署,覆盖3C、汽车、自动化设备、新能源、半导体、工程机械、生物医药等超过20个细分行业[4] - 公司业务现已覆盖全球超过30个国家及地区,2024年的海外收入占比为14 5%[4] - 公司成功服务于多个全球工业标杆企业,包括飞利浦总部荷兰工厂、施耐德电气、一汽大众等[4] 财务数据 - 2022年至2024年,公司营收分别为1 84亿元、2 49亿元和3 39亿元,复合年增长率为35 7%[5] - 2022年至2024年,公司毛利率分别为46 8%、49 2%和45 9%[6] 融资与估值 - 公司已完成4轮累计约2 83亿元人民币的融资[6] - 在18C章程下,公司的领航资深独立投资者为隐山资本和科沃斯,资深独立投资者为赛富投资基金,其他投资方包括华创资本、IDG资本、远桥资产、浩澜资本、洪泰基金等[6] - 公司在今年4月完成IPO前最后一轮融资后,估值为32 7亿元人民币[7] 资金用途 - IPO募集所得资金净额将主要用于推进尖端AGI和具身智能技术的研究及开发,建设一个多功能中心,整合研发、运营、组装及测试功能,机器人产业链上下游的投资和收并购,建立全球销售体系,以及用于营运资金及一般企业用途[7]
深蓝汽车向48万老车主投降价广告惹争议,最新回应;长安马自达换帅丨汽车交通日报
创业邦· 2025-05-27 18:11
奇瑞汽车自动跟随机器人专利 - 奇瑞汽车申请"伴随者自动跟随机器人系统"专利 通过人脸识别 背影识别和声音识别组合方式实现自动跟随 并具备独立识别红绿灯和接送人员能力 [1] 瑞典Meko成立新零配件部门 - 瑞典汽车配件经销商Meko成立新部门 专注于为修理厂和车主提供独家品牌零配件 [1] 深蓝汽车广告争议事件 - 深蓝汽车未经48万老车主同意投放车机开屏广告 发放10000元S09专属购车券引发用户不满 [1] - 公司客服回应称广告是针对首任车主的感恩回馈 每个车主仅会收到一次投放 [1] 长安马自达资本变动 - 长安马自达注册资本从1.17亿美元增至3.94亿美元 增幅达238% [1] - 公司法定代表人由王俊变更为张德勇 同时多位高管发生变更 [1] - 该公司由长安汽车 马自达汽车 中国一汽和马自达(中国)共同持股 [1]
以《民营经济促进法》为基石,AGI定当在时代红利中崛起
中国产业经济信息网· 2025-05-27 15:08
北京民营经济发展促进会党支部李小伟书记在会议致辞中重点强调,新近生效的《民营经济促进法》开 启民营经济发展新纪元。这部具有划时代意义的法律自5月20日实施以来,始终贯彻"公平对待、平等保 护"的立法理念。值得注意的是,当前民营经济已发展成为国民经济重要支柱,经济贡献了全国63%以 上的GDP和89%的就业岗位。他认为,该法通过系统性制度设计,以法治化路径构建制度保障体系,能 够有效护航民营企业行稳致远。 国家发改委经济体制综合改革司原司长孔泾源在专题研讨会上围绕"政策发力与民营经济突围"展开深度 剖析。他表示,当前国家正通过减税降费、优化融资环境等政策工具包,全面激发民营经济活力。他指 出,《民营经济促进法》与宏观政策形成制度合力,既为企业纾困减负,又为创新转型提供战略支撑, 助力民营企业把握数字化、智能化机遇,加速融入国内国际双循环的新发展格局。 中国政法大学教授、全国工商联法律服务与劳动关系委员会委员宋朝武首先深度解析了《民营经济促进 法》。他指出,这部法律以罕见的高效立法进程完成制定,充分体现国家战略层面对民营经济的支持力 度。法律通过系统性制度设计,在市场开放、资源获取等核心领域消除隐性壁垒,全文26 ...
哪吒汽车原CEO张勇所持4050万股权被冻结;小米YU7参加粤港澳大湾区车展丨汽车交通日报
创业邦· 2025-05-26 18:35
3. 【 小米YU7参加粤港澳大湾区车展】5月26日消息,小米汽车发文称,5月31日-6月8日,粤港澳大 湾区车展,小米汽车全家族产品亮相。图片显示,小米YU7确认参加粤港澳大湾区车展。(澎湃新 闻) 1.【哪吒汽车原CEO张勇所持4050万股权被冻结】企查查APP显示,近日,张勇新增一条股权冻结信 息,冻结股权数额4050万元人民币,被冻结标的企业为桐乡合创德力叁科技咨询合伙企业(有限合 伙),冻结日期自2025年5月13日至2028年5月12日,执行法院为浙江省嘉兴市桐乡市人民法院。 (红星新闻) 2.【蔚来汽车经营范围新增电池制造业务】企查查APP显示,近日,上海蔚来汽车有限公司发生工商 变更,经营范围新增电池制造、电池销售、电池零配件生产、电池零配件销售等业务。企查查信息显 示,该公司成立于2015年,法定代表人为秦力洪,由蔚来控股有限公司全资持股。(界面新闻) 扫码订阅汽车交通产业日报, 精选行业新闻,帮你省时间! 此外,如果您还想 查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道 ,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。 (活动期间加入会员可免费获赠一份 产业日报) ...
红杉中国推出 Agent 基准测试「xbench」,双轨评估体系,关注 AI 真实场景的效用
Founder Park· 2025-05-26 14:44
核心观点 - 红杉中国推出AI评估工具xbench,采用双轨评估体系(AGI Tracking与Profession Aligned)追踪模型能力上限与商业落地价值 [1][5][19] - 传统评估体系存在局限性:模型能力与实际效用脱节、题库更新导致历史数据不可比 [10][12] - 提出长青评估机制(Evergreen Evaluation),通过动态更新题库和IRT模型量化能力增长 [17][38][39] - 首次发布ScienceQA(知识测试)和DeepSearch(工具使用)两大评估集,并构建招聘/营销领域专业评估框架 [23][25][26][32] 评估体系创新 双轨架构 - **AGI Tracking**:测试基础能力边界(如ScienceQA得分60 8 vs Gemini 57 2),包含知识/多模态/推理等维度 [4][24][25] - **Profession Aligned**:量化商业价值(如招聘任务经济价值$200/position),已覆盖招聘(03模型得分78 5)和营销(50 8)领域 [4][20][35] 方法论突破 - 从"研究视角"转向"业务视角",设计真实场景任务(如中东市场KOL搜索价值$6,000) [14] - 采用IRT理论解决题库迭代导致的数据断层问题,追踪模型能力斜率(如DeepSeek V2 5显著提升) [39][40] - 引入TMF(技术-市场契合度)分析框架,划分未达标/人机协同/专业化Agent三阶段 [44][45][46] 关键评估集 ScienceQA - 聚焦研究生水平学科知识,季度更新题库,03模型当前领先(60 8分) [4][25] - 题目示例:"奇函数与偶函数嵌套组合的性质判断" [9] DeepSearch - 测试中文互联网环境下的多步推理搜索(03模型65+分),需完成规划→收集→推理→归纳全流程 [4][26] - 典型任务:跨平台合并`result_*.txt`文件并排序 [9] 专业评估 - **招聘领域**:拆解JD分析($20/JD)、人才画像($200/position)等7类可测评任务 [35] - **营销领域**:KOL匹配度预测(03模型50 8分 vs Claude 47 6分) [4][14] 行业影响 - 揭示模型进化速度:18个月内Chatbot能力从20-30分提升至90-100分 [9] - 预测多模态理解、长期记忆、博弈决策将成为下一阶段突破方向 [21] - 推动评估标准从"解题难度"转向"经济价值"(如营销任务节省$6,000人力成本) [14][31]
当大模型把题库“刷爆”,红杉中国推出一套全新AI基准测试
第一财经· 2025-05-26 13:30
基准测试现状与挑战 - 大模型厂商通过基准测试跑分对比新产品 但基准测试难以真实反映AI客观能力 [2] - 静态评估集存在题目泄露问题 模型反复测试可刷高分数 [3] - 主流模型刷爆题目的速度加快 基准测试有效时间急剧缩短 [3] xbench基准测试工具 - 红杉中国推出xbench基准测试工具 采用双轨评估体系和长青评估机制 [3] - 双轨评估体系测评多维度数据集 追踪模型理论能力上限与Agent实际落地价值 [3] - 长青评估机制为动态持续更新方法 解决静态评估集刷榜问题 [3] - xbench最初为红杉内部AGI进程评估工具 2022年ChatGPT推出后开始使用 [3] 垂直领域Agent评测 - 相关机构提出垂直领域Agent评测方法论 构建招聘与营销领域评测框架 [3] - Agent深度搜索能力(自主规划/信息收集/推理分析等)是通向AGI的核心能力 [3] - xbench-DeepSearch评测集关注多模态模型商用视频生成等三个方向 [5] AI Agent发展现状 - AI在长文本/多模态/工具使用/推理方面突破 催化Agent爆炸式增长 [4] - Agent可交付完整任务 相比聊天机器人能提供生产力或商业价值 [4] - 高质量评估集推动Agent在工具使用/编码/客户服务等领域发展 [4] - Agent迭代迅速且外部环境动态变化 测试工具需追踪能力持续增长 [4]
在通往AGI之路上,红杉中国打了一个共鸣的响指
投中网· 2025-05-26 11:13
AI基准测试xbench的推出 - 红杉中国推出首个由投资机构发起的AI基准测试xbench,联合国内外十余家顶尖高校和研究机构的数十位博士研究生,采用双轨评估体系和长青评估机制[1] - xbench重点量化AI系统在真实场景的效用价值,并长期捕捉Agent产品的关键突破,这在全球投资行业属首次[1] - 红杉中国在AI领域布局广泛,投资了AI六小龙中的四家,以及具身智能领域的宇树科技、智元机器人等热门企业[1][2] 推出xbench的背景 - 现有基准测试难以真实反映AI系统的客观能力,基础模型已"刷爆"市面上的基准测试题库,导致评估失效[5][6] - 红杉中国在内部月评中发现主流模型"刷爆"题目的速度加快,基准测试的有效时间急剧缩短,促使公司质疑现有评估方式[6][8] - 核心问题包括:模型能力与AI实际效用的关系不明确,以及不同时间维度上的能力比较缺失[9] xbench的创新解决方案 - 采用双轨评估体系:一条追踪AI系统的能力上限与技术边界,另一条量化AI系统在真实场景的效用价值[11][15] - 引入Profession-Aligned基准概念,考察AI在复杂环境下的实用性任务和商业KPIs,而非仅关注智力题难度[11] - 建立长青评估体系,通过动态更新题目扩充评估集,并设计可横向对比的能力指标,以观察模型发展速度与关键突破[13][15] xbench的特点与意义 - 首期发布包含科学问题解答测评集(xbench-ScienceQA)与中文互联网深度搜索测评集(xbench-DeepSearch),并对主要产品进行综合排名[16] - 提出垂直领域智能体的评测方法论,构建了面向招聘和营销领域的垂类Agent评测框架[16] - xbench本质上是AGI时代的评估标准,红杉中国可能借此探索新的投资方法论,类似2009年对Mobile Only的前瞻判断[16][17] 行业参与与合作 - 红杉中国邀请基础模型与Agent开发者使用xbench验证产品效果,垂类Agent开发者共建行业标准,研究者参与评估研究[17] - 公司希望xbench能成为AGI领域的重要评估工具,帮助捕捉技术-市场契合点(TMF)[15][16]
红杉中国,刚刚发了一篇Paper
投资界· 2025-05-26 11:09
红杉中国推出AI基准测试工具xbench - 红杉中国推出全新AI基准测试工具xbench,并发布相关技术论文,成为首家由投资机构主导发布的基准测试工具[1] - xbench最初是红杉中国在2022年ChatGPT推出后对AGI进程和主流模型进行的内部月评与汇报[3] - 该工具旨在解决当前AI基准测试中模型快速"刷爆"题目、测试有效性时间急剧缩短的问题[3][4] xbench的核心特点 - 采用双轨评估体系:评估AI系统的能力上限与技术边界,同时量化AI系统在真实场景的效用价值[5] - 创新性引入长青评估机制,通过持续维护并动态更新测试内容以确保时效性和相关性[5] - 重点量化AI系统在真实场景的效用价值,采用长青评估机制捕捉Agent产品的关键突破[4][5] xbench的技术创新 - 构建多维度测评数据集,同时追踪模型的理论能力上限与Agent的实际落地价值[5] - 实用性和长青性成为最大亮点:脱离单纯"智力测验",形成对AI能力的连续性评估[6] - 动态对齐现实世界应用需求,为各垂直领域构建具有明确业务价值的测评标准[5] xbench的行业价值 - 切中AI基准测试痛点:构建更科学、长效和如实反映AI客观能力的评价体系[4] - 有望成为AGI时代价值转移之路上的"瞭望塔",第一时间发现AI技术与产品的突破[12] - 重点关注技术-市场契合点(TMF),为AGI创业提供新范式[10][12] 红杉中国的战略布局 - 通过xbench打造高人才密度社区,推动AI技术上限探索和商业化落地机会[15] - 号召基础模型与Agent开发者、垂类专家共同参与社区共建[14][15] - 创新投资机构角色,从商业化评估转向技术标准制定[14][15] AGI时代发展趋势 - 大模型成为AGI时代基础设施,AI应用呈现雨后春笋般发展态势[10] - 创新成本大幅降低,划时代AI Agent可能来自非传统渠道[10] - 移动互联网时代的一切都有望被AGI重构,TMF成为创业新范式[10][12]
王健林再卖48座万达广场,腾讯等“熟人团”接盘;两辆车在充电站起火燃烧,蔚来回应;董明珠孟羽童合体带货500万元丨邦早报
创业邦· 2025-05-26 08:03
万达商业资产出售 - 太盟投资集团联合腾讯控股、阳光人寿等机构共同设立合营企业,收购大连万达商业管理集团持有的48家万达广场项目公司100%股权,涉及北京、广州、成都等多个一二线城市[3] - 交易已获国家市场监管总局无条件批准,但具体金额未披露[3] 新能源汽车行业动态 - 比亚迪推出限时促销活动,涉及王朝网、海洋网共22款智驾版车型,最高补贴优惠5.3万元,其中海豹07DM-i智驾版价格从15万多元降至10.28万元[12] - 蔚来2025款ET5/ET5T车型上市,起售价29.8万元,新增两款车色并升级智能座舱配置[13] - 比亚迪4月欧洲电动汽车销量达7231辆,同比增长169%,首次超越特斯拉成为当地销量十大品牌之一[19] 人工智能与科技行业 - 英伟达将为中国市场推出基于Blackwell架构的AI芯片,售价6500-8000美元,低于H20芯片,预计6月量产[9][10] - 腾讯计划6月发布首个端到端语音通话模型Hunyuan-Voice,并规划推出全球首个"全模态模型"混元-O[12] - 苹果智能家居中枢产品因AI技术推进未达预期推迟至年底发布,配备7英寸显示屏并支持HomeKit控制[10] 消费电子与硬件 - 大疆Mini 5 Pro、Avata 3和Neo 2无人机正在开发中,Mini 5 Pro预计9月发布,Avata 3将配备更大相机传感器[17] - 微软可能砍掉Xbox游戏机硬件,目前在开发的下一代主机或为最后一代产品[12] 机器人技术 - 全球首个人形机器人格斗赛在杭州举行,宇树G1机器人展示出较强的稳定性与敏捷性,能完成侧踢、组合拳等动作并在8秒内起身[7] 区域产业政策 - 广州将出台游戏电竞产业扶持政策,设立专项经费支持研发、赛事、场馆建设等全产业链环节[19]