AGI
搜索文档
云知声通过港交所聆讯:将成「港股AGI第一股」,今年一季度营收同比增长25%
IPO早知道· 2025-06-12 23:06
公司概况 - 云知声是亚洲最早将AI大语言模型商业化的公司之一,成立于2012年,专注于交互式AI研发[2] - 公司已通过港交所聆讯,或将成为"港股AGI第一股",中金公司和海通国际担任联席保荐人[2] - 拥有自研大语言模型山海大模型(600亿参数),计算能力超184 PFLOPS,存储容量超10PB[3] 技术优势 - 2016年建立Atlas AI基础设施,支持机器学习任务动态调度算力[3] - 山海大模型在MedBench评测中综合得分82.2位列第一,SuperCLUE报告总分72位居全球第一梯队[3] - 早期将深度学习应用于语音识别,并推动CNN、GAN、RL等算法的商业应用[4] 市场地位 - 按2024年收入计算是中国第四大AI解决方案提供商,生活AI解决方案排名第三,医疗AI排名第四[4] - 中国AI解决方案市场规模预计从2024年1804亿元增至2030年11749亿元(CAGR 36.7%)[2] 商业化进展 - 采用"灯塔客户"战略,合作头部企业如格力、平安科技、北京协和医院、中国人保等[5] - 2022-2024年营收CAGR 25.0%(6.01亿→7.27亿→9.39亿元),毛利率稳定在38.8%-40.5%[5] - 2024年经调整净亏损率从2022年30.5%收窄至17.9%,2024Q1营收同比增长约25%[5][6] 资本运作 - 获启明创投、挚信资本、京东、中金、高通等机构投资[7] - IPO募资将用于研发能力提升、新兴商业机会投资、国际扩张及营运资金[7]
对谈 DeepSeek-Prover 核心作者辛华剑:Multi Agent 天然适合形式化数学 |Best Minds
海外独角兽· 2025-06-12 21:27
AGI与强化学习 - 实现AGI需借助"经验"媒介,即强化学习过程中积累的高质量数据,突破人类数据集限制[3] - 强化学习是AGI关键解法,AlphaProof通过RL自行"做题"积累经验,在IMO获奖,展示RL在数学等人类知识接近极限领域的突破潜力[3] - 数学证明领域半年内密集突破:AlphaProof、OpenAI o1模型、DeepSeek-Prover三部曲均展现RL在数学推理上的惊人表现[3] 形式化数学与Agent - 形式化数学用符号化方法建模和验证数学推理,将数学正确性归结为代码编译正确性[20][23] - 当代数学面临"分布式挑战",研究者间沟通成本高导致工程瓶颈,形式化数学可构建统一知识库实现中心化研究[26][30] - Lean因对前沿数学支持良好、社区活跃成为主流形式化语言,DeepSeek Prover采用后引领领域命名范式[30][34] - 形式化数学天然适配Multi-Agent,Proof Engineering Agent需具备自我规划、修复和知识积累能力,类似软件工程但更抽象[51][52] DeepSeek Prover技术演进 - Prover三部曲进展:V1验证合成数据Scaling效果,V1.5实现自然语言推理引导形式化代码,V2在671B规模实现高层次数学规划[35][37][38] - 数学RL动作空间开放无界,传统RL难以应对,LLM+RL可完成代码/数学等复杂任务[40] - 思维链扩展模型规模效应,Test Time Scaling成为可靠方向,如GPT-o系列投入更多推理预算提升结果[41] 评估与训练范式 - RL有效工作关键在Verification设定,需任务难度略高于模型当前能力,Evaluation比Training更重要[59][60] - APE-Bench基准设计聚焦Proof Engineering,要求模型处理大规模文本修改并与验证系统交互,推动从单任务向工程级能力跨越[62][63] - 合成数据在形式化数学中密集使用,AlphaProof通过问题变形/拆解从100万题扩展到1亿题,Test Time Training接近Online Learning[43][45] Certified AI与泛化 - Certified AI强调生成质量控制,通过形式化验证确保结果可靠性,数学需每一步正确,代码需通过安全性等检测[68][69] - 数学能力泛化依赖领域间共同推理模式,pre-training阶段数据配比和规则筛选是关键,如GPT-3.5因高比例代码数据提升推理[72] - 形式化方法可推广至化学、生物等依赖数理结构的领域,但需补充物理世界交互[73] 未来技术方向 - 下一个GPT-4级跨越将是具备自主规划、执行和反思能力的Agent,结合Online Learning可实现能力持续优化[80] - Reward Model演进为Reward Agent,动态收集信息判断生成正确性,解决复杂评估问题[76][77] - Pre-training仍为技术基础,虽Scaling单独难支撑跨越,但需持续融入Agent等新方法[83][84] 行业竞争格局 - AGI实现者大概率来自现有头部企业(Google/OpenAI/DeepSeek等),因需补足技术/Infra/人才积累,新入局者困难[81] - 技术发展进入积累期,o1模型与4o形成互补而非代际替代,pre-training瓶颈指单独Scaling不足,非整体重要性下降[82][83]
姜大昕走“窄门”
36氪· 2025-06-12 18:11
公司动态 - 阶跃星辰Tech Fellow段楠离职并加入京东探索研究院担任视觉与多模态实验室负责人 [1] - 公司于2023年4月成立 被称为"多模态卷王" Step系列基座模型研发速度快 [5] - 2024年7月发布Step-2万亿参数语言大模型正式版 Step-1.5V多模态模型 Step-1X图像生成大模型 [5] - 2025年1月一周内发布6款模型 包括推理模型 [5] - 2025年4月30日发布Step-1o-Vision-32k (highres)视觉大模型 [11] 产品调整 - 2024年12月停止大范围投入角色扮演类Agent产品"冒泡鸭" 团队合并至对话产品"跃问"(现更名为"阶跃AI") [1] - 产品策略从早期探索转向聚焦Agent方向 计划在汽车 手机 具身智能 IoT等场景布局 [17] - 与OPPO合作提供"一键全能搜" "一键问屏"服务 与吉利汽车探索"AI+车"场景 与智元机器人合作探索AI+具身机器人 [17][18] 技术路线 - 选择开发端到端的原生多模态大模型 不同于OpenAI式的逐步添加模态的路径 [15] - 认为多模态是实现AGI的必经之路 坚持原生多模理念 [5][21] - 批评Sora技术路线 认为大模型发展主线应是理解生成一体化 [15] - 视觉大模型Step-1o-Vision-32k在chatBot Arena细分榜单排名21位 [11] 市场表现 - 阶跃AI未进入月活TOP15的AI原生APP榜 推测月活不足300万 [6] - 在chatBot Arena总榜未上榜 在六小龙中落后于DeepSeek 零一万物 智谱 [9][10] - 市场投入谨慎 相比Kimi MiniMax等公司投流力度较小 [8] - 开发者认知度较低 被视为大模型调用备选项 [14] 融资与竞争 - 融资规模在AI六小龙中不是最多 单轮融资额也不是最高 [13] - 面临来自科技巨头(腾讯 阿里 字节)和其他创企(Kimi MiniMax 智谱)的激烈竞争 [25] - 2025年国内大模型融资几乎停滞 需要向投资人证明技术路线可行性 [26][28] 团队与挑战 - 创始人姜大昕曾任微软全球副总裁 主导过Bing Azure Microsoft 365等产品的自然语言理解系统 [13] - 视频模型团队部分核心成员跟随段楠加入京东 [1] - 技术路线激进但难度大 需要突破原生多模态模型的技术瓶颈 [15][17] - 缺乏独特市场标签 相比竞品存在感较弱 [4][22]
杨立昆的“反ChatGPT”实验,能救Meta吗?
第一财经· 2025-06-12 17:20
Meta的AI双线战略 - 公司采取双线并进策略应对AI竞争,一方面推进杨立昆主导的"世界模型"V-JEPA 2,另一方面由扎克伯格组建"超级智能"团队押注主流LLM路线 [1][12] - Llama 4发布后表现不佳导致公司在开源大模型领域落后于GPT/o系列、Gemini和Claude,同时面临中国DeepSeek和Qwen的竞争压力 [10] - 公司2025年资本开支指引上调至640-720亿美元,重点增加数据中心和基础设施投资以支持AI发展 [12] 世界模型技术路线 - V-JEPA 2采用联合嵌入预测架构(JEPA),放弃主流Transformer架构,拥有12亿参数,训练使用超过100万小时视频和100万张图像 [4][6] - 该模型比英伟达Cosmos快30倍,专注于物理世界交互能力,使AI能预测行为后果并规划行动方案 [6] - 杨立昆认为自回归LLM存在事实错误、逻辑缺陷等问题,世界模型能提供更接近人类直觉的物理世界理解能力 [4][5] 超级智能团队布局 - 扎克伯格亲自组建约50人顶尖AI团队,提供数千万美元薪酬方案,目标成为AGI领域领导者 [11] - 已招募谷歌DeepMind首席研究员Jack Rae和Sesame AI机器学习负责人Johan Schalkwyk,二人曾参与Gemini项目 [11] - 公司投资数十亿美元(传闻150亿)于数据标注公司Scale AI,其CEO将加入Meta团队,Scale AI当前估值超百亿美元 [12] 战略资源投入 - 公司广告业务现金流可支撑AI巨额投入,计划建设世界顶级算力数据中心 [12] - 杨立昆作为图灵奖得主坚持非主流路线20年,认为自回归预测彻底失败,但当前仍面临内外压力 [7][10] - 扎克伯格回归"创始人模式",认为公司有能力和责任率先实现AGI [2]
下一个十年,AI的大方向
虎嗅· 2025-06-12 09:16
人工智能行业发展回顾 - 2015年AlphaGo击败李世石标志着人工智能技术出圈并迎来爆发期,AI四小龙等公司纷纷创业,主打视觉识别技术 [1] - 2025年行业回顾显示AI四小龙已纷纷凋零,中国AI领域涌现出文心、通义、混元等十余个大模型 [3][4] - 2015-2025年被视为AI上半场(视觉识别),2025-2035年可能转向视觉生成领域 [4] 当前AI技术热点 - 文本生成领域聚焦代码生成和文案生成 [4] - 语音生成领域集中在音乐生成和播客生成 [4] - 图片生成技术应用于海报制作和美颜功能 [5] - 视频生成技术覆盖广告制作和影视创作 [5] - 除中国代码生成外,中外AI企业已在其他生成领域实现商业化变现 [6] 技术里程碑事件 - 2017年Transformer架构颠覆传统专有模型研究范式,导致大量学者回归学术界 [7] - 2023年ChatGPT突破引发行业震动,谷歌仓促推出Gemini应对 [7] - 2024年OpenAI先后发布Sora视觉模型和深度思考o1系统,推动行业突破文本长度竞赛 [8] 头部企业技术路线 - ChatGPT和DeepSeek未重点布局生成技术,而是强化推理能力建设 [10] - DeepSeek的核心优势被归纳为国产化、开源架构、资源效率高、中文语料优化和媒体背书 [10] 技术发展方向争议 - 行业存在AGI(通用人工智能)与AIGC(生成式AI)发展路径的哲学争论 [11] - 可回收火箭案例显示技术创新价值常需事后验证,类比当前AI技术争议 [13][14][15] 技术应用原则 - 历史经验表明局域网/互联网/移动互联网/云计算时代均有明确应用边界 [16][17][18][19] - 人工智能时代需要建立类似"若无法实现XX功能则不应强行AI化"的应用准则 [20]
CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源
机器之心· 2025-06-12 08:53
多模态大模型学习新范式 - 提出Crab统一学习框架,通过数据和模型两个角度实现多模态场景理解任务的高效统一,超越垂类专家模型 [2][3][13] - 当前主流的多任务指令微调范式忽视多模态数据异质性和任务间复杂关系,联合训练可能导致任务相互干扰 [2][13] - 新范式明确任务间互助关系,在时序定位、空间定位、像素级理解和时空推理等任务上实现通用理解能力 [3][13][26] 数据集构建与特征 - 构建AV-UIE数据集,包含200K训练样本,涵盖九种任务,其中时序定位任务占比6.8%,空间定位任务占比25.8%,像素级理解任务占比41.6%,时空理解任务占比25.8% [20] - 数据集通过细化现有标签增加显示推理过程,包含具体时空信息,明确任务间互助关系 [16][18] - 采用in-context learning方式利用多模态大模型标注,辅以人工检查纠正,保证数据质量 [18] 模型架构与技术创新 - 设计Interaction-aware LoRA结构,采用共享A矩阵和多个不同LoRA Head B矩阵,每个Head学习数据交互的不同层面 [23] - 通过Router为不同任务分配权重,解耦模型能力,增强特定能力并建立任务间协助桥梁 [23] - 模型包含三个统一多模态接口,处理audio、visual和segmentation mask数据 [21] 实验性能对比 - 在AVE任务上准确率达到80.15%,超过AVT(75.80)、PSP(77.80)和MM-Pyramid(77.80)等专有模型 [27][28] - 在ARIG任务上cloU达到41.78,AUC达到0.42,超过LVS(23.69 cloU)、EZ-VSL(26.43 cloU)和FNAC(27.15 cloU)等专有模型 [28] - 在AVQA任务上平均准确率达到78.94%,超过ST-AVQA(71.59)、COCA(72.33)和PSTP-Net(73.52)等专有模型 [27][29] 任务类型与能力展示 - 时序定位任务要求模型输入音视频并定位时序片段,如找到发生的音视频事件 [5] - 空间定位任务要求模型输入音频和图像并定位发声物体位置 [7] - 像素级理解任务要求模型输入音频和图片并分割发声物体,包含S4、MS3、AVSS和Ref-AVS等多种分割任务 [9] - 时空推理任务要求模型输入乐器演奏音视频并回答相关问题,涉及时序和空间信息理解与推理 [8]
该翻篇就翻篇吧,搞 AI 一定要向前看
Founder Park· 2025-06-11 20:36
Founder Park /AGI Playground 2025 动意以 Agenda 6.20 PM lec 特别单元 22822882 Founder Show x se np 新锐与成熟创业者的 28 深度探讨 30 6.21 AM 主题分享: Why Chapter 2 ? 6.21 PM Al 硬件 垂直 Agent 全球化 50 6.22 AM al Al Cloud 100 China x AGI Playground 6.22 PM 创业新范式 | 出海新方法 | After Party 6.21 22 PM 露天 Social Playground 喝点东西, 坐下唠! Founder Park /AGI Playground (2025 Buy Tickets Now 15 16 17 18 19 20 21 23 Founder Park Founder Park 2 % % 2 % % % /AGI Playground /AGI Plavaround /2025 '2025 /早鸟单日票 早的印度 /6月22日 /6月21日 31 32 33 x751 × 751 34 35 36 ...
他本是浙大医学4+4,现在带队上海机器人冲刺IPO
36氪· 2025-06-11 18:35
公司概况 - 上海仙工智能是一家以"机器人大脑"(控制系统)为核心的智能机器人公司,成立仅5年已成为全球机器人控制器出货量第一的企业[1][4] - 公司采用"控制器+软件+机器人"一站式解决方案,控制器适配超过300种零部件,支持客户模块化搭建机器人[4][6] - 业务覆盖全球30+国家和地区,客户数量从2022年380家增长至2024年832家,年复合增长率48%[4][14] 产品与技术 - SRC系列控制器集成SLAM、自然环境导航等算法,适配20+行业上千场景,2024年单独销售4055台(年复合增长率54.5%)[6][14] - 自研云端软件系统实现全流程数字化管理,支持多类型机器人统一调度,2024年软件收入2029万元(占6%)[8][20] - 提供1000+款预装控制器机器人产品,2024年出货2576台(年复合增长率84.6%),收入占比提升至69.5%[10][20] 财务表现 - 营收从2022年1.84亿元增长至2024年3.39亿元(年复合增长率35.7%),毛利率稳定在45%-49%[18][26] - 机器人业务收入占比持续提升(2024年2.36亿元),但控制器业务毛利率高达81%[20][26] - 经调整净亏损率从2022年-16.7%收窄至2024年-3.1%,主要因股份支付等非现金支出影响[29][32] 研发与团队 - 研发费用占比超20%,154人团队由5位核心成员带领,包括3位浙大校友联合创始人[22][33] - CEO赵越曾获RoboCup机器人世界杯冠军,持股52.89%投票权,核心团队含多位算法专家[35][37][39] - 科沃斯等机构参与四轮融资,IPO前估值32.7亿元(较首轮增长10倍)[43][44][45] 行业趋势 - 全球智能机器人销量从2020年40.66万台增至2024年108.26万台(年复合增长率27.7%),预计2029年达325万台[49][51] - 近期5家机器人公司集中赴港上市,反映AI进步与自动化需求推动行业进入黄金发展期[47][48][53]
36氪冯大刚:努力伴随AGI一代人共同成长|WAVES新浪潮2025
36氪· 2025-06-11 15:25
中国创投市场新纪元 - 中国创投市场处于周期筑底转折点与结构性转型深化期,政策主导、国资与资本高度集中的新生态正在形成 [1] - 36氪WAVES 2025大会聚焦AI技术革新、全球化浪潮与价值重估等前沿议题,汇聚顶级投资人、创业者及跨领域专家 [1] AI技术发展与行业动态 - AGI(通用人工智能)成为新生产力范式,Deepseek、Manus等案例标志技术加速发展 [3][4] - 2023-2024年创投行业活跃度显著提升,融资事件与产品发布频率达每周级别 [5] - 杭州余杭区(良渚)成为AI创业聚集地,涌现"杭州六小龙"等新兴团队 [5][6] 36氪WAVES大会亮点 - 大会设置投资人会场与创业者平行会场,汇集国内AI领域最具话语权的投资人与创业者 [7] - 特别环节"Let's WAVES"聚焦00后创业者,展示其对未来的独特见解 [7] - 36氪成立15周年,定位为伴随AGI时代成长的新一代创投服务平台 [8] 行业代际变迁 - 移动互联网时代成就中国商业科技最伟大公司,当前进入以AGI为核心的新周期 [3][9] - 新一代创业者展现差异化风貌,通过独立演讲形式输出对技术、产品的原创思考 [7]
智擎全球·链算未来:AGI分布式智算网络扬帆出海,重塑全球算力文明新秩序
中国产业经济信息网· 2025-06-11 11:05
分布式AI算力国际出海战略 - 香港智擎集团正式启动"分布式AI算力国际出海战略",核心为AGI分布式智算网络区块链,旨在突破集中式垄断并实现社会协同 [1] - 该战略标志着中国技术方案在重塑全球算力秩序中迈出关键一步,以破界之势进入全球市场 [1] 算力资源与行业变革 - 算力资源已成为驱动数字文明的"新石油",但硬件垄断、高昂成本和僵化调度机制制约全球创新活力 [2] - AGI分布式智算网络通过区块链技术重构算力生产关系,构建去中心化、全球共享的算力神经网络 [2] - 智能合约的不可篡改性降低协作成本,跨链交互协议释放算力资产流动性,使算力成为可自由交易的基础性生产资源 [2] 技术创新与多维赋能 - AGI分布式智算网络采用"使用即增值"经济模型,每笔算力交易自动触发部分Token销毁,形成稀缺性与生态价值增长的动态平衡 [3] - 初创团队可接近边际成本获取海量算力资源,使3D实时渲染、量子模拟、大模型训练等高算力应用走向普惠化 [3] - 催生"算力产消者"新物种,企业可将闲置设备接入网络转化为收益来源,个体可将消费电子产品转变为生息资产 [3] 社会与国家战略意义 - 打破技术话语权垄断,使全球技术边缘群体获得平等参与智能革命的入场券 [3] - 致力于将算力从资本垄断中释放,重塑为支撑人类集体智慧进化的公共基础设施 [3] - 填平国家、区域间的技术鸿沟,实现"算力即民主"的理想 [3] 法治化与国际化路径 - 依托《民营经济促进法》构建企业安全发展空间,借鉴杭州、深圳等地方政府的前沿天使投资模式 [4] - 战略路径包括参与长三角算力枢纽建设、与浙江大学展开前沿合作、打造标杆应用 [4] - 最终目标是携手"一带一路"沿线及全球各国,建设分布式算力网络枢纽节点 [4] 行业范式升级 - AGI分布式智算网络代表对人类协作文明范式的深刻升级,追求算力资源分配正义和全球算力民主化 [5] - 通过算法共识机制缔造个人利益与集体福祉深度融合的协作范式 [5] - 推动构建更平等、高效、可持续的数字文明新秩序 [6]