多模态融合
搜索文档
MiniMax
2026-03-03 10:52
电话会议纪要分析:MiniMax 一、 涉及的行业与公司 * 涉及的行业为**人工智能(AI)行业**,具体涵盖大语言模型、多模态AI、AI编程智能体、AI办公应用、AI视频生成等领域[2][7][9] * 涉及的**公司是MiniMax**,一家专注于AI模型研发与产品化的初创公司[1][2][4] 二、 核心观点与论据 1. 公司战略定位与核心竞争力 * 公司的战略目标是发展成为**AI时代的平台型公司**,核心驱动力在于持续提升模型的**智能密度**和**token吞吐能力**[2][10] * 核心竞争力基于三方面协同能力:**模型**的长期积累与快速迭代、**“模型+产品”一体化**能力、以及推动**生态**发展的能力[2][4][5] * 坚持**差异化战略**,有所为有所不为,例如2023年即明确不做移动端通用个人助手(类似豆包、ChatGPT),将资源集中于能创造独特价值的Agent与海螺视频等方向[10] 2. 技术路径:坚持多模态融合 * 公司认为**多模态融合**是持续提升AI智能的基本前提,并已系统布局多年[4][6] * 多模态推进分为两个阶段:第一阶段(过去4年)已在**语言、视觉、声音、音乐**等单模态上打造出行业内有影响力的模型;第二阶段(当前)致力于各模态能力的整合以形成新突破,预计2026年上半年推出的**M3与海螺3**将体现该阶段成果[6][7] * 公司是国内仅有的三家在各模态均能达到较领先水平的公司之一,且是其中唯一的初创公司[7] * 视频生成被认为是AGI领域中除编程与智能助手之外**最大的市场**,2026年有望推进到中长视频及接近实时生成,公司有望在该市场获得独特机会[2][7] 3. 市场机会与产品进展 * **编程智能(AI Agent)**:L4/L5级别将实现“同事级、组织级”的智能,2026年有望从“辅助工具”显著跃迁至“同事级协作”[2][8][11] * **办公智能**:潜在市场可能大于编程,覆盖人群更广(如数据分析、文档撰写、PPT制作等),预计2026年办公领域的推进速度可能达到2025年编程场景的增长速度[9][11] * **模型迭代与增长**:从M2到M2.5三代模型仅用**108天**,保持了行业内极快的迭代节奏[4][9] * **2026年前两个月业绩**:M2系列模型的**token使用量已达到2025年12月水平的6倍**,增速超预期,可能与Open Cloud生态发展及模型在coding能力与可用性方面的升级有关[3][11] 4. 研发理念与组织效能 * 强调**研发效率**而非单纯资源投入,胜负取决于模型智力进步速度是否能带来更大规模商业化收入[2][10] * 通过“**A准的实习生**”实践(AI Agent覆盖90%员工),将公司作为实验场,带来了两大增量认知:一是显著提升进步速度并压缩组织链路,加快从模型迭代到用户服务的闭环;二是反向澄清模型智能的目标定义,加速研发定向[4][12] * 在AI native的组织架构下,全模态研发费用相较其他创业公司并不高,且显著低于巨头投入,但各模态均已形成有竞争力的模型[7] 5. 行业趋势与竞争格局判断 * 认为AI行业仍处于高速增长阶段,更接近“**每年增量远大于存量**”的扩张型市场,并非典型的“winner-take-all”格局,具备持续创新与差异化能力的公司能获得结构性机会[4] * 行业增长将呈现**阶梯式上行**,而非线性外推[3][11] * 公司正积极准备迎接2026年智能涌现可能带来的多个“**超级PMF**”(产品市场契合),预计未来一年的渗透率与加速度将快于市场普遍预期[3][11] * 竞争的核心目标是建设成为AI时代的平台公司,长期来看全球范围内只会留下少数AI平台型公司,公司目标是成为其中潜在的独立公司之一[10] 三、 其他重要内容 * 公司在**OpenCloud生态**中已有大量早期开发者,因模型性价比较高,尤其适配大投放量场景,降低了开发者门槛[5] * 公司产品进一步集成OpenCloud,通过Agent的**MAAS Claw**降低终端用户门槛,并向**OpenClaw**贡献代码,体现了参与和促进生态建设的能力[5] * 公司判断,在巨头、创业公司与开源模型并存的格局下,**持续赢得关键战役的关键**在于两点:一是技术能力持续突破边界;二是利用边界突破推动产品与业务逐步具备生态属性[12]
上海一群青年,造了个学术版OpenClaw
量子位· 2026-03-03 00:00
文章核心观点 - 上海科学智能研究院与复旦大学联合发布了名为“大圣”的系统级、面向科学探索的高能动性智能体,旨在通过AI技术彻底变革科研范式,提升科研效率与成功率 [4][5] - “大圣”智能体具备“上天入体”的全域科学探索能力,覆盖生命科学、地球科学、物质科学、人文科学等多个领域,并能通过自驱动实验室链接物理世界进行实证 [11][12][39][74] - 该智能体的成功源于对底层AI架构的重构,包括多模态科学基础模型、多分支群体记忆架构、经过验证的Skills体系以及安全可信的闭环设计,背后是跨学科青年科学家团队的融合创新 [40][41][80][82] 产品与能力 - **核心定位**:作为“超级科研合伙人”,“大圣”是一个系统级、面向科学探索的高能动性智能体,致力于推动科研范式变革 [4][5] - **效率提升**:在演示案例中,针对心肌病基因调控网络的研究问题,智能体通过14个智能体并行工作,迭代11轮,将性能提升11%以上,而传统研究生完成类似工作需至少半个月 [1][2] - **干湿实验闭环**:在生命科学领域,智能体实现了“设计-执行-反馈-优化”的干湿闭环。例如,在siRNA药物设计实验中,联动自驱动实验室后,机械臂在16分钟内完成96个样本的转染操作,效率较传统手工提升3到4倍 [13][18][19] - **多模态科学理解**:智能体具备原生多模态理解能力,能直接处理RNA二级结构、分子结构等科学模态数据,无需转换为文本,避免了信息失真。在RNA序列设计任务中,能理解多源科学条件并直接输出高性能序列 [21][25][26][44] - **地球科学应用**:基于“伏羲气象大模型”,智能体已完成“空地数据互联—模型上天—星上计算”的闭环验证,模型已在轨稳定运行一个月,未来计划发射更多卫星星座以提供更精准的天气预报 [30][31][33][34] - **人文科学应用**:在人文社科领域,智能体能进行苏格拉底式思辨,编排教学流程以培养学生的独立思考能力,而非提供死板的百科定义 [36][37][38] 技术架构与创新 - **多模态科学基础模型(大脑)**:采用“神珍科学多模态基础模型”,为不同科学模态(如RNA序列、分子结构)配备专用Tokenizer,生成原生高保真的Science Token,实现多模态对齐与自反思能力,在文本科学推理上达到业界SOTA水平 [42][44][46][48] - **多分支群体记忆架构(记忆)**:创新性地引入Git版本管理思想,构建多分支群体记忆。该架构以海量文献为基础认知主干,每个并行探索的智能体分身拥有独立记忆分支,实现信息隔离与保护,成功经验与失败教训经审核后可回流至主体认知网络 [50][51][52][54] - **场景验证Skills(法器)**:Skills体系源自真实科研任务的反复实践,而非简单的提示词工程。目前已形成300余个可复用Skills,覆盖物质、生命、地球、人文社科四大学科群的20多个科研场景 [57][59][60] - **安全可信体系(紧箍咒)**:通过体系化三层设计保障安全:执行层(Skill安全、沙箱安全)、协作层(智能体互联安全、隐私计算)、存证溯源层(分布式账本)。隐私计算混合架构将性能损耗降至3%以内,实现“数据不外流、任务可进场” [65][66][67][69] - **自驱动实验室(物理世界链接)**:通过“自驱动生命实验室”和“天算实验室”,实现从数字世界到物理世界的全天候、跨尺度实证闭环,让AI建议得以进行真值验证 [72][74][75] 研发背景与平台 - **开发团队**:“大圣”由上海科学智能研究院(上智院)联合复旦大学发布,研发团队汇聚了领域科学家、AI专家和工程师,通过紧密的跨学科融合进行创新 [4][40][80][82] - **基础平台**:“大圣”是基于“星河启智科学智能开放平台”全面升级的成果。该平台已汇聚400余个科学模型,沉淀22PB级高价值数据与5亿篇文献专利资源 [40] - **科研环境**:上智院提供了自由度极高的探索环境,配备海量高质量算力与充足资源,支持科研人员将想法落地,此前已推动如“亲吻数”等数学难题的突破 [83] 行业活动与展望 - **AI4S智能体CNS挑战赛**:复旦大学与上智院将举办第四届世界科学智能大赛的创新赛道,要求参赛智能体独立完成从文献理解到实验验证的全流程,挑战顶级期刊成果的当前SOTA水平,旨在让智能体承担繁琐工作,解放科研人员 [84][85][87] - **商业价值案例**:基于智能体Skills体系的成果已产生实际商业价值,例如在新型补锂剂分子研发中成果转化2000万元并获得数亿元投资;在某难成药靶点药物研发中,潜在价值估计高达5亿美元 [62] - **产业化推进**:上智院孵化企业“格物智研”打造的AI科研验证基础设施平台将于今年6月上线,旨在推动AI从工具升级为科学家的“超级科研合伙人” [62]
AI领域趋势深度洞察报告-从蛮力到智能:2025年人工智能发展的三大核心
搜狐财经· 2026-02-28 06:52
文章核心观点 报告指出,2025年人工智能行业正经历三大核心趋势转变:从依赖算力堆砌转向注重算法效率与成本控制,从对话工具演变为深入业务流程的生产力工具,以及从无序发展进入全球监管框架逐步建立的阶段[1][4] 从拼蛮力到拼技巧:算法创新、开源浪潮与成本革命 - **算法创新推动成本大幅降低**:混合专家模型架构成为关键,例如DeepSeek-R1采用MoE架构,在推理时仅激活5.5%的参数,使其训练成本仅为5.57百万美元,不到竞争对手OpenAI同等性能模型成本的十分之一[7][9][12] - **开源模型崛起改变行业格局**:中国模型如DeepSeek实现完全开源,可免费使用、修改和商业授权[7] Meta发布的Llama 4同样采用MoE架构,其系列模型下载量巨大,并衍生出29个基于它的模型,推动了开源生态繁荣[14] 开源竞争压力甚至促使OpenAI在2025年8月发布了自2019年以来的首个开放权重模型GPT-OSS[17] - **技术民主化与门槛降低**:算法和开源生态的创新使AI使用门槛急剧下降,学生、小团队和创业者都能利用开源模型创造价值[10][20] 预计未来算法将持续优化,模型将更小、更快、更强,开源将成为主流[21] 从对话工具到工作伙伴:AI成为生产力工具 - **企业AI支出呈现爆发式增长**:根据硅谷风投机构报告,企业在生成式AI上的支出从2024年的115亿美元增长至2025年的370亿美元,年增长率达3.2倍[24][28] 这表明企业正从试用转向规模化部署AI[29] - **AI深度集成至核心业务流程**:企业支出重点从对话工具转向让AI“干活”,包括编程辅助、AI Agent自动化和业务流程优化[24] 例如,GitHub Copilot这类AI编程助手用户数在2025年初突破1500万,能提升编码速度、智能补全代码并改善代码质量,重塑软件开发流程[26] - **AI Agent与人形机器人推动应用落地**:AI正在从工具升级为工作伙伴,AI Agent爆发式增长,人形机器人开始量产,广泛渗透至多个行业[1][4]
中国建筑一局申请基于多模态融合的混凝土结构渗漏检测方法专利,显著提升检测灵敏度与鲁棒性
搜狐财经· 2026-02-18 15:44
公司动态与专利技术 - 中国建筑一局(集团)有限公司与北京中建建筑科学研究院有限公司联合申请了一项名为“一种基于多模态融合的混凝土结构渗漏检测方法”的专利,公开号为CN121543012A,申请日期为2025年11月 [1] - 该专利方法涉及多模态数据采集、预处理、特征提取、自适应加权融合、有限元辅助分析、渗漏溯源与可视化及决策建议生成等多个步骤 [1] - 专利技术旨在通过多模态数据同步采集与时空配准,结合自适应加权融合机制动态调整各模态权重,以解决单一模态易受环境干扰的问题,从而显著提升检测灵敏度与鲁棒性 [1] - 该技术引入有限元模拟渗流-热耦合数据辅助深度学习,并结合渗漏概率图溯源修正,实现从检测渗漏点到诊断渗漏源的跨越,最终生成可视化报告与专家级维修建议 [1] 公司背景信息 - 中国建筑一局(集团)有限公司成立于1953年,位于北京市,是一家以从事建筑安装业为主的企业,注册资本为1000000万人民币 [2] - 该公司对外投资了136家企业,参与招投标项目5000次,拥有专利信息5000条,行政许可4174个 [2] - 北京中建建筑科学研究院有限公司成立于1994年,位于北京市,是一家以从事研究和试验发展为主的企业,注册资本为1200万人民币 [2] - 该研究院对外投资了2家企业,参与招投标项目23次,拥有商标信息4条,专利信息279条,行政许可20个 [2]
智能体不再 “偏科”,OpenAI、讯飞、千问等各显神通
AI研究所· 2026-01-26 17:33
市场概况与政策驱动 - 2025年中国智能体市场规模已达78.4亿元,预计2026年增速将超过70% [1] - 制造、能源、金融、政务四大领域需求占比超70% [1] - 政策层面,《“人工智能 + 制造”专项行动实施意见》明确提出培育1000个高水平工业智能体 [1] 行业核心痛点与挑战 - 传统智能体多依赖单一模态交互,难以应对复杂场景 [2] - 定制开发成本高,限制了中小企业参与 [2] - 部分产品执行链路不完整,无法实现“数据-决策-执行”闭环 [2] 技术突破:多模态交互升级 - 多模态融合已成为头部企业的共同选择,旨在提升智能体对环境的感知与需求理解能力 [4] - 阿里千问采用多模态扩展架构,将图像、音频、GUI界面等不同模态映射至统一语义空间,实现同步处理与融合理解 [5] - 智谱AI旗下CogAgent通过多模态感知实现全GUI空间交互,能以视觉形式感知界面并模拟人类进行点击、输入等操作 [5] - OpenAI旗下智能体Operator具备与图形用户界面交互的能力,可模拟人类在电脑上的操作行为完成任务 [5] - 科大讯飞星辰智能体平台打通语音、视觉、动作、业务流等多模态能力,整合AIUI全链路技术实现1.6秒极速响应 [8] - 星辰平台搭配多麦克风阵列降噪等技术,在-5dB高噪场景中也能保持92%以上的交互成功率 [8] - 阿里千问通过跨应用数据协同,实现文本、支付、物流等多维度信息整合调用 [11] - OpenAI产品强化自然语言理解与工具调用的协同,提升复杂任务执行精度 [11] 技术突破:降低开发门槛 - 星辰智能体平台通过原生MaaS架构,一键连接超50个业界优质开源模型,提供一句话精调、零代码可视化精调等多种定制方式 [12] - 平台深度集成原生RPA功能与AI原子能力,接入行业通用MCP工具,让智能体具备执行与链接能力 [12] - 阿里千问通过简化应用接入流程,让企业无需复杂适配即可实现智能体与现有业务对接 [13] - 智谱AI的Auto框架聚焦终端设备的快速赋能,降低移动场景部署成本 [13] - 星辰智能体推出的Astron开源项目基于Apache2.0协议,支持核心能力二次开发,在GitHub已获得13k+ Star [13] 生态构建与场景落地 - 星辰智能体平台在海外市场聚焦中东、东南亚区域,覆盖公共服务、基建招投标等八大场景,通过本地化部署提供适配服务 [15] - 其海外应用覆盖从数千页基建标书的自动分析,到多语言实时出行引导,再到复杂合同合规风险透视等场景 [15] - 阿里千问重点发力消费服务场景,实现外卖、购物、出行等高频需求的智能协同 [18] - 商汤医疗聚焦医疗领域,其肝脏智慧诊疗智能体实现分钟级三维重建,已在多家头部医疗机构落地 [18] - 星辰智能体依托讯飞开放平台资源积累,该平台聚集超过1026.5万开发者团队,累计覆盖终端设备42.8亿台 [18] - 平台在国内聚焦开发者赋能,在海外设立区域总部与本地化团队,构建全球化生态网络 [18] - OpenAI通过API开放策略,让第三方开发者能基于其核心能力构建垂直场景智能体 [18] - 阿里借助自身生态优势,实现智能体与电商、支付、物流等业务的深度融合 [19] - 智谱AI通过“工具赋能 + 创业辅导”模式,加速培育AI原生企业,丰富产业生态 [19] 行业发展趋势 - 智能体产业正处于从技术探索向规模化落地转型的关键阶段 [21] - 未来智能体的发展将更注重场景适配的精准性、开发的便捷性与生态的开放性 [21] - 企业与开发者的协同创新将成为产业进步的重要动力 [21]
华为靳玉志:ADS 4比旧版本安全多了,说“我们智驾靠堆代码”是胡扯
经济观察网· 2026-01-18 23:28
公司业务表现与市场数据 - 华为乾崑智驾系统(乾崑ADS)于2024年4月推出,并于2025年4月发布ADS 4版本 [2] - 2025年10月至12月,搭载华为乾崑智驾的车型连续3个月销量超过10万辆 [2] - 2025年全年,华为乾崑用户辅助驾驶里程达54.2亿公里,累计避免可能的碰撞212万次,辅助泊车3.3亿次 [2] - 截至新闻发布时,华为乾崑智驾累计辅助驾驶里程已超过72亿公里 [3] - 辅助驾驶活跃用户占比达到98%,智慧助手唤醒26亿次,无缝流转1.32亿次,照明光毯开启2434万次,晕车舒缓开启343万次 [2] - 公司预计到2026年底,搭载乾崑智驾的车辆将达到300万辆 [3] 技术路线与产品发展 - 乾崑智驾ADS 4采用了世界引擎与行为模型结合的架构,代表“世界模型”技术路线,该路线认为语言模态并非构建驾驶能力的必需 [3] - 行业技术路线逐渐分化为VLA大模型和“世界模型”两种,VLA路线强调语言模态的必要性 [3] - 在硬件方案上,公司支持“多模态融合”,认为激光雷达在极限场景(如眩光、无光线)下对提升安全性是必要的 [3] - 公司计划在2026年对乾崑五大解决方案进行全面升级,其中乾崑智驾将发布ADS 5版本 [3] - 下一代安全产品计划首搭于尊界S800与问界M9旗舰车型 [3] 产品性能与用户反馈 - 针对外界关于ADS 4变得更保守的质疑,公司回应称在城区场景下,ADS 4的用户使用比例相较ADS 3.3实际增加了个百分点 [2] - 公司统计数据显示,ADS 4的安全性比ADS 3.3提升了50% [2] - 在每发生一次严重碰撞事故前,乾崑ADS平均已安全行驶的公里数是人类司机的3.58倍 [3] - 公司于2025年广州车展发布华为乾崑App,在一两个月时间内下载量超过100万,用户量达到66万 [4] - 通过该App,公司已收到用户关于功能优化的1.5万条心愿单 [4] 公司对外界质疑的回应 - 公司高管驳斥了关于乾崑智驾系统是靠堆规则、堆代码写出来的不实说法 [2] - 公司表示不认可外界某些不客观的质疑,但始终欢迎用户提出宝贵意见 [4] 未来规划与市场展望 - 公司预计2026年搭载乾崑智驾的车辆将超过80款 [3]
全球AI应用平台市场全景图与趋势洞察报告
搜狐财经· 2026-01-10 20:08
全球AI应用平台市场概况 - AI应用平台正成为AI技术规模化应用的核心载体,是集成了模型开发、部署与运营能力的一体化企业级平台,旨在将复杂技术转化为解决实际业务问题的产品与服务 [2] - 全球市场由美国主导,其市场规模占比超过55%,中美两国合计已占全球近七成份额 [2] - 欧洲市场增长迅速,预计2029年市场规模将达到约2500亿美元 [2] 全球AI市场融资与规模 - 2025年全球AI创业公司融资额达到2023亿美元,同比增长超75%,占全球总融资近50% [13] - 美国在AI融资领域占据主导地位,2025年美国本土企业融资总额达1590亿美元,占全球AI融资的79%,其中旧金山湾区贡献了1220亿美元,占美国融资的四分之三以上 [13] - 西欧市场规模占整个欧洲市场的九成以上 [12] 中国AI市场现状与预测 - 预计到2029年,中国人工智能总投资规模将达1114亿美元,五年复合增长率为25.7% [18] - 生成式AI在中国市场占比将显著提升,预计从2024年占总投资规模的18.2%提升至2029年的41.1%,投资规模超450亿美元,五年复合增长率为48.0% [18] - 中国AI产品在用户规模与产品数量上已具备全球竞争力,2025年数据显示,中国AI APP下载量为2.63亿次,产品总数为172个 [17] - 但在商业化收入和Web端渗透率上仍有提升空间,2025年中国AI APP内购收入为8040万美元,AI WEB访问量为14.25亿次,显著低于全球水平 [17][18] AI应用平台服务商分类 - 平台层/PaaS提供者(如微软Azure、百度智能云),提供开发工具与基础设施 [3] - 解决方案构建者(如Palantir、迈富时),聚焦行业场景交付完整解决方案 [3] - 传统软件服务者(如Oracle、用友),在现有软件中嵌入AI能力实现产品智能化 [3] 全球区域发展特点 - 美国扮演“定义规则”的角色,在基础技术、产品形态与商业模式上引领全球 [3] - 欧洲注重“深度整合”,将AI嵌入高端制造、汽车等实体产业,追求高价值与高合规性落地 [3] - 中国作为“规模应用”的场景大师,依托庞大统一市场,在消费互联网、智慧城市等领域实现快速规模化落地与迭代 [3] 未来技术发展趋势 - AI Agent智能体将向具备规划与工具调用能力的自主系统演进 [3] - 低代码AI开发工具将进一步降低开发门槛 [3] - 多模态融合技术将推动AI从文本向图像、语音、视频统一理解与生成跨越 [3] 全球AI关键趋势 - 大模型推理成本大幅下降,例如DeepSeek-V3使推理成本年降90%,其输入成本仅为GPT-4o的1/18-1/5,输出成本为GPT-4o的1/4-1/10,对比Claude3.5,其输出成本仅为其1/53 [25] - AI Agent已进入大语言模型驱动阶段 [24] - 行业AI应用平台正从工具转向集成化平台 [24] 中国AI产业链结构演进 - 算力方面,正从依赖进口转向国产芯片性能追赶并构建生态,未来目标实现接口算子库/训练统一及云边端动态调度 [20] - 算法方面,从预训练规模竞赛转向强化学习与多模态重点发展,未来目标实现多模态认知统一及深度决策 [20] - 数据方面,从依赖公开语料转向建设语料平台与数据要素市场,未来合成数据占比将超50% [20] - 生态与开发方面,从闭源主导、工程化工具链缺失转向开源模型性能比肩闭源、自动化微调平台缩短周期,未来低代码平台将覆盖80%场景 [20] - 应用方面,从集中于数字原生行业转向行业分化明显,未来将向垂直行业深化与专业化本地化部署发展 [20] 行业AI应用需求与渗透率 - 人工智能行业渗透率持续提升,互联网、电信、政府、金融、制造、交通、服务和教育等是AI技术积极探索和广泛落地的领域 [27] - 2024年数据显示,中国互联网行业的AI渗透率已接近90%,处于绝对领先地位 [30] - 电信、政务、金融行业的渗透率普遍超过70% [30] 制造业AI应用 - 需求围绕“提效、提质、降本、控风险”展开,旨在通过AI打通全链路数据,实现各环节的智能化决策与自动化执行 [28] - 具体应用包括:研发环节的生成式设计与AI仿真以提升效率;生产环节的AI质检与预测性维护;供应链环节的库存优化与风险管控;销售环节的精准获客;服务环节的预测性维护与智能客服 [29] 零售消费业AI应用 - 需求聚焦“精准、高效、降本、提体验”,旨在实现从获客、服务到履约的智能化决策 [31] - 具体应用包括:营销环节的AI内容生成与程序化广告;会员运营环节的个性化分层服务;门店管理环节的智能巡店与排班;供应链环节的精准销量预测与库存优化 [32] 金融保险业AI应用 - 需求正从单点效率提升向跨职能协同与业务模式创新演进 [33] - 具体应用包括:风控环节的智能核保、反欺诈与异常监视;客服环节的AI客服机器人;营销环节的客户流失预测与个性化推荐;合规环节的自动化合同与法规审查 [34] 医疗健康业AI应用 - 需求围绕“精准、高效、可及、经济”的核心价值展开 [37] - 具体应用包括:诊疗辅助环节的医学影像智能分析与电子病历处理;患者管理环节的长期状态监测与个性化干预;药物研发环节的靶点发现与化合物设计 [38] - AI+医疗细分赛道中,医学影像分析商业化能力与市场成熟度最高,电子病历、专病专科、医院管理等也是重点布局领域 [38]
腾讯阿里的子弹,命中同一IPO
虎嗅APP· 2026-01-09 08:10
公司上市与市场表现 - 大模型行业竞争加速,已进入快速抢滩港交所的阶段[5] - MiniMax于1月9日以165港元发行价在港交所上市,按全球发行2919.76万股估算,公司市值有望快速突破500亿港元[6] - 市场认购情绪高涨,IPO孖展金额超2533亿港元,公开发售超额认购1209倍,参与机构超460家,创近年港股机构认购纪录[6] - 公司成立不足四年即成功IPO,有望成为AI领域最快上市企业[6] - 1月8日暗盘交易股价最高触及211.2港元/股,收于205.6港元/股,较发行价上涨24.6%[7] 公司团队与研发效率 - 公司灵魂人物为前商汤科技副总裁闫俊杰,其技术背景为MiniMax夯实了基底[12] - 团队非常年轻,CEO闫俊杰36岁,COO 31岁,大语言模型负责人29岁,视觉模型负责人32岁,全体员工平均年龄仅29岁[13] - 公司展现出极高的人效,截至2025年9月底,员工共385人,累计研发投入仅5亿美元,而同期OpenAI累计投入约400~550亿美元[13] - 相当于用OpenAI约1%的投入,便将文本、语音、视觉三大AI核心模态推进至全球第一梯队[13] 公司发展路径与产品矩阵 - 公司成长路径差异化,成立之初便聚焦全模态模型研发[20] - 2022年率先布局海外C端AI社交赛道,旗下AI角色扮演平台Talkie/星野在海外崭露头角[16] - 2023年启动MoE模型研发,旗下abab 6成为国内首款MoE大模型,使公司成为亚洲首家、全球首批实现MoE架构商用的企业[17] - 2024年8月,上线海螺AI视频生成功能,累计生成视频超5.9亿个,在激烈竞争中率先实现商业化[17] - 2025年10月,发布的新一代文本大模型MiniMax-M2在全球权威测评榜单Artificial Analysis中位列全球前五、开源第一[17] - 已构建覆盖多场景的产品矩阵,包括智能Agent应用MiniMax、视觉生成平台海螺AI、音频生成工具MiniMax语音、全模态交互平台Talkie/星野[20] - 公司业务已覆盖全球200多个国家和地区,拥有超2.12亿用户,服务超100个国家和地区的企业客户与开发者[22] 用户数据与粘性 - 公司旗下产品月活跃用户达2760万[22] - 用户日均使用时长高达70分钟,作为参照,2024年主流长视频平台的用户日均使用时长为60-70分钟[22] 商业模式与财务表现 - 公司以B端和C端双轮驱动构建商业闭环[23] - 2025年前三季度收入达5343.7万美元,已超过2024年全年收入3052.3万美元[23] - 毛利率从2023年的-24.7%大幅改善至2025年前三季度的23.3%[23] - 收入71.1%来自AI应用的订阅及付费服务,付费用户达177万,付费率超6%[24] - 海外收入占比超70%,成为收入结构核心亮点[24] - 通过开放平台API服务从B端获取28.9%的收入,已积累超10万家企业和开发者客户,其中付费客户约2500家[24] - 净亏损规模较大,2022-2024年净亏损分别为7372.9万美元、2.69亿美元、4.65亿美元,2025年前三季度净亏损进一步增至5.12亿美元[26] - 研发投入巨大,2022-2024年研发开支分别为1056万美元、7000.2万美元、1.89亿美元,2025年前三季度为1.80亿美元[26] - 研发费用占当期总收入的比例持续下降,从2023年的2023%降至2024年的619%,2025年前三季度进一步降至337%[26] - 2025年前三季度销售费用下降26%,研发费用仅增长30%,收入却同比大增175%,显示增长质量较高[26] 资本背景与行业意义 - 公司成立以来累计融资超15亿美元[27] - 战略投资人涵盖米哈游、阿里、腾讯、小红书、小米等互联网及移动互联网时代明星企业[27] - 以MiniMax为代表的企业,其践行的C端多模态应用与全球化战略,正在重塑中国新一代科技公司的成长路径与行业共识[28]
大咖再扩列!“WAIC UP!全球年终盛会”议程上新,马上锁定你的那一趴!
36氪· 2026-01-04 18:04
世界人工智能大会日程与主题 - 大会日程分为上午场、下午场和夜场三个主要时段,分别聚焦前沿趋势、实战案例与生态共创 [3][4][10][14] - 上午场核心活动为“WAIC UP”主题演讲,旨在洞见前沿趋势并引爆灵感共振 [5] - 下午场核心活动包括“WAIC @”商业产业主题演讲、“WAIC Ground”科教圆桌、“WAIC FUTURE TECH”未来科技主题演讲及“AI GRAVITY”国际合作主题演讲 [11][12] - 夜场核心活动为“WAIC MORE”,旨在打破圈层边界并共创无限可能 [15] 前沿技术趋势与研究方向 - 生成式AI是大会重点讨论的前沿技术趋势之一 [9] - AI for Science(AI4S)作为科研新范式受到关注,涉及技术预见和世界模型等概念 [9] - 多模态融合、具身智能、量子计算被列为重要的未来科技与研究方向 [13] - AI伦理与安全是大会涵盖的关键议题之一 [13] 产业应用与商业生态 - 下午场设有专门针对商业与产业的实战案例分享环节 [11] - 企业圆桌是探讨产业实践的重要形式 [12] - 出海战略被列为大会讨论的议题,关注人工智能技术的全球化商业布局 [13] 人才培养与教育演化 - 大会设有“校长圆桌”和“青年人才”专题讨论,聚焦科教风向与人才机遇 [12] - 教育演化是大会的核心议题之一 [13] 创业投资与国际合作 - 创业与投资是大会设置的专门讨论板块 [13] - 大会设有“AI GRAVITY”环节,以主题演讲和对话形式聚焦国际合作 [12][13] 互动交流与社群链接 - 夜场设有多个自由交流区,包括WAIC UP Zone、CONNECT Zone、Future Tech Zone和Young Zone,促进跨界互动 [16] - 大会旨在链接多元生态,挖掘多维潜能 [11]
践行者说|朱晓辉:出货量率先破万,华威科如何用“多模态融合”定义机器人触觉的未来?
机器人大讲堂· 2026-01-04 12:37
文章核心观点 - 华威科作为触觉传感器领域的先行者,通过多模态融合技术路径、实现万台级量产能力以及构建数据驱动生态,正推动人形机器人触觉感知从实验室走向产业化,并定义了该技术未来从操作级应用到场景化细分的演进路径 [2][4][6][27][30] 技术破局:多模态融合 - 公司认为触觉是人形机器人融入人类生活的核心,而单一感知模态不足,因此坚定选择多模态融合的技术路线,以模仿人类皮肤能同时感知压力、温度、纹理、震动等多维信息的能力 [7][9] - 公司提出“状态机”概念,使机器人能根据场景(如高温、精密抓取)智能切换主导感知模态(如温度、磁传感、压阻),实现自适应感知,接近人类的“下意识反应” [11] - 多模态融合通过底层算法与硬件深度耦合实现,例如在指尖采用压阻+磁融合方案以提升操作灵敏度,在掌心优化反馈精度,从而构建起全方位、立体化的感知网络 [13] 量产密码:规模化与产品矩阵 - 2025年,公司应用于灵巧手的触觉传感器出货量已突破**1万台**,成为行业内首个实现此量产规模的企业,解决了从实验室样品到批量产品的关键难题 [4][13] - 量产突破依赖于装备、材料与算法的三重创新:自主研发专用生产装备以控制关键参数、自研柔性感知材料保障可靠性、开发自动化动态场景标定系统确保品质与长期稳定性 [14][16] - 量产推动成本进入千元量级,并预测未来**3-5年将进入百元量级**,为人形机器人全身覆盖电子皮肤奠定经济可行性 [16] - 公司发布“龙鳞”与“灵犀”两大产品系列,形成覆盖“操作+交互”的全手掌感知方案。“龙鳞”系列主打全手覆盖,实现手心手背感知,用于交互反馈;“灵犀”系列聚焦指尖,集成压力、温度、纹理感知,用于精密操作 [16][18][20] - 产品采用模块化设计,可适配从**10岁儿童到成年人**的全尺寸手型,并具备可拆卸、边缘计算、**100万次以上使用寿命**等工程化特性 [20] 数据驱动与生态构建 - 公司将自身定位为“具身感知解决方案提供商”,致力于构建“传感+AI+数据”的闭环生态 [22] - 公司与湖北人形机器人创新中心及产业联盟合作,共建聚焦“手部及腕部以下”的触觉数据采集平台,采集物体属性、操作动作与触觉数据的耦合关系,目前已覆盖**10个核心场景、1000种以上物体** [22][24] - 通过分析海量数据优化算法模型,未来计划通过OTA远程升级方式,让机器人的触觉系统具备“自主学习”能力,实现“智能灵巧手” [24] 行业展望与技术演进路径 - 公司描绘了触觉技术三阶段演进路径:第一阶段以灵巧手为核心的操作级应用(当前**1万台出货量**即为此阶段里程碑);第二阶段拓展至机器人身体、脸部的操作+交互融合应用,进入家庭服务、医疗护理等场景;第三阶段实现场景化细分,渗透工业、汽车、3C、家居等多领域 [27] - 公司认为触觉市场规模潜力巨大,其本质是解放人类双手、实现人机共生的核心技术,并明确视觉与触觉是互补关系,触觉在盲区、透明物体识别、细微形变感知等方面具有优势 [27] - 公司下一年的出货量目标是**5万台以上**,标志着触觉感知技术从“可选”到“必选”的跨越 [30]