MiniMax Audio

搜索文档

第一财经· 2025-07-04 17:55

机器人行业上市潮 - 2025年下半年机器人市场预计迎来上市潮，已有近二十家相关企业递表港交所[1][3] - 递表企业集中在工业自动化和服务机器人领域，技术稳定性和场景落地能力已通过订单验证[1] - 宇树科技、智元等机器人企业正在为IPO做准备，多位投资人透露计划下半年递表[1] 企业盈利与上市挑战 - 当前递表企业中部分面临持续亏损，如云迹科技2022-2024年净亏损超8亿元，斯坦德机器人同期净亏损2.7亿元[4] - 云迹科技若18个月内未完成上市，需现金偿还18.7亿元赎回负债[4] - A股不接受纯烧钱估值的企业，港股通过第18C章规则降低特专科技企业上市门槛[3][7] 投资与商业化标准 - 投资人认为企业盈利、订单和出货量是硬指标，B端场景差异化优势企业更具上市潜力[3] - 技术价值需转化为商业价值，如提升工厂效率、降低物流成本等具体场景应用[4] - 大模型领域存在"烧钱-高估值"循环，分水岭在于能否产生真实订单[6] 大模型与机器人技术联动 - 国产AI大模型企业如智谱、MiniMax争抢IPO，MiniMax估值达30亿美元[6] - 数据驱动成为大模型和具身智能领域核心，无监督学习突破人类认知限制[6] - 部分机器人企业寻求上市是为解决数据、算力不足及商业化闭环问题[7] 行业动态与不确定性 - 宇树科技上市时间未明确，处于"边走边看"状态[8] - 大厂数据壁垒可能挤压独立大模型公司生存空间[6]

MiniMax最快今年赴港上市：新发布的M1推理模型直接叫板DeepSeek-R1与GPT-4

IPO早知道· 2025-06-18 21:10

公司上市计划 - MiniMax最快将于2024年赴港上市目前与中介机构就上市事宜进行沟通但无具体时间表 [2][3] - 公司成立于2021年12月当前估值约30亿美元投资方包括云启资本、IDG资本、高瓴创投、明势创投、米哈游、腾讯、阿里等 [4][7] 技术研发进展 - 2025年1月发布并开源01系列模型包含Text-01语言大模型和VL-01视觉多模态模型采用线性注意力机制可处理400万token输入 [4] - 语音大模型规模全球Top 2 支持32种语言视频模型调用量全球领先支持文生视频/图生视频/主体参考等功能 [5] - 6月17日发布M1推理模型为全球首个开源混合架构推理模型复杂场景能力超过国内闭源模型成本仅为GPT-4的0.5% [8][9] - 6月18日发布Hailuo 02视频生成模型打破全球视频模型效果成本纪录 [10] 产品与市场表现 - 推出海螺AI、MiniMax Audio、星野Talkie等多款AI产品在全球范围内具有一定欢迎度 [6] - 自6月17日起连续5天发布新模型包括M1推理模型和Hailuo 02视频模型等 [1][8][10] 行业动态 - 国内大模型领域头部企业之一与智谱AI、面壁智能等并称"大模型六小龙" [2][15]

大语言模型

Artificial Intelligence

Artificial Intelligence

上海证券报· 2025-05-17 04:09

模速空间概况 - 模速空间是上海徐汇滨江的AI产业集聚区，2023年9月揭牌，面积1.5平方公里，已汇聚近400家大模型企业，占上海备案大模型总量的61% [2] - 形成完整产业链，涵盖算力芯片、基础设施到工业、医疗、金融等垂直应用，集聚阶跃星辰、无问芯穹、商汤科技等标杆企业 [2] - 目标定位为"比肩硅谷的未来坐标"，联合中科院、上海交大等科研机构及千亿级产业基金、万卡算力资源构建产学研生态 [2] 企业动态与技术突破 - 商汤科技发布日日新SenseNovaV6大模型体系，多模态推理与数据分析能力对标国际领先水平 [4] - MiniMax服务全球超5万家企业开发者，C端应用覆盖200+国家和地区用户，推出MiniMax Chat、海螺AI等产品 [4] - 阶跃星辰发布总参数量4.8B的3D大模型Step1X-3D，两年内已发布23款自研基座模型（17款为多模态） [4] - 斑马智行采用端到端智能座舱架构方案，计划2024年Q2首发实车、Q3量产，合作40+汽车品牌并落地超1000万辆汽车 [5] 产业生态与支持体系 - 提供算力调度、语料开放、金融、人才、场景对接五大平台，投用超10万张算力卡，汇聚千亿级基金矩阵 [6] - "上下楼即上下游"模式实现产业链协同，企业可快速获取算力、数据、基模、应用等资源 [6][7] - 徐汇区推出"十百千万计划"：10万㎡创新载体、100个备案大模型、1000家新增企业、万亿级产业辐射 [9] - 政府提供3.6亿元算力补贴，开源高质量语料库降低训练成本，千亿基金矩阵已服务148家企业融资 [9] 国际化与未来规划 - 2024年2月组织企业参加阿布扎比全球AI展会，筹办西岸国际科技消费节提升全球影响力 [9] - 目标成为AI企业全球创业首选地及落户中国首站，打造核心技术策源地、青年创业首选地、标杆应用涌现地 [10]

商汤(HK:00020)

Artificial Intelligence

Artificial Intelligence

腾讯研究院· 2025-04-24 23:56

OpenAI图像生成模型gpt-image-1 - OpenAI发布新图像生成模型gpt-image-1及其API，支持图像生成、编辑和变体功能，每张图成本低至0.02美元 [1] - 模型支持自定义尺寸、质量、格式、压缩度和背景透明度，能结合世界知识生成更符合上下文的高质量图像 [1] - Adobe、Figma、Canva等多家企业已将该API集成到产品中，可应用于设计、电商、教育等多个领域 [1] 微软AI智能体同事 - 微软推出AI智能体同事功能，主要包括研究员(Researcher)、分析师(Analyst)等智能体，打造全新工作流程系统 [2] - Microsoft 365 Copilot更新整合了网页、工作内容和Pages，支持全天候专家咨询、新型工作流、综合搜索等功能 [2] - 微软2025工作趋势报告预测，未来2-5年内所有公司都将转型为"前沿公司"，由人类和AI智能体组成混合团队 [2] Skywork-R1V 2.0多模态模型 - Skywork-R1V 2.0多模态模型全面开源，38B权重支持视觉文本双推理，在MMMU等多项测试中达到开源SOTA成绩 [3] - 新增Skywork-VL Reward多模态奖励模型，通过MPO混合偏好优化机制提升模型泛化能力 [3] - 在高考理科题目解答中展现出优异实力，并由Adobe、Figma等多家企业采用，应用于创意设计等实际场景 [3] 腾讯云代码助手CodeBuddy升级 - 腾讯云推出Craft软件开发智能体，支持自然语言一句话生成完整项目，采纳率达90%，实现开发平均编码时间缩短40% [4] - 支持MCP协议，Craft可直接接入测试、构建、部署等工作流程，并支持第三方插件扩展 [5] - 该智能体已在腾讯内部广泛应用，并服务百万开发者及数千家团队，包括小米、美的等企业及微信、QQ等产品团队 [5] 纯端侧大模型上车量产 - 面壁智能首个纯端侧大模型驱动的智能座舱cpmGO实现量产，从零到量产仅用10个月，刷新行业纪录 [6] - cpmGO具备纯本地运行、毫秒级响应、91%执行准确率等特点，已获得高通、英特尔等十余家芯片厂商支持，并与多家车企合作 [6] - 该产品通过MiniCPM技术实现数据本地处理、多模态交互和GUI Agent功能，可在断网环境下稳定运行，解决了传统云端方案的网络依赖问题 [6] MiniMax Audio音频工具 - MiniMax发布AI音频工具MiniMax Audio，支持30+种语言，中文和粤语效果领先，10秒即可完成高精度声音克隆 [7] - 支持直接读取PDF、TXT及网页内容，最高支持20万字符输入，配备300+种预设音色和灵活的声音参数调节 [7] - 价格亲民，每月免费额度10000点，基础套餐5美元/月，支持API接入和企业级私有部署 [7] OpenAI模型使用限额提升 - OpenAI对Plus、Team、Enterprise和Education用户的深度研究查询限额从每月10次提升至25次 [8] - 专业用户的深度研究使用限额增加到每月250次 [8] - Plus用户的GPT-4o和GPT-4o3模型使用数量实现翻倍 [8] Flex.2-preview文生图模型 - Ostris团队发布基于8亿参数的文生图扩散模型Flex.2-preview，专为ComfyUI优化，支持线条、姿态和深度控制等功能 [10] - 模型采用轻量化设计，16GB显存即可运行，支持高级图像修补、ComfyUI节点化工作流，且1024x1024图像仅需50步生成 [10] - 基于Apache2.0许可开源，支持微调和商业使用，集成XLabs ControlNet，在VBench评估中性能优于前代模型 [10] ManipTrans机器人操作技能迁移 - 北京通用人工智能研究院等单位提出ManipTrans方法，能高效将人类双手操作技能迁移至机器人灵巧手，实现如拧瓶盖、盖笔帽等复杂操作 [11] - ManipTrans采用两阶段方法，先用预训练模型模仿人类手部动作，再通过残差学习模块进行精细调整，解决了形态差异和交互精度问题 [11] - 研究团队同时发布大规模数据集DexManipNet，包含61种任务、1200多件物体的3300条操作序列，并已在真机平台验证可行性 [11] Mercor AI招聘CEO观点 - 人类数据市场从众包低技能任务转向筛选顶尖人才，评估模型不仅要测试基本能力，还要评估"经济上有价值的工作"表现 [12] - 未来最有价值的人才特征是拥有"反常识性观点"和"品味"，以及良好的适应性，而不是单纯的技术技能 [12] - 强化微调(RFT)将成为企业定制AI能力的重要方式，只需几百或几千个样本就能实现高效训练，有望构建一个庞大的评估任务生态系统 [12]

生成式AI

Artificial Intelligence

gpt-image-1

Microsoft 365 Copilot

Skywork-R1V 2.0

Craft

生成式AI

Artificial Intelligence

gpt-image-1

Microsoft 365 Copilot

Skywork-R1V 2.0

Craft