Hailuo 2.3
搜索文档
AI周报:英伟达成全球首家市值破5万亿美元公司 OpenAI IPO完成重组
第一财经· 2025-11-02 11:20
英伟达市值里程碑与战略动向 - 英伟达股价于10月29日开盘上涨超5%,盘中市值达5.13万亿美元,成为史上首家市值突破5万亿美元的公司,但10月30日收盘市值回落至4.93万亿美元 [1] - 英伟达市值从突破4万亿美元到逼近5万亿美元仅用时约3个月,期间关键动作为推动芯片架构迭代、密集对外投资以及拓展新产品线 [1] - 英伟达宣布对诺基亚进行10亿美元股权投资,以切入电信领域并加速AI-RAN创新,同时推出支持6G的加速计算平台Arc Aerial RAN Computer [9] OpenAI资本重组与上市规划 - OpenAI于10月28日完成资本重组,简化公司架构,为上市铺平道路,公司正在筹备IPO,估值最高可能达1万亿美元 [2] - OpenAI计划最早在2026年下半年提交上市申请,融资目标下限为600亿美元,最终时间表和金额可能根据业务发展及市场变化调整 [2] 科技巨头财报与AI业务表现 - 谷歌母公司Alphabet 2025财年第三季度营收首次突破1000亿美元,营收和利润均超市场预期,增长主要得益于云计算、AI、广告和订阅业务 [3] - 谷歌云业务板块收入同比增长35%,季度末积压订单额达1550亿美元,预计收入增速可继续保持在30%以上 [3] - 工业富联第三季度营收2431.72亿元,同比增长42.81%,净利润103.73亿元,同比增长62.04%,其云计算业务营收同比增长超75%,受益于AI算力需求旺盛 [11] AI模型竞争与多模态发展 - MiniMax于10月28日至31日密集发布四款AI模型,包括M2大模型、视频生成模型Hailuo 2.3、语音模型Speech 2.6以及音乐模型Music 2.0 [3] - M2模型编程水平接近海外顶尖模型,价格仅为Claude Sonnet 4.5的8%(每百万Token输入0.3美元),推理速度快近2倍(TPS约100) [3] - 中国厂商模型水平逐渐接近海外顶尖模型,MiniMax的特色优势在于多模态能力,其视频、语音模型在业内具有一定声量 [4] AI基础设施投资与项目进展 - “星际之门”项目计划在美国密歇根州萨利恩镇建造算力超1吉瓦的数据中心园区,投资金额数十亿美元,计划于2026年初开始建设 [7] - 与其他6个美国站点合计,未来三年内“星际之门”计划容量将达8吉瓦以上,总投资超过4500亿美元,OpenAI表示此园区将使项目提前完成 [7] 行业资本运作与新兴赛道 - AI生成式引擎优化(GEO)初创智推时代完成千万级人民币种子轮融资,由三七互娱领投,融资将用于自研SaaS产品迭代与全球市场拓展 [8] - GEO被视为连接品牌与AI流量的关键桥梁,是千亿级新赛道的核心基础设施,近一年来成为资本追逐的热门赛道 [8] 产业链相关公司业绩 - 光模块公司“易中天”第三季度业绩参差,天孚通信营收14.63亿元同比增长74.37%,新易盛营收60.68亿元同比增长152.53%,中际旭创营收102.16亿元同比增长56.83% [10] - 三家公司净利润均实现高增长,但除中际旭创外,天孚通信和新易盛营收环比下降,且两家公司毛利率不稳定 [10] - 工业富联作为英伟达核心供应商,其2026财年第二季度毛利率为6.76%,远低于英伟达同期72.4%的毛利率 [11] 企业战略调整与资源分配 - 亚马逊宣布计划裁减约1.4万名公司职员,以精简运营、加快人工智能部署,自2022年以来累计裁员已超2.7万人 [5] - 亚马逊将资源重新分配到优先领域,旨在让公司更加强大,因其在AI增长方面落后于微软和其他竞争对手 [6]
AI周报 |英伟达成全球首家市值破5万亿美元公司;OpenAI IPO完成重组
第一财经资讯· 2025-11-02 11:17
英伟达成首家市值破 5 万亿美元公司 美股10月29日开盘,英伟达股价上涨超5%,盘中市值达5.13万亿美元,成为史上首个市值突破5万亿美 元的公司。当日收盘英伟达涨2.99%,30日收盘则跌2%。截至30日收盘,英伟达市值4.93万亿美元,回 到5万亿美元以下。微软、苹果近日市值也站上4万亿美元。截至30日收盘,苹果市值4.03万亿美元,创 历史新高。微软10月28日收盘市值4.03万亿美元,30日又回到4万亿美元之下。 点评:英伟达从今年7月市值突破4万亿美元,到近日盘中市值逼近5万亿美元,只花了约3个月的时间。 在这段时间里,英伟达最受外界瞩目的动作,一是推动芯片架构迭代,二是密集对外投资如OpenAI、 英特尔、诺基亚等,巩固AI生态,三是拓展新产品线。科技巨头市值飙涨背后,是全球人工智能浪潮 的持续驱动。不过,近期市场上关于AI是否存在泡沫仍有激烈讨论。 完成重组后,OpenAI 筹备 IPO 10 月 30 日,有消息称,OpenAI 正在为 IPO 做准备,估值最高可能达到1 万亿美元。这次将是史上规 模最大的上市之一。部分人士表示,OpenAI 计划最早在 2026 年下半年向证券监管机构提交 ...
上海AI独角兽MiniMax发布全模态“全家桶”:中国AI从跟跑到领跑的技术突围
环球网资讯· 2025-11-01 10:29
公司技术发布概览 - 上海AI独角兽MiniMax稀宇极智在10月底集中发布了文本、视频、语音和音乐四大模型,实现全模态技术领域的全面突破 [1] 文本大模型M2 - 新一代文本大模型MiniMax-M2正式发布和开源,该模型仅有10B激活参数(总参230B),在全球权威测评榜单Artificial Analysis (AA)上总分冲入全球前五、开源第一,跻身全球文本模型第一梯队 [2] - M2模型综合成本低至约0.53美元/百万Tokens,不及Claude 4.5 Sonnet的8%,推理速度是其近两倍,具备颠覆性的定价策略 [2] - 该模型专为编码与智能体任务深度优化,契合新兴多智能体工作流对高效协同与快速响应的需求 [2] 国际技术认可 - Meta在其大规模实验中正式采用了MiniMax原发技术报告中的CISPO损失函数和FP32 Head技术,将其整合进Meta的ScaleRL核心配方,标志着中国在强化学习算法领域的全球领先地位得到国际权威确认 [3] 视频生成模型海螺2.3 - 视频生成模型海螺2.3(Hailuo 2.3)在动态表现力、风格化呈现以及人物表演细腻度方面取得显著突破 [4] - 新版本模型在提升性能表现的同时保持了Hailuo 02的原有定价水平,其Fast版本批量创作成本最高可降低50% [4] 语音模型Speech 2.6 - Speech 2.6模型专门针对Voice Agent场景深度优化,将首包响应时间压到250毫秒,达到语音赛道绝对头部水平 [5] - 模型升级亮点包括超低延时响应、专业格式无障碍识别和更高自然度,新增的"Fluent Lora"功能可将原始录音复刻出流畅自然的声音 [6] 音乐生成模型Music 2.0 - Music 2.0模型能够精准捕捉与还原人声的细腻情绪和器乐的动态张力,在人声表现方面实现重大突破,音色无限接近真实人声 [7] - 模型支持生成结构完整、逻辑清晰的歌曲,单首时长可达5分钟,生成的旋律更容易记忆且能实现层次丰富的编曲 [7] 行业影响与战略意义 - 此次全模态模型发布反映出中国AI正从应用模仿转向算法原创,完成从"中国制造"到"中国创造"的战略转变 [8] - 公司的技术路径以性能比肩顶尖水平、成本实现普惠、算法勇于原创为特点,为全球AI发展提供了"中国方案" [8] - AI视频、语音、音乐生成技术的发布将为数字内容创作产业注入新的活力 [8]
上海AI独角兽抛出全模态“全家桶”
国际金融报· 2025-10-31 21:06
同时,该模型综合成本低至约0.53美元/百万Token,不及Claude 4.5 Sonnet的8%,推理速度是其近 两倍。 文本模型M2上线仅5天,在API整合平台OpenRouter上的实时调用token量已经排到了全球第四、国 产第一;在编程场景中全球第三。 继开源文本大模型M2,上海AI独角兽MiniMax稀宇极智接连发布视频模型Hailuo 2.3、语音模型 Speech 2.6和音乐模型Music 2.0。 10月28日发布的最新视频生成模型海螺2.3(Hailuo 2.3),在Hailuo 02模型基础上实现全面技术升 级的新版本,在动态表现力、风格化呈现以及人物表演细腻度方面取得显著突破。 10月27日,新一代文本大模型MiniMax M2正式发布和开源,这款仅有10B激活参数(总参230B) 的轻量级模型在全球权威测评榜单Artificial Analysis (AA)上创造了历史性突破——总分冲入全球前五、 开源第一。 在语音技术领域,MiniMax发布的Speech 2.6模型针对Voice Agent场景进行了深度优化,将首包响 应时间压到了250毫秒。与传统语音指令识别不同,Voic ...
深度|开源新王M2与全模态布局,AI竞赛的另一种可能
Z Potentials· 2025-10-30 10:32
技术实力与行业地位 - 新一代自研开源文本大模型M2在权威Artificial Analysis榜单上登顶全球开源模型第一,综合能力在智能体和代码等关键维度上逼近GPT-5等顶尖闭源模型 [2] - M2总分冲入全球前五,在所有开源模型中位列第一,综合表现超越Google的Gemini 2.5 Pro和Anthropic的Claude 4.1,直逼Claude 4.5 Sonnet [8] - 原创算法CISPO被AI巨头Meta在其最新论文中公开致敬,Meta研究指出该算法在提升多轮对话逻辑性方面展现了良好效率和结果 [2][6] 市场表现与开发者认可 - M2上线3天便在知名AI聚合平台OpenRouter快速攀升到全球调用量第7名与编程场景第3名 [3] - 在OpenRouter平台,M2免费版本调用量达到21B tokens,增长26%,超过Anthropic Claude Sonnet 4.5的112B tokens(增长16%)和Google Gemini 2.5 Pro的30.7B tokens(增长14%) [6] 产品性能与成本优势 - M2展现了强大的端到端开发能力,在Terminal-Bench和SWE-Bench等高难度基准测试中名列前茅,具备深入开发者工作流的实用价值 [12] - M2单位成本不到同级竞品Claude 4.5的8%,并面向全球限时免费,旨在瓦解"算力税"、推动AI普惠 [12] 多模态战略与商业化进展 - 公司多模态模型协同出击,新发布Hailuo 2.3视频模型Fast版本为B端工业级应用降本50%,解决AI视频"叫好不叫座"的商业软肋 [13] - Speech 2.6语音模型以250ms首包延迟的极致性能解决语音交互卡顿感,凭借自动文本规整、高鲁棒性复刻等特性赢得LiveKit、Pipecat、Vapi等海内外顶级客户订单 [13] 发展路径与行业趋势 - 公司展示"飞轮生态"式发展路径,在文本、视频、语音等各条战线深耕技术,并将模型能力注入自研应用,用商业闭环反哺模型迭代 [14] - 多模态融合成为大模型发展全球趋势,公司通过三线并进的体系化作战能力,展示在AI竞赛中场战事中的务实路径 [13][14]
MiniMax发布视频模型Hailuo 2.3和Media Agent;百度AI眼镜将于11月1日预售丨AIGC日报
创业邦· 2025-10-29 08:09
1.【马斯克推出AI编辑的百科全书Grokipedia】马斯克于当地时间周一推出了他的Grok版本的百科全 书Grokipedia,有超过80万条人工智能生成的条目,以对抗他所谓的充斥着"觉醒病毒"的维基百 科。grokipedia.com网站上一个关于马斯克的词条介绍说,他的公众形象是"创新的梦想家和玩世不 恭的挑衅者的融合",还介绍了他的饮食细节,指出他"偶尔会放纵一下,比如每天早上吃甜甜圈并喝 多杯健怡可乐"。(环球网) 2.【MiniMax发布视频模型Hailuo 2.3和Media Agent】10月28日消息,MiniMax发布视频模型 Hailuo 2.3,在肢体动作呈现、风格化以及人物微表情方面实现了效果提升,同时对运动指令响应做 进一步优化。此外,Hailuo V ideo Agent迭代升级为支持全模态全能创作的Media Agent,并已经 在全球同步上线。( 科创板日报) 3. 【 OpenAI 估算了 ChatGPT 有多少用户显现 "心理健康紧急状况" 迹象】 OpenAI 表示,其正 与心理健康专业人士合作,以改进 ChatGPT 对特定用户群体的响应方式 —— 这些用户或显现出 ...
AI日报:Hailuo 2.3发布;豆包AI编程史诗级升级;马斯克推出AI百科全书Grokipedia
搜狐财经· 2025-10-29 04:13
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内 容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://app.aibase.com/zh 1、免费试玩!Hailuo 2.3发布!文字直出电影级视频 详情链接:https://top.aibase.com/tool/hailuoshipinapp 2、编程零基础秒出专业H5!豆包AI编程史诗级升级:PPT式拖拽+多Agent全自动协作,产品经理也能 当全栈! 豆包AI编程工具实现了从辅助写代码到全自动交付产品的范式跃迁。通过PPT式可视化编辑界面和多 Agent协同工作流,用户无需编程基础即可快速生成交互式H5、数据看板等产品。 【AiBase提要:】 Hailuo 2.3在动作、表情和物理交互方面实现了重大突破,标志着AI视频生成进入专业影视时代。其双 模式策略满足不同场景需求,并提供免费试用,推动国产AI视频生态发展。 【AiBase提要:】 动作流畅度提升,人物动作符合真实力学 表情细腻自然,亚洲面孔细节精准 物理交互真实,水花、布料等遵循现实规律 新版豆包支持自然语 ...
腾讯研究院AI速递 20251029
腾讯研究院· 2025-10-29 00:20
高通发布AI推理芯片 - 高通发布两款面向下一代AI推理优化的数据中心解决方案AI200和AI250 [1] - AI200每张加速卡支持768GB LPDDR内存 AI250引入近存计算架构实现超10倍有效内存带宽提升 [1] - 两款解决方案均支持直接液冷散热 PCIe纵向扩展与以太网横向扩展 整机架功耗160千瓦 [1] - AI200预计2026年商用 AI250预计2027年商用 [1] - 解决方案配备丰富软件栈 与主流AI框架无缝兼容 支持一键模型部署 [1] OpenAI资本重组与动态 - OpenAI宣布完成资本结构重组 非营利主体改名为OpenAI Foundation并持有营利实体26%股份 当前估值约1300亿美元 [2] - 微软在营利实体中持有32.5%股份 员工和投资者持有47%股份 [2] - OpenAI已同意额外购买2500万美元微软Azure云服务 [2] - OpenAI Foundation承诺在健康治愈疾病和AI弹性技术解决方案两大领域投入250亿美元 [2] - 软银225亿美元投资将顺利到账 [2] - OpenAI首次公布心理健康数据 每周约0.07%用户出现精神病或躁狂迹象 0.15%用户谈及自杀念头 以8亿周活计算每周约120万人表达自杀倾向 [10] - 新版GPT-5在所有类别中减少39%到52%不良答案 合规性达91% [10] - OpenAI面临16岁男孩自杀案件诉讼 加州政府多次警告公司必须保护年轻用户 [10] MiniMax视频模型升级 - MiniMax发布Hailuo 2.3视频模型 在肢体动作呈现 风格化和人物微表情方面实现显著提升 保持既有价格实现加量不加价 [3] - Hailuo 2.3 Fast模型生成速度更快定价更低 最高可为批量创作降低50%成本 对运动指令响应更优化 [3] - Hailuo Video Agent升级为支持全模态全能创作的Media Agent 可实现一键成片功能并支持自然语言与AI交互共创 [3] 马斯克发布Grokipedia - 马斯克正式发布开源版维基百科Grokipedia V0.1 收录超88万篇文章 每次查询Grok都会核验事实 [4] - Grokipedia对比维基百科在内容详细度和参考资料数量上均有优势 但被指部分内容直接从维基百科照搬复制 [4] - 维基百科页面浏览量同比减少8% 创始人认为AI无法取代维基百科准确性 正成立工作组应对AI搜索时代挑战 [4] Claude集成Excel - Anthropic推出Claude for Excel插件以研究预览形式发布测试版 仅Max Teams或企业版前1000名用户可体验 [5] - 插件可在Excel侧边栏直接使用 支持实时分析数据 自动跳转对应单元格 跟踪并解释修改理由 [5] - Claude新增6项金融领域技能包括可比公司分析 折现现金流模型 尽职调查数据包等 已被领先银行和金融科技公司广泛使用 [6] Thinking Machines Lab研究成果 - OpenAI前CTO Mira Murati的Thinking Machines Lab公布同策略蒸馏研究 以1/10成本达到强化学习同等效果 [7] - 在数学推理任务上 同策略蒸馏用1800 GPU小时达到传统强化学习需17920 GPU小时的性能 成本直降90% [7] - 该方法通过反向KL散度和零折扣因子实现高效训练 无需等待完整轨迹 教师查询仅需一次前向传播 不需要单独奖励模型 [7] 英伟达开源OmniVinci模型 - 英伟达发布OmniVinci全模态理解模型 仅用0.2万亿Token训练数据 数据效率提升6倍 [8] - 在Dailyomni基准测试上比Qwen2.5-Omni高出19.05分 在音频理解MMAR测试上高出1.7分 在视频理解Video-MME测试上高出3.9分 [8] - 创新架构包括OmniAlignNet 时间嵌入分组和约束旋转时间嵌入三大技术 实现视觉 音频和文本的统一全模态理解 [8] 数学奖项颁发 - 2025塞勒姆奖颁给王虹和Vesselin Dimitrov 世界华人数学家大会ICCM数学奖金奖颁给王虹 邓煜 袁新意 三人均为北大数院校友 [9] - 王虹今年宣布证明挂谷猜想 邓煜与团队突破希尔伯特第六问题 袁新意证明几何Bogomolov猜想 [9] - 塞勒姆奖被视为菲尔兹奖风向标 56位获奖者中诞生10位菲尔兹奖得主 三位获奖者均为明年国际数学家大会45分钟报告人 [9]