小熊跑的快
搜索文档
国产大模型怎么样?
小熊跑的快· 2026-01-08 14:25
全球AI技术发展路径 - OpenAI最新进化以GPT-5.2系列与GPT-4o持续迭代为核心,技术路径是强化学习,致力于提升模型精度并减少幻觉 [1] - 当前技术发展已无重大变革,主要进行工程优化以降低成本,没有路径上的根本性突破 [2] 国产AI模型的追赶与突破 - 预计从2026年开始,国产大模型将迎来发展年,有望缩小与国外的差距,并在应用层面实现超越 [3] - 国内研究如DS梁文锋的mHC方法,通过为矩阵添加约束,在不显著增加计算量的前提下,提升模型各层间的信息交流效率,其27B参数模型性能已超越传统更大参数模型 [3] - 预期国产模型V4即将面世,将进一步降低国内AI应用的成本 [4] 国内主要科技公司的AI布局与资本开支 - 腾讯通过高薪挖人(如姚顺雨)加强AI团队,其资本开支计划显示公司可能在2026年有重要动作 [5] - 阿里巴巴不仅推动千问等大模型走向消费者市场,还大力投资AI边缘侧(如夸克眼镜),其阿里云在海外的基础设施建设进展迅速 [5] - 字节跳动的资本开支预期达到2900亿元,相比之前翻了一倍,并与华为签署合作,其大模型日调用量从去年初的6万亿次大幅增长至50万亿次 [5] 港股科技板块投资机会 - 国内主要大模型厂商多集中于恒生科技指数ETF和恒生互联网ETF,但近期股价处于底部 [5] - 截至2025年12月24日,恒生科技指数ETF的NTM PE约为19.3倍,处于过去5年42.4%的分位数,估值低于历史中枢,存在修复空间 [5] - 恒生互联网ETF的跟踪指数为恒生互联网科技业指数,其近一年涨幅为+37.84% [8] 产业链核心环节与下游应用 - 中积电在产业链中卡位关键,类似于台积电,在预期的2026年“万芯大战”中处于核心地位,存在涨价与扩产的逻辑 [10] - 快手、B站等内容平台有望受益于AI多模态技术的加持,市场静待国产模型出现爆款应用 [10] - 腾讯的智能体应用备受期待,有望在近期(如春节)推出 [11]
昨晚Ai周边大涨
小熊跑的快· 2026-01-07 07:06
美股AI板块市场表现 - 除GPU环节外,美股AI产业链其他环节均出现显著上涨[1] - 存储、光缆、光模块等硬件环节以及AI应用软件环节均录得反弹或稳步上涨[2][3] 存储行业 - 闪迪股价上涨27.56%至349.630美元,盘后微涨1.18%至353.760美元[4] - 西部数据股价上涨16.77%至219.380美元,盘后微涨0.65%至220.800美元[4] 光通信行业 - Lumentum股价上涨11.31%至397.420美元,盘后微涨0.37%至398.880美元[4] - Ciena科技股价上涨10.13%至254.294美元,盘后微跌0.13%至253.970美元[4] AI应用与自动驾驶 - 中概股自动驾驶公司禾赛科技股价上涨10.52%至26.800美元,盘后微跌0.37%至26.700美元[4] - 中概股自动驾驶公司小马智行股价上涨5.35%至17.340美元,盘后微跌0.75%至17.210美元[4] - 美股SaaS应用公司(如MongoDB、Snowflake、Palantir、Salesforce等)市值达数千亿美元级别并稳步上涨[3] - AI机器人公司Figure Technologies股价上涨5.24%至56.010美元,盘后基本持平于56.000美元[4] 其他相关行业 - 锂矿公司雅保股价上涨8.18%至158.090美元,盘后微涨0.15%至158.330美元[4] - 先进核能公司Oklo股价上涨7.09%至95.670美元,盘后微跌0.51%至95.180美元[4] - 锂矿公司智利矿业化工股价上涨6.27%至74.540美元,盘后基本持平于74.500美元[4]
大家都不爱AI了?
小熊跑的快· 2026-01-06 22:54
光模块行业市场情绪与表现 - 光模块板块在当日全市场中是唯一上涨的板块,但市场关注度或情绪似乎不高,作者对此感到困惑[1] - 尽管在CES大会上展示了新的Rubin架构,但市场反应平淡,仅存储池化技术(将KV Cache从嵌入式改为通过BL-4接口外接独立存储)是新信息,其他如背板链接、无风扇设计均已被市场预期[1] 英伟达下一代技术规格预期 - 预计下一代NVFP4芯片的推理算力将达到50 PFLOPS,训练算力将达到35 PFLOPS[3] - 预计下一代HBM4内存带宽将达到22 TB/s[3] - 预计下一代NVLink每GPU带宽将达到3.6 TB/s[3] - 预计下一代芯片晶体管数量将达到3360亿个[3] 西部数据公司市场数据 - 西部数据股票交易量为615.6万股,流通股本为1.47亿股[6] - 西部数据当前股价为325.37美元,公司市值为477亿美元[6] - 西部数据股票当日换手率为4.20%,股价当日涨幅为18.71%[6] - 西部数据股票的市盈率为负值(-27),市净率为5.08[6]
努力的一群大哥
小熊跑的快· 2026-01-06 13:12
行业工作节奏与竞争强度 - 陆家嘴金融从业者工作强度极高 日程安排密集 例如晚上八点半刚结束与上市公司的饭局 九点即开始线上交流 全天学习AI应用和脑机接口 参与商业航天相关活动 并需进行第二轮接待 直至凌晨两点还需查阅会议记录 次日早上八点二十分参加晨会 [1] - 国内商业环境竞争异常激烈 交付周期被极度压缩 海外客户通常给予一年的交付时间 而国内客户要求缩短至七天 这种“只争朝夕”的节奏给相关公司带来巨大压力 [2] - 高强度的工作节奏和极短的交付周期被形容为“卷吐血了” 反映出行业内的竞争已至白热化程度 [3]
ces 大会 终端看点
小熊跑的快· 2026-01-06 08:21
NVIDIA在CES大会发布自动驾驶新产品 - 公司在CES大会上发布了一系列名为Alpamayo的开源推理模型,旨在引导自动驾驶汽车应对复杂驾驶情况 [1] - 此次发布的核心是Alpamayo 1,这是一个拥有100亿个参数的逻辑推理系统 [1] - 公司表示,该系统能够更接近人类的驾驶方式 [1] Alpamayo模型的技术原理与特点 - 模型的工作原理是将意外的驾驶情况分解成一系列更小的问题,然后再找到最安全的行驶路径 [1] - 在每一步,该模型都能解释其推理过程 [1] - 公司同时发布了一款名为AlpaSim的姊妹模型,允许开发者针对现实生活中很少遇到的驾驶场景进行闭环训练 [1] 产品商业化落地进展 - 2025款梅赛德斯-奔驰CLA将成为首款搭载英伟达全套自动驾驶技术栈(包括Alpamayo)的车型 [1]
昨晚美股也涨 应用
小熊跑的快· 2026-01-06 07:45
MongoDB公司股票表现 - 股票代码MDB 股价420.820美元 当日涨幅5.30% 市值342亿美元[2] - 市盈率为负483倍 市净率11.85倍 流通股本8136万股 当日成交量166.8万手[2] - 盘后交易股价420.500美元 微跌0.08%[2] MongoDB技术指标与交易数据 - 技术指标TRIX(12,9)数值为0.23[2] - 当日股价最高423.410美元 最低417.911美元 收盘于420.810美元附近[2] - 全天交易总量为166.81万手[3] 行业比较与市场观察 - 文章将MongoDB与Palantir进行比较 认为其遵循相似的发展路径[3] - 提及另一科技股FIGR 股价53.220美元 市值114亿美元 当日大幅上涨21.67%[5] - 市场观察指出当前行情有2024年9-11月的感觉 描述为“咔咔涨 小弹性股”[6]
minimax 也要上市
小熊跑的快· 2026-01-05 12:57
公司概况与市场定位 - 公司为MiniMax 是一家专注于全模态大模型的AI公司 采用模型即产品的策略 通过B端和C端双轮驱动实现商业化[1] - 公司累计融资额达15.5亿美元 本次IPO发行估值区间为59.2至64.8亿美元 约合461.23至503.99亿港元 与智谱估值相近[1] - 公司发行价区间为151至165港元/股 最高募资约5.38亿美元 约合41.9亿港元 并获得14家基石投资者合计27.23亿港元的认购[1] 财务表现与运营数据 - 公司2025年前九个月总收入约为5344万美元 同比增长174.7%[4] - 收入结构以C端为主 C端收入3802万美元 占总收入71.1% B端收入1545万美元 占比28.9%[1] - 毛利率呈现显著差异 C端业务毛利率仅为4.7% 而B端业务毛利率高达69.4%[1] - 公司2025年前九个月整体毛利率为23.3%[4] - 公司处于高速增长但持续亏损阶段 2023年净亏损2.69亿美元 2024年净亏损4.65亿美元 2025年前九个月净亏损5.12亿美元[5] - 自2022年至2025年前九个月 公司累计净亏损约13.2亿美元 截至2025年前九个月现金储备为10.46亿美元[5] - 公司用户规模庞大 累计用户超2亿 月活跃用户达2764万 付费用户177.16万 付费率为0.8% 平均每付费用户收入为15美元[1][9] 产品矩阵与商业模式 - C端产品矩阵包括Talkie/星野 海螺AI MiniMax语音和MiniMax App/Agent[6][7][8] - Talkie/星野是AI陪伴与虚拟角色产品 结合卡牌玩法 通过订阅 内购和广告变现 2025年前九个月贡献了35.1%的收入[6] - 海螺AI是文生/图生视频产品 由Hailuo模型驱动 采用订阅和按次付费模式 同期贡献了32.6%的收入[6] - MiniMax语音支持40多种语言 延迟低至250毫秒 提供语音生成与克隆功能 通过订阅和API收费[7] - MiniMax App/Agent提供文本交互与智能体服务 支持代码生成等 通过订阅和企业定制收费[8] - B端业务主要通过开放平台提供全模态API和模型即服务 覆盖超过100个国家 服务于AI硬件 文旅 电商等行业[8] - C端变现模式主要为订阅 内购和广告 B端则通过API调用量计费和MaaS定制服务收费[9] - 公司采用MoE架构以降低训练和推理成本 并以相对较低的资金投入达到了全球第一梯队的全模态能力[9] - 公司73.1%的收入来自海外市场 避开了国内激烈的API价格战[4][9] - 公司形成了增长飞轮 C端爆款产品获取用户和收入 反哺模型迭代 进而增强B端能力 技术再赋能C端 形成业务闭环[9] 行业比较与市场表现 - 公司收入体量与竞争对手智谱相近 但在业务侧重点上不同 公司C端收入占比超过七成[1][10] - 数据显示全球C端AI产品的付费率普遍较低 公司付费率低于1% ChatGPT付费率也低于5%[10] - 由于C端获客成本较高 尽管公司与智谱收入规模相似 但亏损更为显著[10] - 在AI Agent类别中 公司的MiniMax Agent产品在特定统计周期内访问量达到216万 同比增长143.82%[11]
所以又脑机了?
小熊跑的快· 2026-01-05 10:06
脑机接口行业动态 - 文章提及一个新的潜在万亿规模市场赛道正在出现[1] - 该赛道指向脑机接口行业[1] - 行业动态包括埃隆·马斯克提及相关产品可能进入量产阶段[1] 市场关注度转移 - 市场投资者的关注点可能正从商业航天领域转向脑机接口领域[1] - 文章以提问形式探讨了这种关注度转移的现象[1] 研究背景说明 - 文章作者的研究背景主要集中在人工智能和美股市场[1] - 作者基于此背景对脑机接口这一新兴领域提出探讨[1]
ds新论文
小熊跑的快· 2026-01-04 19:31
文章核心观点 - 字节跳动提出的mHC(Manifold-Constrained Hyper-Connections)技术是一种针对Transformer架构的工程优化方法 该方法通过将单一路径的残差连接扩展为多条可混合信息的并行通道 并施加数学约束以保持信息传递的稳定性 从而在不大幅增加计算开销的前提下 显著提升大模型的训练稳定性和性能表现 使得参数更小的模型能达到甚至超越传统更大参数模型的水平 [1][2][5] 技术背景与问题 - 传统Transformer模型在处理信息时 数据需逐层传递 层数过多会导致信息衰减甚至丢失 影响最终输出质量 [1] - 2015年提出的残差连接技术通过将每层输出与原始输入相加再传递 缓解了信息衰减问题 [1] - 2024年字节提出的Hyper-Connections方法拓宽了残差通路为多条并行通道 但信息每经过一层都需经过一个可学习矩阵处理 层数过多时易导致信号被无限放大 引发损失值飙升 [1] mHC技术原理与创新 - mHC的核心创新是在Hyper-Connections的基础上 为混合信息的矩阵添加了“流形约束” 具体是约束为“双随机矩阵” 即矩阵中每一行元素之和与每一列元素之和都等于1 [1] - 该约束使得信息在四条并行通道之间重新分配时总量保持不变 避免了信息在传递过程中被异常放大或衰减 从而确保了训练稳定性 [1][2] - 该方法仅引入了6.7%的额外训练时间开销 计算量增加不大 [1] - 其本质是在Transformer架构内部进行工程优化 而非颠覆性的路径革新 [5] 性能优势与影响 - mHC技术通过拓宽模型的信息通道并施加算法矩阵约束 使得数据传输更为有序 充分利用了带宽优势 [2] - 实验结果表明 采用mHC技术的27B参数模型 其性能能够超越传统参数规模更大的模型 [2] - 该技术可能与硬件做了适配优化 减少了跨节点数据调用量 从而更好地发挥了单卡计算性能 [3] - 预计未来会出现参数活性低于37B 但结构更“宽”的模型 [4]
智谱上市
小熊跑的快· 2026-01-04 15:13
公司上市与估值 - 智谱AI于1月8日上市,发行价为116.2港元/股,全球发售3741.95万股H股,募资净额约41.734亿港元,IPO估值约518亿港元(约478亿人民币)[2] - 公司上市前经历多轮融资,估值快速攀升:B轮(2022年9月)估值25.8亿元人民币,C轮(2024年6月)估值210亿元人民币[2] 财务表现与增长 - 公司营业收入高速增长:2022年至2024年整体营业收入分别为0.57亿元、1.25亿元、3.12亿元,复合年增长率达133.28%[3] - 2025年上半年营收达1.91亿元,较2024年同期大幅增长325.0%[3] - 收入主要来自通过MaaS平台提供大模型服务,支持本地化及云端部署[2] - 收入结构以本地化部署为核心支柱,2022年至2025年上半年占比分别为95.5%、90.4%、84.5%、84.8%[7] - 自2024年起,本地化部署服务开始从海外客户产生收入,主要来自东南亚[7] 成本结构与盈利能力 - 公司经调整净亏损持续扩大:从2022年的0.97亿元增长至2024年的24.66亿元,2025年上半年经调整净亏损达17.52亿元[4] - 亏损攀升源于研发投入激增,以及为抢占市场而扩充销售营销团队和加大广告投放[4] - 营业成本中,计算服务费(基础算力)占比显著上升,从2022年的0%增至2025年上半年的37.6%[11] - 毛利率呈现波动:2022年至2024年整体毛利率分别为54.6%、64.6%、56.3%,2025年上半年为50.0%[12] - 分业务看,本地化部署毛利率较高但呈下降趋势(2022年53.6%至2025年上半年59.1%),云端部署毛利率波动巨大且近期转负(2025年上半年为-0.4%)[12] 费用支出分析 - 研发开支是最大的费用项,且绝对值与占收入比均急剧上升:从2022年的0.84亿元(占收入147.0%)增至2024年的21.95亿元(占收入702.7%),2025年上半年达15.95亿元(占收入835.4%)[5] - 销售及营销开支同样快速增长,从2022年的0.15亿元(占收入26.4%)增至2024年的3.87亿元(占收入124.0%),2025年上半年为2.09亿元(占收入109.3%)[5] - 一般及行政开支也呈增长趋势,2025年上半年为1.85亿元(占收入97.0%)[5] 业务模式与市场定位 - 公司主要面向企业端(2B)提供大模型服务,专注于支持私有化(本地化)部署,未大量投入资金购买C端流量[13] - GLM产品因出身清华,以严谨、准确性高著称,在国企和教培行业应用较多[13] - 公司在中国大模型行业收入排名第二[13] - 此次上市融资约41.7亿港元,将为AI基础设施(算力等)投入提供更多资金[13]