大语言模型 - 财报，业绩电话会，研报，新闻 - Reportify

大语言模型

搜索文档

字节突然开源Seed-OSS，512K上下文碾压主流4倍长度！推理能力刷新纪录

量子位· 2025-08-21 10:36

模型发布概况 - 字节跳动开源360亿参数大模型Seed-OSS-36B 采用Apache-2.0协议支持免费学术研究与商业部署 [1][4] - 模型命名呼应OpenAI的GPT-OSS系列基于内部技术专为开源社区打造未直接开源商业模型豆包(Doubao) [3][4] 核心技术特性 - 原生支持512K上下文窗口是主流开源模型DeepSeek V3.1(128K)的4倍预训练阶段直接构建非后期插值实现 [5][6][7] - 引入思考预算(Thinking Budget)机制通过设定token数量(建议512整数倍)控制模型思考深度适应简单任务快速响应或复杂任务深度推理 [9][10][12] - 采用成熟架构设计：360亿参数稠密模型(非MoE) 64层网络隐藏层维度5120 词汇表155K 集成RoPE/GQA/RMSNorm/SwiGLU技术 [13] 性能表现 - 知识理解：MMLU-Pro达65.1分(超越Qwen2.5-32B-Base的58.5分) TriviaQA获82.1分 [16] - 推理能力：BBH基准87.7分刷新开源记录数学能力GSM8K达90.8分 MATH达81.7分 [17] - 代码能力：HumanEval得分76.8 MBPP达80.6 指令微调版在AIME24数学竞赛获91.7分仅次于OpenAI OSS-20B [18][19] - 训练效率：仅用12T token达成性能低于同规模模型15T+数据量 [20] 团队技术布局 - Seed团队成立于2023年定位"打造最先进AI基础模型" 覆盖大语言模型/多模态/AI基础设施领域 [21] - 已开源项目包括：8B代码生成模型Seed-Coder(自主管理训练数据) 多模态模型BAGEL(处理文本/图像/视频) 实验性语言模型Seed Diffusion(离散状态扩散技术) 训练框架VeOmni(PyTorch原生全模态分布式) 同声传译模型Seed LiveInterpret(低延迟音色复刻) [22][23][24][25] 生态影响 - 模型发布于Hugging Face与GitHub平台强化国产开源基座模型阵营 [4][26] - 提供含合成指令数据(高性能)与无合成数据(高纯净度)双版本满足研究社区差异化需求 [14]

大语言模型

大语言模型

上半年“增收不增利”，要打造行业AI Agent的佳发教育称“AI相关产品规模未达预期”

每日经济新闻· 2025-08-21 07:51

财务表现 - 公司2025年上半年营收为2.73亿元，同比增长5.03%，归母净利润为4078.16万元，同比下降4.60%，扣非后净利润为3906.12万元，同比下降6.78% [1] - 公司出现"增收不增利"情况，计划半年度不分红送股 [2] - 营业成本同比增长20.94%，远高于营收5.03%的同比增幅 [2] - 一季度营收同比下滑51.82%至0.55亿元，归母净利润转亏为-0.1亿元；二季度营收同比增长49.23%至2.19亿元，归母净利润同比增长40.3%至0.51亿元 [2] 业务分拆 - "教育考试标准化考点产品及整体解决方案"营收约1.54亿元，同比下滑11.93%，毛利率同比下滑0.47个百分点 [2] - "智慧教育产品及整体解决方案"营收约9458.29万元，同比增长66.55%，但毛利率同比下降15.07个百分点至28.8% [2] 成本与费用 - 摊销员工持股计划费用约788.88万元，对净利润影响金额约为670.54万元 [2] 战略布局 - 公司全面接入DeepSeek大模型，构建适配"考、教、管、评、学、研"全场景的垂类教育智能体应用基座 [3] - AI相关产品国产化程度提升，但仍处于市场储备和拓展初期，业务规模未达预期 [3] 股东变动 - 四川发展证券投资基金管理有限公司增持约17.8万股，尹回增持约3.26万股，庞玉学新进前十名股东 [3]

佳发教育(SZ:300559)

大语言模型

教育数字化

教育考试标准化考点产品及整体解决方案

智慧教育产品及整体解决方案

垂类教育智能体应用基座

大语言模型

教育数字化

教育考试标准化考点产品及整体解决方案

智慧教育产品及整体解决方案

垂类教育智能体应用基座

理想VLA到底是不是真的VLA？

理想TOP2· 2025-08-20 23:38

技术架构分析 - 理想MindVLA采用基于大语言模型(LLM)的主干网络，实现多模态信息整合（视觉、激光雷达、语言、地图、定位等），并通过LLM输出决策后转换为控制轨迹[1] - 技术路径属于狭义的VLA（Vision-Language-Action）架构，与传统的E2E+VLM模型存在显著差异[1] - 系统采用串行神经网络结构，决策通过扩散模型生成更稳定的轨迹[3] 场景性能表现防御性驾驶 - 在无遮挡十字路口可实现快速稳健行驶，有遮挡路口会根据剩余距离实现G值可调的丝滑减速[1] - 相比E2E+VLM模型（需特定模块强制减速），VLA减速过程更自然且无漏检/虚警现象[1][2] 拥堵场景处理 - 高架拥堵时能主动选择向左变道规避右侧持续加塞车辆，体现场景理解能力[2] - 传统E2E+VLM模型在该场景仅触发绕行逻辑，缺乏深度推理能力[2] 非标车道控制 - 在1.5-2.5倍宽度的匝道中自动选择居中行驶，彻底消除E2E模型常见的"画龙"现象[3] - 扩散模型生成的轨迹具有更好的中短时序稳定性[3] 复杂路径规划 - 面对50米内需连续变3车道的场景，VLA会坚决选择直行触发导航重规划[4] - E2E模型在该场景可能冒险变道或被动触发重规划[4] 能力边界评估 - 语音交互功能基于LLM实现，具备基础语音和记忆能力[4] - 高维度选路能力显著提升，底层控制更稳健[4] - 当前仍属L2级辅助驾驶，需随时准备接管[4][5] - 在杭州部分场景（三点式掉头、语义理解）表现优于FSD，但控车细节仍存差距[5] 技术迭代优势 - 采用MoE架构和工程优化，分场景并行迭代效率高于传统端到端模型[4] - 关键信息提取延迟控制在15-20米范围，满足防御性驾驶需求[4] 现存问题 - 偶发交通信号误判（如将主路红灯误判为辅路信号）[5] - 存在跟随前车错误决策的案例需人工接管[5] 硬件配置 - 测试系统搭载于2022款双OrinX计算芯片平台[6]

大语言模型

多模态信息整合编码

大语言模型

多模态信息整合编码

斑马智行递表港交所为中国最大的以软件为核心的智能座舱解决方案供应商

智通财经· 2025-08-20 21:49

公司上市与市场地位 - 斑马智行向港交所主板递交上市申请德意志银行中金公司国泰君安国际为联席保荐人 [1] - 公司是中国最大的以软件为核心的智能座舱解决方案供应商按2024年收入计算排名第一按解决方案搭载量计算亦排名第一 [3] - 公司是中国仅有的两家完全自研汽车操作系统的第三方供应商之一唯一一家无缝整合系统级操作系统解决方案 AI全栈端到端解决方案和汽车平台服务三大核心支柱的厂商 [3] 技术能力与行业认可 - 斑马智行的大语言模型能力在九家中国顶级汽车AI公司中排名第一在车辆控制驾驶娱乐出行商务生活方式和社交互动等多个真实场景的表现均领先同行 [3] - 公司凭借自研的汽车操作系统与全栈元神AI架构协助主机厂打造智能汽车实现自然语音控制和个性化车舱体验 [3] 行业增长前景 - 全球智能汽车销量预计从2024年5800万辆增长至2030年8650万辆复合年增长率6.9% [4] - 中国智能汽车中大语言模型渗透率预计从10%提升至40% [4] - 中国智能座舱解决方案市场规模预计从2024年1290亿元人民币增长至2030年3274亿元人民币复合年增长率16.8% [5] - 基于软件的座舱解决方案市场预计从2024年401亿元人民币增至2030年1149亿元人民币复合年增长率达19.2% [5] 财务表现 - 2022年收入8.05亿元人民币 2023年8.72亿元人民币 2024年8.24亿元人民币 [5] - 2024年截至3月31日止三个月收入1.68亿元人民币 2025年同期1.36亿元人民币 [5] - 2022年年度亏损8.78亿元人民币 2023年8.76亿元人民币 2024年8.47亿元人民币 [5] - 2024年截至3月31日止三个月亏损2.04亿元人民币 2025年同期亏损15.82亿元人民币 [5] - 2025年截至3月31日止三个月出现其他无形资产减值损失184.099亿元人民币 [6]

大语言模型

智能汽车软件

智能座舱解决方案

汽车操作系统

大语言模型

智能汽车软件

智能座舱解决方案

汽车操作系统

新股消息 | 斑马智行递表港交所为中国最大的以软件为核心的智能座舱解决方案供应商

智通财经网· 2025-08-20 21:49

公司概况与市场地位 - 斑马智行向港交所主板递交上市申请联席保荐人为德意志银行、中金公司及国泰君安国际 [1] - 公司定位为智能座舱解决方案的全球先驱及领导者致力于将汽车转变为智慧伙伴聚焦人车互动主要入口 [3] - 凭借自研汽车操作系统与全栈元神AI架构协助主机厂实现自然语音控制和个性化车舱体验 [3] - 按2024年收入计算是中国最大以软件为核心的智能座舱解决方案供应商按解决方案搭载量计算排名第一 [3] - 中国仅有两家完全自研汽车操作系统的第三方供应商之一唯一整合系统级操作系统、AI全栈端到端解决方案和汽车平台服务三大核心支柱 [3] - 大语言模型能力在九家中国顶级汽车AI公司中排名第一车辆控制、驾驶、娱乐等多场景表现领先同行 [3] 行业前景与市场规模 - 全球智能汽车销量预计从2024年5800万辆增长至2030年8650万辆复合年增长率6.9% [4] - 中国智能汽车大语言模型渗透率预计从10%提升至40% [4] - 中国智能座舱解决方案市场规模预计从2024年1290亿元人民币增长至2030年3274亿元人民币复合年增长率16.8% [5] - 基于软件的座舱解决方案市场预计从2024年401亿元人民币增至2030年1149亿元人民币复合年增长率19.2% [5] 财务表现 - 2022年收入8.05亿元人民币 2023年8.72亿元人民币 2024年8.24亿元人民币 [5] - 2024年截至3月31日止三个月收入1.68亿元人民币 2025年同期1.36亿元人民币 [5] - 2022年亏损8.78亿元人民币 2023年亏损8.76亿元人民币 2024年亏损8.47亿元人民币 [5] - 2024年截至3月31日止三个月亏损2.04亿元人民币 2025年同期亏损15.82亿元人民币 [5] - 2025年截至3月31日止三个月出现其他无形资产减值损失184.099亿元人民币 [6]

大语言模型

智能座舱解决方案

大语言模型

智能座舱解决方案

突破Agent长程推理效率瓶颈！MIT&新加坡国立联合推出强化学习新训练方法

量子位· 2025-08-20 18:21

文章核心观点 - MEM1框架通过强化学习训练AI Agent自主管理记忆和推理显著提升处理复杂任务时的效率和性能 [2][3][6][8][9][12][17][22] 技术原理 - 采用基于结果奖励的强化学习训练使模型学会提取、整合和修剪信息 [12][14] - 引入内部状态<IS>作为工作记忆实现近似常量级显存开销 [8][9][16] - 通过注意力掩码机制限制关注范围迫使模型高效压缩历史信息 [12] 性能表现 - 7B参数MEM1模型推理速度达传统14B模型的3.5倍 [2] - 峰值上下文token数量降至传统模型的1/4 [2] - 在16目标任务测试中准确率12.3% 远超对比模型Qwen2.5-14B-Instruct的3.54%和Qwen2.5-7B+外部记忆模块的4.56% [3][17] 应用场景 - 支持多轮复杂任务处理包括文档检索QA、开放域Web QA和多轮网购决策 [19] - 展现分问题独立存储、自适应搜索策略和任务规划能力 [20] - 在长程环境交互任务中保持上下文稳定避免线性增长 [16] 行业意义 - 为处理长推理上下文挑战提供新思路替代传统外部记忆模块方案 [22] - 实现端到端训练降低工程复杂度并提升效果可控性 [12][22] - 论文已被COLM 2025 RAM workshop收录为口头报告 [3]

大语言模型

Qwen2.5-14B-Instruct

Qwen2.5-7B + 外部记忆模块

大语言模型

Qwen2.5-14B-Instruct

Qwen2.5-7B + 外部记忆模块

网宿科技2025上半年净利润同比增长25.33% 海外市场开拓进展显著

全景网· 2025-08-20 11:17

财务表现 - 2025年上半年实现营业收入23.51亿元同比增长2.19% [1] - 归属于上市公司股东的净利润达3.73亿元同比增长25.33% [1] - 经营活动现金流量净额为3.76亿元同比增长52.41% [1] 业务发展 - 安全业务收入64,671.22万元同比增长13.96% [1] - 剥离MSP业务并出售CloudswayPte.Ltd股权以优化业务结构 [1] - 设立迪拜子公司推进东南亚、中东等海外市场布局 [1] 技术创新 - 发布大模型安全深度评估服务提供AI应用一站式安全解决方案 [2] - 升级新一代边缘AI平台构建"资源-模型-服务-应用"四层能力矩阵 [2] - 开发边缘AI网关、边缘模型推理及边缘AI应用核心产品 [2] 行业认可与治理 - 网宿安全在2025年IDC MarketScape中国智能安全访问服务边缘厂商评估中位列领导者类别 [2] - 实施2025年限制性股票激励计划产生股份支付成本6,558.23万元同比增加1,910.36万元 [2]

网宿科技(SZ:300017)

大语言模型

大语言模型

英伟达发布小语言模型Nemotron-Nano-9B-v2；印度研发400纳米机器人，“钢铁防线”实现牙齿脱敏丨AIGC日报

创业邦· 2025-08-20 08:08

人工智能模型技术进展 - 阿里通义千问推出图像编辑模型Qwen-Image-Edit 基于20B参数模型开发实现图片文字精准编辑功能[1] - 英伟达发布开源小语言模型Nemotron-Nano-9B-v2 在基准测试中取得同类最佳性能支持在单个A10 GPU上运行[2] - 淘天集团推出3B多模态大模型CombatVLA 在3D动作游戏战斗任务中成功率超越GPT-4o和人类玩家具备秒级响应和高分辨率感知能力[3] 游戏AI技术应用 - CombatVLA模型可生成AoT解释并解析Python代码指令在黑神话悟空和只狼游戏中实现实时战术推理[3][4] - 模型通过按键操作控制游戏角色包括生命恢复键"r" 技能键"1" 闪避键"space"等具体指令执行[4] - 在敌人攻击时执行闪避操作在非攻击时段执行轻攻击或蓄力攻击蓄力0.607秒可增加伤害值[4] 医疗纳米技术创新 - 印度科研团队开发400纳米机器人CalBot 通过外部磁场操控在牙本质小管内形成300-500微米封堵层[4] - 纳米机器人涂层可阻隔冷热刺激实现类似牙釉质的牙齿保护效果从根本上解决牙齿敏感问题[4] 创投数据分析平台 - 睿兽分析平台覆盖17万+活跃企业包含2万家投资价值企业和50+国家高新技术企业[6] - 平台包含10万+基金数据 2万+LP数据 1万+专精特新小巨人企业提供1400+行业标签体系[6] - 提供全生命周期投资追踪涵盖人形机器人商业航天 AGI等热门赛道行业图谱[5][6]

大语言模型

3D动作游戏专用VLA模型

通义千问Qwen - Image - Edit

大语言模型

3D动作游戏专用VLA模型

通义千问Qwen - Image - Edit

GPT-5落地，Kimi掉队，大模型“腰部危机”或将提前

犀牛财经· 2025-08-19 16:34

OpenAI GPT-5发布与资本市场反应 - OpenAI推出GPT-5 大语言模型与推理模型深度耦合事实错误率较GPT-4o下降47% 多轮复杂任务一次性通过率刷新SOTA [2] - 资本市场迅速反应英伟达股价当日上涨6.4% 微软股价上涨3.1% A股算力租赁板块整体高开 [2] 月之暗面Kimi模型市场表现 - Kimi K2开源模型上线不足一月热度迅速退潮与DeepSeek并称大模型双雄的竞争地位明显弱化 [2] - 2024年7月MAU滑落至1408万国内排名第九较2024年12月高点蒸发近三分之一 [3] - 2024年春节营销投入超1亿元单用户获客成本30元但MAU增长仅为短期现象 [4] Kimi模型面临的多重挑战 - 长文本技术优势被快速抹平豆包/通义/元宝等厂商将长文本上限卷至百万tokens标配 [4] - 垂直场景工具通过专业数据库绑定切走高价值客群金融学术等领域遭受降维打击 [4] - 数据生态受限依赖公开语料与有限合作方难以启动数据飞轮效应 [4] - 算力成本高企美国GPU禁售导致国产替代性能折损30%-50% 外采云资源训练成本较自建云大厂高20%以上 [4] - 资本支持不足 2023年8月后未获新融资 2024年底股权纠纷导致潜在出资方观望 [4] 国内大模型市场竞争格局 - 2024年国内大模型公开订单金额超400亿元科大讯飞/百度/阿里/腾讯占据80%以上份额 [5] - 腰部厂商市场机会锐减在头部厂商垄断格局下基本颗粒无收 [5]

大语言模型

Artificial Intelligence

大语言模型

Artificial Intelligence

“数”看期货：大模型解读近一周卖方策略一致观点-20250819

国金证券· 2025-08-19 15:33

股指期货市场表现 - 上周四大期指主力合约全面上涨，中证1000期指涨幅最大达5.21%，上证50期指涨幅最小为2.19% [3][11] - IC、IM处于贴水状态且贴水收窄，IF、IH转为升水状态 [3][11] - 四大期指合约成交量均上升，IH上升幅度最大为65.56%，IM上升幅度最小为30.52% [3][11] - 四大期指持仓量均上升，IH上升幅度最大为11.50%，IF上升幅度最小为3.16% [3][11] - 当季合约年化基差率分别为：IF-1.00%、IC-7.95%、IM-8.22%、IH1.71% [3][11] 跨期价差与套利机会 - IF、IC、IM和IH当月与下月合约跨期价差率分别处于2019年以来18.10%、32.40%、14.20%和9.00%分位数 [4][12] - 以年化收益5%计算，IF正反套当月合约基差率需分别达到0.84%和-1.57% [4][12] - 以年化收益5%计算，IF正反套下月合约基差率需分别达到1.20%和-2.34% [4][12] - 目前IF主力合约不存在正反套机会 [4][12] 分红影响与市场预期 - 沪深300、中证500、上证50和中证1000指数分红对9月主力合约点位影响分别为3.62、1.40、1.39和0.89 [5][12] - IH、IF主力合约转为升水格局，IC、IM主力合约贴水收窄，显示市场情绪持续火热 [5][13] - 中美关税暂停延期带来良好宏观预期，半导体、光伏板块上行预期增强 [5][13] - 四大合约跨期价差处于历史分布偏左位置，IH持续远高近低格局显示市场看好A股未来 [5][13] 卖方策略观点汇总 - 10家券商认为增量资金持续入市，外资和险资活跃度上升，居民存款搬家处于早期阶段 [6][37] - 8家券商认为市场情绪高涨，交投活跃，赚钱效应扩散 [6][37] - 行业方面对科技成长、红利、上游资源品板块有一致性看好 [6][37] - 12家券商认为A股市场呈现牛市特征，有望延续震荡上行或慢牛趋势 [37] - 6家券商对债市持乐观态度，5家持中性态度 [37]

大语言模型

大语言模型