Workflow
大语言模型
icon
搜索文档
字节突然开源Seed-OSS,512K上下文碾压主流4倍长度!推理能力刷新纪录
量子位· 2025-08-21 10:36
模型发布概况 - 字节跳动开源360亿参数大模型Seed-OSS-36B 采用Apache-2.0协议 支持免费学术研究与商业部署 [1][4] - 模型命名呼应OpenAI的GPT-OSS系列 基于内部技术专为开源社区打造 未直接开源商业模型豆包(Doubao) [3][4] 核心技术特性 - 原生支持512K上下文窗口 是主流开源模型DeepSeek V3.1(128K)的4倍 预训练阶段直接构建非后期插值实现 [5][6][7] - 引入思考预算(Thinking Budget)机制 通过设定token数量(建议512整数倍)控制模型思考深度 适应简单任务快速响应或复杂任务深度推理 [9][10][12] - 采用成熟架构设计:360亿参数稠密模型(非MoE) 64层网络 隐藏层维度5120 词汇表155K 集成RoPE/GQA/RMSNorm/SwiGLU技术 [13] 性能表现 - 知识理解:MMLU-Pro达65.1分(超越Qwen2.5-32B-Base的58.5分) TriviaQA获82.1分 [16] - 推理能力:BBH基准87.7分刷新开源记录 数学能力GSM8K达90.8分 MATH达81.7分 [17] - 代码能力:HumanEval得分76.8 MBPP达80.6 指令微调版在AIME24数学竞赛获91.7分仅次于OpenAI OSS-20B [18][19] - 训练效率:仅用12T token达成性能 低于同规模模型15T+数据量 [20] 团队技术布局 - Seed团队成立于2023年 定位"打造最先进AI基础模型" 覆盖大语言模型/多模态/AI基础设施领域 [21] - 已开源项目包括:8B代码生成模型Seed-Coder(自主管理训练数据) 多模态模型BAGEL(处理文本/图像/视频) 实验性语言模型Seed Diffusion(离散状态扩散技术) 训练框架VeOmni(PyTorch原生全模态分布式) 同声传译模型Seed LiveInterpret(低延迟音色复刻) [22][23][24][25] 生态影响 - 模型发布于Hugging Face与GitHub平台 强化国产开源基座模型阵营 [4][26] - 提供含合成指令数据(高性能)与无合成数据(高纯净度)双版本 满足研究社区差异化需求 [14]
上半年“增收不增利”,要打造行业AI Agent的佳发教育称“AI相关产品规模未达预期”
每日经济新闻· 2025-08-21 07:51
财务表现 - 公司2025年上半年营收为2.73亿元,同比增长5.03%,归母净利润为4078.16万元,同比下降4.60%,扣非后净利润为3906.12万元,同比下降6.78% [1] - 公司出现"增收不增利"情况,计划半年度不分红送股 [2] - 营业成本同比增长20.94%,远高于营收5.03%的同比增幅 [2] - 一季度营收同比下滑51.82%至0.55亿元,归母净利润转亏为-0.1亿元;二季度营收同比增长49.23%至2.19亿元,归母净利润同比增长40.3%至0.51亿元 [2] 业务分拆 - "教育考试标准化考点产品及整体解决方案"营收约1.54亿元,同比下滑11.93%,毛利率同比下滑0.47个百分点 [2] - "智慧教育产品及整体解决方案"营收约9458.29万元,同比增长66.55%,但毛利率同比下降15.07个百分点至28.8% [2] 成本与费用 - 摊销员工持股计划费用约788.88万元,对净利润影响金额约为670.54万元 [2] 战略布局 - 公司全面接入DeepSeek大模型,构建适配"考、教、管、评、学、研"全场景的垂类教育智能体应用基座 [3] - AI相关产品国产化程度提升,但仍处于市场储备和拓展初期,业务规模未达预期 [3] 股东变动 - 四川发展证券投资基金管理有限公司增持约17.8万股,尹回增持约3.26万股,庞玉学新进前十名股东 [3]
理想VLA到底是不是真的VLA?
理想TOP2· 2025-08-20 23:38
技术架构分析 - 理想MindVLA采用基于大语言模型(LLM)的主干网络,实现多模态信息整合(视觉、激光雷达、语言、地图、定位等),并通过LLM输出决策后转换为控制轨迹[1] - 技术路径属于狭义的VLA(Vision-Language-Action)架构,与传统的E2E+VLM模型存在显著差异[1] - 系统采用串行神经网络结构,决策通过扩散模型生成更稳定的轨迹[3] 场景性能表现 防御性驾驶 - 在无遮挡十字路口可实现快速稳健行驶,有遮挡路口会根据剩余距离实现G值可调的丝滑减速[1] - 相比E2E+VLM模型(需特定模块强制减速),VLA减速过程更自然且无漏检/虚警现象[1][2] 拥堵场景处理 - 高架拥堵时能主动选择向左变道规避右侧持续加塞车辆,体现场景理解能力[2] - 传统E2E+VLM模型在该场景仅触发绕行逻辑,缺乏深度推理能力[2] 非标车道控制 - 在1.5-2.5倍宽度的匝道中自动选择居中行驶,彻底消除E2E模型常见的"画龙"现象[3] - 扩散模型生成的轨迹具有更好的中短时序稳定性[3] 复杂路径规划 - 面对50米内需连续变3车道的场景,VLA会坚决选择直行触发导航重规划[4] - E2E模型在该场景可能冒险变道或被动触发重规划[4] 能力边界评估 - 语音交互功能基于LLM实现,具备基础语音和记忆能力[4] - 高维度选路能力显著提升,底层控制更稳健[4] - 当前仍属L2级辅助驾驶,需随时准备接管[4][5] - 在杭州部分场景(三点式掉头、语义理解)表现优于FSD,但控车细节仍存差距[5] 技术迭代优势 - 采用MoE架构和工程优化,分场景并行迭代效率高于传统端到端模型[4] - 关键信息提取延迟控制在15-20米范围,满足防御性驾驶需求[4] 现存问题 - 偶发交通信号误判(如将主路红灯误判为辅路信号)[5] - 存在跟随前车错误决策的案例需人工接管[5] 硬件配置 - 测试系统搭载于2022款双OrinX计算芯片平台[6]
斑马智行递表港交所 为中国最大的以软件为核心的智能座舱解决方案供应商
智通财经· 2025-08-20 21:49
公司上市与市场地位 - 斑马智行向港交所主板递交上市申请 德意志银行 中金公司 国泰君安国际为联席保荐人 [1] - 公司是中国最大的以软件为核心的智能座舱解决方案供应商 按2024年收入计算排名第一 按解决方案搭载量计算亦排名第一 [3] - 公司是中国仅有的两家完全自研汽车操作系统的第三方供应商之一 唯一一家无缝整合系统级操作系统解决方案 AI全栈端到端解决方案和汽车平台服务三大核心支柱的厂商 [3] 技术能力与行业认可 - 斑马智行的大语言模型能力在九家中国顶级汽车AI公司中排名第一 在车辆控制 驾驶 娱乐 出行 商务 生活方式和社交互动等多个真实场景的表现均领先同行 [3] - 公司凭借自研的汽车操作系统与全栈元神AI架构 协助主机厂打造智能汽车 实现自然语音控制和个性化车舱体验 [3] 行业增长前景 - 全球智能汽车销量预计从2024年5800万辆增长至2030年8650万辆 复合年增长率6.9% [4] - 中国智能汽车中大语言模型渗透率预计从10%提升至40% [4] - 中国智能座舱解决方案市场规模预计从2024年1290亿元人民币增长至2030年3274亿元人民币 复合年增长率16.8% [5] - 基于软件的座舱解决方案市场预计从2024年401亿元人民币增至2030年1149亿元人民币 复合年增长率达19.2% [5] 财务表现 - 2022年收入8.05亿元人民币 2023年8.72亿元人民币 2024年8.24亿元人民币 [5] - 2024年截至3月31日止三个月收入1.68亿元人民币 2025年同期1.36亿元人民币 [5] - 2022年年度亏损8.78亿元人民币 2023年8.76亿元人民币 2024年8.47亿元人民币 [5] - 2024年截至3月31日止三个月亏损2.04亿元人民币 2025年同期亏损15.82亿元人民币 [5] - 2025年截至3月31日止三个月出现其他无形资产减值损失184.099亿元人民币 [6]
新股消息 | 斑马智行递表港交所 为中国最大的以软件为核心的智能座舱解决方案供应商
智通财经网· 2025-08-20 21:49
公司概况与市场地位 - 斑马智行向港交所主板递交上市申请 联席保荐人为德意志银行、中金公司及国泰君安国际 [1] - 公司定位为智能座舱解决方案的全球先驱及领导者 致力于将汽车转变为智慧伙伴 聚焦人车互动主要入口 [3] - 凭借自研汽车操作系统与全栈元神AI架构 协助主机厂实现自然语音控制和个性化车舱体验 [3] - 按2024年收入计算是中国最大以软件为核心的智能座舱解决方案供应商 按解决方案搭载量计算排名第一 [3] - 中国仅有两家完全自研汽车操作系统的第三方供应商之一 唯一整合系统级操作系统、AI全栈端到端解决方案和汽车平台服务三大核心支柱 [3] - 大语言模型能力在九家中国顶级汽车AI公司中排名第一 车辆控制、驾驶、娱乐等多场景表现领先同行 [3] 行业前景与市场规模 - 全球智能汽车销量预计从2024年5800万辆增长至2030年8650万辆 复合年增长率6.9% [4] - 中国智能汽车大语言模型渗透率预计从10%提升至40% [4] - 中国智能座舱解决方案市场规模预计从2024年1290亿元人民币增长至2030年3274亿元人民币 复合年增长率16.8% [5] - 基于软件的座舱解决方案市场预计从2024年401亿元人民币增至2030年1149亿元人民币 复合年增长率19.2% [5] 财务表现 - 2022年收入8.05亿元人民币 2023年8.72亿元人民币 2024年8.24亿元人民币 [5] - 2024年截至3月31日止三个月收入1.68亿元人民币 2025年同期1.36亿元人民币 [5] - 2022年亏损8.78亿元人民币 2023年亏损8.76亿元人民币 2024年亏损8.47亿元人民币 [5] - 2024年截至3月31日止三个月亏损2.04亿元人民币 2025年同期亏损15.82亿元人民币 [5] - 2025年截至3月31日止三个月出现其他无形资产减值损失184.099亿元人民币 [6]
突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法
量子位· 2025-08-20 18:21
文章核心观点 - MEM1框架通过强化学习训练AI Agent自主管理记忆和推理 显著提升处理复杂任务时的效率和性能 [2][3][6][8][9][12][17][22] 技术原理 - 采用基于结果奖励的强化学习训练 使模型学会提取、整合和修剪信息 [12][14] - 引入内部状态<IS>作为工作记忆 实现近似常量级显存开销 [8][9][16] - 通过注意力掩码机制限制关注范围 迫使模型高效压缩历史信息 [12] 性能表现 - 7B参数MEM1模型推理速度达传统14B模型的3.5倍 [2] - 峰值上下文token数量降至传统模型的1/4 [2] - 在16目标任务测试中准确率12.3% 远超对比模型Qwen2.5-14B-Instruct的3.54%和Qwen2.5-7B+外部记忆模块的4.56% [3][17] 应用场景 - 支持多轮复杂任务处理 包括文档检索QA、开放域Web QA和多轮网购决策 [19] - 展现分问题独立存储、自适应搜索策略和任务规划能力 [20] - 在长程环境交互任务中保持上下文稳定 避免线性增长 [16] 行业意义 - 为处理长推理上下文挑战提供新思路 替代传统外部记忆模块方案 [22] - 实现端到端训练 降低工程复杂度并提升效果可控性 [12][22] - 论文已被COLM 2025 RAM workshop收录为口头报告 [3]
网宿科技2025上半年净利润同比增长25.33% 海外市场开拓进展显著
全景网· 2025-08-20 11:17
财务表现 - 2025年上半年实现营业收入23.51亿元 同比增长2.19% [1] - 归属于上市公司股东的净利润达3.73亿元 同比增长25.33% [1] - 经营活动现金流量净额为3.76亿元 同比增长52.41% [1] 业务发展 - 安全业务收入64,671.22万元 同比增长13.96% [1] - 剥离MSP业务并出售CloudswayPte.Ltd股权以优化业务结构 [1] - 设立迪拜子公司推进东南亚、中东等海外市场布局 [1] 技术创新 - 发布大模型安全深度评估服务 提供AI应用一站式安全解决方案 [2] - 升级新一代边缘AI平台 构建"资源-模型-服务-应用"四层能力矩阵 [2] - 开发边缘AI网关、边缘模型推理及边缘AI应用核心产品 [2] 行业认可与治理 - 网宿安全在2025年IDC MarketScape中国智能安全访问服务边缘厂商评估中位列领导者类别 [2] - 实施2025年限制性股票激励计划 产生股份支付成本6,558.23万元 同比增加1,910.36万元 [2]
英伟达发布小语言模型Nemotron-Nano-9B-v2;印度研发400纳米机器人,“钢铁防线”实现牙齿脱敏丨AIGC日报
创业邦· 2025-08-20 08:08
人工智能模型技术进展 - 阿里通义千问推出图像编辑模型Qwen-Image-Edit 基于20B参数模型开发 实现图片文字精准编辑功能[1] - 英伟达发布开源小语言模型Nemotron-Nano-9B-v2 在基准测试中取得同类最佳性能 支持在单个A10 GPU上运行[2] - 淘天集团推出3B多模态大模型CombatVLA 在3D动作游戏战斗任务中成功率超越GPT-4o和人类玩家 具备秒级响应和高分辨率感知能力[3] 游戏AI技术应用 - CombatVLA模型可生成AoT解释并解析Python代码指令 在黑神话悟空和只狼游戏中实现实时战术推理[3][4] - 模型通过按键操作控制游戏角色 包括生命恢复键"r" 技能键"1" 闪避键"space"等具体指令执行[4] - 在敌人攻击时执行闪避操作 在非攻击时段执行轻攻击或蓄力攻击 蓄力0.607秒可增加伤害值[4] 医疗纳米技术创新 - 印度科研团队开发400纳米机器人CalBot 通过外部磁场操控在牙本质小管内形成300-500微米封堵层[4] - 纳米机器人涂层可阻隔冷热刺激 实现类似牙釉质的牙齿保护效果 从根本上解决牙齿敏感问题[4] 创投数据分析平台 - 睿兽分析平台覆盖17万+活跃企业 包含2万家投资价值企业和50+国家高新技术企业[6] - 平台包含10万+基金数据 2万+LP数据 1万+专精特新小巨人企业 提供1400+行业标签体系[6] - 提供全生命周期投资追踪 涵盖人形机器人 商业航天 AGI等热门赛道行业图谱[5][6]
GPT-5落地,Kimi掉队,大模型“腰部危机”或将提前
犀牛财经· 2025-08-19 16:34
OpenAI GPT-5发布与资本市场反应 - OpenAI推出GPT-5 大语言模型与推理模型深度耦合 事实错误率较GPT-4o下降47% 多轮复杂任务一次性通过率刷新SOTA [2] - 资本市场迅速反应 英伟达股价当日上涨6.4% 微软股价上涨3.1% A股算力租赁板块整体高开 [2] 月之暗面Kimi模型市场表现 - Kimi K2开源模型上线不足一月热度迅速退潮 与DeepSeek并称大模型双雄的竞争地位明显弱化 [2] - 2024年7月MAU滑落至1408万 国内排名第九 较2024年12月高点蒸发近三分之一 [3] - 2024年春节营销投入超1亿元 单用户获客成本30元 但MAU增长仅为短期现象 [4] Kimi模型面临的多重挑战 - 长文本技术优势被快速抹平 豆包/通义/元宝等厂商将长文本上限卷至百万tokens标配 [4] - 垂直场景工具通过专业数据库绑定切走高价值客群 金融学术等领域遭受降维打击 [4] - 数据生态受限 依赖公开语料与有限合作方 难以启动数据飞轮效应 [4] - 算力成本高企 美国GPU禁售导致国产替代性能折损30%-50% 外采云资源训练成本较自建云大厂高20%以上 [4] - 资本支持不足 2023年8月后未获新融资 2024年底股权纠纷导致潜在出资方观望 [4] 国内大模型市场竞争格局 - 2024年国内大模型公开订单金额超400亿元 科大讯飞/百度/阿里/腾讯占据80%以上份额 [5] - 腰部厂商市场机会锐减 在头部厂商垄断格局下基本颗粒无收 [5]
“数”看期货:大模型解读近一周卖方策略一致观点-20250819
国金证券· 2025-08-19 15:33
股指期货市场表现 - 上周四大期指主力合约全面上涨,中证1000期指涨幅最大达5.21%,上证50期指涨幅最小为2.19% [3][11] - IC、IM处于贴水状态且贴水收窄,IF、IH转为升水状态 [3][11] - 四大期指合约成交量均上升,IH上升幅度最大为65.56%,IM上升幅度最小为30.52% [3][11] - 四大期指持仓量均上升,IH上升幅度最大为11.50%,IF上升幅度最小为3.16% [3][11] - 当季合约年化基差率分别为:IF-1.00%、IC-7.95%、IM-8.22%、IH1.71% [3][11] 跨期价差与套利机会 - IF、IC、IM和IH当月与下月合约跨期价差率分别处于2019年以来18.10%、32.40%、14.20%和9.00%分位数 [4][12] - 以年化收益5%计算,IF正反套当月合约基差率需分别达到0.84%和-1.57% [4][12] - 以年化收益5%计算,IF正反套下月合约基差率需分别达到1.20%和-2.34% [4][12] - 目前IF主力合约不存在正反套机会 [4][12] 分红影响与市场预期 - 沪深300、中证500、上证50和中证1000指数分红对9月主力合约点位影响分别为3.62、1.40、1.39和0.89 [5][12] - IH、IF主力合约转为升水格局,IC、IM主力合约贴水收窄,显示市场情绪持续火热 [5][13] - 中美关税暂停延期带来良好宏观预期,半导体、光伏板块上行预期增强 [5][13] - 四大合约跨期价差处于历史分布偏左位置,IH持续远高近低格局显示市场看好A股未来 [5][13] 卖方策略观点汇总 - 10家券商认为增量资金持续入市,外资和险资活跃度上升,居民存款搬家处于早期阶段 [6][37] - 8家券商认为市场情绪高涨,交投活跃,赚钱效应扩散 [6][37] - 行业方面对科技成长、红利、上游资源品板块有一致性看好 [6][37] - 12家券商认为A股市场呈现牛市特征,有望延续震荡上行或慢牛趋势 [37] - 6家券商对债市持乐观态度,5家持中性态度 [37]