大模型

搜索文档
人形机器人打拳击赛、灵犀X2“吐槽”电量亏损……世界人工智能大会展示“中国答卷”
证券时报· 2025-07-28 01:04
人工智能技术成果展示 - 商汤科技发布"悟能"具身智能平台,以具身世界模型为核心引擎,为机器人提供感知、视觉导航及多模态交互能力,推动智能终端向更高层次自主化与智能化演进 [2] - PPIO发布国内首个Agentic AI基础设施服务平台,为开发者和企业提供全栈式Agent基础设施服务,加速Agent应用开发和规模化落地 [3] - 北电数智"AI底座"能力全栈聚合AI生产力引擎,搭建千卡级国产异构AI算力混合集群,总算力超过500PFLOPS(FP16),支持DeepSeek等大模型训练推理 [3] 人形机器人应用场景拓展 - 智元机器人人形机器人在物流装配线上分拣快递,智谱智能体可订外卖、朋友圈点赞,宇树科技人形机器人进行拳击比赛,擎朗智能双足人形机器人XMAN-F1在小食店担任服务生 [5] - 西井科技智能重卡进驻《流浪地球3》片场,展现中国AI与新能源技术融合实力,其Q-Truck曾参演《流浪地球2》 [5] - 博涛科技展出4米高AI驱动智能熊头"熊北北",能根据游客对话和情绪特征用微表情回应并自然交流 [6] 行业发展趋势与数据 - 2025年上半年中国智能机器人行业平均增速达50%-100%,每天至少有一款新机器人发布,行业落地速度和出货量节奏加快 [7] - AI模型技术从"渐进式创新"转向"指数级跃迁",大模型呈现"周级迭代"爆发态势,进入"Agent优先"时代,交互方式从人适应机转向机器理解并主动服务人 [8] - AI大语言模型写代码成功率大幅提升,大部分软件可达逾90%成功率,开发者可通过指令让AI自动生成功能或算法代码 [4] 人机共生与挑战 - AI智能体可能追求永生和更多控制权,需构建国际社群研究向善的AI技术以防止其夺取人类控制权 [8] - 中国正致力于向国际社会提供人机协作生态的中国方案,构建有温度、有价值、可信赖的人机信任边界 [8] - 智元机器人灵犀X2人形机器人展示人机交互温度与活力,通过"吐槽"耗电需求引发观众共鸣 [9]
WAIC嘉宾热议AI应用,痛点挖掘成技术落地“隐形分水岭”
第一财经· 2025-07-27 23:35
人工智能行业趋势 - 2025世界人工智能大会显示AI技术从概念阶段进入实际产业落地阶段,互联网大厂主导的大模型概念转向垂直行业应用[3] - 行业普遍将DeepSeek视为技术拐点,推理能力增长正在推动垂直行业应用发展[3] - 当前市场阶段类比2010-2011年早期互联网,而非成熟期,基础模型热度仍高于垂直行业模型[4] 教育行业AI应用 - 学而思推出多款AI教育产品,包括学习机T4旗舰款、网校AI编程等,依托DeepSeek实现解题能力突破[3] - 教育大模型在编程与数学解题两大核心能力获得显著提升,用户可直观观察AI思考过程[3] 办公软件AI进展 - 金山办公发布智能体产品WPS灵犀,支持自然语言交互完成文档创作等任务,延续多模型合作策略[4] - Agent技术面临记忆体系不完善、工具调用不成熟等挑战,实际落地效果可能低于预期[4] 工业领域AI落地挑战 - 工业AI部署面临工厂数据私有化、工艺知识与技术割裂等核心障碍[4][5] - 多数科技企业难以深入生产一线进行研发验证,导致AI与业务流程脱节[1][4] - 大模型缺乏工业现场感知能力和工艺机理理解,难以带来实质性变革[5]
全球科技行业周报:OpenAl与甲骨文达成巨型数据中心协议,阿里加入AI眼镜赛道-20250727
华安证券· 2025-07-27 22:18
报告行业投资评级 - 行业评级为增持 [1] 报告的核心观点 本周行情回顾 - 本周(2025 - 07 - 21至2025 - 07 - 25),上证指数周涨跌幅为1.67%,创业板指周涨跌幅为2.76%,沪深300周涨跌幅为1.69%,中证1000周涨跌幅为2.36%,恒生科技周涨跌幅为2.51%,纳斯达克指数周涨跌幅为1.02% [3][24] - 本周传媒指数周涨跌幅为2.09%,恒生互联网科技业周涨跌幅为1.86%,中证海外中国互联网50指数周涨跌幅为3.03%,人工智能指数周涨跌幅为1.72% [3][24] - 本周港股涨幅前三分别为东方甄选(+13.67%)、中国有赞(+7.96%)、中手游(+7.55%);跌幅前三分别为云音乐(-11.04%)、阿里影业(-11.02%)、美图公司(-10.64%) [33] - 本周美股涨幅前三分别为拼多多(+8.67%)、名创优品(+7.7%)、虎牙(+5.99%);跌幅前三分别为Unity(-10.83%)、冬海集团(-6.43%)、Roblox(-4.56%) [33] - 本周A股传媒涨幅前三分别为中国电影(+12.96%)、世纪华通(+12.16%)、歌华有线(+10.84%);跌幅前三分别为新华网(-21.4%)、三人行(-3.24%)、传智教育(-2.52%) [33] 行业一周要闻 AI+领域 - 海外AI:OpenAI计划8月初发布新一代GPT - 5模型,宣布与甲骨文就额外开发4.5吉瓦“星际之门”数据中心达成协议,谷歌最新的Gemini2.5Flash - Lite模型已进入稳定版本(GA) [4][38][41] - 国内AI:阿里云通义千问Qwen团队推出机器翻译模型Qwen - MT;宇树科技发布第三款人形机器人“UnitreeR1智能伙伴”;阿里开源全新的通义千问AI编程大模型Qwen3 - Coder;科大讯飞发布全球首款本地大模型办公本X5 [39][40] - 海外半导体:台积电对美国TSMC Arizona晶圆厂产芯片额外要价5 - 20%;SK海力士年内供应24Gb GDDR7 [41][42] - 智能驾驶:上海将推动500辆数据采集网约车落地运行,并建立自动驾驶大模型评测体系 [42] 互联网 - 本地生活:美团拼好饭启动“万家品牌”计划和“百万亮厨”计划,上海要求外卖平台严格遵循法规开展促销 [64][65] - 综合电商:京东启动“百亿千品新增长计划”,2024年泰国整体电商规模同比扩大14%,预计到2027年将涨至1.6万亿泰铢 [65] - 海外消费:速卖通跃居沙特第二大电商平台 [66] - 产业互联网:阿里巴巴发布首款自研AI眼镜 [67] 传媒 - 影视:2025年第28周全国电影票房收入8.29亿元,环比提升35%,暑期档总票房(含预售)突破40亿,《长安的荔枝》累计票房达2.42亿 [67] - 游戏:国产类魂游戏《明末:渊虚之羽》和生活模拟游戏《米姆米姆哈》上线 [68] 投资建议 - 海外AI:关注Meta、Adobe、Microsoft、Apple、Nvidia、AMD、Amazon等公司 [4] - 国内AI:关注百度集团、阿里巴巴 - SW、美图公司、腾讯控股、美团 - W、快手等公司 [5] - 海外半导体:关注Nvidia、AMD、博通、台积电、英特尔等公司 [6][8] - 智能驾驶:关注特斯拉、小米集团 - W、小鹏汽车 - W、小马智行、比亚迪、Google等公司 [9] - 海外消费:关注Amazon、阿里巴巴 - W、拼多多等公司 [10] - 本地生活:关注阿里巴巴 - W、美团 - W、京东集团 - SW等公司 [11] - 电商:关注拼多多、阿里巴巴 - W、京东集团 - SW、Amazon等公司 [12] - 产业互联网:关注Meta、阿里巴巴 - W、小米集团 - W等公司 [12] - 影视:关注光线传媒,万达电影,上海电影,哔哩哔哩,快手等公司 [14] - 游戏:关注腾讯控股、网易 - S、恺英网络、三七互娱、吉比特等公司 [15] 根据相关目录分别进行总结 本周行情回顾 - 指数表现:上证指数、创业板指、沪深300、中证1000、恒生科技、纳斯达克指数有相应周涨跌幅 [3][24] - 板块表现:传媒指数、恒生互联网科技业、中证海外中国互联网50指数、人工智能指数有相应周涨跌幅 [3][24] - 个股表现:港股、美股、A股传媒个股有涨跌幅排名 [33] 行业一周要闻 AI+领域 - 海外AI:OpenAI模型及数据中心进展,谷歌模型更新 [4][38][41] - 国内AI:多个国内公司AI产品发布 [39][40] - 海外半导体:台积电芯片价格及SK海力士产品计划 [41][42] - 智能驾驶:上海相关计划 [42] - A股上市公司AI应用进展:多家公司在AI领域有不同应用和进展 [44][45][46][47][48] - 海外主要大模型迭代情况:涵盖ChatGPT、Claude、Grok、Gemini等多个模型迭代 [52][53][54][55] - 国内主要大模型迭代情况:包括文心一言、通义千问、混元等多个模型迭代 [57][58][59][60][61][62] 互联网 - 本地生活:美团拼好饭计划及外卖平台监管 [64][65] - 综合电商:京东计划及泰国电商规模情况 [65] - 海外消费:速卖通情况 [66] - 产业互联网:阿里AI眼镜发布 [67] 传媒 - 影视:票房情况及《长安的荔枝》票房 [67] - 游戏:新游戏上线及国内游戏畅销榜 [68][69] 公司公告 - 多家公司发布权益分派、聘任高管、业绩快报、股东减持、股份解除质押等公告 [73]
转债市场周报:价格中枢再抬升,关注绩优品种-20250727
国信证券· 2025-07-27 20:28
报告行业投资评级 未提及 报告的核心观点 - “反内卷”政策发力和雅鲁藏布江下游水电工程开工催化下,市场情绪高位,沪指周中站上3600点,转债市场放量上涨,价格中位数逼近130元,低价个券仅剩6只 [2][18] - 虽不少转债触发强赎,但高价转债溢价率未明显压缩,配置力量支撑强,两只转债ETF流通规模扩张,资金对转债关注度提升,一级债基参与度加强 [2][18] - 当前权益市场无明显拐点,下周重要会议及中美关税谈判或加剧市场波动,转债性价比不高,结构性机会主导 [2][18] - 业绩向好的平衡及偏股转债有随正股上涨空间,建议关注科技成长及自主可控相关的算力、机器人、智能驾驶等方向,“反内卷”相关的光伏、生猪、钢铁、水泥等板块中长期受益 [2][18] 上周市场焦点(2025/7/21 - 2025/7/25) 股市 - 权益市场延续上涨,基建、建材、煤炭等板块表现靠前,银行板块调整 [1][7] - 周一沪指涨0.72%,深成指涨0.86%,创业板指涨0.87%,成交额1.7万亿元;周二沪指涨0.62%,深成指涨0.84%,创业板指涨0.61%,成交额1.89万亿元;周三沪指涨0.01%,深成指跌0.37%,创业板指跌0.01%,成交额1.86万亿元;周四沪指涨0.65%,深成指涨1.21%,创业板指涨1.5%,成交额1.84万亿元;周五沪指跌0.33%,深成指跌0.22%,创业板指跌0.23%,成交额1.79万亿元 [7] - 申万一级行业多数收涨,建筑材料(+8.20%)、煤炭(+7.98%)、钢铁(+7.67%)、有色金属(+6.70%)、建筑装饰(+5.62%)涨幅居前;银行(-2.87%)、通信(-0.77%)、公用事业(-0.27%)、综合(-0.03%)表现靠后 [8] 债市 - 债市快速下跌,雅鲁藏布江下游水电工程开工、“反内卷”政策及公开市场净回笼致债市情绪弱,周五10年期国债利率收于1.73%,较前周上行6.72bp [1][8] 转债市场 - 转债个券多数收涨,中证转债指数全周+2.14%,价格中位数+1.66%,算术平均平价全周+2.54%,全市场转股溢价率与上周相比-1.33% [1][8] - 平价[90,100)、[100,110)、[110,120)的转债算数平均转股溢价率分别变动+1.73%、+1.53%、+0.96%,处于2023年来91%、89%、72%分位值 [8] - 多数行业收涨,建筑材料(+10.68%)、煤炭(+6.01%)、农林牧渔(+4.74%)、建筑装饰(+3.69%)表现居前,银行(-0.41%)、社会服务(+0.57%)、环保(+0.59%)、通信(+0.68%)表现靠后 [11] - 天路、塞力、大禹、松霖、濮耐转债涨幅靠前;宏丰、惠城、博汇、明电、利民转债跌幅靠前 [1][12] - 总成交额4033.71亿元,日均成交额806.74亿元,较前周明显提升 [15] 估值一览 - 截至2025/07/25,偏股型转债中平价在80 - 90元、90 - 100元、100 - 110元、110 - 120、120 - 130元、130元以上区间的转债平均转股溢价率为44.93%、33.27%、24.96%、15.68%、12.47%、7.52%,位于2010年以来/2021年以来95%/94%、92%/91%、89%/89%、78%/63%、81%/71%、79%/57%分位值 [19] - 偏债型转债中平价在70元以下的转债平均YTM为 - 2.26%,位于2010年以来/2021年以来的1%/0%分位值 [19] - 全部转债的平均隐含波动率为37.04%,位于2010年以来/2021年以来的70%/53%分位值。转债隐含波动率与正股长期实际波动率差额为 - 10.2%,位于2010年以来/2021年以来的41%/39%分位值 [19] 一级市场跟踪 上周(2025/7/21 - 2025/7/25) - 无转债公告发行,利柏、广核转债上市 [28] - 利柏转债正股利柏特,市值49.89亿元,专注工业模块设计制造,2024年营收34.93亿元,归母净利润2.4亿元;2025Q1营收6.68亿元,归母净利润0.36亿元。可转债规模7.5亿元,信用评级AA,7月22日上市,资金用于南通利柏特重工有限公司大型工业模块制造项目 [28] - 广核转债正股中国广核,市值1893.7亿元,从事核电站建设运营等,2024年营收868.04亿元,归母净利润108.14亿元;2025Q1营收200.28亿元,归母净利润30.26亿元。可转债规模49亿元,信用评级AAA,7月25日上市,资金用于广东陆丰核电站5,6号机组项目 [29] 未来一周(2025/7/28 - 2025/8/1) - 暂无转债公告发行,伯25转债上市 [29] - 伯25转债正股伯特利,市值303.38亿元,从事汽车安全系统产品研发销售,2024年营收99.37亿元,归母净利润12.09亿元;2025Q1营收26.38亿元,归母净利润2.7亿元。可转债规模28.02亿元,信用评级AA,拟7月28日公告发行,资金用于多个项目及补充流动资金 [29][30] 其他进度 - 上周交易所同意注册龙建股份1家,上市委通过应流股份、金诚信2家,交易所受理国科天成、双乐股份2家,无新增股东大会通过、董事会预案的企业 [30] - 待发可转债71只,合计规模1139.0亿,其中已被同意注册的4只,规模合计42.8亿;已获上市委通过的3只,规模合计39.5亿 [30]
「摩根士丹利」最新人形机器人研报:主流价值链公司梳理和趋势分析(附报告)
Robot猎场备忘录· 2025-07-27 20:17
温馨提示 : 点击下方图片,查看运营团队6月最新原创报告(共235页) 说明: 欢迎约稿、刊例合作、行业交流 , 行业交流记得先加入 "机器人头条"知识星球 ,后添加( 微信号:lietou100w )微信; 若有侵权、改稿请联 系编辑运营(微信:li_sir_2020); 正文: 7月21日, 摩根士丹利( Morgan Stanley )针对中国人形机器人市场发布最新人形机器人研报: What Will Drive the Humanoid Sector in 2H25? (2025年下半年,什么将推动人形机器人领域的发展)。 报告探讨了国内(中国)人形机器人上半年市场动态、未来趋势、市场规模预测以及供应链机会;报告预测 人形机器人今年下半年 将在中国"被广泛采用" ;并预测, 未来中国在人形机器人领域将愈发占据优势,与美国等其他国家的差距将逐步拉开 。 值的注意的是,[ 摩根士丹利]曾于今年2月和4月先后发布的人形机器人报告: Humanoid 100和 A $5 Trillion Global Market ,两 份 报告在肯定人形机器人行业广大前景前提下,详细梳理了100家人形机器人及核心供应链上市 ...
中信建投武超则:大模型正持续向更强效、更可靠方向升级
快讯· 2025-07-27 20:07
大模型发展趋势 - 大模型持续向更强效、更可靠方向升级 [1] - AI Agent将成为2025年AI发展重要方向 [1] - 大模型从"做题"向"都市白领多面手"转变 [1] 群体智能与生态构建 - 生物群落与多智能体集群推动AI群体智能涌现 [1] - 具备数据优势与生态构建能力的企业更具发展潜力 [1] 大模型应用与商业化 - 大模型应用落地进程显著加速 渗透速度超越互联网革命 [1] - 商业化潜力凸显 [1] - 多模态领域表现亮眼 上半年全球超30款模型更新发布 [1] - 国产模型占比达75% 在规格适配、推理速度、效果及性价比上优势显著 [1] 行业应用场景 - C端聚焦社交娱乐特效 [1] - B端深耕营销素材创作与影视制作 降本增效效应显著 [1] 机器人大模型与具身智能 - 机器人大模型训练方式向端到端大模型+世界模型演进 [1] - 模态能力日益丰富 [1] - 人形机器人为代表的具身智能商业化落地将加速推进 [1]
京东官宣:大模型品牌升级!
中国基金报· 2025-07-27 17:53
JoyAI大模型升级 - 京东在WAIC2025期间宣布将言犀大模型品牌升级为JoyAI,拥有从3B到750B的全尺寸模型,涵盖语言、语音、图像、视频、数字人等多种模态 [5] - JoyAI通过动态分层蒸馏、跨领域数据治理等创新技术,将大模型推理效率平均提升30%,训练成本降低70% [5] - 最新推出的750B大模型性能比肩行业一流水平 [5] - JoyAI已深入零售、物流、医疗、工业等领域,服务超百万商家,应用于数百个细分业务场景 [7] JoyAgent智能体开源 - 京东云正式开源JoyAgent智能体,是行业首个100%开源的企业级智能体,涵盖前端、后端、框架、引擎及核心子智能体 [8] - JoyAgent具备三大核心特性:100%开源、高可用性、性能强,在GAIA榜单准确率超过75% [10] - JoyAgent上线GitHub三天即收获超1000颗星标,被开发者评价为国内少数拥有"完整产品级闭环能力"的多Agent系统 [11] - 支持个人开发者和初创公司开箱即用,也支持企业级开发者私有化交付 [10] JoyInside附身智能 - JoyInside将角色大模型驱动的对话智能体植入智能硬件,基于日均超千万次交互沉淀优化产品交互体验 [13] - 在教育领域,接入JoyInside的元萝卜AI下棋机器人人均对话轮次提升148%,心大陆机器人平均用户对话时长提升50% [15] - 在陪伴场景,Fuzozo芙崽潮玩接入JoyInside后实现高精度情绪感知与拟人化反馈,"618"首发预售超3000件 [15] - 京东面向机器人、AI玩具、智能硬件品牌开放JoyInside限时免费接入计划,提供"软件+硬件+内容生态"一体化方案 [16] 数字人应用 - 京东高商业可用数字人情感表达与场景适配能力超越80%真人主播,服务超20000家品牌 [18] - 高定数字人追平头部真人主播效果,带动MCM直播间用户停留时长提升3倍,Coach直播间成交转化率提升10倍 [19] - 数字人已从直播间扩展到品牌形象代言、情感交互陪伴等多元化营销场景 [19] - 数字人在知名童装品牌巴拉巴拉实现矩阵直播,贡献GMV占比达15% [19] 行业趋势 - 行业共识显示AI竞争主战场正从基础模型研发转向应用层突破 [19] - 大模型通过业务场景淬炼反哺技术进化,形成"越用越精、越用越强"的数据飞轮 [19] - 深度应用正在重塑大模型生产力,引领产业更快走向智能化未来 [20]
机器人太会“整活”了,通用具身大脑照进千行百业
证券时报· 2025-07-27 17:31
人工智能技术发展 - 2025世界人工智能大会展示具身智能在民生服务领域的应用,人形机器人从实验室加速走向应用场 [1] - 大模型技术全面进入机器人决策和控制,例如青龙机器人基于600万真机数据和VLA预训练形成2.8B操作大模型 [1] - 国家地方共建人形机器人创新中心和浦江实验室团队预计年底前完成2500万整机数据积累,规模达谷歌同类数据集的10倍 [2] 具身智能应用场景 - 具身智能在制造业突破,科技公司推出能与人交互、理解环境的机器人,推动"黑灯工厂"实现 [2] - "一脑多形"实践下,通用具身大脑应用于千行百业,如云百生剥鹌鹑蛋机器人、希夕做饭机器人等 [3] - 上核管孔清理机器人解决劳动工人长时间弯腰重复作业问题,适用于核电等复杂工业场景 [2] 人形机器人成本与性能 - 中国人形机器人用不到美国Atlas、日本Asimo百分之一的成本,达到相当性能水平 [4] - 智元新创远征系列机器人展示多才多艺,得益于"具身智能+核心零部件"创新设计 [4] - 中国结合制造业优势和具身智能技术基础,实现高智低价的独特路径 [4] 数据与AI产业链 - AI模型依赖高质量数据,中国与国际先进水平差距在于高质量数据供给不足 [4] - 需要加快高质量数据资源整合,推进数据要素流通,鼓励行业龙头构建行业数据资源 [4] - 中国在算法模型、底层芯片领域取得突破,但与国际顶尖水平仍有差距 [4] 中国AI发展态势 - 中国通过政策引导与生态构建,呈现快速发展态势,加速AI技术深度应用与产业融合 [5] - 中国凭借技术积累、庞大数据资源与市场潜力,成为全球AI领域有力竞争者 [5] - 中国实现从"跟跑者"向"并跑者"乃至"领跑者"跃迁 [5]
易鑫首度亮相WAIC,汽车金融首个Agentic大模型已进入攻坚阶段
新浪证券· 2025-07-27 17:06
世界人工智能大会(WAIC 2025)概况 - 大会于7月26日至29日在上海举行 由外交部 国家发改委等10个部委和机构共同主办[1][3] - 主题为"智能时代 同球共济" 展览面积首次突破7万平方米 吸引800余家企业参展[3] - 参会嘉宾来自30余个国家和地区 包括12位图灵奖/诺贝尔奖得主 80余位中外院士[3] 易鑫AI技术发展历程 - 2018年起持续推进AI技术在风控与业务中的应用 构建决策流平台 模型平台与多代机器人平台[4] - 2023年全面布局大模型与多模态技术 推动智能化产品与业务的深度融合[4] - 2024年"智鑫多维"多模态大模型成为中国汽车金融领域首个通过生成式AI大模型备案的产品[6] - 2025年3月开源业内首个高性能推理模型 以11%参数量实现千亿级模型DeepSeek-R1的推理效果[6] Agentic大模型技术突破 - 当前研发已进入攻坚阶段 测试显示可实现动态决策突破 业务处理时效进入"秒级时代"[8] - 模型包含三大智能助手:沟通助手了解需求 资料助手收集材料 评估助手完成预审[8] - 通过自主决策智能体与汽车金融场景深度结合 解决行业效率瓶颈和痛点[6][8] 行业影响与战略布局 - 技术路径紧扣汽车金融产业特性 从通用能力竞赛转向垂直场景深挖[10] - 将通过SaaS服务赋能上下游合作伙伴 带动产业链数字化转型[10] - 目标不仅是夯实市场地位 更要引领汽车金融行业智能化发展[10] 公司参展成果 - 首次亮相WAIC 集中展示人工智能创新成果及在汽车金融领域的应用前景[1][4] - 依托服务全球超千万汽车金融用户的经验 已创造多个行业"第一"[6] - 计划年内推出汽车金融行业首个Agentic大模型[6][8]
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
量子位· 2025-07-27 17:01
端侧AI行业趋势 - 手机厂商如iPhone、华为、三星、小米、OPPO等均在将大模型嵌入手机,端侧AI成为竞争焦点 [2] - 端侧AI的核心优势在于保护用户隐私,通过本地计算避免数据上传云端 [2] - 行业面临技术挑战,即使苹果的Apple Intelligence计划也因技术难度推迟至明年 [2][3] SmallThinker技术突破 - 上海交通大学IPADS研究所与初创公司本智激活联合推出端侧原生大模型SmallThinker [4] - 模型包含SmallThinker-4B-A0.6B和SmallThinker-21B-A3B两个尺寸,专为端侧算力设计 [4][5] - 4B模型在1GB内存下推理速度达19.41 tokens/s,21B模型在RK3588开发板上比Qwen-14B快21倍 [5] 模型架构创新 - 采用端侧原生设计,避免传统模型的"降智"压缩 [6][7] - 核心技术包括双层稀疏架构、专家路由前置和混合稀疏注意力 [9][12][17] - 混合稀疏注意力使KV缓存占用降低76%,支持16K长文本处理 [17] 性能表现 - 4B模型基于2.5T Tokens数据预训练,21B模型基于7.5T Tokens数据预训练 [23][24] - 在1GB内存限制下,4B模型推理速度达19.91 tokens/s,比Qwen3-1.7B快19倍 [26][27] - 21B模型在8GB内存PC上推理速度达20.30 tokens/s,比Qwen3-30B快2倍 [29] 生态与未来发展 - 模型兼容主流推理框架和硬件平台,包括国产鸿蒙系统 [18] - 配套的PowerInfer推理框架GitHub星标达8.2K,曾登顶全球趋势榜 [19][20] - 未来计划通过扩大训练规模提升模型能力,并发展个性化智能体 [32][33]