Workflow
通用AI
icon
搜索文档
总编辑圈点 | 更小内存带来更强AI,压缩内存可提升大模型处理任务准确性
环球网资讯· 2026-01-01 12:29
来源:科技日报 英国爱丁堡大学与英伟达的联合团队开发出一种新方法,能够压缩人工智能(AI)模型运行时所依赖的内存,从而在保持响应速度不变的情况下,提升模 型处理复杂任务的准确性,或显著降低其能耗。这也意味着,更小的内存将带来"更强的AI",有望打破大语言模型(LLM)性能瓶颈。 团队发现,将LLM所使用的内存压缩至原有大小的1/8后,模型在数学、科学和编程等专业测试中的表现反而更好,且推理时间并未延长。这一方法亦有助 于模型同时响应更多用户请求,从而降低单个任务的平均功耗。除了节能优势,这项改进还有望使AI更适用于处理复杂问题的系统,或存储速度较慢、内 存容量有限的终端设备,例如智能家居产品和可穿戴技术。 AI模型通常通过"思考"更复杂的假设,或同时探索更多可能性来寻找答案。在此过程中,模型需要将已生成的推理线程内容暂存于一种称为"KV缓存"的内 存中。随着线程数量增多或线程长度增加,KV缓存的体积会迅速扩大,成为性能瓶颈,拖慢模型输出响应的速度。 为突破这一限制,团队提出了一种名为"动态记忆稀疏化"(DMS)的内存压缩技术。该方法并非保留所有生成的标记(即AI模型处理的基本数据单元), 而是动态判断哪些标记 ...
“若美中AI竞赛是场橄榄球赛,目前比分24比18”
观察者网· 2025-12-30 19:57
美中AI竞赛的橄榄球赛比喻 - 核心观点:美媒将美中AI竞赛比作一场橄榄球赛,认为中场休息时美国以24比18领先中国,但下半场中国势头正盛,竞争格局存在变数 [1][3] 比赛比分与专家观点 - 报道设定的中场比分为美国24分,中国18分 [3] - 专家给出的比分存在差异,从美国24比12领先到美国21比19微弱领先不等,反映出对竞争胶着程度的不同看法 [6] - 部分专家认为美国在模型、芯片、全球人才及盟友方面领先,而中国在算法、数据、能源和基础设施方面具备优势 [6][7] 美国得分点分析 - ChatGPT发布被视为开球回攻达阵,为美国获得7分 [3] - 英伟达凭借连接Claude、Gemini和Grok等模型完成77码达阵进攻,再获7分,累计14分 [3] - 美国通过出口管制制造射门机会,获得3分,累计17分 [3] - 英伟达依靠芯片优势完成22码冲球达阵,再获7分,累计24分 [3] 中国得分点分析 - DeepSeek表现突出,完成80码接球达阵,为中国获得7分 [4] - 华为稳扎稳打完成达阵并完成2分转换,获得8分,累计15分 [4] - 阿里巴巴和字节跳动的贡献帮助射门得分,获得3分,将比分追至18分 [5] 关键因素:芯片(四分卫) - 芯片被比作比赛中的四分卫,是核心角色 [7] - 特朗普政府允许英伟达向中国出售较旧的H200芯片,被形容为将“老将”交易给对手 [7][8] - H200芯片于2024年年中发布,比最先进的Blackwell芯片落后一代 [8] - 分析认为,若H200获准销往中国,美国的计算能力优势将缩小至不到七倍 [8] - 英伟达高管担心全面阻止销售会迫使中国建立平行的、不受美国控制的AI生态系统 [9] 关键因素:聊天机器人(接球手) - 聊天机器人被比作接球手,负责将机会转化为得分 [11] - 全球聊天机器人排行榜LMArena leaderboard显示,美国公司模型一度占据前20名中的多个席位 [11] - 中国公司如阿里巴巴、百度和DeepSeek也位列前30名 [12] - DeepSeek使用二流的英伟达芯片打造出世界一流聊天机器人,引发市场抛售,规模高达1万亿美元 [12] - 中国公司公开研究成果以证明其竞争力,引发关于其获得更好硬件后是否会迅速超越美国的疑问 [12] 竞争态势总结 - 美国在AI模型、先进芯片、全球人才和盟友网络方面被认为保持领先 [6] - 中国在能源、基础设施、算法和数据方面展现优势,并依靠开源创新迅速崛起 [6][7] - 中国的追赶势头,特别是在硬件受限情况下仍能取得突破的能力,被视为下半场比赛的主要变数 [12][13]
蚂蚁集团公布灵光App最新数据:上线1个月用户成功创建1200万个闪应用
新浪财经· 2025-12-26 11:23
产品功能与用户采用 - 通用AI助手灵光宣布其用户已成功创建1200万个闪应用 [1][3] - 闪应用是灵光三大核心功能之一 用户无需编程基础 通过自然语言描述需求即可生成 [1][3] - 灵光生成闪应用的速度最快可达30秒 生成的应用可编辑、可交互、可分享 [1][3] - 闪应用创建数量的快速增长 显示该产品形态正被普通用户快速接受与持续使用 [1][3] 增长数据与时间线 - 灵光上线仅两周后 用户就已成功创建330万个闪应用 [1][4] - 上线不到一个月时间 闪应用创建总数从330万增长至1200万 [1][4] - 在不到一个月的时间内 闪应用创建量增长了近4倍(从330万至1200万) [1][4] 应用场景分布 - 用户创建的灵光闪应用已覆盖多个主要使用场景 [1][4] - 覆盖场景包括娱乐与陪伴、生活服务、效率工具、教育与自我提升等 [1][4]
给AI接上专有知识库:RAG的工程化实现
钛媒体APP· 2025-12-23 15:09
文章核心观点 - 通用大语言模型在企业应用场景中存在知识盲区、知识过时和幻觉三大缺陷,无法满足企业处理内部专有知识的需求[2][3] - 检索增强生成架构通过为通用大模型配备检索企业专有知识库的能力,使其成为懂企业业务的“内部专家”,是解决上述矛盾的主流方案[2][8] - RAG的落地不仅是技术工程,更倒逼企业在知识管理、业务适配和持续运营上进行深度管理变革,其成功取决于组织的长期投入[18][21][23] RAG的定义与价值 - RAG是一种工程化管理体系,其核心理念是给通用大模型配备一个懂得高效查阅公司资料的“助理”[5] - 其工作流程分为三步:先检索企业内部知识库找到最相关资料,再将资料作为上下文注入提问,最后让大模型基于真实资料生成答案[5][6] - RAG的价值在于管理上解决了企业痛点:消除AI幻觉、无需重新训练模型即可更新知识、使AI能回答企业专有问题[7][8] 通用AI在企业应用中的缺陷 - 知识存在“盲区”:AI只知公开互联网信息,对企业内部知识、专有业务术语和未公开数据完全“失明”[3] - 知识存在“过期”:AI模型的知识截止于训练日期,无法实时跟进企业每天更新的流程和产品[3] - AI会“瞎编”:当AI不知道答案时,会编造听起来合理的答案,这种“幻觉”在企业场景中可能导致决策失误[3] - 结果导致通用AI在企业内部专业场景下常常“答非所问”或“胡说八道”[4] RAG的工程化实现架构 - RAG是一套需要搭建“双向数据流管道”的严谨工程化架构,分为离线管道和在线管道[9] - **第一阶段:索引构建**:目标是将企业内部散乱的非结构化私有知识转化为AI可理解和快速检索的格式,这是系统的地基[10] - **第二阶段:检索增强**:目标是根据用户问题从向量数据库中高效准确地找到最相关知识片段,核心包括语义理解与向量搜索以及重排序以提高准确性[12][13][14] - **第三阶段:生成输出**:目标是将检索到的知识与大模型结合生成高质量答案,核心挑战包括提示词构建的平衡艺术以及生成后的后处理与引用标注[15][16][17][18] RAG落地面临的管理挑战 - **知识管理挑战**:RAG效果取决于知识库质量,企业会遭遇知识散落与版本混乱、权限与涉密问题、以及知识更新责任人缺失等管理问题[19] - **业务适配挑战**:不同业务场景对RAG要求不同,存在通用框架与专有需求的矛盾,例如业务术语理解和多模态知识处理[20] - **持续运营挑战**:RAG不是一次性项目,需要持续运营以应对效果衰减、建立用户反馈闭环和价值量化评估体系[21][22] RAG的定位与局限 - RAG让AI从“通用助手”变成了“企业专家”,通过结合检索系统与生成模型,降低了幻觉并提升了专业性[22] - RAG已成为企业应用AI的第一步和主流架构,是将AI力量转化为企业内部生产力和决策力的关键[23] - RAG也存在局限:其效果依赖知识质量,擅长“查资料回答”但不擅长“复杂推理”[22]
蚂蚁做健康,底气在哪?
虎嗅APP· 2025-12-15 22:18
蚂蚁集团AI战略重心与健康赛道布局 - 公司AI战略重心转向健康赛道,将原AI健康应用“AQ”全面升级为“蚂蚁阿福”,标志着从AI工具向AI健康朋友的演进 [2] - 公司近期完成关键组织架构调整,原“数字医疗健康事业部”升级为“蚂蚁健康事业群”,跻身集团五大核心战略板块 [5] - 公司采取通用与垂类AI双线并进的策略,在推出通用助手“灵光”的同时,将大健康确立为战略垂类赛道 [5][6][8] 产品表现与市场反馈 - “蚂蚁阿福”新版发布24小时内,登上苹果应用商店下载榜TOP 6 [3] - “蚂蚁阿福”上线不到半年,月活跃用户规模突破1500万,跻身国内前五大AI APP [5] - “蚂蚁阿福”月活复合增速达83.4%,远超行业13.5%的平均增速,成为国内用户规模最大的健康管理类AI应用 [8][9] - 通用AI助手“灵光”上线6天,下载量突破200万 [5] 健康赛道的市场机遇与需求变化 - 国民健康需求发生结构性变化,关注点从“治病”转向“治未病”,且健康管理人群日趋年轻化 [13][14] - 人口结构变化带来长期确定性需求,截至2024年底,中国60岁及以上人口达3.1亿,占总人口22% [14] - 海量日常健康疑问缺乏便捷可靠的解答渠道,“蚂蚁阿福”平均每天回答超500万个问题,其中55%来自三线以下城市 [14] - 健康需求的“零容错”属性及对专业性的高要求,天然构筑了垂类AI的壁垒 [14][23][24] 公司的能力积累与竞争优势 - “蚂蚁阿福”的技术底座建立在匹配超万亿tokens专业医疗语料、持续优化的千亿参数多模态模型之上 [16] - 产品背后有千人规模的医学标注团队与院士专家名医顾问团深度共创,确保AI的可靠与精准 [16] - 公司在健康领域有超过十年的深耕,其健康服务体系已覆盖大多数核心场景,模型能力在独立App发布前已通过“安诊儿”等产品经历真实场景试炼 [16] - “蚂蚁阿福”服务侧能直连超5000家医院和30万医生,串联起在线问诊、买药、挂号、医保支付等完整流程,跨越了“场景闭环”门槛 [16] - 公司在健康领域的核心护城河在于专业和信任,其领先的安全技术、严格的隐私保护体系在健康场景中完成了价值迁移 [19] 垂类AI的价值与行业趋势 - 行业认为AI发展正从技术热潮回归现实,核心在于融入真实场景并解决问题 [21] - 健康、金融、政务等高壁垒行业正成为考验AI能力的“练兵场”,垂类AI价值开始显现 [23] - 健康是垂类AI的黄金赛道,一旦建立用户信任与高频使用习惯,将构筑“长坡厚雪”式的长期壁垒 [23]
灵光App官宣:用户已成功创建330万个闪应用
新浪科技· 2025-12-02 10:22
产品表现与用户采用 - 灵光App上线两周内,用户成功创建330万个“闪应用” [1][3] - 产品上线6天即突破200万下载量,远超ChatGPT首周的60.6万和Claude的15.7万 [1][3] - 产品达成100万下载量仅用时4天,快于Sora2的5天 [1][3] 产品功能与定位 - 灵光是蚂蚁集团开发的全模态通用AI助手,已成为年度现象级AI产品 [1][3] - 首期上线三大核心功能:“灵光对话”、“灵光闪应用”和“灵光开眼” [1][3] - 用户创建的闪应用主要覆盖五大实用场景:娱乐类、日常工具类、教育类、健康管理类和生活类 [1][3] 应用场景分析 - 娱乐类闪应用包括互动游戏、情绪减压等,旨在提供轻松体验 [1][3] - 日常工具类闪应用包括倒计时、待办清单等,助力用户效率提升 [1][3] - 教育类闪应用包括语言打卡、备考自测等,满足学习和教育需求 [1][3] - 健康管理类闪应用包括热量记录、健身计划等 [1][3] - 生活类工具闪应用包括美食抽签、旅行规划等 [1][3]
上线6天 通用AI助手灵光下载量超200万
贝壳财经· 2025-11-25 11:21
产品发布与市场表现 - 蚂蚁集团推出的全模态通用AI助手“灵光”于11月18日发布 [2] - 产品上线6天后总下载量突破200万次 [1] - 首次达到100万下载量用时4天 随后仅用2天便再次新增100万下载量 [1] - 目前在中国区App Store免费应用总榜中排名第六 在免费工具榜中排名第一 [2] 产品功能与用户应用 - “灵光闪应用”功能支持用户在30秒内通过对话生成一个小应用 [2] - 该功能使不懂代码的用户也能快速创建满足个人和家庭需求的专属应用 [2] - 用户生成的应用具有多样性 例如“辅导作业赛博功德箱”、“遛娃抽签器”、“元气满满加油站”等 [2] - 产品特点在于提供了可交互的行动能力 超越了仅回答问题的传统AI助手范畴 [2]
灵光突破200万下载:首破百万用4天 再破百万仅2天
贝壳财经· 2025-11-24 12:22
产品市场表现 - 通用AI助手灵光总下载量在上线6天后突破200万 [1] - 首次达到100万下载量用时4天,随后再破100万下载量的时间缩短至2天 [1] - 产品持续领跑全球AI产品的下载增速 [1] 应用商店排名 - 灵光在App Store中国区免费应用总榜单中维持第六位 [1] - 灵光在App Store中国区免费工具类应用榜单中维持第一位 [1]
灵光突破200万下载:首破百万用4天,再破百万仅2天
中金在线· 2025-11-24 10:23
产品市场表现 - 通用AI助手灵光上线6天总下载量突破200万 [1] - 首次达到100万下载用时4天,随后再破100万下载的时间压缩至2天 [1] - 产品在App Store中国区免费应用总榜维持第六位,免费工具榜维持第一位 [1] - 下载规模远高于ChatGPT首周的60.6万和Claude首周的15.7万 [1] - 突破100万下载速度快于Sora的5天 [1] 核心功能特点 - 首批上线三大核心功能:“灵光对话”、“灵光闪应用”和“灵光开眼” [2] - “灵光闪应用”功能支持最快30秒生成一个可编辑、可交互、可分享的小应用 [1][2] - 产品是业内首个全代码生成多模态内容的AI助手,支持3D、音视频、图表、动画、地图等全模态信息输出 [2] - 开创性地在移动端实现“自然语言30秒生成小应用” [2] 用户反响与应用场景 - “灵光闪应用”功能在社交平台掀起“全民手搓AI应用”的热潮 [1] - 即使完全不懂代码的用户也能通过简单对话快速创造满足个人和家庭需求的专属应用 [1] - 用户生成的应用示例包括“辅导作业赛博功德箱”、“遛娃抽签器”、“元气满满加油站”、“油车电车省钱计算器”等 [1] - 功能使AI助手从“回答问题”转变为具备“可交互的行动能力” [1]
特斯拉GEN3人形加入“世界模拟器”学会脑补场景!落地能力强化!产业链确定性提升
机器人大讲堂· 2025-11-01 15:51
特斯拉Optimus机器人技术进展 - 特斯拉GEN3版本技术方案已进入定型阶段,国产供应商在核心部件环节取得突破,审厂与订单落地节奏加快[1] - 特斯拉展示名为“世界模拟器”的神经网络系统,旨在为自动驾驶和人形机器人项目打造无限逼真的虚拟训练场[1] - “世界模拟器”是一个完全由神经网络构成的“孪生世界”,能基于真实世界数据以高保真度生成连续、多视角的虚拟驾驶场景,使AI系统一天内学习相当于人类500年驾驶时长的经验[3] - 特斯拉采用“端到端”技术路线,AI模型直接处理像素并输出驾驶指令,该系统可被整体优化,以实现快速规模化扩展[3] - 用于训练汽车的“世界模拟器”可被无缝迁移至擎天柱机器人项目,用于训练机器人在物理世界中的导航与交互,无需承担真实测试的风险和成本[5] - 特斯拉正打造一套解决通用物理世界交互问题的底层AI引擎,基于汽车大规模应用载体持续提升人形机器人大脑能力,加速Optimus场景落地进程[6] - 若特斯拉在2026年第一季度确定发布V3版本,则意味着2025年底有望实现供应链定点框架合同落地,并在接下来的5年进入快速增长[8] - 供应链已收到指引,需在2026年下半年准备周产1000台产能,2027年有望达周产10000台以上,部分供应商据传海外建厂、产品迭代及量产推进从未停止[8] 潜在受益供应商分析 震裕科技 - 公司独立研发人形机器人线性关节所需行星滚柱丝杆及其他人形机器人所需的精密加工零件、电机组件等[9] - 在反向式行星滚柱丝杠上2024年已具备设计、生产及检测的全套成熟工艺,已建立峰值推力覆盖100N到12000N范围、导程精度覆盖C3/C5的标品库,完成量产SOP验证[9] - 线性执行器模组及反向式行星滚柱丝杠已对接海外大客户,国内相关人形机器人本体厂实现批量供货、送样等全覆盖,部分产品小批量交付[9] - 前三季度实现营业收入65.93亿元,同比增长31.47%;归母净利润4.12亿元,同比增长138.93%[10] - 计划于2025年—2030年期间在宁海县投资建设精密部件制造装备及工艺装备和精密结构件、人形机器人精密模组及零部件项目,投资总额为21.1亿元[10] 三花智控 - 传闻特斯拉将与三花智控在墨西哥成立合资公司,专注于人形机器人Optimus的执行器总成研发与生产,合资公司将直接对接特斯拉得州超级工厂的Optimus量产需求[11] - 公司布局制冷空调电器零部件、汽车零部件两大业务板块,诸多产品全球市占率超过50%[11] - 2025年前三季度营收为240.3亿元,同比上升16.9%;归母净利润为32.4亿元,同比上升40.9%[12] - 依托电机制造经验和规模优势,成功切入仿生机器人机电执行器制造领域,截至2024年底,公司机器人研发团队已超过180人[12] - 计划投资38亿元建设机器人机电执行器和域控制器研发及生产基地,项目已于2025年3月28日正式开工[12] 拓普集团 - 公司于2022年切入机器人赛道,2025年半年报显示,将热管理技术及产品应用于机器人等行业,并取得首批订单15亿元[14] - 具备永磁伺服电机、无框电机等各类电机的自研能力,以及整合电机、减速机构、控制器的经验,研发的机器人电驱执行器和旋转执行器已多次向客户送样并获得认可[14] - 2025年前三季度营收达209.28亿元,同比增8.14%,归母净利润19.67亿元[14] - 2025年1月已实现2条电驱系统生产线投产,年产能为30万套电驱执行器,泰国工厂10月已形成批量生产产能,机器人厂房15万平方,满产产值有望达100亿人民币[14] 浙江荣泰 - 公司高度重视人形机器人战略布局和业务拓展,积极配合客户进行产品开发[15] - 2025年4月收购上海狄兹精密机械有限公司51%股权;2025年7月收购广州金力智能传动技术股份有限公司15%股权,有助于快速进入精密传动、智能装备和人形机器人等新兴领域[15] - 2025年前三季度营业总收入9.6亿元,同比增长18.65%;归母净利润2.03亿元,同比增长22.04%[16] - 泰国子公司厂房正在积极有序推进建设中,主要规划布局机器人新材料结构件和丝杠产品等相关业务,计划在明年第一、第二季度实现稳定生产和供货能力,项目总投资3亿元[16] 北特科技 - 凭借20余年在金属精加工领域的技术积累,持续与客户合作开发多种丝杠产品如行星滚柱丝杠、滚珠丝杠、梯形丝杠以及微型丝杠,产品应用于人形机器人等新兴市场领域[18] - 2025年前三季度营业收入为17.1亿元,同比上升17.5%;归母净利润为9267万元,同比上升52.4%[18] - 在上海嘉定工厂投资建设了丝杠相应产线,能实现全工序独立完成生产,并于2025年3月开工建设行星滚柱丝杠研发生产基地项目,同时公告在泰国建设生产基地[18] 新泉股份 - 公司是特斯拉第二大供应商,最近三年一直是公司前三的核心客户,收入贡献在2成左右,产品配套覆盖Model3、Model Y等车型[20] - 凭借与特斯拉的紧密商务关系,可能切入高价值环节,现有能力覆盖塑料件、轻量化材料加工,可能将汽车内饰的垂直整合能力延伸至机器人关节模组或外壳件[20] - 前三季度营业收入114.13亿元,同比增加18.83%,归属上市公司股东的净利润6.23亿元,同比减少9.19%[21] - 拟设立全资子公司,投资1亿元进军智能机器人领域,并在马来西亚、墨西哥、斯洛伐克建立了生产基地[21] 斯菱股份 - 公司于2024年正式成立机器人零部件事业部,主要聚焦于谐波减速器的研发和量产,该产品适用于协作机器人、人形机器人等场景[22] - 谐波减速器的核心设备已于2024年底陆续到位,目前已达到可小批量生产阶段,计划于今年投资第二条产线,预计年底达产[22] - 2025年前三季度营业收入为5.81亿元,同比上升4.4%;归母净利润为1.4亿元,同比上升2.2%[23] - 泰国工厂已成功取得美国海关颁发的原产地认证函,能够满足北美市场大部分订单需求,正在进行第三期投资以扩大产能[23] 福赛科技 - 公司专注于汽车内饰件的研发与生产,在精密模具制造等方面有深厚积累,具备同步设计开发等能力[25] - 2025年前三季度营收12.68亿元,同比增长34.81%;归母净利润1.07亿元,同比增长104.98%[25] - 作为特斯拉供应商,全球化布局前瞻,墨西哥第三工厂建成后总面积达3万平方米,2024年海外收入3.16亿元,2025年上半年达2.42亿元,毛利率持续提升并实现扭亏为盈[25] 科达利 - 公司战略聚焦人形机器人领域,参股公司科盟创新布局谐波减速器、摆线减速器、旋转关节总成三大类产品[26] - 谐波减速器主推钢铝复合谐波;摆线减速器已具备样品,下半年将开始送样客户;执行器方面,公司推出轴向磁通电机旋转关节,下半年送样客户[26] - 前三季度实现营业收入106.03亿元,同比增长23.41%;归母净利润11.85亿元,同比增长16.55%[27] - 海外项目正按既定节奏稳步进行,以墨西哥工厂为支点完善国际供应链体系,匈牙利三期项目设备正在发运安装阶段,美国和泰国项目正在进行前期准备工作[27]