大模型

搜索文档
AI产业跟踪:月之暗面开源KimiK2,“Kimi时刻”推动AI大模型应用迎来新发展节点
长江证券· 2025-07-19 20:54
报告行业投资评级 - 看好,维持 [9] 报告的核心观点 - 7月11日月之暗面正式发布并开源最新MoE架构基础模型Kimi - K2,包括基础模型Kimi - K2 - Base与微调后模型Kimi - K2 - Instruct,均可商用,已同步上线并更新API,定价16元人民币/百万token输出,Kimi - K2的开源及其对“模型即Agent”的追求或将推动国内AI大模型应用迎来新发展节点 [2][6] 根据相关目录分别进行总结 Kimi - K2模型特点 - Kimi首个开源万亿参数模型,定位“非推理”模型但实现全线SOTA,擅长代码与通用Agent任务,总参数1T,使用MoE架构推理时激活参数32B,在编程、工具调用、数学推理三大维度比肩顶级闭源推理模型,多项测试表现优异 [12] 训练方法与技术突破 - 预训练引入Muon Clip优化器,替换传统Adam优化器,引入qk - clip控制logits规模,实现15.5T tokens训练零崩溃 [12] - 采用大规模Agentic数据合成策略,自演数千工具、数百智能体,生成百万级多轮工具调用轨迹,填补真实交互数据缺口 [12] - 后训练阶段采用通用强化学习,可验证任务用结果奖励,不可验证任务用自我评价critic,统一RLHF与RL框架,实现端到端任务完成训练 [12] 能力边界扩展 - 工具链自动化,可自主抓取数据、建模、生成可交互HTML页面,全流程无需人工编排 [12] - 擅长生成兼具设计感与视觉表现力的代码,具备较强图形能力与交互性,持续对话优于单轮问答 [12] - 本地可部署,官方给出vLLM/SGLang/TensorRT - LLM脚本,降低私有化门槛 [12] 定价策略 - 具备极高性价比,API输出价$2.50/百万tokens(≈16元RMB),仅为Claude 4 Sonnet的1/5,叠加MIT开源协议+超大规模使用条款,有望打造Kimi品牌认知,加速AI应用商业化落地 [12] 投资建议 - 当前Agent投资核心逻辑强化,教育、医疗、企服等垂直场景的Agent落地周期有望加速,看好Agent商业化元年及投资机遇,建议关注AI Agent相关厂商、中国推理算力产业链、云服务厂商、与大厂合作的IDC [12]
机器狗、无人机、大模型 新技术应战高温保供电
新华网· 2025-07-19 15:24
新技术在电力行业的应用 - 机器狗在长沙220千伏延农变电站进行自动巡检 每天出动3次 巡检时长30分钟 相比人工巡检2小时效率显著提升 [1][2] - 机器狗配备激光雷达 可见光摄像头和红外摄像头 能完成红外测温 油温油位检测和外观缺陷识别 并实时传输数据 [2] - 机器狗腿部配备多种传感器 具备快速行进 爬楼梯和过草地等复杂地形适应能力 [2] 无人机在电力抢修中的作用 - 湖南北部超高压线路出现缺陷时 应急抢险小队部署2台系留照明无人机 4名工人借助应急照明6小时完成抢修 [2] - 国网湖南超高压输电公司无人机巡检中心重点应对湖南 广东 云南 贵州四地超特高压线路灾情险情 [4] AI技术在电力调度中的应用 - 国网长沙供电公司调控中心引入"AI调度员" 基于电力大模型组建配网运行智能体 实时分析气象预警 设备重过载等多源数据 [4] - AI调度员能自动生成负荷转供方案 半分钟内可生成6个方案 包含1个最佳方案 考虑因素多达35种 远超人工 [4][6] - AI方案不仅考虑可靠性指标 还涉及线路损耗等经济性指标 使方案更加精准高效可行 [6] 电力行业应对高温措施 - 湖南发布高温红色警报 用电负荷创历史新高 电力部门日均配备400多支抢修队伍 中低压发电车及应急电源车24小时待命 [1][6] - 采用"人防+技防"和"人巡+机巡"相结合的方式 保障电网稳定安全和居民可靠用电 [6]
死磕技术的自动驾驶黄埔军校,三周年了~
自动驾驶之心· 2025-07-19 14:32
业务发展 - 打造了四个IP矩阵:自动驾驶之心、具身智能之心、3D视觉之心、大模型之心,覆盖知识星球、公众号、视频号、哔哩哔哩、知乎等平台 [2] - 从纯线上教育转型为全栈式服务平台,新增硬件业务、论文辅导和求职业务,并在杭州设立线下办公室 [2] - 知识付费仍是核心业务,但重点拓展了硬件教具、线下培训和求职招聘等多元化服务 [2] 技术方向 - 自动驾驶行业正经历大模型引发的智驾方案升级,从VLM/VLA向更先进的端到端解决方案演进 [2] - 具身智能和大模型是重点孵化方向,已举办多期圆桌论坛,受到学术界和产业界广泛关注 [2] - 视觉大语言模型(VLM)在自动驾驶中的应用包括预训练、迁移学习和知识蒸馏等多个技术分支 [9][12][13] 社区建设 - 自动驾驶之心知识星球已成为国内最大的自动驾驶技术社区,拥有近4000名成员和100+行业专家 [4] - 社区覆盖30+自动驾驶技术学习路线,包括端到端自动驾驶、BEV感知、Occupancy等前沿方向 [4] - 每周活跃度位居国内前20,注重成员积极性和技术交流 [4] 内容体系 - 知识星球包含四大板块:技术领域分类汇总、科研界顶级大佬直播、求职资料分享和痛点问题解答 [7] - 整理了视觉大语言模型、世界模型、扩散模型和端到端自动驾驶四大前沿技术方向的资源 [6] - 汇总了多个Awesome资源库,涵盖VLM架构、推理策略、安全隐私等细分领域 [8] 数据集资源 - 整理了VLM预训练使用的多个大型数据集,包括LAION5B(5B图文对)、WuKong(100M中文图文对)等 [15] - 汇总了自动驾驶相关数据集,如nuScenes、Waymo Open Dataset、BDD100K等,涵盖感知、预测、规划等任务 [21][22] - 收集了语言增强的自动驾驶系统数据集,支持自然语言导航和空间推理等高级功能 [22] 应用领域 - 智能交通领域应用包括语言引导车辆检索、视觉问答和视频异常识别等技术 [23] - 自动驾驶感知方向涉及行人检测、3D目标检测和开放词汇语义分割等任务 [24] - 定位规划领域探索语言引导导航、轨迹预测和运动规划等解决方案 [25] 行业趋势 - 世界模型在自动驾驶中快速发展,涵盖3D场景理解、未来场景演化和物理原理建模等方向 [30][31] - 扩散模型在自动驾驶中的应用包括场景生成、数据增强和轨迹预测等多个方面 [33][39] - 端到端自动驾驶研究聚焦多模态融合、可解释性和长尾分布处理等关键问题 [45][55]
烧钱换能力,老员工经验作废!一线Agent厂商、用户经验亲述:抛弃技术驱动,巨额投入如何不打水漂?
AI前线· 2025-07-19 11:44
AI Agent市场现状 - 2024年中国AI Agent软件市场规模突破50亿元[1] - 51%受访者已在生产环境中使用Agent 中型公司(100-2000人)采用积极性最高[1] - 非科技公司中90%受访者已或计划将Agent投入生产 性能质量和成本是主要关注点[1] 企业应用策略 - 来也科技从RPA+AI转向基于大模型的数字化劳动力平台 2023年推出三款智能体助手产品[4] - 英科医疗年初开始应用多种大模型 与来也科技合作营销/HR领域 与飞书合作终端用户应用[5] - 制造业生产环节应用挑战较大 当前落地主要在销售和职能管理方向[6] 产品定位差异 - 传统自动化侧重后台降本增效 AI Agent更多支持前台业务增长和扩张[7] - 英科医疗现阶段更看重模式创新而非降本增效 认为后者是必然结果[7][8] - RPA应用从最初几个流程发展到近1000个 体现量变到质变过程[9] 组织文化转型 - 英科医疗董事长亲自推动AI转型 举办创新大赛并设立多重奖励机制[10] - 招聘策略转向顶尖高校和社会人员潜力 降低经验权重[12] - 研发团队年轻化是关键 80后/70后需保持思维活跃以适应新技术[13] 技术架构演进 - 来也科技重构产品架构 将RPA作为UI自动化工具 IDP作为文档处理工具[19] - 工作流与智能体结合的复合编排方式更为实用 核心流程仍需依赖工作流[23] - 大模型能力不足和业务结果获取难度是当前主要瓶颈[26][27] 成本与研发策略 - 创新阶段不过度关注成本 英科医疗视其为员工能力投资[31] - 来也科技采用精锐小团队模式(3-8人)开发新智能体应用 避免资源浪费[33] - 营销类智能体效果衡量标准是有效线索和交易促成 已观察到积极反馈[35] 未来发展机遇 - C端机会在于软硬件结合的新终端设备 B端几乎所有流程都需要Agent迭代[37][38] - 企业存活关键是找到精准定位 制造业需围绕公司战略方向部署Agent[39] - 来也科技退出欧洲市场后聚焦东南亚/港澳台地区 保持大客户策略[40][41]
吴雄昂:RISC-V会成为主流
半导体行业观察· 2025-07-19 11:21
RISC-V架构发展前景 - RISC-V将在AI计算领域成为主流架构,未来5年迎来转折点,采用曲线将非常陡峭 [3][4][8] - AI技术革命需要全新计算架构,RISC-V因其开放性和定制化能力成为最优选,与移动时代Arm的崛起路径相似 [7][8][13] - RISC-V社区将在AI架构中扮演更重要角色,吸引Arm背景资深人士加入 [3][10][11] RISC-V对比Arm的竞争优势 - RISC-V开放架构允许用户掌握控制权,可自由调整指令集和微架构,而Arm创新受限于大客户兼容性需求 [11][13] - Arm授权模式复杂且存在市场限制,RISC-V提供差异化设计空间,适合特定领域优化 [12][13] - AI新范式需要定制化架构,RISC-V的灵活性与Arm标准化设计形成鲜明对比 [11][13][15] 行业参与者战略布局 - 吴雄昂创立CoreLab公司,聚焦RISC-V定制处理器IP解决方案,提供Arm级品质与RISC-V灵活性结合的端到端服务 [14] - CoreLab与Tenstorrent合作开发高性能RISC-V CPU,目标2027年推出全球最快产品,并联合推动生态兼容性 [15][16] - 行业资深人士认为RISC-V生态不成熟是短期问题,Arm早期同样经历类似阶段 [17] AI技术变革驱动因素 - AI产生全新数据类型(如摄像头数据),传统X86/Arm架构难以满足计算需求,催生架构革新 [7] - 大模型军备竞赛推动算力争夺,英伟达市值突破4万亿美元印证底层硬件重要性 [7] - AI程序需基于开放架构开发,RISC-V的Vector/Matrix特性适配多种处理器场景 [13][15]
今年上半年规上工业增加值同比增长6.4%
新京报· 2025-07-18 18:53
工业经济表现 - 上半年规上工业增加值同比增长6.4%,一季度和二季度分别增长6.5%和6.3% [1] - 制造业增加值占GDP比重达25.7%,保持稳定 [1] - 重点行业如电气机械、汽车、电子、通用设备、化工、有色金属增长较快,对规上工业增长贡献率提升 [1] - 装备制造业和高技术制造业增加值占规上工业比重分别为35.5%和16.4% [1] - 电子、电气机械、通用设备等行业利润增长超过10% [1] 区域工业表现 - 31个省份规上工业增加值全部实现同比增长,福建、安徽、河南、湖南增速超8% [1] - 8个工业大省利润增速高于全国平均水平,河南、湖南、湖北、江苏实现两位数增长 [1] 未来政策方向 - 实施钢铁、有色金属、石化、建材等十大重点行业稳增长工作方案,推动调结构、优供给、淘汰落后产能 [1] - 支持重点工业大省发挥"挑大梁"作用,包括落实政策、培育新增长点、促进转型等 [1] - 加快"人工智能+"行动,推动大模型在制造业重点行业落地 [1] - 组织实施国家科技重大专项和重点研发计划,培育生物制造、低空产业等新产业 [1] - 推动人形机器人、元宇宙、脑机接口等未来产业创新发展 [1]
工信部:实施新一轮钢铁、有色金属、石化等重点行业稳增长行动
21世纪经济报道· 2025-07-18 17:39
工业和信息化发展情况 - 上半年规上工业增加值同比增长6 4%,较GDP增速高出1 1个百分点,工业生产维持较高增速 [1] - 制造业增加值占GDP比重达25 7%,基本保持稳定 [1] - 制造业投资同比增长7 5%,受益于"十四五"规划重大工程建设和设备更新改造工程 [1] 重点行业表现 - 电气机械、汽车、电子、通用设备、化工、有色金属等行业增长较快,对规上工业增长贡献率提升 [1] - 装备制造业和高技术制造业增加值占规上工业比重分别达35 5%和16 4% [1] - 电子、电气机械、通用设备等行业利润增长超过10% [1] - 有色金属工业增加值同比增长7 6%,十种常用有色金属产量4031 9万吨,同比增长2 9% [4] - 1-5月有色金属行业营业收入和利润同比分别增长15 9%、16 9% [4] 区域工业表现 - 31个省份规上工业增加值全部实现同比增长,福建、安徽、河南、湖南增速超8% [2] - 8个工业大省利润增速高于全国平均水平,河南、湖南、湖北、江苏实现两位数增长 [2] 政策方向与行动计划 - 将实施钢铁、有色金属、石化、建材等十大重点行业稳增长工作方案 [2] - 推动科技创新与产业创新融合,开展制造业卓越质量工程和"人工智能+"行动 [3] - 加快动力电池等再生资源综合利用,推进绿色低碳标准体系建设 [3] - 培育生物制造、低空产业、人形机器人、元宇宙、脑机接口等未来产业 [3] - 将印发机械、汽车、电力装备等行业稳增长工作方案 [4] - 落实铜、铝、黄金产业高质量发展实施方案,推动有色金属行业供需协同发力 [4][5] 装备制造业表现 - 上半年装备制造业占规上工业增加值比重35 5%,1-5月利润同比增长7 2% [4] - 铁路客货车辆、包装专用设备、充电桩等产品产量快速增长 [4] - 铁路船舶航空航天、汽车、通用设备制造业固定资产投资实现两位数增长 [4]
揭秘苹果AI核心团队人才地图
36氪· 2025-07-18 17:23
核心观点 - Meta以2亿美金年薪挖角苹果AI基础模型团队负责人庞若鸣 反映苹果AI战略保守且内部阻力大[4][5][6] - 苹果AFM团队研发能力强劲(模型参数达数千亿 接近DeepSeek V3) 但受制于封闭生态和硬件限制 成果无法及时公开[28][39][40] - 公司高管对AI认知分歧导致决策低效 软件工程负责人Craig Federighi长期主导AI资源分配 投入远低于行业水平[36][37] 团队架构与人才储备 - 庞若鸣团队80%为华人 核心成员包括陈智峰(接任负责人)、王子瑞(早期AFM开发者)、尹国立(推理引擎专家)等谷歌系顶尖人才[10][12][20] - 团队学术影响力显著:陈智峰论文被引11.8万次 主导TensorFlow开发 杜楠参与谷歌GLaM/Palm 2项目 论文被引2.5万次[15][24][25] - 多模态领域持续补强 近期引入Zhe Gan(论文被引2.6万次) 强化视觉-语言联合表示学习能力[23] 研发成果与技术瓶颈 - 已训练数千亿参数基础模型 能力接近行业前沿的DeepSeek V3[28] - 硬件性能制约明显:自研PCC芯片仅达英伟达H100水平 需对模型大幅妥协以适应设备[40][41] - 工程化流程滞后:研发成果需等待产品上线才能发布 当前展示功能多为阉割版或落后1-2年的技术[39] 管理层决策矛盾 - AI负责人John Giannandrea自2018年加入后持续受挫 Siri团队于2023年被移交软件工程部门[34][37] - Craig Federighi坚持"苹果标准" 2023年前拒绝大规模AI投入 ChatGPT爆发后才组建千万美元级团队[36] - 内部资源分配失衡:GPU数量远少于竞争对手 部分依赖谷歌TPU租赁[37] 行业竞争对比 - 薪酬差距显著:Meta为庞若鸣开出的2亿美金年薪 远超苹果现有体系[4][27] - 研发投入悬殊:OpenAI累计融资超100亿美元 苹果AI团队年度预算仅千万美元级[36] - 生态开放度差异:苹果坚持封闭硬件适配 而竞争对手普遍采用云端协同方案[39][40]
Manus们在“出走”,怎么还有AI产品逆向回国?
36氪· 2025-07-18 17:22
AI创业生态趋势 - AI产品创业生态呈现两极分化趋势 出海团队衣锦还乡与新人寻觅新天地并存 [2] - 10个Agent创业中有9个初始开发英文版本面向全球 注册地多为新加坡或美国加利福尼亚 [3] - 华人创业者推出的AI Agent开始引起硅谷关注 包括OpenAI等巨头 [2] 公司动态与产品策略 - Manus创始人被指"跑路"新加坡 国内社交媒体清空 中文版产品停用 [1] - 爱诗科技海外产品PixVerse积累6000万用户 月活1600万 国内版"拍我 AI"功能类似海外版中翻 [5] - Lovart海外版集成GPT-Image-1等顶流模型 国内版星流Agent调用Flux1并优化中文语义理解 [5] - Manus海外版调用Claude模型 国内曾与阿里通义千问合作但现公告已无法查看 [6] 市场拓展与竞争格局 - 爱诗科技联创表示中国是重要市场 早期因团队规模受限未进入 现为拓展良机 [8] - 国内用户付费意愿接近海外 毒液变身特效吸引小几百万人使用 闲鱼出现代做服务 [9] - 字节内部有4个团队对标Manus 大厂在人力物力上具有明显优势 [11] - OpenAI等巨头在视频图像垂类领域深入竞争 初创企业面临严峻挑战 [11] 商业模式与成本压力 - Manus单任务成本约2美元 与B站用户日均90分钟观看的年度服务器成本相当 [14] - 视频生成功能成本从10美分到75美分/秒不等 用户试用可能造成大量现金消耗 [14] - 大模型公司处于产业链顶层 AI产品交付效果受模型供应商显著影响 [13] 技术挑战与用户体验 - AI产品需面对用户对交付效果的质疑 AI幻觉等问题持续存在 [16] - 产品使用体验存在"抽卡式"不稳定问题 消耗用户热情 [18] - 创业者将AI产品定位为"会写代码的实习生" 尚未达到AGI水平 [16] 行业前景与机遇 - 初创企业在中东等地区存在机会 可通过本地化适配避开巨头竞争 [13] - 类似Kimi和DeepSeek的案例显示 AI创业是长期竞赛 机会始终存在 [18]
【招银研究|行业深度】数字金融之AI+银行——大模型与银行数字化转型的三组关系
招商银行研究· 2025-07-18 17:00
大模型与银行业数字化转型的核心观点 - 大模型技术为银行业开辟全新赋能路径,通过数字化转型提升资产组织效率并降低运营成本[1] - 银行业AI应用呈现"生成式AI+判别式AI"协同发展格局,通过伞形模式或串联模式实现技术升级[6] - 数字化转型不仅是技术升级,更依赖业务流程深度变革,需建立战略规划、组织协同和技术实施的闭环联动[3] 第一组关系:大模型基础能力与银行应用场景 - 大模型在自然语言处理领域三大突破(内容生成、信息提取、对话交互)高度契合银行业知识密集型特征[1] - 前台应用:智能客服缩短通话时长10%,营销文案自动生成提升客户满意度30%[1][5] - 中台应用:某银行"智能授信"将尽调报告撰写时间从1周缩至5分钟,覆盖29家分行[21] - 后台应用:代码生成效率提升20%-30%,单元测试行覆盖率达60%-80%[24] - 国外银行AI应用中前台/中台/后台占比分别为55%/19%/26%,知识库构建占比最高[25] 第二组关系:生成式AI与判别式AI - 生成式AI擅长非结构化数据处理但存在运算成本高、可解释性差等问题,判别式AI在结构化数据处理和风控评级中优势明显[2] - 两类AI协作模式:伞形模式(大模型拆解任务+判别式AI执行)提升建模效率30%;串联模式(模型输出串联)在旅游线路规划中效用提升79%[39][40] - 判别式AI在银行业务中持续创造价值:某股份行智能放款覆盖90%业务量,单笔时长从5小时缩至5分钟[33] - 摩根大通2024年科技投入达170亿美元,大模型研究数量从2021年2项增至2024年30项,同时保持对其他AI技术的稳定投入[41][42] 第三组关系:人工智能与银行数字化转型 - 银行数字化转型成功率仅16%,领先银行数字化渠道销售额增长30% vs 落后银行9%[55] - 银行业三次技术变革均伴随流程调整:金融电子化阶段实现数据集中处理;互联网金融阶段改造支付清算体系;FinTech阶段推动普惠贷款超1万亿元[56][57][58] - 业务流程变革面临四大挑战:部门协作障碍、收益分配矛盾、伙伴意愿不足、数据基础薄弱[60] - 成功案例显示需具备四大要素:战略层面顶层设计、长期投入定力、跨部门协作机制、科学推进节奏[61] 国内外银行大模型应用实践 - 国内A银行大模型应用超200个,覆盖渠道运营、风控合规、程序开发等领域[11] - 跨境支付报文处理中,BERT模型分类准确率超90%,全球查询报文年发送量达20.5亿笔[17] - 摩根大通构建CFA考试表现评估等17项大模型性能测试,反映其对技术落地的稳健态度[42] - 澳洲联邦银行实现员工通过自然语言查询IT问题,55%国外银行AI案例服务于内部员工[25][26]