Workflow
大模型
icon
搜索文档
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
量子位· 2025-07-12 12:57
Kimi K2模型发布 - 发布全新Kimi K2基础大模型,采用MoE架构,总参数1T,激活参数32B,能力领先性体现在代码、Agent、数学推理任务上[2] - 模型支持128K上下文,在SWE Bench Verified、Tau2、AceBench等基准测试中取得开源模型SOTA成绩[9][11] - 模型发布即开源,提供Kimi-K2-Base基础预训练模型和Kimi-K2-Instruct指令微调版本,遵循修改版MIT协议[4][25][26] 技术能力提升 - 代码能力显著提升,支持粒子系统、可视化和3D场景开发,可生成山川峡谷3D景观和3D粒子星系模拟[17][18][19] - Agent工具调用能力增强,具备复杂指令解析能力,可自动拆解需求为可执行的ToolCall结构[22] - 数学等科学能力得到优化,通过通用强化学习和自我评价机制解决不可验证任务的奖励稀缺问题[14][34] 技术创新细节 - 采用MuonClip优化器替代传统Adam优化器,提升训练稳定性和token使用效率,完成15.5T token平稳训练[29][30][31] - 构建大规模Agentic Tool Use数据合成pipeline,覆盖数百领域数千工具,由LLM评估筛选高质量样本[32] - 通过可验证任务持续优化critic,提升泛化任务表现[34] 市场格局变化 - 2024年AI智能助手Web端市场形成Kimi智能助手、豆包AI和文心一言TOP 3格局,占据70%市场份额[56] - APP端豆包和Kimi智能助手断崖式领先,市场份额占比80%[58] - DeepSeek R1发布后市场格局巨变,形成字节豆包、DeepSeek、Kimi、腾讯元宝(DDTK)新格局[60] 公司战略调整 - Kimi通过K2开源大模型回应市场质疑,明确不放弃自研大模型的战略方向[67] - 公司选择打造更强开源大模型,追求全维度SOTA,重新证明技术领先性[68] - 模型开源策略可能改变行业竞争格局,此前已有2家"六小龙"公司放弃大模型自研[66]
月之暗面发布并开源Kimi K2模型
环球网资讯· 2025-07-12 10:46
模型发布与开源 - 月之暗面正式发布Kimi K2模型并宣布开源 [1] - 该模型采用MoE架构,总参数达1T,激活参数为32B [1] - 在代码能力与通用Agent任务处理方面表现突出 [1] 技术性能与基准测试 - Kimi K2在SWE Bench Verified、Tau2、AceBench等多项基准测试中取得开源模型最优成绩 [3] - 采用MuonClip优化器实现万亿参数模型的稳定高效训练 [3] - 在自主编程、工具调用和数学推理三大核心能力维度表现优秀 [3] - 技术有效提升Token利用效率,为模型找到新的Scaling空间 [3] 实际应用与产品化 - 用户可通过官网kimi.com或Kimi App体验Kimi K2模型 [4] - API服务已上线,兼容OpenAI和Anthropic的Chat API接口 [4] - 支持最长128K上下文,具备更强通用性与工具调用能力 [4]
深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?
机器之心· 2025-07-12 10:11
模型发布与市场反应 - 月之暗面正式发布Kimi K2大模型并开源两款商用模型Kimi-K2-Base与Kimi-K2-Instruct[4] - 模型API定价16元人民币/百万token输出[2] - 发布20分钟内Hugging Face下载量接近12K[5] - 网友测试显示其代码能力优于Grok 4且可能成为Claude 4 Sonnet的开源平替[17][20] 技术性能与基准表现 - 在LiveCode Bench等多项基准测试中超越DeepSeek-V3-0324等开源模型成为新SOTA[9] - 部分性能指标赶超GPT-4.1和Claude 4 Opus等闭源模型[9] - 采用混合专家架构(MoE)总参数量1万亿激活参数32亿支持128k上下文长度[21] - 支持工具调用(ToolCalls)JSON模式及互联网搜索功能但不支持视觉[21] 训练技术创新 - 引入MuonClip优化器解决万亿参数训练稳定性问题采用qk-clip技术控制Attention logits爆炸[24][26] - 完成15.5T tokens预训练未出现训练尖峰[28] - 通过减少Attention Heads数量提升长上下文效率增加MoE稀疏性提高token利用率[25] 工具调用与数据合成 - 开发ACEBench启发的pipeline合成数百领域数千种工具生成多轮交互数据[33][34] - 利用LLM作为评判员筛选高质量训练数据减少低质量数据影响[35] - 结合可验证任务奖励与自我评价机制扩展强化学习应用场景[36][37] 行业竞争趋势 - 与Grok 4类似采用大规模工具调用策略[42] - 国内大模型竞争转向算法创新而非单纯堆参数算力以应对算力资源紧缺[43] - HuggingFace联合创始人评价K2开源模型正挑战闭源模型领先地位[21]
上半年辽粮集团营业收入同比增长53.31
辽宁日报· 2025-07-12 09:15
公司动态 - 辽粮集团入选国家粮食产业科技创新联盟成员单位并取得国家粮食和物资储备局技术创新中心辽宁分中心资格 [1] - 公司探索应用推广智能仓储装备与服务技术 推动产学研用协同创新 [1] - 公司加大数智赋能力度 推进信息化建设 规划运用人工智能、大模型等新一代数字技术 [1] - 公司落实藏粮于技 打造新质生产力 实现业财数据和集团化管理集中管控 [1] - 公司启动组建以来力度最大的结构性变革 打破区域、层级、隶属关系壁垒 制定13项核心任务和49项细化措施 [1] - 公司调整组织架构 同步新设业务板块布局 [1] 业务表现 - 公司储备业务运营管理、贸易流通、加工品牌、现代服贸、农产品等业务板块协同发力 [2] - 公司建立精干高效的管理体系 管理效能由低向高转变 [2] - 公司上半年实现营业收入55.5亿元 同比增长53.31% [2] - 公司总资产规模达到229.1亿元 同比增长27.14% [2] - 公司粮食收/采购量同比增长53.2% 销售量同比增长157.16% [2] 战略举措 - 公司推进粮食购销和储备管理体制改革 建立监管新模式 [1] - 公司推广应用智能仓储装备与服务技术 实现风险管控前置化、运营效能最大化 [1]
当我们谈大模型和vla岗位的时候,究竟有哪些内容?(附岗位)
自动驾驶之心· 2025-07-11 19:23
大模型与VLA技术差异 - 所有依赖大模型的方案都可归为大模型岗位 包括VLM和VLA等技术方向 关键技术涉及微调 轻量化 量化和部署等 [2] - VLA概念包含执行环节(Vision+Language+Action) 属于端到端技术范畴 当前行业存在两阶段(大模型+Diffusion)和单阶段(纯大模型)两种实现方案 [2] - 大模型在自动驾驶领域应用需进行场景适配 例如采用qwen等模型进行微调以提升场景理解与预测能力 [2] 岗位需求与薪资水平 - 大模型研发工程师岗位月薪范围30k-80k 工作地点覆盖深圳/上海 [2] - VLA/VLM大模型算法岗位月薪达40k-100k 工作地点包括北京/上海/杭州 要求3-5年自动驾驶或AI算法经验 [8] - 端到端/VLA工程师需参与驾驶系统全流程研发 包含数据集构建 模型调优及闭环评测系统开发 [6] 核心技术能力要求 - 需精通Transformer架构及多模态大模型训练 熟悉PyTorch/DeepSpeed等框架 具备轨迹预测或决策规划项目经验 [9] - 优先考虑顶会论文发表者(CVPR/ICCV等)或算法竞赛获奖者(ACM/IOI) 需掌握模仿学习/强化学习技术 [5][9] - 视觉大模型方向要求搭建数据pipeline 探索数据合成技术 优化垂直场景下的模型推理性能 [5] 前沿技术应用方向 - 研发重点包括千亿参数级大模型训练 驾驶场景生成式模型开发(Diffusion/LLM)以及多模态数据挖掘 [11] - 需探索大模型在自动驾驶的创新应用 如视觉-语言-行为的多模态决策系统 融合模仿学习与强化学习技术 [10] - 行业关注世界模型与仿真场景构建 要求熟悉nuScenes/Waymo等数据集 具备量产项目经验者更具竞争力 [11]
Manus多平台账号清空!曾被认为是下一个DeepSeek
搜狐财经· 2025-07-11 18:47
Manus近期动态 - Manus官网首页显示"Manus在你所在的地区不可用",多个社交平台账号内容已清空 [1] - 公司近期进行大规模裁员,回应称是"基于经营效率考量对部分业务团队进行调整",将继续专注核心业务发展 [3] - 公司总部已从中国迁至新加坡,产品负责人张涛6月公开确认该信息 [3] Manus产品与市场表现 - Manus由武汉AI创业公司Monica于今年3月推出,定位为全球第一款通用Agent(智能体)产品,能解决复杂多变任务 [4] - 产品内测阶段邀请码在二手平台被炒至数万元,并出现大量"代申请邀请码"账号,资本市场出现相关概念股 [4] - 曾传出与阿里通义千问团队达成战略合作,阿里回应确认双方在开源模型方面合作 [4] 行业与技术争议 - Manus被质疑缺乏自研底层大模型,陷入"套壳"争议,网络评价两极分化 [4] - Monica创始人肖弘表示Agent需要复合能力,当前相关产品团队少,行业仍处早期阶段 [4] - 产品负责人张涛称Manus是基于大模型已有能力的场景探索成果,需理性看待其发展 [5]
ICML spotlight | 一种会「进化」的合成数据!无需上传隐私,也能生成高质量垂域数据
机器之心· 2025-07-11 17:22
数据短缺问题 - 公共数据产生速度预计到2028年将赶不上大模型训练的消耗速度而被耗尽[1] - 医疗、工业制造等特殊领域可用数据原本就少,数据短缺问题更严重[1] 现有解决方案的局限性 - 垂直领域中小企业倾向于使用现成大模型API,但无法直接合成垂域数据[4][5] - 大模型生成的数据与垂域实际数据存在巨大差距,无法满足垂域特性需求[7][8] - 垂域数据因隐私、知识产权等原因不能上传,增加了prompt工程难度[9] PCEvolve框架核心创新 - 只需少量标注样本即可在保护隐私同时进化出整个数据集[2] - 采用类似达尔文进化论的迭代进化框架:生成候选数据→选择淘汰→下一轮进化[11] - 设计基于指数机制的新型隐私保护方法,适配垂域少样本场景[11] 技术实现细节 - 利用开源Encoder基座模型将数据映射到特征空间计算距离[16] - 通过寻找聚类中心代表标签所有私有数据来降低计算成本[16] - 提出相似度度量h(d_s^c,D_p)来优化合成数据与垂域数据的绝对距离[18] 实验验证结果 - 在COVIDx数据集上精度达64.04%,相比初始49.34%提升显著[23] - 在Came17数据集上精度达69.10%,相比初始50.47%提升显著[23] - 在KVASIR-f和MVAD-l数据集上也分别达到50.95%和59.26%的精度[23]
从具身智能到行业应用,腾讯云携业界专家共话AI新趋势
搜狐财经· 2025-07-11 16:34
行业趋势与AI技术发展 - 通用大模型加速落地,AI从任务型算法迈向认知智能,具身智能崛起打破虚拟与物理世界界限[3] - 人工智能技术推动行业变革,可能超越"工业4.0"迈向"工业5.0"时代[7] - 大模型技术以前所未有速度重塑千行百业,上海人工智能实验室在多模态大模型、具身智能等领域领先[10] 企业数字化转型实践 - 泸州老窖通过智能制造重构传统酿酒体系,实现全流程自动化,人力需求从6000人降至164人[7][8] - 泸州老窖构建数字化营销体系实现产品全流程追溯,并与腾讯云合作探索金融科技应用[8] - 腾讯内部700+应用全面接入AI,2024年研发投入达707亿元同比增长220%[11] 具身智能技术进展 - 具身智能是未来10-20年科技领域最大机会,但面临数据稀缺和技术突破挑战[14][16] - 机器人核心技术路线为视觉语言动作模型(VLA),需解决开放环境任务持续稳定运行问题[15] - 上海人工智能实验室提出数据金字塔概念,结合仿真与真实数据推动具身智能发展[23][25] AI在垂直领域应用 - 阿尔特汽车将AI应用于研发全流程,已服务80+客户研发500+车型,推出垂直AI创绘模型"TAI"[19][20] - AMT集团通过AI赋能消费品营销,实现导购培训、经营监控、数字分身等场景落地[28][29] - 凯傲集团与英伟达合作开发AI物料搬运系统,利用仿真技术替代传统样机测试流程[62] 企业AI战略布局 - 泸州老窖计划构建"5+N"智算中心,采用大模型+小模型双轮驱动策略[34] - 腾讯云聚焦基础模型研发、内部AI化、安全技术三大方向,赋能30+行业数字化转型[45] - 西门子推动内部数据共享政策,探索具身智能仿真验证工具在制造业的应用[47] AI项目实施方法论 - 工业智能体在三维图纸处理、知识库构建、设备预测性维护等领域效果显著[50] - 传统企业需建立"握手机制",实现业务与技术团队协同推进AI场景化[54] - AI项目评估需结合业务指标,从"AI换人"转向"人机协同"的价值体系重构[52]
上汽乘用车张栋林:大模型与汽车的融合仍面临多重挑战
贝壳财经· 2025-07-11 15:49
智能辅助驾驶发展现状 - L2级别辅助驾驶安全程度评分为7分(满分10分),核心在于系统控制转向和加减速但需驾驶员全程监控[3] - L2级别属于人机共驾状态,驾驶员需全程监控并执行全部动态驾驶任务,是安全行驶最终责任人[3] - 车企需准确宣传辅助驾驶功能,明确告知用户适用范围和局限性[3] - L2级功能侧重监控驾驶员(手和眼),L3级侧重监控环境及车辆自身(ODD边界和故障)[4] - 智能辅助驾驶热度提升源于产业层面成本降低(SOC芯片和传感器产业化)和监管层面安全标准强化[5] 上汽集团智能化布局 - 2023年MG7成为首款搭载高速领航辅助系统和点对点泊车的全球市场燃油车型,并采用单模北斗定位芯片[5] - 2025年下半年MG4将搭载与OPPO智行研发的手车互联系统,支持手机语音备车、无感互联等六大创新功能[5] 大模型对汽车行业影响 - 大模型带来系统性变革:感知层面从规则驱动到语义理解(识别交警手势等场景),决策层面从专家系统到类人推理,座舱交互从功能机到智能体[6][7] - 研发生产端大模型可降本增效,实现开发效率提升(自动生成测试场景)和数据闭环重构(自动挖掘高价值场景)[7] - 变革面临三重挑战:技术决策平衡(推理延时VS实时性)、开发质量风险(不可解释性导致合规问题)、组织体系重构(人才转型和流程冲突)[8][9] 行业发展核心逻辑 - 整车研发始终需在安全-体验-成本三角中寻求平衡,无论技术如何迭代[1][10] - 大模型与汽车融合需克服车载计算平台低功耗与大模型高功耗矛盾、离散数据与高质量场景数据矛盾等技术瓶颈[8]
国元证券晨会纪要-20250711
国元香港· 2025-07-11 10:04
实时热点 - 美国上周初请失业金人数为22.7万低于预期 [4] - 特朗普会见非洲五国总统谈矿产和移民接收 [4] - 美联储穆萨莱姆称稳定币可能成为支付的重要组成部分 [4] - OPEC+代表称OPEC+讨论从10月起暂停增产 [4] - 财政部规定4500万元人民币以上的医疗器械政府采购项目应排除欧盟企业参与 [4] - 2025年退休人员养老金调整上调2% [4] - 光伏玻璃减产信号增强 [4] - 国内稀土双巨头宣布提价 [4] - 台积电6月销售额同比增26.9% [4] - 马斯克旗下xAI正式发布旗舰大模型Grok 4 [4] - 2年期美债收益率涨3.13个基点报3.870% [4] - 5年期美债收益率涨3.15个基点报3.932% [4] - 10年期美债收益率涨1.78个基点报4.348% [4] 经济数据 海外市场重要指数 - 纳斯达克指数收市价20630.66,涨跌0.09% [5] - 道琼斯工业指数收市价44650.64,涨跌0.43% [5] - 美元指数收市价97.59,涨跌0.10% [5] - 标普500收市价6280.46,涨跌0.27% [5] - 日经225收市价39646.36,涨跌 -0.44% [5] 其他重要指数 - 波罗的海干散货收市价1423.00,涨跌 -0.56% [5] - CME比特币期货收市价114060.00,涨跌1.62% [5] - ICE布油收市价68.88,涨跌 -1.87% [5] - 伦敦金现收市价3323.34,涨跌0.31% [5] - 美元兑人民币(CFETS)收市价7.18,涨跌 -0.07% [5] 香港重要指数 - 恒生指数收市价24028.37,涨跌0.57% [5] - 恒生中国企业指数收市价8668.26,涨跌0.83% [5] - 恒生科技收市价5216.60,涨跌 -0.29% [5] - 恒生期货收市价30971.08,涨跌0.59% [5] 内地重要指数 - 上证指数收市价3509.68,涨跌0.48% [5] - 深证综指收市价2107.11,涨跌0.26% [5] - 沪深300收市价4010.02,涨跌0.47% [5] - 创业板指收市价2189.58,涨跌0.22% [5]