多模态大模型

搜索文档
多模态技术爆发元年,行业应用如何落地?
AI前线· 2025-05-06 12:25
作者 | AICon 全球人工智能开发与应用大会 策划 | 李忠良 编辑 | 宇琪 近年来,多模态大模型技术发展迅速,展现出强大的视觉理解能力,显著提升了 AIGC 的可控 性,各行各业正经历从"人工密集型"到"AI 原生驱动"的颠覆性变革。那么,多模态技术中面临哪 些核心技术挑战?在 AIGC 技术落地过程中,会产生什么新的应用场景?大模型的下一阶段突破 可能来自哪些方向? 近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了 上海交通大学人工智能学院副教授赵波担任主 持人,和快手快意多模态模型算法负责人高欢、腾讯混元专家研究员邵帅一起,在 AICon 全球人工智 能开发与应用大会 2025 上海站即将召开之际,共同探讨多模态大模型如何开启智能交互新篇章。 部分精彩观点如下: 在 5 月 23-24 日将于上海举办的 AICon全球人工智能开发与应用大会 先训练一个大模型,再用它来蒸馏小模型或减少推理步数,比直接训练小模型或低步数模型效果 更好。 现阶段,比起通用模型,针对特定业务场景定制化的垂直领域模型仍是更优选择。 如果单纯为了追求效果而无限制地扩大模型规模,虽然可能获得性能提升,但投入产出比 ...
一文了解中国音频行业发展现状及未来前景趋势预测(智研咨询发布)
搜狐财经· 2025-05-03 14:18
行业概述 - 音频是指人耳能够感知的声音信号,频率范围在20赫兹到20000赫兹之间,通过物体振动产生的机械波传播并被听觉神经感知 [2] - 音频信号形式可分为模拟音频和数字音频 [2] 行业发展历程 - 萌芽期(1996-2005年):广东珠江经济广播首次网络实时广播,苹果公司引入播客概念 [4][5] - 探索期(2006-2015年):动听中国成为早期中文有声书网站,豆瓣FM、蜻蜓FM、喜马拉雅、荔枝FM等平台相继上线 [4][5] - 扩张期(2016-2019年):音频平台开放直播功能,网易云音乐、斗鱼等跨界竞争加剧 [4][5] - 成熟期(2020年至今):荔枝赴美上市,喜马拉雅提交港股上市申请,天猫精灵实现AI交互突破 [4][5] 行业产业链 - 上游:内容创作(音乐、有声读物等)、原材料(金属、塑料等)、零部件(芯片、扬声器等) [6] - 中游:音频平台 [6] - 下游:智能手机、智能音箱、车载终端等收听渠道及用户 [6] 市场规模与技术发展 - 2024年中国音频行业市场规模达287亿元,同比增长14.80% [2] - AI技术(多模态大模型、生成式AI)推动音频内容创作智能化,提升用户体验 [2] 相关企业 - 上市企业:腾讯音乐(01698)、网易云音乐(09899)、漫步者(002351)、中文在线(300364)、科大讯飞(002230) [2] - 其他企业:中文在线、掌阅科技、科大讯飞、华为、小米、阿里巴巴等 [2] 行业报告 - 智研咨询发布《中国音频行业市场研究分析及发展趋势预测报告》,涵盖产业链、市场规模及重点企业分析 [8][9][11] - 报告旨在分析音频行业市场走向,挖掘发展潜力,预测发展前景 [9][11]
2025年迈向智能驱动新纪元,大语言模型赋能金融保险行业的应用纵览与趋势展望报告-众安信科
搜狐财经· 2025-05-01 06:57
大模型技术发展与行业机遇 - 全球大模型技术发展多元化,垂类大模型通过定制化训练提供精准行业解决方案,中国在算力自主化、数据优化等方面取得进展[1][24] - 新技术降低大模型训练、运维和推理成本,推动金融行业流程重构,企业需平衡购置、推理和运维成本[1][29] - 国产大模型如DeepSeek和通义千问在成本控制与推理性能上突破,实现数据安全合规、低成本高性能和中文语义优化[1][26][27] - DeepSeek通过混合专家技术将6710亿参数活跃计算量压缩至37亿,训练成本仅为同规模模型的6%[26] - 通义千问融合预训练与垂直领域优化能力,在对话交互、代码生成等场景形成专项突破[27] - 腾讯混元T1模型解码速度提升2倍,在中英文推理基准中领先[28] 大模型赋能保险全链 - 保险机构加速接入大模型,应用聚焦内部提效,覆盖业务全链条及中后台管理环节[1][16] - 初期优先选择容错成本低的场景如智能客服、智能质检、营销助手等,建立调试与反馈机制[6][7] - 大模型推动行业由结构化数据向多源动态信息系统演进,提升风险识别广度与响应及时性[8] - 金融机构经营理念重塑,呈现金融服务精准化跃迁和跨行业生态化协同两大趋势[9] - 银行利用实时企业数据优化信贷评估,保险与医疗平台合作开发预防型保险产品[9] 合作范式演变 - 数据要素价值凸显,金融保险行业通过横向、垂直和政企协同构建高质量数据集[1][19] - 政企协同推动数据要素流通,垂直整合构建企业级智能协同底座,横向协同拓展跨场景联动[19][42] - 多模态大模型为金融保险带来智能化转型机遇,填补非结构化信息处理能力空白[62] - 多模态模型应用于智能客服、理赔审核、欺诈识别等场景,提升审核准确率与风控能力[62] - 通义干问通过双核架构实现全模态实时交互,视觉推理模块采用链式思维增强方法[53] 技术演进与成本优化 - 垂类大模型通过行业特定数据集训练,减少计算成本并提供精准解决方案[33][40] - GPT-4级别模型单周期训练成本近5000万美元,垂类模型更经济高效[33] - 国产模型生态呈现功能分化趋势,语言生成模型与推理模型分别专注语义理解和逻辑决策[48] - 轻量化技术如蒸馏模型降低终端部署成本,Qwen-32B等模型实现对OpenAI-o1-mini的局部超越[49] - 模型部署从"可用"向"可适配"迈进,聚焦跨架构柔性部署机制构建[31]
人工智能赋能千行百业 上海创新浓度提升
中国新闻网· 2025-05-01 05:59
人工智能产业孵化平台发展 - 上海市打造的人工智能大模型专业孵化和加速平台"模速空间"已入驻企业100余家,聚焦多模态大模型应用、语料创新等技术前沿议题 [1] - 平台每两周举行"AI极客夜话"活动,行业专家分享实战案例,探讨AI技术实际应用问题 [1] - 平台内设置人工智能产品体验店,展示200余款AI科技产品,涵盖智能穿戴、健康监测、音频设备等多个领域 [3] 人工智能技术研发与应用 - 多模态大模型研究者通过与产业应用端交流,更关注技术实际应用广度和用户规模 [2] - 人形机器人企业通过日常生活场景数据采集,日均完成千余条操作数据采集,用于训练机器人"新大脑" [4] - 智元机器人3月发布首款通用具身模型基座智元启元大模型(Genie Operator-1)和新款人形机器人灵犀X2 [4] 人工智能产业链发展 - 智元机器人通过人工智能和机器人技术融合创新,带动零部件产业链能力提升 [4] - 上海市聚集约25万名人工智能领域人才,创新企业和青年才俊持续增加 [4] - 人工智能技术产业应用价值核心在于实际落地效果,研究者重视与产业应用端合作 [2]
美的集团(000333):2025年一季报点评:持续拓展全球推动数智驱动
东莞证券· 2025-04-30 17:04
报告公司投资评级 - 维持对美的集团“增持”评级 [1][5] 报告的核心观点 - 美的集团2025年一季度业绩符合预期,公司持续推进“科技领先、用户直达、数智驱动、全球突破”四大战略主轴,不断深化全球化布局,建立完善研发体系,聚焦全面智能化和全面数字化,预计2025 - 2026年每股收益分别为5.61元、6.15元,当前股价对应PE分别为13倍、12倍 [1][5] 根据相关目录分别进行总结 财务数据 - 2025年一季度,美的集团实现营业总收入1284.28亿元,同比增长20.61%;归母净利润124.22亿元,同比增长38.02%;扣非后归母净利润127.5亿元,同比增长38.03% [1] - 2025年一季度,公司毛利率同比下降1.87个百分点至25.45%;期间费用率同比下降3.82个百分点至13.23%,其中销售费用率、管理费用率和财务费用率分别同比下降0.74、0.35和2.73个百分点,分别达到9.25%、6.14%和 - 2.21%;净利率同比提高1.45个百分点至9.97% [5] - 盈利预测简表显示,2024 - 2027年营业总收入分别为4090.84亿、4439.73亿、4757.15亿和5085.08亿元;归母公司所有者的净利润分别为385.37亿、430.16亿、471.48亿和515.36亿元;摊薄每股收益分别为5.03元、5.61元、6.15元和6.72元;PE分别为14.8倍、13.2倍、12.1倍和11.0倍 [6] 业务布局 - 美的集团业务遍及200多个国家和地区,美国收入占比很低,在海外设有22个研发中心和23个主要制造基地,未来将持续拓展海外制造布局,推动海外新工厂建设与投产 [5] - 公司持续加强自有品牌产品研发投入,通过本地化用户洞察与创新完善全球各区域产品布局和竞争力,2024年美的系自有品牌在多个国家和家电品类取得市场突破 [5] 技术发展 - 美的集团加速全面智能化落地,推进大模型和Agent技术探索与应用,建立家居领域语言大模型 - 美言,应用于多种产品,提供人机交互服务,实现全屋家居家电融合的深度智能控制和智能管家服务体验 [5] - 公司首次将Agent能力应用于家居场景生成,实现快速响应和可控生成效果,研究团队积极参与行业大模型技术研究,在多个国际AI会议发表多篇专业论文,拓展具身智能、多模态大模型和图像生成等领域前沿研究 [5]
星宸科技:4月29日召开业绩说明会,投资者参与
证券之星· 2025-04-30 15:09
业绩表现 - 2025年Q1公司各业务线均实现超过20%的同比增长,智能机器人芯片单季度出货量及营收超过2024年全年[2] - 2024年度实现归属于上市公司股东的净利润约2.56亿元,同比增长约25.18%;2025年一季度实现归属于上市公司股东的净利润约5,117.87万元,同比增长约0.48%[3] - 2025年一季度营业收入6.65亿元,同比上升26.36%;扣非净利润3986.76万元,同比下降14.03%;毛利率33.29%[10] 业务发展 - 智能物联领域导入众多智能机器人头部品牌客户,智能机器人芯片实现超预期增长[2] - 智能车载领域ADAS及感知芯片开始起量,实现显著增长[2] - 智能安防领域完整产品布局满足市场需求,行业地位进一步巩固[2] - 智能机器人领域2024年出货量及营收同比2023年增长超过三倍,2025年Q1单季度出货量及营收超过2024年全年[3] - 智能穿戴领域推出适用AI眼镜的SoC芯片SSC309QL,客户终端产品预计2025年下半年出货[3] 研发投入 - 2024年全年研发投入约6.02亿元,同比增长约21.95%,研发投入率约25.59%[4] - 2025年Q1研发投入约1.68亿元,同比增长约19.8%,研发投入率约25.24%[4] - 重点投入大算力、运动ISP、超低功耗、3D TOF传感等前沿IP技术[4] 未来增长点 - 智能机器人、智能眼镜、车载激光雷达等领域有望成为后续增长点[3] - 正在开发下一代适用于运动及智能穿戴场景的先进IP及SoC芯片,预计2025年下半年投片[3] - 快速升级更大算力、具备多模态大模型、人机交互的高阶机器人芯片,有望于2026年量产[3] 市场布局 - 直接及间接海外销售占比已过半[5] - 目标在二~三年内成为智能机器人行业头部的SoC芯片供应商[3] - 已建立广大海外头部品牌销售渠道,形成竞争优势[5] 行业前景 - 端边侧AI SoC芯片将朝着更高效能、更低功耗、更小尺寸的方向发展[8] - 智能安防领域AI-ISP技术成为2024年及未来产品技术创新热点[8] - 智能车载领域对芯片的图像处理能力、视频处理能力以及可靠性等升级需求大幅提升[8] - 多模态大模型将为端边侧设备提供更强大的智能处理能力[9] 机构预测 - 2025年预测净利润范围3.01亿-4.16亿元,2026年预测净利润范围3.986亿-5.76亿元[12] - 最近90天内共有4家机构给出评级,买入评级1家,增持评级3家[11]
新华财经早报:4月30日
新华财经· 2025-04-30 10:13
金融行业 - 何立峰指出要强化上海金融开放枢纽门户功能,增强人民币资产全球配置和风险管理中心地位,推动上海国际金融中心建设取得新突破 [2][4] - 三部门开展市场准入壁垒清理整治行动,清理整改不合理规定和做法,营造公平市场准入环境 [2][4] - 国家发展改革委追加下达810亿元超长期特别国债资金支持消费品以旧换新 [2][4] - 3月债券市场共发行各类债券87356.6亿元,截至3月末托管余额183.1万亿元 [4] - 财政部拟5月9日续发行710亿元30年期2025年超长期特别国债(二期) [4] - 五大行董事会通过修改公司章程并撤销/不再设立监事会议案,尚需股东大会审议 [2][4] - 中国人民银行召开会议部署金融“五篇大文章”统计制度落地工作 [4] - 北京证监局称2024年辖区200余家公司发行公司债券和ABS募资9000余亿元,同比增长9% [4] - 港交所与香港证监会为“中概股”回流提供指引协助,推进全面上市制度检讨 [4] 钢铁行业 - 一季度重点统计会员钢铁企业累计营业收入14360亿元,同比下降6.61%;营业成本13505亿元,同比下降7.73%;利润总额215.83亿元,同比增长1.08倍 [4] 铁路运输行业 - 铁路五一假期运输4月29日启动,8天预计发送旅客1.44亿人次,同比增长4.9% [4] 白酒行业 - 贵州茅台一季度营业总收入514.43亿元,同比增长10.67%;归母净利润268.47亿元,同比增长11.56%;酱香系列酒营收70.22亿元,同比增长18.30%;海外营收11.19亿元,同比增长37.53% [2][5] - 山西汾酒季度净利润同比增长6.15%至66.48亿元 [8] 房地产行业 - 万科A一季度营收379.95亿元,同比下降38.31%;净利润-62.46亿元;拟出售0.61%总股本的A股库存股;第一大股东提供33亿元借款;拟更换审计机构 [5] 家电行业 - 美的集团拟分拆安得智联至香港联交所主板上市,季度净利润同比增38.02%至124.22亿元 [5][8] - 海尔智家季度净利润同比增长15.09%至54.87亿元 [8] 科技行业 - 腾讯重构混元大模型研发体系,成立大语言模型部、多模态模型部等新部门 [5] - 杰华特筹划发行H股股票并在香港联交所主板挂牌上市 [5] - 广合科技拟发行H股股票并在香港联交所主板上市 [5] - 剑桥科技已就H股IPO递表 [5] - 工业富联季度净利润同比增长24.99%至52.31亿元 [8] - 韦尔股份季度净利润同比增长55.25%至8.66亿元 [8] 能源行业 - 国家发展改革委、国家能源局印发《电力辅助服务市场基本规则》,提出完善现货市场规则等内容 [4] - 中国石油季度净利润同比增长2.3%至468.09亿元 [8] 汽车行业 - 上汽集团季度净利润同比增长11.40%至30.23亿元 [8] - 三一重工季度净利润同比增长56.40%至24.71亿元 [8] - 塞力斯季度净利润同比增长240.60%至7.48亿元 [8] - 九号公司季度净利润同比增长236.22%至4.56亿元 [8] 旅游零售行业 - 中国中免季度净利润同比下降15.98%至19.38亿元 [8] 金融服务行业 - 国泰海通季度扣非后净利润同比增长60.65% [8] 电力行业 - 长江电力季度净利润同比增长30.56%至51.81亿元 [8]
“扫地茅”科沃斯强势回归,一季度净利同比增60%再创行业新高
贝壳财经· 2025-04-30 08:34
财务表现 - 2024年公司总收入达165.42亿元,同比增长6.71%,归属于上市公司股东的净利润8.06亿元,同比增长31.70% [6] - 2025年第一季度实现营收38.58亿元,同比增加11.06%,归属于上市公司股东的净利润4.75亿元,同比增加59.43%,环比翻倍增长 [7] - 2024年运营成本、销售费用得以控制,营销费用同比减少3.53% [11] - 2024年公司毛利率46.52%,同比增加1.94个百分点 [24] 双品牌战略 - 科沃斯品牌服务机器人2024年销售收入80.82亿元,占全部收入的48.86%,添可品牌高端智能生活电器销售收入80.61亿元,同比增长10.87%,占全部收入的48.73% [11] - 科沃斯品牌服务机器人产品全球出货达295万台,同比增长16.9%,添可品牌洗地机全球出货达414万台,同比增长28.3% [20] - 添可洗地机在美、法、德、加、意等9大国家站点中稳居市占第一 [30] 研发投入与创新 - 2024年研发支出达8.85亿元,同比增长7.30% [22] - 截至报告期末,公司合计获得授权专利2415项,在申专利1470项,新增专利申请410项,其中发明专利157项 [23] - 公司在机器人技术的三维空间理解、交互能力、AI算力、多模态大模型和具身智能等方面已提交专利申请152项,其中100项为发明专利 [23] - 科沃斯推出T30、T50和X8系列等多款畅销扫地机器人产品,X8系列洗地机器人凭借行业首创的滚筒恒压活洗功能推动行业技术革新 [16] 海外市场拓展 - 2024年科沃斯和添可品牌实现海外收入共计68.08亿元,同比增长12.6%,占公司品牌业务收入的42.2% [32] - 科沃斯和添可品牌在欧洲市场营业收入较上年分别显著增长51.6%和64.0% [28] - 添可已进入欧洲20多个国家超过50个重要的零售渠道 [32] - 2024年擦窗机器人、割草机器人海外收入展现强劲发展势头 [31] 行业背景 - 2024年中国清洁电器市场规模突破400亿元,成为第六大家电品类,行业销售额423亿元,同比增长24.4%,零售量3035万台,同比增长22.8% [10] - 2024年全球清洁电器市场零售额规模达到200亿美元,同比增长8%,东欧、拉丁美洲、中东和非洲零售额同比增速均接近20% [27] - 2024年全球扫地机器人市场出货量2060.3万台,同比增长11.2%,全年销售额达93.1亿美元,同比增长19.7% [27] - 2024年国内洗地机市场零售量同比增长31.1%,添可在内的前三品牌占据洗地机市场65.0%的零售额份额 [27]
星宸科技(301536) - 301536星宸科技投资者关系管理信息20250430
2025-04-30 08:02
业务增长情况 - 2025 年 Q1 各业务线同比增长超 20%,智能机器人芯片单季度出货量及营收超 2024 年全年,ADAS 及感知芯片起量,智能安防领域行业地位巩固提升 [2] 盈利情况 - 2024 年度归属于上市公司股东的净利润约 2.56 亿元,同比增长约 25.18%;2025 年一季度约 5,117.87 万元,同比增长约 0.48% [3] 盈利增长点 - 智能机器人、智能眼镜、车载激光雷达等领域有望成为后续增长点 [3] 产品布局 - 已推出适用 AI 眼镜的 SoC 芯片 SSC309QL,客户终端产品预计 2025 年下半年出货;正开发下一代适用于运动及智能穿戴场景的先进 IP 及 SoC 芯片,预计 2025 年下半年投片 [3] 人形机器人领域布局 - 机器人芯片初步完成产品矩阵,已大批量出货;2024 年出货量及营收同比 2023 年超三倍增长,2025 年 Q1 单季度出货量及营收超 2024 年全年 [4] 技术与市场布局 - 技术上正升级高阶机器人芯片,有望 2026 年量产;市场上有望 2025 年跻身领先梯队,目标二至三年内成为智能机器人行业头部 SoC 芯片供应商 [5] 研发投入 - 2024 年全年研发投入约 6.02 亿元,同比增加约 1.1 亿元,同比增长约 21.95%,研发投入率约 25.59%;2025 年 Q1 约 1.68 亿元,同比增加约 2,773 万元,同比增长约 19.8%,研发投入率约 25.24% [6] 毛利率波动看法 - 优先提升产品销售规模及市场占有率,后续规模效应释放有望降低成本,长期盈利及毛利率将稳健向好 [7] 激励计划 - 2024 年 7 月 10 日披露《2024 年限制性股票激励计划(草案)》 [7] 销售占比 - 直接及间接海外销售占比已过半(穿透至最终客户计算) [7] 收并购打算 - 持续评估投资或并购战略标的,有重大进展会及时披露 [8] 股东人数 - 截止 2025 年 4 月 18 日股东人数为 22,683 户 [9] 回购计划 - 聚焦主业发展,若有相关计划将及时披露 [10] 市值管理计划 - 依法依规运用多种方式提升公司价值,增强投资者信心 [10] 公司业绩情况 - 2024 年度营业收入约 23.54 亿元,同比增长约 16.49%;2025 年一季度约 6.65 亿元,同比增长约 26.36% [10] 行业发展前景 - 端边侧 AI SoC 芯片朝更高效能、更低功耗、更小尺寸发展,多模态时代带来新机遇 [11] 一季度业绩与收入结构 - 2025 年一季度各产品线双位数增长,智能物联及智能车载领域增速更高,相关产品线营收占比持续提升 [13] 业绩波动原因 - 受行业周期波动影响,但自 2023 年下半年企稳回暖,持续开拓新业务领域 [13]
ICLR 2025|首个动态视觉-文本稀疏化框架来了,计算开销直降50%-75%
机器之心· 2025-04-29 11:22
本文由华东师范大学和小红书联合完成,共同第一作者是华东师范大学在读硕士、小红书 NLP 团队实习生黄文轩和翟子杰,通讯作者是小红书 NLP 团队负责人 曹绍升,以及华东师范大学林绍辉研究员。 多模态大模型(MLLMs)在视觉理解与推理等领域取得了显著成就。然而,随着解码(decoding)阶段不断生成新的 token,推理过程的计算复杂度和 GPU 显存 占用逐渐增加,这导致了多模态大模型推理效率的降低。现有的方法通过减少预填充(prefill)阶段的视觉 token 冗余来实现推理加速。遗憾的是,这种在预填充 阶段实现的视觉 token 稀疏化所带来的加速优势,在解码阶段会逐渐减弱。当解码输出的文本 token 数量增多时,这些方法仍然会遇到性能瓶颈。 为了解决上述问题,团队创新性地提出了一个全新的动态视觉 - 文本上下文稀疏化推理加速框架 ——Dynamic-LLaVA。该框架针对多模态大模型在不同推理模式 下(包括预填充阶段以及有无 KV Cache 的解码阶段),设计了定制化的稀疏化推理方案,以实现多模态大模型的高效推理。实验结果表明,Dynamic-LLaVA 在 几乎不损失视觉理解和生成能力的前提 ...