Workflow
多模态大模型
icon
搜索文档
2025年中国多模态大模型行业市场规模、产业链、竞争格局分析及行业发趋势研判:将更加多元和深入,应用前景越来越广阔[图]
产业信息网· 2025-05-29 09:47
多模态大模型行业定义及分类 - 多模态大模型是能够同时处理和理解多种模态数据(如文本、图像、音频、视频、3D模型等)的大规模人工智能模型,通过深度学习技术实现跨模态信息融合与推理 [2] - 与传统单一模态模型相比,多模态大模型更像全能翻译官,能够将不同模态信息融会贯通,更准确地处理复杂任务 [2] 多模态大模型行业发展历程 - 行业经历了任务导向阶段、视觉-语言预训练阶段和多模态大模型阶段 [4] - 多模态大模型阶段已实现更灵活的交互方式,强调跨模态理解与生成能力同步提升 [4] 多模态大模型行业发展现状 - 2024年中国多模态大模型市场规模为156.3亿元,较2023年增加65.4亿元,预计2025年达234.8亿元 [6] - 数字人领域应用份额最大(24%),其次是游戏与广告商拍(各13%),智能营销和社交媒体(各10%) [8] 多模态大模型行业产业链 - 上游包括AI芯片、GPU/FPGA/CPU/ASIC、服务器等硬件及基础软件 [10] - 中游为多模态大模型产品(如CLIP、BLIP、LLaMA等) [10] - 下游应用于工业、农业、金融科技等生产制造领域,教育、游戏、传媒等生活娱乐领域,基建、交通、医疗等公共服务领域 [10] - AI芯片市场规模从2019年116亿元增长至2024年1447亿元 [12] - 游戏领域2024年销售收入达3257.83亿元,用户规模6.74亿人 [14] 多模态大模型行业竞争格局 - 主流大模型包括中科院紫东太初、华为盘古、百度文心、腾讯混元、阿里通义、科大讯飞星火等 [16] - Kimi、DeepSeek等通过技术优化将训练成本控制在3000-6000万美元 [16] - 百度文心大模型4.5是首个原生多模态模型,具备多模态理解和高情商特点 [16] - 腾讯混元大模型采用动态路由机制,训练成本降低40% [16] - 阿里通义大模型在医疗、司法、文化传播等领域落地应用 [16] 多模态大模型行业发展趋势 - 多模态大模型正成为推动相关产业创新发展的重要力量,能提供更丰富和个性化的服务体验 [19] - 未来将实现更自然高效的人机协作,在金融分析、智能客服、教育辅导、内容创作等场景展现多任务处理能力 [19] - 技术发展将呈现更加多元和深入的趋势,模型将更智能、更人性化 [19]
每日市场观察-20250528
财达证券· 2025-05-28 21:47
市场表现 - 5月28日市场延续跌势,成交额1.02万亿,较上一交易日减少约100亿,超八成个股涨跌幅局限于3%以内[1] - 5月27日沪指跌0.18%,深成指跌0.61%,创业板指跌0.68%[2] 资金流向 - 5月27日上证净流入10.27亿元,深证净流出20.48亿元,化学制药、计算机设备、农化制品主力资金流入前三,工业金属、半导体、乘用车主力资金流出排名前三[4] 消息面 - 1 - 4月全国规模以上工业企业利润总额21170.2亿元,同比增长1.4%,国有控股企业利润总额同比下降4.4%,股份制企业增长1.1%,外商及港澳台投资企业增长2.5%,私营企业增长4.3%[5] - 5月26日穆迪维持中国主权信用评级“A1”和负面展望不变,财政部称是对中国经济向好前景的正面反映[7] 行业动态 - 2025年第一季度非洲智能手机市场出货量同比增长6%达1940万部,预计全年增长3%,传音一季度出货量同比下滑5%[8][9] - 上海首个交通领域多模态大模型“通达”问世,有望让路口通行效率提升15%[10][11] 基金动态 - 首批26只新型浮动费率基金中有16只5月27日开启发行,6月底前基本完成募集,部分基金公司将发行重心放在6月初[12] - 首批基于业绩比较基准的浮动费率产品启动发行,中国银行推出认购费一折优惠让利投资者[13]
整理:每日科技要闻速递(5月28日)
快讯· 2025-05-28 07:27
新能源汽车 - 比亚迪刀片电池提前通过新国标 [2] - 小马智行与迪拜道路交通管理局达成战略合作 [2] - 小米SU7 Ultra锁单量达到2.3万辆 [2] - 部分车企参与研讨会讨论"零公里"二手车等议题 [2] - 长安汽车董事长预计行业竞争将在2年内回归良性环境 [2] 集成电路(芯片) - 三星计划2028年推出玻璃中介层 [2] - 三星调整HBM团队组织架构并押宝定制化HBM [2] - 三星将在6月后停止接受多层单元NAND订单 [2] - 台积电将生产基于MicroLED的光通信互连产品 [2] - 台积电在德国慕尼黑设立欧洲芯片设计中心 [2] 人工智能 - 上海推出首个交通领域多模态大模型,路口通行效率有望提升15% [2] - 英伟达供应商解决机架过热问题并开始出货Blackwell芯片 [2] - 腾讯云推出GooseFS 2.0,为人工智能业务场景提供全面支持 [2] 其他 - Salesforce拟80亿美元收购Informatica [2] - 非洲智能手机市场预计2025年实现3%增长 [2] - 抖音试行新规处理可能诱发"开盒"等事件的信息 [2] - 美国得州对苹果和谷歌应用商店实施年龄验证 [2] - Neuralink融资6亿美元,估值达90亿美元 [2] - 苹果计划发布专用视频游戏应用程序以增强游戏行业影响力 [2]
全日程公布|谷歌Veo 3惊艳发布后,这场CVPR分享会值得每个AI人「听个声」
机器之心· 2025-05-27 14:38
前几天,谷歌在 I/O 2025 大会上正式发布了其最新一代 AI 视频生成模型 Veo 3,在生成高质量视频的同时首次实现了音画同步。对于 Veo 3 的震撼效果,有人高 度评价称,「它会是不亚于 OpenAI Sora 的跨时代产品」,标志着 AI 视频进入到了真正的「有声时代」。 从中可以发现,虽然当前 AI 社区已有的大模型已经足够惊艳,但得益于架构的创新、算力集群的投入,仍然会「卷」出一些新东西来。比如视频生成领域,从最 初的无声进化到如今的有声,提升明显;再比如多模态领域,逐渐朝着理解与生成大一统的方向演进。 因此,为让从业者全面了解 AI 社区涌现的最新创新成果和发展趋势,机器之心计划 6 月 8 日在北京举办「CVPR 2025 论文分享会」,围绕着多模态、视频生成等 热门主题邀请顶级专家、论文作者与现场参会观众共同交流。 作为计算机视觉领域中最重要的国际会议之一,CVPR 具有极高的含金量,每年都会吸引大量研究机构和高校参会。今年,CVPR 2025 共收到 13008 份论文投 稿,最终接收 2878 篇论文,整体接收率为 22.1%。 作为一场为国内 AI 人才打造的盛会,本次论文分享会 ...
上海首个交通领域多模态大模型问世 有望让路口通行效率提升15%
快讯· 2025-05-27 11:07
公司成立与产品发布 - 上海首家国资背景垂直领域大模型企业中城交(上海)科技有限公司正式成立 [1] - 公司同时发布上海首个交通领域多模态大模型"通达大模型" [1] - "通达"是全市首个交通专用大模型 [1] 产品核心能力 - 具备"专家顾问"功能 为管理人员提供专业知识服务 [1] - 辅助交通组织管理 担当算法基石和中央大脑 [1] - 通过视频监控和物联网设备实时捕捉路口车流量变化及周边道路通行态势 [1] - 可在极短时间内完成海量数据模拟并生成交通信号优化方案 [1] 产品应用效果 - 在试点城市使路口通行效率提升15%左右 [1] - 改变传统依赖管理人员经验的交通信号调整模式 [1] - 被形容为交通管理的"千里眼"和"最强大脑" [1] 行业影响 - 标志着上海交通智能化的一次迭代升级 [1] - 为城市交通拥堵问题提供"智慧药方" [1]
从马拉松到格斗大赛,人形机器人在教育行业的奇点时刻还有多远?
36氪· 2025-05-27 07:48
2025 年,人形机器人与具身智能( Embodied AI )正从实验室走向规模化落地,成为全球科技与资本竞逐的焦点。从特斯拉 Optimus 的工厂「 007 」到 宇树机器人「租赁商演生态」,从青岛康复机器人的「无人家务」到越疆 Dobot Atom 的「家庭早餐助手」,这场由 AI 大模型与硬件革命驱动的产业变 革,正在重塑人类社会的生产与生活方式。 你是否想象过,拥有与人类相似外形和智慧的机器人在我们的生活中自由行走?这类被称为人形机器人的存在,正是集成了人工智能、高端制造、新材料 等前沿技术的结晶。根据工业和信息化部发布的《人形机器人创新发展指导意见》,人形机器人被视为继计算机、智能手机、新能源汽车之后的又一革命 性产品。 与其他传统机器人不同,人形机器人不仅外观更加贴近人类,还逐步具备了接近人类的自主思维和运动控制能力。它们由模拟人体结构的「躯干」(包括 双足、双臂、头部及其连接件)、拥有认知智能的「大脑」,以及确保动作灵巧平稳的「小脑」组成。其类人的外形也使得在人机交互中更具亲和力,更 加符合智能机器人「以人为本」的设计理念,也更适用于手足操作的人形空间。 据测算,目前全球人形机器人市场规模已 ...
上海网达软件股份有限公司关于2024年度暨2025年第一季度业绩暨现金分红说明会召开情况的公告
上海证券报· 2025-05-27 03:35
业绩表现 - 2024年实现营业收入3.34亿元,同比增长13.18%;归属于上市公司股东的净利润1047.69万元,同比增长112.57%;扣非净利润220.62万元,同比增长102.34% [2] - 2025年一季度营业收入7447.01万元,同比增长11.11%;扣非净利润121.07万元,同比增长35.34% [11] - 高新视频解决方案毛利率同比增加8.16%,AI视频大数据解决方案毛利率同比增加30.30%,成为重要增长点 [2] 业务发展 - 基于自研行业大模型,聚焦智慧安防、智慧社区、智慧医疗、安全生产等场景,提供专业化、轻量化解决方案 [3] - 将高清视频处理、AI模型、XR引擎等模块标准化,形成可快速复用的技术中台,降低定制化开发成本 [3] - 产品深度融入信创生态,完成与国产操作系统(OpenEuler、麒麟、统信、鸿蒙等)及处理器平台(鲲鹏、飞腾、海光等)的兼容适配认证 [3] 技术布局 - 以AI大模型为底座、超高清视频为入口、XR为交互界面,为细分市场提供高附加值解决方案 [5] - AI大模型赋能安全领域:建立全方位智能感知体系,已在码头/港口实现项目落地,并推广至园区、商场、轨道交通等行业 [7] - AI大模型赋能全媒体领域:研发智能图像创作系统、直播拆条系统等,构建企业级媒体数智台,承接国家主流媒体客户端平台项目 [8] 行业前景 - 高新视频产业加速向"智能化、沉浸化、交互化"发展,推动产业链从终端显示向内容生产、算力网络、行业应用全链条延伸 [9] - 多模态大模型整合文本、图像、语音、视频等信息,渗透工业、教育、金融、医疗等行业核心场景,成为智能化转型关键引擎 [9] 2025年规划 - 夯实视频技术底座:聚焦超高清编解码、低时延传输,加速国产化硬件平台适配,探索视频技术赋能数字化转型新模式 [12] - 激活AI大模型势能:基于自主4K/8K全生态链解决方案,打造智能创作工具链,搭建AI视频能力开放平台 [12] - 布局扩展现实生态:强化空间计算、实时渲染能力,推进XR与AI、物联网融合,在数字文娱、职业培训等领域形成标杆解决方案 [12] 其他事项 - 拟每10股派发现金红利1.50元(含税),合计派发4005.13万元,股东会召开后2个月内实施 [5] - 全资子公司上海众响信息技术有限公司已完成注销,不再纳入合并报表范围 [16][17] - 作为华为鸿蒙开发服务商,拥有100多名鸿蒙资质工程师,参与研发2款重要应用并获鸿蒙先锋奖 [6]
第九届世界无人机大会暨国际低空经济与无人系统博览会在深圳举行
南方日报网络版· 2025-05-26 15:57
无人机与具身智能技术结合 - 更多无人机企业尝试将无人机与具身智能技术相结合,产品线深入细分领域 [1] - 展会低空经济板块展出5000多架(台)各类无人机及上下游配套产品 [2] - 道通智能展示多模态大模型应用,无人机可自主优化飞行路径,成为空中机器人 [2] - 猎户座AP3-P3柔韧系留清洗系统展示小型清洗无人机在城市建筑小场景的应用潜力 [2] 无人机应急救援应用 - 展会展示无人机消防作战单元车、智能遥控救援担架、飞行救生圈等应急救援产品 [3] - 浙江俱星动力科技展出内嵌四旋翼的飞行救生圈,可远程遥控并自动识别落水者 [3] - 龙翼航空无人机消防作战单元车配备长航时侦察无人机和三架投弹灭火无人机,单次覆盖火场面积500平方米,效率提升5倍以上 [3]
重磅!2025年中国及部分省市多模态大模型行业政策汇总及解读(全)政策鼓励多模态大模型应用场景创新
前瞻网· 2025-05-26 11:25
政策历程与核心观点 - 2023年地方政策从算力角度切入,鼓励大模型技术体系发展和应用场景创新,广东、北京、上海率先行动 [1] - 2024年地方政策围绕"高效办成一件事"提升政务效率,2025年政府工作报告首次写入"支持大模型广泛应用",强调国产算力底座的全链发展 [1] - 国家层面通过"人工智能+"行动促进数字技术与制造、市场结合,支持智能终端及装备发展,推动数据标注规模化标准化 [4] 国家层面政策汇总 - **规范性政策**:2025年3月《人工智能生成合成内容标识办法》要求平台审核AI内容标识,9月实施国家标准 [5] - **鼓励类政策**:2024年12月《中小企业数字化赋能专项行动方案》建设垂直行业大模型,强化中小企业技术供给 [5] - **支持类政策**:2024年1月国务院推动大模型优化政务服务,发改委研究降低大模型算力消耗 [5] - **规划类政策**:2023年5月《科技成果赋智中小企业专项行动》推动智能技术供给,2022年10月虚拟现实计划发展多节点算力设施 [6][7] 重点国家政策解读 - 《新一代人工智能发展规划》设定"三步走"目标:2025年部分技术世界领先,2030年总体领先 [7][8] - 《"数据要素×"三年行动计划》目标2026年打造300+应用场景,数据产业年均增速超20%,覆盖12个重点领域 [11] 省市政策汇总 - **广东**:2023年11月研发千亿级通用大模型,构建多模态垂直领域模型 [13] - **北京**:2025年目标形成3-5个基础大模型、100个行业模型、1000个案例 [14] - **上海**:2027年吸引100+大模型生态企业,构建算法评测体系 [14] - **深圳**:2024年建成4000P FLOPS智算中心,推动工业上楼项目配建 [13] 省市发展方向 - **浙江**:2024年14项措施覆盖算力设施、模型生态、实体经济赋能 [13] - **江苏**:2023年重点研究AI基础理论,突破跨媒体智能、内容生成等技术 [13] - **安徽**:2023年加快智算中心建设,开放大模型应用场景 [13] - **宁夏**:2024年运用大模型建设政务服务知识库,实现智能客服 [13]
2025年中国多模态大模型行业主要模型 主要多模态大模型处理能力表现出色【组图】
前瞻网· 2025-05-22 16:58
多模态大模型技术概述 - 视觉+语言多模态大模型的主流方法是通过预训练的大语言模型和图像编码器结合图文特征对齐模块实现跨模态理解减少对高质量图文对数据的依赖[1] - 行业主要上市公司包括阿里巴巴百度腾讯科大讯飞万兴科技三六零昆仑万维云从科技拓尔思等[1] CLIP模型技术特点 - CLIP采用对比学习方法连接图像和文本特征通过文本编码器实现zero-shot视觉分类[2] - 使用句子模板(prompt engineering)作为分类标签显著提升效果例如"A photo of a..."的句式结构[2] Flamingo模型架构 - Flamingo整合CLIP与语言模型新增技术使模型能基于视觉和文本输入生成文本响应[5] - 训练使用4类数据集包括2种(图像文本)对1种(视频文本)对及交错图像文本数据集[5] BLIP模型创新 - BLIP统一视觉语言任务的理解与生成能力通过自监督引导学习增强跨模态性能[7] - 相比CLIP新增图像生成视觉问答图像描述等复杂任务处理能力[7] LLaMA多模态实现 - LLaMA采用CLIP ViT-L/14视觉编码器+语言解码器架构通过映射矩阵将视觉特征转化为Token[8] - 可替换基础映射层为gated cross-attention或Q-former等复杂网络提升性能[8] 行业研究资源 - 前瞻产业研究院提供《全球及中国多模态大模型行业发展前景与投资战略规划分析报告》[10] - 其他服务包括产业新赛道研究IPO咨询专精特新企业申报等解决方案[12]