多模态大模型
搜索文档
(经济观察)业界人士热议:文旅行业将率先拥抱人工智能
中国新闻网· 2025-05-08 23:09
中新社上海5月8日电 (记者郑莹莹)上海徐汇区"AI+文旅生态成长计划"8日在模速空间内启动。参与活动 的业界人士认为,对于拥抱人工智能技术,文旅行业更具包容度。 "工业等领域的应用场景需要非常高的准确率,但文旅场景对于这类新科技的包容度是比较高的。比 如,机器人表演有时还会摔跤,对此大家其实是能包容的。"上海魂伴科技有限责任公司(简称:魂伴科 技)合伙人金成思说。他认为,文旅场景有望率先实现人工智能应用落地。 魂伴科技在2025年4月举办的2025上海龙华庙会上展示人形机器人应用。 中新社记者郑莹莹摄 魂伴科技在今年4月举办的2025上海龙华庙会上"秀"了一把机器人,吸引了沪上众多市民游客围观。这 对金成思触动很大:"当时机器人的表演其实并没有往日视频里酷炫,但市民游客仍觉得比在网络视频 里看到的更好、更真实,现场有些老年市民看到现实版人形机器人后,还期待它未来能帮忙养老。" 这让他思考,也许更重要的是让更多市民有机会了解、接触机器人。"我们要让机器人产品从实验室里 走到广场上,了解市民的需求,哪怕让机器人出洋相。如此,我们才能知道我们差的是什么。" 上海稀宇科技有限公司的公共事务副总裁严奕骏也看好文旅领域 ...
国泰海通|电子:从“能动”到“灵动”,机器人智能化步入新篇章
国泰海通证券研究· 2025-05-08 21:18
投资建议。 人形机器人高速发展,具身智能是驱动商业化落地的核心因素。机器人智能水平以及实时控制 性能提升将驱动感知性能、算力、通信效率等需求增长,端侧传感、驱控及通信芯片将充分受益。具身智 能落地打开人形机器人成长空间,未来应用前景广阔,带动整机厂商业绩上行。 报告导读: 具身智能是人形机器人商业化落地核心,多模态、强化学习加速智能进化,感 知传感迭代革新, EtherCAT 赋能高速通信,端侧算力持续升级。 本文摘自:2025年5月8日发布的 从"能动"到"灵动",机器人智能化步入新篇章 舒 迪 ,资格证书编号: S0880521070002 更多国泰海通研究和服务 亦可联系对口销售获取 重要提醒 本订阅号所载内容仅面向国泰海通证券研究服务签约客户。因本资料暂时无法设置访问限制,根据《证 券期货投资者适当性管理办法》的要求,若您并非国泰海通证券研究服务签约客户,为保证服务质量、 控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的 不便表示诚挚歉意,非常感谢您的理解与配合!如有任何疑问,敬请按照文末联系方式与我们联系。 法律声明 市 场空间超万亿,实现具身智能是商业化落 ...
国泰海通:具身智能驱动人形机器人商业化落地 算法突破等成行业上涨催化剂
智通财经网· 2025-05-08 15:56
行业前景 - 具身智能是人形机器人商业化落地核心因素 驱动感知性能、算力、通信效率等需求增长 [1] - 人形机器人潜在应用场景覆盖生产制造、社会服务、危险作业等领域 对人类社会适配性高 [1] - 2024-2028年中国人形机器人智能水平整体处于Lv1 少部分产品向Lv2探索 市场规模不足百亿元 [1] - 2045年以后中国人形机器人市场规模有望突破万亿元 [1] 技术发展 - 多模态大模型提高人机交互效率 英伟达GR00T、特斯拉Grok3整合多模态感知 提升交互及决策精度 [2] - 优必选基于DeepSeek-R1研发具身推理大模型 预期可实现复杂环境中准确高效反应和决策 [2] - 强化学习成为运动算法主要范式 基于奖励函数实现步态、奔跑等运动高效学习并增强泛化能力 [2] - 纯视觉+六维力传感器+电子皮肤有望成为传感器标准方案 显著降低硬件成本并提高感知灵敏度 [2] 基础设施 - EtherCAT具备高实时性、低延迟与高同步性 通信延迟由CAN协议的毫秒级降至微秒级 预计成为主流通信协议 [2] - 机器人智能向具身智能演进 端侧算力需求持续增长 驱动端侧芯片性能升级 [2]
【行业前瞻】2025-2030年全球及中国多模态大模型行业发展分析
搜狐财经· 2025-05-07 11:45
多模态大模型行业概述 - 多模态大模型能够处理、理解和生成多种类型数据(如文本、图像、音频、视频等),通过跨模态语义对齐实现不同模态数据的无缝连接和理解 [1] - 应用领域包括自然语言处理、图像识别、语音识别、智能驾驶、医疗影像诊断等 [1] - 行业主要上市公司包括阿里巴巴、百度、腾讯、科大讯飞、万兴科技、三六零、昆仑万维、云从科技、拓尔思等 [1] 多模态大模型产业链 - 产业链分为基础层、模型层和应用层 [1] - 基础层主要包括硬件和基础软件 [1] - 模型层包括CLIP、BLIP、BLIP-2、dreamLLM、LLaMA、LLaVA、flamingo、mini-GPT4等 [1] - 应用层涵盖生产制造、生活娱乐、公共服务等领域 [1] 多模态大模型产品成本 - 国内主流大模型训练成本在数千万至数亿美元级别,百度文心、阿里通义、腾讯混元等大厂模型投入超2亿美元 [3] - 创业公司如Kimi、DeepSeek训练成本在3000-6000万美元之间 [3] - 云托管成本受模型规模影响显著,大厂依托自有云平台降低成本,初创公司依赖多云弹性部署 [3] - 具体成本示例:盘古大模型训练成本≥1亿美元,文心大模型≥3亿美元,混元大模型≈2.5亿美元,通义大模型≥2亿美元 [5] 全球多模态大模型行业发展历程 - 早期探索期(1956年-2005年):人工智能学科诞生,神经网络模型开始发展 [6] - 快速成长期(2006年-2019年):深度学习概念被重新引入,Transformer等模型推动行业进步 [6] - 大模型兴起期(2020年-2022年):参数规模迅速扩大,2022年被视为大模型元年 [6] - 广泛应用期(2023年至今):大模型在各领域深度应用不断拓展 [6] 全球大模型算力需求 - 人工智能依赖"强算法、高算力、大数据"支持,模型大小和参数量直接影响智能涌现质量 [9] - GPT-3大模型训练参数量为1750亿,算力消耗为3640PF-days,需要至少1万片GPU支撑 [9] - 模型参数扩大十倍时,算力投入将超过十倍 [9]
【投资视角】启示2025:中国多模态大模型行业投融资及产业基金分析(附投融资事件、投资类型和兼并重组等)
前瞻网· 2025-05-06 16:08
多模态大模型行业投融资概况 - 行业核心公司包括阿里巴巴、百度、腾讯、科大讯飞、三六零、云从科技等[1] - 2025年投融资呈现爆发式增长,前4个月投融事件17件,金额达16亿元,超过2024年全年11件/5.16亿元的水平[1] - 2021年曾出现单笔高峰,5件事件融资金额达19.1亿元[1] 投融资事件明细 - 2025年代表性融资案例:爱芯元智C轮10亿元(宁波通商基金领投)、红熊AI天使轮1800万元、海豚智能种子轮数千万元[4] - 2024年大额融资包括:百川智能A2轮28.24亿元(阿里巴巴等参投)、月之暗面股权投资3亿美元(腾讯领投)、MiniMax股权投资6亿美元[6] - 早期融资占比达60%,种子轮至B+轮为主流,典型如云梧智能Pre-A轮数千万元、原力灵机天使轮2亿元[4][7] 投资主体与地域分布 - PE/VC占投资主体58.3%,企业投资者占27.8%,CVC仅2.6%(含百度风投、美团龙珠等)[8] - 北京吸纳50%投资案例,深圳占10%,上海占8%,宁波/三亚/苏州因营商环境优势吸引部分项目[10] - 主要投资机构包括宁波通商基金(管理规模超900亿元)、中关村协同基金(规模50亿元)、两江基金(556亿元)等[13][15] 行业发展趋势 - 技术处于萌芽期,融合文本/图像/语音等多数据类型,应用场景覆盖办公、教育、企业管理等领域[16] - 投资方重点关注商业化路径清晰度与垂直行业应用能力,偏好"投新投早投小"策略[17][18] - 国资背景机构(如中关村投资集团)与科技巨头(阿里/腾讯)构成主要资本力量[17]
多模态技术爆发元年,行业应用如何落地?
AI前线· 2025-05-06 12:25
作者 | AICon 全球人工智能开发与应用大会 策划 | 李忠良 编辑 | 宇琪 近年来,多模态大模型技术发展迅速,展现出强大的视觉理解能力,显著提升了 AIGC 的可控 性,各行各业正经历从"人工密集型"到"AI 原生驱动"的颠覆性变革。那么,多模态技术中面临哪 些核心技术挑战?在 AIGC 技术落地过程中,会产生什么新的应用场景?大模型的下一阶段突破 可能来自哪些方向? 近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了 上海交通大学人工智能学院副教授赵波担任主 持人,和快手快意多模态模型算法负责人高欢、腾讯混元专家研究员邵帅一起,在 AICon 全球人工智 能开发与应用大会 2025 上海站即将召开之际,共同探讨多模态大模型如何开启智能交互新篇章。 部分精彩观点如下: 在 5 月 23-24 日将于上海举办的 AICon全球人工智能开发与应用大会 先训练一个大模型,再用它来蒸馏小模型或减少推理步数,比直接训练小模型或低步数模型效果 更好。 现阶段,比起通用模型,针对特定业务场景定制化的垂直领域模型仍是更优选择。 如果单纯为了追求效果而无限制地扩大模型规模,虽然可能获得性能提升,但投入产出比 ...
一文了解中国音频行业发展现状及未来前景趋势预测(智研咨询发布)
搜狐财经· 2025-05-03 14:18
行业概述 - 音频是指人耳能够感知的声音信号,频率范围在20赫兹到20000赫兹之间,通过物体振动产生的机械波传播并被听觉神经感知 [2] - 音频信号形式可分为模拟音频和数字音频 [2] 行业发展历程 - 萌芽期(1996-2005年):广东珠江经济广播首次网络实时广播,苹果公司引入播客概念 [4][5] - 探索期(2006-2015年):动听中国成为早期中文有声书网站,豆瓣FM、蜻蜓FM、喜马拉雅、荔枝FM等平台相继上线 [4][5] - 扩张期(2016-2019年):音频平台开放直播功能,网易云音乐、斗鱼等跨界竞争加剧 [4][5] - 成熟期(2020年至今):荔枝赴美上市,喜马拉雅提交港股上市申请,天猫精灵实现AI交互突破 [4][5] 行业产业链 - 上游:内容创作(音乐、有声读物等)、原材料(金属、塑料等)、零部件(芯片、扬声器等) [6] - 中游:音频平台 [6] - 下游:智能手机、智能音箱、车载终端等收听渠道及用户 [6] 市场规模与技术发展 - 2024年中国音频行业市场规模达287亿元,同比增长14.80% [2] - AI技术(多模态大模型、生成式AI)推动音频内容创作智能化,提升用户体验 [2] 相关企业 - 上市企业:腾讯音乐(01698)、网易云音乐(09899)、漫步者(002351)、中文在线(300364)、科大讯飞(002230) [2] - 其他企业:中文在线、掌阅科技、科大讯飞、华为、小米、阿里巴巴等 [2] 行业报告 - 智研咨询发布《中国音频行业市场研究分析及发展趋势预测报告》,涵盖产业链、市场规模及重点企业分析 [8][9][11] - 报告旨在分析音频行业市场走向,挖掘发展潜力,预测发展前景 [9][11]
2025年迈向智能驱动新纪元,大语言模型赋能金融保险行业的应用纵览与趋势展望报告-众安信科
搜狐财经· 2025-05-01 06:57
大模型技术发展与行业机遇 - 全球大模型技术发展多元化,垂类大模型通过定制化训练提供精准行业解决方案,中国在算力自主化、数据优化等方面取得进展[1][24] - 新技术降低大模型训练、运维和推理成本,推动金融行业流程重构,企业需平衡购置、推理和运维成本[1][29] - 国产大模型如DeepSeek和通义千问在成本控制与推理性能上突破,实现数据安全合规、低成本高性能和中文语义优化[1][26][27] - DeepSeek通过混合专家技术将6710亿参数活跃计算量压缩至37亿,训练成本仅为同规模模型的6%[26] - 通义千问融合预训练与垂直领域优化能力,在对话交互、代码生成等场景形成专项突破[27] - 腾讯混元T1模型解码速度提升2倍,在中英文推理基准中领先[28] 大模型赋能保险全链 - 保险机构加速接入大模型,应用聚焦内部提效,覆盖业务全链条及中后台管理环节[1][16] - 初期优先选择容错成本低的场景如智能客服、智能质检、营销助手等,建立调试与反馈机制[6][7] - 大模型推动行业由结构化数据向多源动态信息系统演进,提升风险识别广度与响应及时性[8] - 金融机构经营理念重塑,呈现金融服务精准化跃迁和跨行业生态化协同两大趋势[9] - 银行利用实时企业数据优化信贷评估,保险与医疗平台合作开发预防型保险产品[9] 合作范式演变 - 数据要素价值凸显,金融保险行业通过横向、垂直和政企协同构建高质量数据集[1][19] - 政企协同推动数据要素流通,垂直整合构建企业级智能协同底座,横向协同拓展跨场景联动[19][42] - 多模态大模型为金融保险带来智能化转型机遇,填补非结构化信息处理能力空白[62] - 多模态模型应用于智能客服、理赔审核、欺诈识别等场景,提升审核准确率与风控能力[62] - 通义干问通过双核架构实现全模态实时交互,视觉推理模块采用链式思维增强方法[53] 技术演进与成本优化 - 垂类大模型通过行业特定数据集训练,减少计算成本并提供精准解决方案[33][40] - GPT-4级别模型单周期训练成本近5000万美元,垂类模型更经济高效[33] - 国产模型生态呈现功能分化趋势,语言生成模型与推理模型分别专注语义理解和逻辑决策[48] - 轻量化技术如蒸馏模型降低终端部署成本,Qwen-32B等模型实现对OpenAI-o1-mini的局部超越[49] - 模型部署从"可用"向"可适配"迈进,聚焦跨架构柔性部署机制构建[31]
人工智能赋能千行百业 上海创新浓度提升
中国新闻网· 2025-05-01 05:59
人工智能产业孵化平台发展 - 上海市打造的人工智能大模型专业孵化和加速平台"模速空间"已入驻企业100余家,聚焦多模态大模型应用、语料创新等技术前沿议题 [1] - 平台每两周举行"AI极客夜话"活动,行业专家分享实战案例,探讨AI技术实际应用问题 [1] - 平台内设置人工智能产品体验店,展示200余款AI科技产品,涵盖智能穿戴、健康监测、音频设备等多个领域 [3] 人工智能技术研发与应用 - 多模态大模型研究者通过与产业应用端交流,更关注技术实际应用广度和用户规模 [2] - 人形机器人企业通过日常生活场景数据采集,日均完成千余条操作数据采集,用于训练机器人"新大脑" [4] - 智元机器人3月发布首款通用具身模型基座智元启元大模型(Genie Operator-1)和新款人形机器人灵犀X2 [4] 人工智能产业链发展 - 智元机器人通过人工智能和机器人技术融合创新,带动零部件产业链能力提升 [4] - 上海市聚集约25万名人工智能领域人才,创新企业和青年才俊持续增加 [4] - 人工智能技术产业应用价值核心在于实际落地效果,研究者重视与产业应用端合作 [2]
美的集团(000333):2025年一季报点评:持续拓展全球推动数智驱动
东莞证券· 2025-04-30 17:04
报告公司投资评级 - 维持对美的集团“增持”评级 [1][5] 报告的核心观点 - 美的集团2025年一季度业绩符合预期,公司持续推进“科技领先、用户直达、数智驱动、全球突破”四大战略主轴,不断深化全球化布局,建立完善研发体系,聚焦全面智能化和全面数字化,预计2025 - 2026年每股收益分别为5.61元、6.15元,当前股价对应PE分别为13倍、12倍 [1][5] 根据相关目录分别进行总结 财务数据 - 2025年一季度,美的集团实现营业总收入1284.28亿元,同比增长20.61%;归母净利润124.22亿元,同比增长38.02%;扣非后归母净利润127.5亿元,同比增长38.03% [1] - 2025年一季度,公司毛利率同比下降1.87个百分点至25.45%;期间费用率同比下降3.82个百分点至13.23%,其中销售费用率、管理费用率和财务费用率分别同比下降0.74、0.35和2.73个百分点,分别达到9.25%、6.14%和 - 2.21%;净利率同比提高1.45个百分点至9.97% [5] - 盈利预测简表显示,2024 - 2027年营业总收入分别为4090.84亿、4439.73亿、4757.15亿和5085.08亿元;归母公司所有者的净利润分别为385.37亿、430.16亿、471.48亿和515.36亿元;摊薄每股收益分别为5.03元、5.61元、6.15元和6.72元;PE分别为14.8倍、13.2倍、12.1倍和11.0倍 [6] 业务布局 - 美的集团业务遍及200多个国家和地区,美国收入占比很低,在海外设有22个研发中心和23个主要制造基地,未来将持续拓展海外制造布局,推动海外新工厂建设与投产 [5] - 公司持续加强自有品牌产品研发投入,通过本地化用户洞察与创新完善全球各区域产品布局和竞争力,2024年美的系自有品牌在多个国家和家电品类取得市场突破 [5] 技术发展 - 美的集团加速全面智能化落地,推进大模型和Agent技术探索与应用,建立家居领域语言大模型 - 美言,应用于多种产品,提供人机交互服务,实现全屋家居家电融合的深度智能控制和智能管家服务体验 [5] - 公司首次将Agent能力应用于家居场景生成,实现快速响应和可控生成效果,研究团队积极参与行业大模型技术研究,在多个国际AI会议发表多篇专业论文,拓展具身智能、多模态大模型和图像生成等领域前沿研究 [5]