多模态技术
搜索文档
OpenAI发布最强编程模型,科创AIETF(588790)近10日“吸金”合计超3亿元
新浪财经· 2025-11-20 10:49
指数与ETF表现 - 截至2025年11月20日10:24,上证科创板人工智能指数下跌0.64%,成分股中石头科技领涨0.64%,福昕软件领跌3.13% [1] - 科创AIETF(588790)当日下跌0.67%,报价0.75元,但本月以来累计上涨0.81% [1] - 科创AIETF盘中换手率为1.45%,成交额8899.80万元,近1年日均成交额为3.92亿元 [1] 产品规模与资金流向 - 科创AIETF近半年规模增长30.11亿元,呈现显著增长态势 [3] - 科创AIETF最新份额达到81.37亿份 [4] - 近10个交易日内该ETF有7日实现资金净流入,合计流入3.12亿元,日均净流入3123.48万元 [4] 指数构成与权重 - 上证科创板人工智能指数选取30只科创板中为AI提供基础资源、技术及应用支持的上市公司证券作为样本 [4] - 截至2025年10月31日,指数前十大权重股合计占比70.92%,包括澜起科技、金山办公、寒武纪等 [4] 行业技术动态 - OpenAI于2025年11月19日推出GPT-5.1-Codex-Max智能体编程模型,提升了长远推理能力、效率和实时交互能力,并取代旧版成为Codex集成界面默认模型 [1] - 谷歌于11月18日发布新一代大型语言模型Gemini 3,并已部署至谷歌搜索的AI模式、Gemini应用等核心产品 [1] 技术演进与投资机会 - Gemini 3 Pro在多模态理解和逻辑推理两大关键能力上显著提升,其中多模态性能具有显著领先优势 [2] - 智能体相关能力在长文本检索、任务流程规划方面形成亮点,结合模型能力和开发平台升级,能更好支持细分场景的智能体开发落地 [2] - 模型发展带来了以多模态为代表的应用机会,同时催生了对算力的新需求 [2]
中信证券:建议关注以多模态为代表的应用机会 同步关注模型发展带来的算力新需求
智通财经网· 2025-11-20 09:00
文章核心观点 - Google发布最新基座模型Gemini 3 Pro,其多模态理解和逻辑推理两大关键能力显著提升,多模态性能表现达到领先水平 [1] - 模型围绕Agent开发、代码生成、用户交互等关键能力持续升级,在主流测试集上达到领先水平,目前已全面向Search、Gemini app、AI Studio、Vertex AI、Google Antigravity等渠道开放 [1] - 建议关注以多模态为代表的应用机会,同步关注模型发展带来的算力新需求 [1][8] 多模态能力 - Google将Gemini 3 Pro定位为"世界最好的多模态理解模型",强调其综合利用多种模态信息进行推理思考的能力 [2] - 在理解+推理测试集MMMU-Pro/Video-MMMU上分别得分81.0%/87.6%,较GPT-5.1的76.0%/80.4%有明显提升 [2] - 在测试GUI交互能力的ScreenSpot-Pro测试集上正确率达到72.7%,大幅超越Claude Sonnet 4.5的36.2% [2] - 模型多模态能力是从最初开始构建,原生多模态架构创新带来性能显著领先 [1][2] 推理能力 - Gemini 3 Pro在主流推理测试集上性能优异,GPQA Diamond测试集上得分91.9%,略微领先于GPT-5.1 [3] - HLE测试集上无工具调用正确率达到37.5%,较GPT-5.1的26.5%有明显提升 [3] - 深度思考模式下模型在HLE测试集上正确率进一步提升到41%,ARC-AGI-2成绩为45.1%,大幅超越GPT-5.1的17.6% [3] - SimpleQA Verified测试集上正确率达到72.1%,较GPT-5.1的34.9%有大幅领先,反映模型知识丰富度和信息准确性提升 [3] Agent能力 - 模型工具调用能力与GPT-5.1、Claude 4.5 Sonnet相比有小幅领先,任务规划能力表现更好,支持100万Tokens上下文窗口长度 [4] - 长上下文精确检索测试集性能大幅领先,结合推理和多模态理解能力升级,展示更丰富的Agent开发潜力 [4] - 发布全新Agent开发平台Google Antigravity,整合模型、代码助手、外部工具、可视化开发环境等,覆盖完整端到端开发工作流 [6] 编程能力 - 在swe-bench verified等关键测试集上与Claude 4.5 Sonnet能力相近,更多侧重网页UI为代表的前端开发能力 [4] - WebDev Arena上得分达到1487,超越GPT-5.1和Claude 4.5 Sonnet等模型 [5] - 通过实时的用户界面改造能力,Google Search可以用视觉结合文本的方式更有效阐述结论 [5] 生态系统 - To C端将Gemini App作为统一入口,当前Gemini app MAU超6.5亿,超过70%的Google Cloud用户使用Google的AI服务 [6] - 超过1300万开发者使用Gemini模型进行应用开发,通过丰富的Agent工具提升用户粘性 [6] - To D端通过Google Antigravity平台培育丰富Agent生态,将开发者思路快速转化成可落地的Agent产品 [6]
增长超200%,MaaS能让企业级AI“照进现实”么?丨ToB产业观察
钛媒体APP· 2025-11-07 13:50
中国AI大模型与MaaS市场概况 - 2024年中国AI大模型解决方案市场规模达34.9亿元人民币,同比增长126.4% [2] - 2024年中国MaaS(模型即服务)市场规模达7.1亿元人民币,同比激增215.7% [2][6] - MaaS市场预计2024至2029年将以66.1%的年均复合增长率高速扩容,2029年市场规模预计达90亿元人民币 [6] 企业级AI应用面临的挑战 - 英伟达预测2030年全球AI基础设施开支将达3-4万亿美元,2025-2030年复合增长率达38%-46% [3] - 单一企业大模型训练单次成本常超百万元人民币,推理阶段算力消耗为持续刚性支出 [3] - 为100万用户提供AI个性化学习服务的教育机构,仅GPU租赁费用每年需数千万元人民币 [3] - 中小企业AI平均投入仅320万元人民币,不足大型企业的十分之一 [4] - 某能源企业千卡级算力池因缺乏统一纳管工具,算力利用率不足40% [5] - 传统模式下,新模型适配周期长达1至4周,MoE类模型因结构复杂耗时更久 [5] MaaS模式的优势与价值 - MaaS通过“技术优化+模式创新”显著降低企业AI应用综合成本,使低成本规模化成为可能 [2][6] - 采用MaaS模式的企业,AI投入回报率较传统模式提升2至3倍,金融行业达4倍以上 [7] - MaaS服务商通过大规模采购与国产算力适配降低硬件成本,硅基流动使用华为昇腾卡推理成本比英伟达低50%以上 [7] - 动态扩缩容技术可根据业务量实时调整算力资源,某电力巨头采用前算力利用率仅35%,夜间闲置算力占比达60% [3][7] - MaaS通过低代码界面与可视化仪表盘降低应用门槛,某电力巨头实现非技术人员参与Agent开发,日Token消耗达百亿级 [8] - 硅基流动MaaS平台支持异构算力统一纳管,实现dense类模型当天上线、MoE类模型1至2天适配,较行业平均周期缩短80%以上 [8] MaaS市场格局与发展趋势 - 2025年上半年公有云大模型调用量达536.7万亿Tokens,较2024年全年增长近400% [10] - 市场呈现“头部引领、多元竞争”格局,火山引擎2025年上半年以49.2%的Token调用量份额位居第一 [10] - 硅基流动MaaS平台积累超700万用户,适配DeepSeek V2后单月用户从50万激增至500万 [10] - 私有化部署主要服务央国企或大型企业,硅基流动已完成某电力巨头、某石化等头部案例落地 [11] - 百度智能云服务超600家金融客户,并与国家电网联合打造“光明电力大模型” [11] - 预计2027年中小企业MaaS渗透率将从当前30%提升至60% [11] - MaaS服务正从单一模型调用向“AI Agent+多模态”综合平台演进,未来将成为企业智能生产力核心载体 [12]
物流三巨头抢滩具身智能赛道
每日商报· 2025-11-07 06:24
行业趋势:物流装备巨头跨界布局具身智能 - 杭叉集团、井松智能、中力股份三大物流装备企业先后发布人形机器人产品,物流领域正成为人形机器人规模化落地的场景 [1] - 人形机器人、大模型等新技术成为物流行业升级的最新驱动力,将推动智能物流建设达到更高水平 [3] - 过去十年自动叉车、自动导向车等装备的自动化能力已无法满足日益增长的物流需求,人形机器人的“泛化适应能力”成为行业新焦点 [3] 公司动态:产品发布与技术突破 - 杭叉集团发布首款“杭叉X1系列物流人形机器人”,可承担料箱搬运、堆垛和原箱拆垛等作业,导航精度达毫米级,能在非结构化环境中实现“手、脚、眼、脑”协同 [1] - 井松智能展出自研“轮足式人形机器人”,支持30kg负载,兼容物料转运、拣选、码垛等场景,兼具轮式移动高效和足式移动适配性,可通行阶梯等复杂场景 [2] - 中力股份发布“具身物料移动机器人”并首次搭载机械手臂,标志着从传统搬运迈向“全场景自主操作”阶段,并计划在“双十一”全球首发专为仓储拣料设计的“袋鼠”机器人 [2] 技术演进:从概念走向现实的能力跃迁 - AI大模型和多模态技术进步使人形机器人具备理解、决策与交互能力,可自主识别物料、动态规划路径、与人协同工作,实现传统自动导向车无法完成的跃迁 [3] - 杭叉集团通过控股子公司杭叉智能收购国自机器人,增强了公司在移动机器人算法和软件方面的技术创新能力 [2] - 人形机器人能够模拟人工实际作业,完成物流场景中的高频作业,其动作方式更贴近人类,实现柔性替代与人机协作 [1][2] 应用前景:解决特定场景痛点 - 人形机器人可解决现有自动化方案无法匹配的细分领域,如货车装卸货环节、窄巷道或狭小空间的物料搬运 [4] - 人形机器人与智能物流专用设备的协作有望推动智能物流建设上升到新的高度 [4]
AI如何将旅游业推向“价值奇点”?比利信息从“西湖+”实践开始
36氪· 2025-11-06 17:49
行业趋势转变 - 旅游科技创新焦点正从“行前”的规划、预订环节转向解决“旅途中”碎片化、即时发生的体验瞬间 [1] - 人工智能在文旅行业的角色发生两方面转变:从辅助决策工具向能主动识别场景、触发体验的智能运营体转变;从支撑运营效率走向驱动商业增长的核心引擎 [1] - 行业底层逻辑正从“静态展示”的“智慧景区”向“动态经营”的“智能增长”重塑,让内容、流量、供给形成实时循环 [11] 公司项目核心能力 - AI旅行智能体“泡泡爱旅行”项目将AI能力定位在“旅程中”,基于游客实时位置、气候变化及兴趣偏好,结合地图与相机多模态输入生成即时推荐 [4] - 通过“情境感知+权益触发”机制,AI具备即时理解旅程环境的能力,例如高温天气推送冷饮券,乘船时自动激活语音导览,靠近热门拍摄点提示最佳机位 [6] - 在真实空间搭建“可感知流量网络”,于西湖片区278艘摇橹船、餐厅等高频觅景点设置二维码入口,游客行为数据被实时识别、分析、再分发 [6] 商业模式创新 - 引入RaaS(Result as a Service,结果即服务)模式,AI系统以提升销售额为目标,与景区按结果分成,技术方从“系统交付者”变为“经营共创者” [10] - 该模式让景区与技术公司在同一条增长曲线上绑定利益,推动行业价值链再分配,可能成为AI时代文旅数字化的主流趋势 [10] - 产品设计从“单一门票”转向“体验融合”,策划如“汉服写真+门票”等组合产品,提升游客参与度并带来新收入增量 [7] 项目运营成效 - 2025年上半年,部分低热度景区游客流量与门票收入显著提升,例如万松书院门票收入增长率达40.9% [6] - AI不仅改变了游客路径,更在重构景区的流量分布与商业结构,使冷门景点通过推荐获得二次曝光 [6] - AI开始在“商品供给”逻辑中扮演角色,而不仅是在“推荐”层面,以更低运营成本触发更高转化效率 [9] 公司战略与发展 - 公司历经酒店电视系统服务、旅游新媒体平台、AI智能体生态构建三个阶段,2023年完成2.1亿元A轮融资 [13] - 以杭州西湖项目为样板,计划未来两年内将智能体服务拓展至成都、无锡、三亚等核心目的地 [13] - 公司认为AI的核心竞争力将在于其“理解人”的能力,即基于行为数据重构供给体系,在现场实时生成运营动作 [11]
AI破晓前,最早动身的人
投资界· 2025-10-30 16:36
中国AI产业路径演变 - 中国经济结构处于"腾笼换鸟"阶段,科技驱动成为新主线,代表"新质生产力"的"三新"经济占比稳步提升[7] - 中国AI创业者依托活跃的开源生态、庞大多元的应用场景与完整供应链,凭借高性价比硬件和智能体能力竞争,呈现与美国闭源高成本模式"双轨并行"之势[7] - DeepSeek以"高性能、全开源"路径出圈,证明中国AI可在全球范围做Tier 1竞争者,改变战局走向[8] 蓝驰AI投资五大趋势 - 国内以开源为主的大语言模型开发策略形成"飞轮效应",通过开源模式降低单位成本,提高采用率,加速模型迭代[9][10] - 强化学习日臻重要,拓展大语言模型的智能范围和密度,实现从"图书馆学习"到"实践中学习"的转变[10] - Agentic System具备自主性并释放基础模型潜力,帮助利用基础模型力量交付结果而不只是答案[10] - AI Coding能力外溢成为推动个性化应用爆发式增长的重要因素[10] - 多模态技术推动各类人工智能应用蓬勃发展[10] 蓝驰AI投资版图布局 - 投资版图覆盖模型及应用层、具身智能、AI硬件、底层基础设施,包括月之暗面、智元机器人、VITURE、PPIO等头部项目[5][14] - 2023年参与月之暗面A1轮融资,关键决策依据是创始人杨植麟的人才密度,其新模型"Kimi K2"被Nature评价为"另一个DeepSeek时刻"[13] - 2024年1月出手GenSpark天使轮,其24人团队发布新功能Super Agent后45天内创下3600万美元ARR[13] - 重注具身智能赛道,2023年投资银河通用机器人和智元机器人,2024年联合领投它石智航1.2亿美元天使轮创行业纪录[15] 科技投资策略与生态建设 - 投资策略基于对"什么在驱动人工智能底层变革"的整体思考,真正机会在于比别人更早看清结构性变化[17] - 坚持"押头部、投最前沿"策略,在月之暗面A1轮第一个给出TS,在银河通用、智元机器人等项目早期投资多轮加注[17] - 推出创业者生态品牌"不鸣Booming",打造创业DAO生态,其中不鸣创业营录取率仅9%[18] - 顶尖华人技术人才回流趋势明显,新一代创业者年轻、高学历、成就卓越且具有全球化视野[15]
OCP峰会推动AI技术发展,我国卫星互联网组网加速
2025-10-19 23:58
行业与公司 * 纪要涉及光通信、卫星互联网、液冷技术、国产算力、海外算力及AI应用等多个行业[1] * 具体提及的公司包括中兴通讯、通宇通讯(子公司红晴科技)、英维克、寒武纪、亿联网络、世嘉公司、旭创、新易盛、英伟达、OpenAI、谷歌等[1][3][5][6][7][11][12][13][14] 核心观点与论据 光通信与网络设备 * 光模块市场受益于AIG技术发展,OCP会议推动相关技术[1][2] * 中兴通讯交换芯片和CPU被低估,其51.2T交换芯片及5纳米制程珠峰CPU芯片预计明年量产销售,将显著增收增利,公司估值有望从约20倍提升至30倍或更高[1][3] * 光通信行业业绩强劲,世嘉公司净利润同比增长超30%[3][13] * 旭创和新易盛在第三、第四季度1.6T产品开始放量,800G产品出货提升,明年800G和1.6T产品需求逐渐清晰,有加单行为[3][13] * 尽管中美贸易摩擦导致市场波动,但明年光模块的量价需求呈现不降反升的状态,基本面依然向上[2] 卫星互联网 * 卫星互联网投资建设加速,G60、千帆等公司发射新星座[1][5] * 民营火箭公司蓝箭航天预计11月上旬进行朱雀二号火箭发射尝试,南京航天可回收火箭朱雀三号也将在11月中旬发射[5] * 通宇通讯子公司红晴科技将受益于卫星互联网赛道发展,包括天线与地面站建设[1][5] 液冷技术 * 液冷技术受关注,英维克第三季度业绩显示毛利率与净利润提升[1][6] * 今年液冷处于0~1阶段,明年海外液冷利润贡献预计逐步兑现[1][6] * 全球液冷市场规模预计达千亿人民币[1][6] 国产算力 * 国产算力领域应关注寒武纪等芯片巨头业绩放量节奏[1][7] * 亿联网络第三季度业绩环比同比均有增长,产能向海外转移,预计明年实现30多亿利润,对应不到15倍PE,加上约5%的股息率,是稳健标的[1][7][8] 海外算力与AI应用 * OCP大会明确硬件更新目标,包括功率、连接网络及液冷[1][9] * AI大发展背景下,超节点或大网络集群需求增加,参数扩张趋势明显[1][9] * 明年多模态技术预计将进一步扩展,需要大规模集群支持[10] * 英伟达发布了CPX和SkyCross等硬件更新,展示GPU数量增加后的能效变化及推理需求[11] * OpenAI更新导购功能实现变现,并预告12月发布新产品,显示AI应用持续落地[12] * 谷歌模型测试版已发布,关注Gemini 3.0模型发布预期[14] 其他重要内容 * 中兴通讯服务器业务今年营收预计达到250亿至300亿,相较去年的100亿有显著增长[4] * 在OCP大会上成立了伊桑组织,共同推进标准化Scratch层面的共识[10]
公司问答丨云从科技:在文生视频与生成式人工智能(AIGC)领域 公司已开展相关布局
格隆汇APP· 2025-10-11 17:36
公司技术布局 - 公司在文生视频与生成式人工智能领域已开展相关布局,重点聚焦于AI驱动的虚拟数字人技术及平台建设 [1] - 公司推出的数字人产品"云月"已上线,融合了自主研发的语言、视觉及跨模态大模型等核心能力 [1] - 公司将持续跟踪Sora等新型视频生成技术的突破,并积极探索多模态技术在实际应用中的创新融合 [1] 产品应用场景 - 公司数字人产品及AIGC技术的应用场景涵盖虚拟直播、智能客服、动画内容及视频创作等 [1] - 数字人产品"云月"可实现数字人生成与多类型内容生产 [1]
云知声入通迎估值重估:借Sora2东风,AGI龙头前景可期
搜狐财经· 2025-10-08 15:46
公司资本市场表现与财务业绩 - 公司于2025年6月30日登陆港交所,被称为“港股AGI第一股”,并于同年9月被纳入恒生综合指数及港股通标的 [1] - 2025年上半年营业收入达4.05亿元,同比增长20.2% [1] - 大模型相关业务收入同比激增457.4%至9876万元,占营业收入比重接近25% [1] - 医疗业务单客户收入同比大增116.2%,保险行业理赔审核服务收入暴增1386.8% [1] - 丽奥资产管理给予公司“买入”评级,目标价为915.39港元 [1] - 2022-2024年,公司营收复合年增长率达25% [4] 技术发展与战略布局 - OpenAI发布的Sora2实现了“物理现实交互”能力与画面音效精准同步,标志着多模态技术进入“物理可信”阶段 [2] - 公司打造的“云知大脑”整合了多模态感知与生成、知识图谱、物联平台等核心组件 [2] - 公司通过大模型蒸馏技术将模型参数压缩至0.5B以内,实现了高性能、低延迟的端侧部署,并应用于吉利博越L等车型的智慧座舱 [2] - 公司的“云端一体+多模态融合”技术架构可与Sora2的API开源生态形成互补 [2] - 医疗行业专用大模型UniGPT-Med-U1在MedBench测评中稳居第一,可将医学影像、病历文本与语音诊断数据深度融合 [3] - AI芯片累计出货量已突破1亿颗 [4] 商业化应用与市场拓展 - 公司业务聚焦医疗与日常生活两大核心场景,其“AI+行业”模式展现出高成长性 [1][3] - 在智慧医疗领域,多模态技术可为临床诊疗提供支持,未来结合Sora2能力可实现手术AI模拟演示和病情动态可视化 [3] - 在智慧座舱领域,现有语音交互系统与Sora2的场景生成技术结合,能根据用户指令生成个性化出行场景视频 [3] - 公司与广西卫健委达成战略合作深化“AI+医疗”落地,并通过共建东盟总部项目与瓦努阿图政府合作将技术推向国际市场 [3] - 公司发展受益于《国务院关于深入实施“人工智能+”行动的意见》的政策指引 [3] 行业趋势与公司定位 - Sora2的发布被业内称为“创造力领域的ChatGPT时刻”,揭开了多模态竞争的序幕 [2][4] - 公司被市场视为AI赛道中为数不多的稳健标的,其估值逻辑聚焦于作为AGI时代领跑者的长期潜力 [1][4] - 公司凭借十三年技术积淀、清晰的商业化路径与资本市场加持,站在新的增长起点 [4] - 公司发展战略为“技术研发为核、行业应用为翼、资本助力为桥”,旨在将技术浪潮转化为商业价值 [5]
“技术引领+临床实践”双轮驱动 商汤医疗助力病理数智化转型
中国新闻网· 2025-09-24 13:42
行业挑战 - 病理诊断面临数据复杂多样、专业人才短缺、诊断标准不一的共性挑战 [1] 技术解决方案 - 公司以医疗大语言模型"大医"为智慧中枢 融合原创病理大模型PathOrchestra及影像基模型等多模态技术 [1] - 打造通专融合技术体系 实现对病理图像、文本报告及临床信息的高效融合与协同理解 [1] - 通过三大技术平台协同实现采-存-管-用-研全链路闭环的智慧病理综合解决方案 [3] 技术应用 - 采用技术引领+临床实践双轮驱动模式 展示病理大模型性能 [1] - 凸显人工智能技术在真实医疗场景中的应用价值 [1] - 探索数字病理与人工智能技术的交叉融合 持续攻坚多模态大模型关键技术 [3] 发展路径 - 以模型筑基-平台赋能-生态共建为路径 推动医疗大模型从技术可行到临床好用发展 [3]