多模态AI
搜索文档
谷歌nano-banana模型一致性强出圈,看好多模态场景应用提速
东方证券· 2025-09-02 09:47
行业投资评级 - 传媒行业评级为"看好"(维持)[4] 核心观点 - 谷歌最新nano-banana模型具有SOTA级图像理解与编辑能力 在人物和产品一致性上接近100% 显著提升电商和广告素材生产效率 释放更多营销预算[1] - 高一致性图像生成作为AI视频创作前置步骤 对解决视频一致性痛点有助益 推动多模态下游场景应用深化[1] - 技术突破与成本优化将加速产业趋势 带动用户增长、付费渗透和商业化提升 尤其关注多模态AI应用出海公司[2] - 年底至明年重视Meta逻辑演绎 模型能力带来的CTR提升有望推动收入增长及估值重塑[2] 投资标的 - 建议关注:快手-W(01024 买入)、美图公司(01357 未评级)、万兴科技(300624 未评级)、MiniMax(未上市)[2] - 建议跟进大厂落地测试:阿里巴巴-W(09988 买入)、腾讯控股(00700 买入)、快手-W(01024 买入)[2] 模型技术优势 - nano-banana模型位居LMArena文生图和图像编辑双榜单首位 具备三项核心能力:人物/产品一致性接近100% 元素替代能还原真实物理规律 支持数十张图片自然融合[7] - 适用于电商A/B测试批量化生产 节省商家测试成本 释放素材投放预算[7] 产业链影响 - 图像一致性对AI视频工作流有关键作用 文生图阶段的高一致性输出将提升视频生成整体效率 带动泛用户使用和行业渗透率加速[7]
三态股份涨0.85%,成交额1.14亿元,近3日主力净流入-4144.15万
新浪财经· 2025-09-01 16:00
股价表现与交易数据 - 9月1日股价上涨0.85% 成交额1.14亿元 换手率5.53% 总市值74.55亿元 [1] - 主力资金连续3日净流出 当日净流出281.66万元 行业排名第8/18 所属行业主力净流出1.19亿元 [4] - 近20日主力累计净流出1.51亿元 近5日净流出6083.83万元 近10日净流出4939.37万元 [5] 业务构成与经营表现 - 主营业务为出口跨境电商零售和第三方出口跨境电商物流 海外营收占比达99.98% [2][3] - 2025年上半年营业收入8.27亿元 同比增长3.27% 归母净利润2325.52万元 同比下滑48.75% [8] - 收入构成:兴趣爱好类28.88% 国际专线24.71% 家居生活23.64% 工具配件10.62% 潮流时尚8.66% [7] 技术创新与AI应用 - 自主研发知识产权风险检测工具"睿观·ERiC" 基于AI大数据模型提供风险监测解决方案 [2] - A+智能图片生成项目采用Stable Diffusion技术 通过文本输入生成高质量定制化图像 [2] - 多模态模型融合大型语言模型LLM和图像CV算法 为跨境电商提供产品风险检测服务 [3] 股东结构与机构持仓 - 股东户数3.12万户 较上期减少5.71% 人均流通股7023股 较上期增加6.06% [8] - 香港中央结算有限公司为第一大流通股东 持股332.85万股 较上期增持229.59万股 [9] - 中证1000ETF产品集体增持 南方中证1000ETF持股221.77万股 华夏中证1000ETF持股128.76万股 [9] 市场定位与行业属性 - 所属申万行业为商贸零售-互联网电商-跨境电商 概念板块涵盖小盘股/知识产权/AIGC等 [8] - 公司成立于2008年1月 于2023年9月28日上市 A股上市后累计派现1.10亿元 [7][9] - 技术面显示筹码平均交易成本9.73元 当前股价靠近压力位9.48元 [6]
三态股份跌0.10%,成交额2.35亿元,今日主力净流入-2986.00万
新浪财经· 2025-08-28 16:13
公司业务与战略 - 主营业务为出口跨境电商零售和第三方出口跨境电商物流 核心产品包括出口跨境电商零售业务和出口跨境电商物流业务[2] - 研发AIGC项目如A+智能图片生成项目 通过Stable Diffusion技术生成高质量图片 利用mask机制控制像素点生成概率 提升运营效率并节约制作成本[2] - 软件业务采用大型语言模型LLM和图像CV算法训练多模态模型"睿观·ERiC" 为跨境电商企业提供产品风险检测服务[2] 财务表现 - 2025年第一季度营业收入4.03亿元 同比增长3.48% 归母净利润1400.44万元 同比减少53.47%[9] - A股上市后累计派现1.10亿元[10] - 海外营收占比达99.98% 受益于人民币贬值[3] 股权与股东结构 - 股东户数3.12万户 较上期减少5.71% 人均流通股7023股 较上期增加6.06%[9] - 十大流通股东包括南方中证1000ETF持股176.65万股(较上期减少16.34万股) 香港中央结算有限公司持股103.26万股(新进) 华夏中证1000ETF持股98.23万股(新进)[10] 市场交易数据 - 8月28日成交额2.35亿元 换手率11.35% 总市值75.10亿元[1] - 主力净流出2986万元 占成交额0.13% 行业排名12/18 连续2日被主力资金减仓[5] - 主力持仓占比6.77% 筹码分布非常分散 无控盘现象[6] 行业属性与地域特征 - 所属申万行业为商贸零售-互联网电商-跨境电商 概念板块包括小盘、AIGC概念、知识产权、智慧物流、电子商务等[8] - 注册地位于深圳市南山区 属于粤港澳大湾区企业[4] - 主营业务收入构成:兴趣爱好28.88% 国际专线24.71% 家居生活23.64% 工具配件10.62% 潮流时尚8.66% 数码科技2.99% 国际邮政0.33% 商业快递0.16% 其他收入0.02%[8]
InternVL 3.5来了!上海AI Lab最新开源:硬刚 GPT-5 还把效率玩明白
自动驾驶之心· 2025-08-28 07:33
模型发布与性能 - 上海AI Lab推出开源多模态模型InternVL 3.5系列,在通用性、推理能力和推理效率方面显著提升 [2] - 通过级联强化学习(Cascade RL)框架实现更优性能,离线RL阶段确保稳定收敛,在线RL阶段进行精细对齐 [2] - 提出视觉分辨率路由器(ViR)动态调整视觉标记分辨率,结合解耦视觉-语言部署(DvD)方法优化效率 [2] - 在多个基准测试中表现领先,显著缩小与GPT-5等顶级商业模型的性能差距 [2] 模型架构与参数规模 - 模型架构包括动态高分辨率文本分词器、InternViT视觉编码器和视觉-语言连接器 [5] - 采用两阶段训练范式:大规模预训练阶段和多阶段后训练阶段 [5] - 提供多种参数规模版本,从1.1B到241B,包括密集模型和MoE模型 [3] - 最大模型InternVL3.5-241B-A28B总参数量达240.7B,其中视觉参数5.5B,语言参数235.1B [3] 训练方法与数据 - 预训练阶段使用1.16亿个样本,对应约2500亿个标记,纯文本与多模态数据比例约为1:2.5 [7] - 后训练采用三阶段策略:监督微调(SFT)、级联强化学习(Cascade RL)和视觉一致性学习(ViCO) [9] - SFT阶段使用高质量对话数据,包含来自InternVL3的指令遵循数据和"思考"模式下的多模态推理数据 [9] - 测试时扩展(TTS)方法包括深度思考(逐步推理)和并行思考(Best-of-N策略) [11] 多模态推理与数学能力 - 在MMMU基准测试中,InternVL3.5-241B-A28B达到82.7分,显著超越前代产品 [15] - MathVista基准测试中,InternVL3.5-241B-A28B获得63.9分,较InternVL3-1B的18.8分有大幅提升 [15] - 在MathVerse视觉only测试中,InternVL3.5-241B-A28B达到68.5分,相比InternVL3-1B的18.7分进步显著 [15] - 使用并行思考技术后,多个模型的数学推理能力进一步提升 [15] OCR与文档理解 - 在AI2D测试中,InternVL3.5-241B-A28B达到87.3分(无mask)和95.0分(有mask) [17] - DocVQA测试中,InternVL3.5-241B-A28B获得94.9分,优于GPT-4o的92.8分 [17] - OCRBench测试中,InternVL3.5-241B-A28B达到907分,表现优异 [17] - 在TextVQA测试中取得84.5分,超越GPT-4o的77.4分 [17] 多模态理解与幻觉评测 - MMBench V1.1英文测试中,InternVL3.5-241B-A28B获得87.4分 [21] - MMVet测试中达到81.2分,优于GPT-4o的69.1分 [21] - HallusionBench测试中获得77.9分,表现突出 [21] - 综合多模态理解能力在多个基准测试中领先 [21] 具身智能与GUI代理 - 在VSI-Bench测试中,InternVL3.5-241B-A28B达到69.5分,显著优于GPT-4o的34.0分 [29] - GUI代理任务中,ScreenSpot-v2测试获得92.9分,OSWorld-G测试达到53.2分 [27] - WindowsAgentArena测试中取得18.0分,WebArena-Lite-v2测试获得11.7分 [27] - 在具身智能体任务中表现优异,多个测试分数领先 [29] 多语言与视频理解 - 多语言MMBench测试中,英文达到87.6分,中文86.4分,表现均衡 [24] - 视频理解任务中,Video-MME测试达到72.9分(无字幕)和76.0分(有字幕) [25] - MVBench测试获得76.5分,MLVU测试达到78.2分 [25] - 在多语言和多模态视频理解方面表现全面 [24][25]
今日十大热股:华胜天成算力概念持续火热,合力泰5天4板电子纸概念爆发,歌尔股份领衔消费电子行情
金融界· 2025-08-27 11:15
市场整体表现 - 沪指跌0.39%,深成指涨0.26%,创业板指跌0.75%,两市成交额2.71万亿元,较前一日缩量约4600亿元 [1] - 全市场超2800只个股上涨,涨停个股达92只,主要集中在计算机、机械设备等行业 [1] - 消费电子、游戏、猪肉板块领涨,芯片、稀土永磁等板块回调 [1] 人气热股及热度特征 - 利欧股份热度排名第一,属液冷服务器和多模态AI概念,首板涨停 [2] - 华胜天成热度排名第二,属东数西算和信创概念,持续上榜 [2] - 领益智造热度排名第三,属同花顺果指数和智能音箱概念,2天2板 [2] - 拓维信息热度排名第四,属华为盘古和华为昇腾概念,首板涨停 [2] - 寒武纪-U热度排名第五,属中国AI 50和汽车芯片概念,热度值7.5 [2] - 歌尔股份热度排名第六,属同花顺果指数和无线耳机概念,首板涨停 [2] - 奋达科技热度排名第七,属减速器和智能音箱概念,首板涨停 [2] - 合力泰热度排名第八,属电子纸和无线充电概念,5天4板 [2] - 北方稀土热度排名第九,属稀土永磁和小金属概念,热度值6.25 [2] - 中电鑫龙热度排名第十,属东数西算和数据中心概念,首板涨停 [2] 个股核心驱动因素 - 利欧股份上半年预计净利润3.5-4.5亿元,同比扭亏,受益于持有理想汽车股票的公允价值变动及出售收益 [3] - 华胜天成作为华为昇腾生态核心合作伙伴,深度参与天津、济南等国家级人工智能计算中心建设,中报预告净利润同比大增148%-172% [3] - 领益智造通过收购江苏科达进入新能源汽车零部件赛道,加速人形机器人核心部件研发与量产,与智元机器人等企业建立深度合作关系 [3] - 拓维信息作为华为生态核心战略伙伴,深度参与鸿蒙、昇腾AI及鲲鹏等关键领域,中报归母净利润同比暴增超2200% [3] - 寒武纪-U作为国内AI芯片领军企业,二季度环比增长近100%,定增39.85亿元获上交所审核通过 [4] - 歌尔股份受益于全球智能眼镜出货量上半年同比激增110%,其中AI眼镜增长250%,收购Micro-LED厂商Plessey强化产业链布局,完成10亿元增持并启动回购计划 [4] - 奋达科技越南生产基地于7月实现大批量投产,缓解关税政策对订单交付的影响,在AI硬件领域推出下棋机器人、桌面陪伴机器人等新产品,研发投入同比大增35.9% [4] - 合力泰通过司法重整化解91.15亿元债务,资产负债率从193.91%骤降至27.52%,电子纸业务收入占比提升至67.69%,越南及德国基地投产加速智慧零售市场布局 [5]
多模态AI概念股集体走强,科大讯飞涨超5%
格隆汇· 2025-08-27 11:15
市场表现 - A股市场多模态AI概念股集体走强,开普云20CM涨停,中科创达涨超16%,岩山科技、润建股份10CM涨停,熵基科技涨超9%,科大讯飞涨超5% [1] - 开普云涨幅20.00%,总市值76.77亿,年初至今涨幅155.76% [2] - 中科创达涨幅16.48%,总市值368亿,年初至今涨幅34.36% [2] - 岩山科技涨幅10.08%,总市值415亿,年初至今涨幅84.38% [2] - 润建股份涨幅10.00%,总市值160亿,年初至今涨幅68.31% [2] - 熵基科技涨幅9.30%,总市值79.69亿,年初至今涨幅53.58% [2] - 科大讯飞涨幅5.65%,总市值1271亿,年初至今涨幅14.05% [2] 政策驱动 - 国务院印发《关于深入实施"人工智能+"行动的意见》,提出加快实施6大重点行动,包括"人工智能+"科学技术、产业发展、消费提质、民生福祉、治理能力、全球合作 [1] - 到2027年,人工智能与6大重点领域广泛深度融合,新一代智能终端、智能体等应用普及率超70%,智能经济核心产业规模快速增长 [1] - 到2030年,人工智能全面赋能高质量发展,新一代智能终端、智能体等应用普及率超90%,智能经济成为我国经济发展的重要增长极 [1]
以68%涨幅领涨港股科技板块,七牛智能(02567)站上“AI”浪潮新风口
智通财经网· 2025-08-26 21:10
核心财务表现 - 2025年上半年营业收入8.29亿元,同比增长16.8% [1] - 经调整EBITDA亏损收窄至-350万元,同比大幅改善64.6% [1] - AI相关业务收入1.84亿元,占总收入比重达22.2% [2] 业务板块分析 - 传统MPaaS业务收入5.91亿元,同比增长16.4%,通过全球网络覆盖和智能分配技术保障服务可靠性 [2] - APaaS业务增速达24.4%,体现快速上线和易拓展特性优势 [2] - AI业务构建全栈能力,涵盖算力资源、大模型平台及音视频应用 [1][2] AI战略布局进展 - 推出DeepSeek系列AI算力服务、AIGC内容安全解决方案及数字人营销Agent产品 [3] - 新发布"灵矽AI"智能语音交互解决方案,突破多模态自然交互技术瓶颈 [3] - 开发者用户数量突破160万,AI大模型用户量超1万人 [2] - 从音视频云服务商转型为多模态AI基础设施与解决方案提供商 [3] 行业与政策环境 - 全球大模型发展重心从参数竞赛转向落地应用,实时交互与多模态处理需求提升 [4] - 国家"东数西算"工程八大枢纽节点算力总规模达215.5百亿亿次/秒,智能算力占比80.8% [4] - 地方政府积极扶持AI产业,创造空前发展机遇 [4] 资本市场表现 - 2025年7月初以来股价累计上涨68%,引领港股科技板块 [5] - 港股资金向具备技术优势与成长空间的企业集中配置 [5] - AI红利实现收入转化,未来2-3年为战略兑现关键窗口期 [5]
AI告别“故事会”:谁能通过商业化验证?七牛智能(02567.HK)中报给出关键样本
格隆汇· 2025-08-26 20:49
文章核心观点 - AI行业正从概念探索阶段迈入商业化验证期 资本市场聚焦于能证明商业价值的企业 关注技术从"可用"到"好用"的临界点以及商业化落地节奏与场景闭环能力 [1] - 七牛智能作为多模态AI和MCP稀缺标的 通过财报展现出良性增长轨道和可持续商业闭环 其技术布局在端侧AI和具身智能领域持续深化 [1][3][11] - 当前市场对公司的估值认知仍停留在传统PaaS工具商层面 静态市销率2.4倍低于同业 未能充分反映其向AI生态运营商的战略升级和多模态领域的领先地位 [13][14][16] 财务表现 - 2025年上半年营业收入同比增长16.8%至8.29亿元 经调整EBITDA收窄至-350万元 同比收窄64.6% 表明公司找到通往盈利的路径 [3] - MPaaS业务收入达5.91亿元 同比增长16.4% APaaS业务收入2.22亿元 同比增速24.4% AI相关业务收入1.84亿元 占总收入的22.2% [7] - APaaS付费客户平均贡献达8.3万元 是MPaaS客户8434元的近十倍 业务模型呈现从"基础服务"到"高价值方案"的生态闭环 [7][8] 商业模式 - 公司构建可持续AI生态闭环 MPaaS作为漏斗顶层吸引庞大客户群 APaaS作为价值提炼层提供低代码场景解决方案 开发者生态巩固壁垒 [7][8] - 截至2025年上半年开发者数量突破160万 PaaS业务展现高粘性与持续复购特性 2025年8月初AI大模型用户量突破10,000人 [8] - 成长来源于具有真实付费意愿的客户和刚需场景 而非由巨额投入驱动 已完成从技术验证到行业验证再到付费验证的三级跳 [8] 技术布局 - 公司通过MCP架构升级技术中台 MCP协议成为解决智能落地"最后一公里"的关键基础设施 七牛智能较早上线MCP功能帮助客户对比多模型效果 [10][11] - 2025年7月升级AI推理服务 推出Agent和MCP托管平台 提供大模型推理与MCP工具调用的统一中间层 通过标准化接入与安全编排降低开发门槛 [11] - 切入端侧AI与具身智能赛道 推出"灵矽AI"自然交互平台 在教育智能硬件、智能家居和服务机器人行业提供情感交互和多模态交互能力 [12] 行业地位 - 公司是中国多模态云服务领域稀缺标的 2023年是中国第二大音视频APaaS服务商 市场份额14.1% MPaaS平台日均处理音视频播放量高达46亿分钟 [16] - 多模态AI融合文本、图像、音频、视频等多维数据 解决教育、医疗、内容创作等真实世界复杂场景 赋能万亿级市场 [16] - 科技产业迎来端侧AI规模化落地与具身智能商业化元年 高盛预测2035年全球人形机器人市场规模将突破1500亿美元 [12] 估值潜力 - 公司静态市销率2.4倍 显著低于同业平均水平 传统PaaS公司全球PS在2-5倍 AI基础设施平台PS中枢在8-20倍区间 [14] - 估值未反映三重核心价值:从PaaS工具商到AI生态运营商的业态升级溢价、多模态领域的稀缺性溢价、高毛利APaaS收入占比提升的成长弹性溢价 [14][16][17] - 随着AI原生战略在多模态领域深化落地和APaaS收入放量 估值体系有望向AI平台与高成长企业靠拢 触发盈利与估值的戴维斯双击 [14][17]
AI告别“故事会”:谁能通过商业化验证?七牛智能(02567.HK)中报给出关键样本
格隆汇APP· 2025-08-26 20:30
行业阶段转变 - AI行业正从概念探索阶段迈入商业化验证期 资本市场不再为所有AI故事买单 而是聚焦能证明商业价值的企业 [2][3] - 投资者关注技术从"可用"到"好用"的临界点 更紧盯商业化落地节奏与场景闭环能力 财报季成为观察行业真实进展的重要窗口 [3] 公司财务表现 - 2025年上半年营业收入同比增长16.8%至8.29亿元 经调整EBITDA收窄至-350万元 同比收窄64.6% [7] - 公司呈现"卖得更多、亏得更少"的良性增长态势 与多数AI公司"增收却增亏"的局面形成鲜明对比 [8] 业务结构分析 - MPaaS业务收入5.91亿元 同比增长16.4% 展现音视频云基础需求的稳健性 [10] - APaaS业务收入2.22亿元 同比增速达24.4% 通过低代码/零代码方式提供场景化应用 [10] - AI相关业务收入1.84亿元 占总收入22.2% 成为强劲增长新引擎 [10] 商业生态闭环 - 构建客户价值漏斗:MPaaS作为顶层吸引庞大客户群 APaaS作为价值提炼层聚焦深度需求客户 [11] - APaaS付费客户平均贡献8.3万元 是MPaaS客户8434元的近十倍 [12] - 开发者数量突破160万 PaaS业务展现高粘性与持续复购特性 AI大模型用户量突破10,000人 [12] 技术布局升级 - 通过MCP架构升级技术中台 较早推出MCP功能帮助客户对比多模型效果 [17] - 2025年7月升级AI推理服务 推出Agent和MCP托管平台 提供大模型推理与MCP工具调用的统一中间层 [18] - 推出"灵矽AI"自然交互平台 切入端侧AI与具身智能赛道 应用于教育智能硬件、智能家居和服务机器人行业 [19] 市场地位与估值 - 2023年是中国第二大音视频APaaS服务商 市场份额14.1% MPaaS平台日均处理音视频播放量46亿分钟 [24] - 静态市销率仅2.4倍 显著低于同业平均水平 未充分反映向AI原生生态运营商的战略升级 [23] - 估值未充分体现三重溢价:业态升级溢价、多模态领域稀缺性溢价、高毛利APaaS收入占比提升带来的成长弹性溢价 [23][24][25]
中胤时尚涨4.91%,成交额1.67亿元,近3日主力净流入-194.35万
新浪财经· 2025-08-26 16:38
股价表现与交易数据 - 8月26日股价上涨4.91% 成交额1.67亿元 换手率3.85% 总市值43.61亿元 [1] - 当日主力资金净流入392.83万元 占成交额0.02% 行业资金排名11/60 [4] - 近20日主力累计净流出4125.19万元 近10日净流出1946.21万元 近5日净流出1186.46万元 [5] 概念题材与业务布局 - 公司涉及AIGC概念、虚拟数字人、多模态AI、三胎概念及人民币贬值受益题材 [2] - 参股孙公司新畅元科技掌握3D数字人生成重建、AIGC+3D数字人跨模态实时交互等国际领先技术 [2] - 新畅元科技第一代数字人产品"创视元"支持文本/语音多模态内容一键生成视频 [2] - 童鞋设计与供应链整合业务收入占比10%-15% 设计覆盖女鞋、童鞋及男鞋全品类 [2] - 海外营收占比达83.07% 受益人民币贬值 [3] 财务与经营状况 - 2025年1-6月营业收入1.79亿元 同比下降7.04% [7] - 同期归母净利润-250.70万元 但同比增长83.85% [7] - A股上市后累计分红8333.24万元 近三年累计分红5933.24万元 [8] 股权与筹码结构 - 股东户数8200户 较上期减少5.75% [7] - 人均流通股29268股 较上期增加6.10% [7] - 主力轻度控盘 筹码分布分散 主力成交额占比12.59% [5] - 筹码平均交易成本16.17元 股价接近18.70元压力位 [6] 公司基础信息 - 2011年10月成立 2020年10月上市 主营鞋履设计、图案设计及供应链整合服务 [7] - 所属申万行业为纺织服饰-服装家纺-非运动服装 [7] - 概念板块涵盖小盘股、英伟达概念、虚拟数字人、融资融券等 [7]