多模态AI
搜索文档
中胤时尚跌0.38%,成交额3972.15万元,近3日主力净流入-238.57万
新浪财经· 2025-12-16 15:41
核心观点 - 中胤时尚是一家以鞋履设计为核心,并拓展至供应链整合、生产及虚拟数字人等领域的创意设计企业,其股价近期表现疲软,主力资金持续流出,技术面面临压力位考验 [1][5][6] - 公司业务呈现多元化概念标签,包括新疆振兴、三胎(童鞋)、人民币贬值受益、虚拟数字人及多模态AI,这些构成了其潜在的市场关注点 [2][3] - 公司2025年前三季度营收下滑但净利润亏损同比收窄,海外收入占比高,且近期股东户数稳定 [3][7][8] 公司业务与财务概况 - 公司主营业务收入构成为:供应链整合业务77.12%,鞋履生产业务6.93%,设计业务6.61%,品牌运营业务4.59%,其他(补充)3.28%,文旅服务业务1.46% [7] - 2025年1-9月,公司实现营业收入2.64亿元,同比减少8.48%;归母净利润为-1231.90万元,但同比增长50.10%(亏损收窄) [7][8] - 公司A股上市后累计派现8333.24万元,近三年累计派现5933.24万元 [9] 市场表现与资金动向 - 12月16日,公司股价跌0.38%,成交额3972.15万元,换手率1.05%,总市值37.87亿元 [1] - 当日主力资金净流出107.02万元,占比0.03%,在所属行业中排名27/60,且已连续3日被主力资金减仓 [4] - 近5日主力净流出773.43万元,近10日净流出1584.96万元 [5] - 主力持仓方面,主力没有控盘,筹码分布非常分散,主力成交额1866.13万元,占总成交额的8.77% [5] 技术面分析 - 该股筹码平均交易成本为16.73元,近期筹码减仓,但减仓程度减缓 [6] - 目前股价靠近压力位15.98元,若无法突破则可能回调,突破则可能开启上涨行情 [6] 概念与战略布局 - **新疆振兴**:为响应国家号召,公司于2021年在新疆和田地区建立了鞋履生产基地(新疆中胤鞋业有限公司) [2] - **三胎(童鞋)概念**:公司童鞋设计和供应链整合业务收入占比在10%-15%之间,鞋履设计覆盖全品类包括童鞋 [2] - **人民币贬值受益**:根据2024年年报,公司海外营收占比高达83.07% [3] - **虚拟数字人与多模态AI**:公司参股孙公司新畅元科技在虚拟人技术上有储备,其第一代数字人产品“创视元”支持AIGC多模态内容生成,可从文本、语音一键生成视频 [3] 公司基本信息 - 公司全称为浙江中胤时尚股份有限公司,位于浙江省温州市,成立于2011年10月21日,于2020年10月29日上市 [7] - 公司所属申万行业为纺织服饰-服装家纺-非运动服装,概念板块包括虚拟数字人、融资融券、增持回购、小盘、英伟达概念等 [7] - 截至12月10日,公司股东户数为7800户,较上期无变化;人均流通股为30769股,较上期无变化 [7]
45 亿美元估值背后:红杉为何连续三次押注这家“隐形”AI 公司?
36氪· 2025-12-16 12:10
公司融资与估值 - Fal.ai在最新一轮D轮融资中估值升至45亿美元,三个月内估值翻了三倍 [1] - 本轮融资由红杉资本领投,凯鹏华盈和英伟达跟投,这是红杉资本在当年第三次投资该公司 [1] - 融资不仅包含1.4亿美元的新资本,还涉及老股东的二级交易,这通常意味着增长确定性已被验证 [6] 业务模式与市场定位 - 公司不训练基础模型,也不直接开发应用,而是专注于为图像、视频、音频等多模态模型提供托管、推理、调度与扩展能力的基础设施 [2] - 公司的价值在于将GPU管理、延迟控制和稳定性等复杂性整体外包,使企业无需自建团队承担高复杂度成本 [7] - 公司卡位在“多模态 + 实时 + 生产级”的高频负载场景,直接嵌入真实业务流,与仅提供托管工具的竞争对手形成差异 [7] 财务表现与市场验证 - 公司在当年10月前后已实现超过2亿美元的年化收入,客户包括Adobe、Shopify、Canva、Quora等 [4] - 超过2亿美元的年化收入数据将公司从“未来叙事”推入“已被市场验证”的区间 [4] 行业趋势与竞争格局 - AI的定价权正在从模型层转向运行层,价值从“谁造得更好”转向“谁跑得更稳” [1][11] - 多模态生成正从演示走向真实业务流,进入高频、实时、稳定的生产阶段,实时性成为硬约束 [2] - 随着模型能力提升,限制应用落地的关键因素不再是模型本身,而是推理效率与基础设施稳定性 [2] - 公司的主要竞争对手包括:云厂商的AI平台(如AWS Bedrock)、同类推理平台(如Replicate、Fireworks)以及企业内部自建团队 [7] - 企业真正购买的不是模型,而是让模型在现实世界中可靠运行的能力 [7] 对企业的启示 - 多模态AI已从创新实验进入基础设施候选层,企业面临的问题不再是“要不要用”,而是是否会错过事实标准 [10] - “AI要不要自己做”的决策框架正在改变,运行层不必重复发明,类似于企业不再自建数据中心 [10] - 一旦生成能力稳定可调用,内容、营销、设计等工作方式将从项目制转向系统制,瓶颈从人力转向算力与吞吐 [10] - 在基础设施级别的竞争中,观望的成本往往高于选错的成本 [11]
中胤时尚涨3.53%,成交额6380.54万元,后市是否有机会?
新浪财经· 2025-12-15 16:00
核心观点 - 中胤时尚是一家以鞋履设计为核心,同时提供供应链整合服务的创意设计企业,其股价在12月15日出现上涨,市场关注点集中于其新疆生产基地、童鞋业务、高海外营收占比、以及参股公司在虚拟数字人与多模态AI领域的技术储备等多个概念主题 [1][2][3][7] 公司业务与财务表现 - 公司主营业务收入构成为:供应链整合业务77.12%,鞋履生产业务6.93%,设计业务6.61%,品牌运营业务4.59%,其他(补充)3.28%,文旅服务业务1.46% [7] - 2025年1-9月,公司实现营业收入2.64亿元,同比减少8.48%;归母净利润为-1231.90万元,但同比增长50.10% [7][8] - 公司A股上市后累计派现8333.24万元,近三年累计派现5933.24万元 [9] 市场表现与交易数据 - 12月15日,公司股价上涨3.53%,成交额6380.54万元,换手率1.67%,总市值38.02亿元 [1] - 当日主力资金净流出90.46万元,占成交额0.01%,在所属行业中排名31/60,且已连续3日被主力资金减仓 [4] - 近3日、5日、10日、20日的主力资金净流入额分别为-385.52万元、-830.90万元、-1814.56万元、-940.07万元 [5] - 主力持仓方面,主力没有控盘,筹码分布非常分散,主力成交额2026.17万元,占总成交额的9.95% [5] 技术面与筹码分析 - 该股筹码平均交易成本为16.74元,近期筹码减仓,但减仓程度减缓 [6] - 目前股价在压力位16.38元和支撑位14.79元之间,可做区间波段操作 [6] 概念主题与业务亮点 - **新疆振兴概念**:为响应国家号召,公司于2021年在新疆和田地区建立了鞋履生产基地(新疆中胤鞋业有限公司) [2] - **三胎/童鞋概念**:公司童鞋设计和供应链整合业务收入占比在10%-15%之间,鞋履设计覆盖全品类包括童鞋 [2] - **人民币贬值受益**:根据2024年年报,公司海外营收占比高达83.07%,受益于人民币贬值 [3] - **虚拟数字人与多模态AI**:公司参股孙公司新畅元科技在虚拟人技术上有多项储备,包括3D数字人生成重建、AIGC+3D数字人、3D数字人AI跨模态实时交互等,其第一代数字人产品“创视元”支持AIGC多模态内容生成,可从文本、语音一键智能生成视频 [3] 公司基本信息 - 公司全称为浙江中胤时尚股份有限公司,位于浙江省温州市,成立于2011年10月21日,于2020年10月29日上市 [7] - 公司所属申万行业为纺织服饰-服装家纺-非运动服装,所属概念板块包括虚拟数字人、融资融券、增持回购、小盘、英伟达概念等 [7] - 截至12月10日,公司股东户数为7800户,较上期无变化;人均流通股为30769股,较上期无变化 [7]
商汤(00020)日日新Seko系列模型与寒武纪成功适配 国产算力&多模态AI实现关键跨越
智通财经网· 2025-12-15 14:22
公司产品与技术发布 - 商汤科技正式发布Seko2.0,这是行业首个多剧集生成智能体,在多剧集视频生成的一致性方面展现出显著优势 [1] - Seko2.0基于商汤自研的日日新Seko系列模型技术底座,该系列包括SekoIDX、SekoTalk等图像与视频生成多模态模型 [1] 国产化适配与算力支持 - 商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配,实现了国产算力对AIGC核心场景从语言到多模态的关键跨越 [1] - 商汤LightX2V框架设计了强兼容的国产化适配插件模式,可快速完成各类国产硬件的适配,目前已支持寒武纪等多款国产芯片 [1] - 为释放国产算力优势,Seko系列模型与LightX2V框架引入了低比特量化、压缩通信、稀疏注意力等硬件友好创新机制,将推理性能提升3倍以上 [1] 战略合作与生态构建 - 商汤科技与寒武纪已于今年10月达成战略合作,重点推进软硬件的联合优化,并共同构建开放共赢的产业生态 [2] - 此次与寒武纪在多模态生成模型的适配,是国产大模型与国产算力底座协同创新的重要实践,旨在让开发者和企业以更低成本享受顶尖多模态AI能力 [2] - 双方将共同推动国产AI应用生态的繁荣与发展,打磨更高效、更易用的阶梯式产品体系,并面向开发者构建更开放、友好的工具与生态 [3] 未来协同优化方向 - 持续优化模型核心能力:将在长序列处理、低比特计算等方向持续优化,在确保模型效果的基础上提升多模态生成的整体效率与响应速度 [2] - 提升算力利用率与成本效率:通过算子融合、算子自动调优等,推进更高效的计算与存储方式,降低模型运行所需的资源占用 [2] - 强化大规模并行处理能力:基于计算与通信并行等优化技术,优化跨硬件的调度与通信策略,提升复杂任务在大规模集群中的运行效率与稳定性 [2] - 构建更灵活的资源管理机制:探索分层调度与异构资源协同技术,在保证性能的同时有效降低显存压力,使模型能在更广泛的环境中稳定运行 [2] - 通过双方的深入协同优化,将全面提升模型效率、显著增强算力与资源利用率并优化跨硬件环境的协同适配,进一步降低多模态AI的使用门槛 [2]
商汤日日新Seko系列模型与寒武纪成功适配,国产算力&多模态AI实现关键跨越
格隆汇· 2025-12-15 14:05
公司产品与技术发布 - 商汤科技正式发布Seko2 0 这是行业首个多剧集生成智能体 在多剧集视频生成的一致性方面展现出显著优势 [1] - Seko2 0基于商汤自研的日日新Seko系列模型技术底座 包括SekoIDX SekoTalk等图像与视频生成多模态模型 [1] - 商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配 实现了国产算力对AIGC核心场景从语言到多模态的关键跨越 [1] 技术适配与性能优化 - 商汤LightX2V框架设计了强兼容的国产化适配插件模式 可快速完成各类国产硬件的适配 目前已支持寒武纪等多款国产芯片 [1] - Seko系列模型与LightX2V框架引入了低比特量化 压缩通信 稀疏注意力等硬件友好创新机制 将推理性能提升3倍以上 [1] - 公司与寒武纪的战略合作重点推进软硬件的联合优化 并共同构建开放共赢的产业生态 [2] 未来合作与优化方向 - 双方将持续优化模型核心能力 在长序列处理 低比特计算等方向提升多模态生成的整体效率与响应速度 [2] - 双方将提升算力利用率与成本效率 通过算子融合 算子自动调优等 降低模型运行所需的资源占用 [2] - 双方将强化大规模并行处理能力 优化跨硬件的调度与通信策略 提升复杂任务在大规模集群中的运行效率与稳定性 [2] - 双方将构建更灵活的资源管理机制 探索分层调度与异构资源协同技术 有效降低显存压力 [2] 行业影响与生态建设 - 商汤与寒武纪在多模态生成模型的适配 是国产大模型与国产算力底座协同创新的重要实践 [2] - 双方的协同优化将降低多模态AI的使用门槛并提升整体体验 [3] - 双方将共同推动国产AI应用生态的繁荣与发展 打磨更高效 更易用的阶梯式产品体系 并面向广大开发者构建更开放 友好的工具与生态 [3]
DeepSeek倒逼vLLM升级,芯片内卷、MoE横扫千模,vLLM核心维护者独家回应:如何凭PyTorch坐稳推理“铁王座”
36氪· 2025-12-15 08:36
vLLM项目发展历程与社区生态 - vLLM项目起源于加州大学伯克利分校Sky Computing Lab,于2023年开源其核心PagedAttention技术,在短短一年多内GitHub Star数突破4万,并迅速增长至6.5万,已成为全球科技公司首选的推理引擎 [1] - Neural Magic公司通过“免费平台 + 开源工具”策略,在AI优化领域脱颖而出,通过深入贡献vLLM构建了企业级推理堆栈并维护预优化模型库,其社区积累与工程实力吸引了红帽的注意 [1] - 2024年11月,红帽正式收购Neural Magic,并将包括vLLM核心维护者Michael Goin在内的核心团队纳入旗下,Michael在优化推理性能、最大化CPU/GPU效能方面拥有超过十年经验 [1] vLLM技术演进与模型支持 - vLLM开发团队作为项目“内核团队”,专注于集成与开发高性能推理内核,随着DeepSeek R1等模型的发布,团队开发重心从聚焦Llama系列转向全力投入DeepSeek模型相关特性优化 [3] - 在0.7.2版本中,团队紧凑开发以迅速响应DeepSeek新特性,高效支持了Qwen 2.5 VL并引入了Transformers backend,使用户能直接运行任意Hugging Face模型 [3] - 随后的0.7.3版本成为一次规模更大的更新,为DeepSeek启用了多Token预测、MLA注意力等优化,扩展了对AMD硬件的支持与调优,并推动了vLLM从支持张量并行、流水线并行到支持专家并行的演进 [4] - 团队将DeepSeek开源的一系列高性能工具,如DeepGEMM、DeepEP、专家并行负载均衡等,系统化地融入vLLM生态 [4] - 团队面向推理场景不断扩充高性能内核库,涵盖定制版Triton、CUTLASS、CUDA内核、HIP内核等,还包括各种量化支持与众多定制内核实现 [7] - 除了主导DeepSeek V3的整合,团队还完成了GPT-OSS、Qwen、Kimi等多个模型的适配与优化 [7] 硬件生态支持与战略 - vLLM团队的核心使命之一是构建开放、高效的硬件推理生态,广泛支持各类主流芯片,并深度参与新硬件的架构设计与性能优化 [8] - 过去几个月,团队与NVIDIA共同推进Blackwell芯片的支持工作,优化B200相关性能,并与AMD团队保持紧密协作以确保其在vLLM中的性能表现 [8] - 团队与Google TPU团队紧密合作一年多,完成了多次版本发布,并作为最高决策者参与设计了整体沐曦芯片的支持架构 [8] - 团队与硬件伙伴的合作流程严谨,例如在沐曦项目的早期阶段便共同讨论支持框架设计,主导高层架构,并通过创建跨公司“线上联合工作组”确保高效推进 [8] - vLLM广泛支持从NVIDIA、AMD到Google TPU乃至国内众多芯片的核心战略在于深度拥抱PyTorch,将其作为连接上层框架与底层硬件的“最大公约数” [9] - 只要硬件厂商提供了对PyTorch的良好支持,适配vLLM的工作就已完成了绝大部分(约90%),剩余约10%主要涉及对PyTorch中效率较低的部分进行定制优化 [10] - vLLM中的模型定义几乎完全基于PyTorch编写,并支持十余种其他硬件backend的注意力实现,如NVIDIA的FlashAttention、AMD的ROCm Attention、Google TPU的Pathways Attention等 [10] 多模态能力拓展 - vLLM团队将vLLM从一个纯文本推理引擎,全面升级为一个支持全模态生成与理解的统一服务平台,多模态模型架构改变了vLLM的架构 [17] - 团队对vLLM v1版本进行了彻底重构,一项关键创新是多模态前缀缓存,将Page Attention机制从文本token的键值缓存扩展至图像、音频等任意模态输入,大幅提升了重复请求的处理效率 [18] - 团队实现了编码器解耦技术,将视觉、音频编码器与语言模型backbone解耦,为超大规模推理场景提供了极致的弹性与资源利用率 [18] - 2024年12月,vLLM-Omni作为其首个“全模态”推理框架正式发布,它将文本、图像、音频、视频的统一生成从概念变为可落地的生产级代码 [19] - Omni引入了一套完全解耦的流水线架构,让不同阶段按需分配资源,并通过统一调度衔接,一个omni-modality推理请求会经过模态编码器、LLM核心与模态生成器三类组件 [19] - 如今vLLM支持的范围十分广泛,包括多模态理解与生成、嵌入模型、智能体编程,以及企业级的文档理解、OCR、推荐系统、客服、编程辅助乃至缺陷检测等判别式任务 [21] 社区竞争优势与迭代 - 随着vLLM逐渐发展成熟,许多公司开始将更多修改回馈至上游,更倾向于直接使用上游vLLM而不是开发私有版本,这一良性循环的核心驱动力在于“速度” [22] - vLLM的上游版本通过与众多领先的模型实验室和公司合作,快速收集反馈并修复问题,然后放回社区,vLLM的合作名单涵盖了从DeepSeek、Qwen、字节、腾讯,到LinkedIn、亚马逊、Mistral、Azure和Snowflake等 [23] - 当社区版本的迭代速度远超私有分支时,用户更倾向于使用社区版本,这种“速度优势”正推动vLLM加速成为大模型推理领域的事实标准 [23] - vLLM作为一个每月下载量超20万次的热门推理框架,团队正着手解决开发者反馈的启动速度偏慢问题,在GitHub上建立了专项跟踪与“启动体验优化”项目 [24] - 导致启动时间较长的因素包括CUDA graph capture time和torch.compile,开发团队已推动torch.compile团队重视启动时间问题并取得了一些显著改进 [24] - 团队还打造了工具和指南,指导用户处理冷启动与热启动的差异,并建议通过复制缓存目录来实现热启动以提升速度 [25] 红帽的战略角色与贡献 - 红帽全球约有两万名员工,其中可能有一两千名工程师完全在社区中做贡献,所做工作非常中立,vLLM的治理结构本身高度分散,共有15到20个不同组织的成员担任提交者或维护者 [26] - 红帽如此投入vLLM,源于一个战略判断:推理是AI应用成本的核心环节,实现高性能需要vLLM集成最前沿的模型优化 [26] - 红帽最具代表性的贡献是主导推动了vLLM v1版本的架构重构,这次升级为未来系统设计奠定了基础,并实质性地推动了社区标准化进程 [27] - 例如,红帽与PyTorch torch.compile团队长达一年半的合作,优化了上游框架以更好支持vLLM的高阶场景,让支持新硬件、新模型变得更容易 [27]
智元机器人否认和宇树高价争抢春晚赞助席位;小米否认进军AI教育;马斯克称自己是钢铁侠原型;豆包手机二手价被炒到3.6万元丨邦早报
创业邦· 2025-12-11 08:11
具身智能与机器人行业动态 - 有报道称智元机器人与宇树科技竞逐2026年央视春晚赞助席位,智元开价6000万元,宇树将报价拉升至1亿元,但智元机器人回应称该消息不属实[4] - 通用类人灵巧操作具身智能机器人生产商中科硅纪完成新一轮战略融资,由华控基金领投,京东集团、正大集团等通过其投资的基金参与[19] 人工智能人才与战略动向 - 前字节跳动视觉大模型AI平台负责人潘欣已加入美团,负责多模态AI创新工作,主导了LongCat App等多个相关应用的开发[4] - 阿里云CTO、通义实验室负责人周靖人已成为阿里巴巴合伙人[17] - OpenAI任命原Slack首席执行官Denise Dresser为首席营收官,负责统筹全球营收战略[17] - Meta战略转向闭源模型,一款代号为“Avocado”的新模型预计于2026年春季发布,可能以闭源形式推出[18] 消费电子与AI硬件市场热度 - 夸克AI眼镜S1在多渠道售罄,发货周期拉长至45天,二手市场现货价格被炒至4000-5000元[9] - 豆包与努比亚合作的AI手机努比亚M153技术预览版工程机在二手平台价格攀升,全新未拆封版本报价3999到4999元不等,最高报价达36000元,并衍生出日租金50至79元的短期租赁业务[9][10] 企业投资与资本运作 - 京东通过其控制的投资机构以约34.73亿港元的代价,收购位于香港干诺道中3号一幢27层高办公大楼特定部份50%的权益[15] - 全球图像级激光雷达解决方案提供商Seyond图达通以De-SPAC方式在香港交易所主板上市,合计募集资金约10.27亿港元,上市首日收盘价为13.3港元/股,截至09:40市值超146亿港元[19] - 为跨境电商企业提供海外数字营销服务的福建米多多集团向香港联交所递交招股说明书,筹备港股上市[19] AI与科技行业融资事件 - 面向非技术用户的AI自动化工作流平台Refly.AI完成数百万美元种子轮融资,投资方包括金沙江创投、高瓴创投等[19] - 全球消费级3D打印品牌快造科技(Snapmaker)完成数亿元人民币B轮融资,由高瓴创投、美团联合领投[19] - 西安迈斯拓扑科技有限公司完成近亿元人民币天使轮融资,由中科创星领投,资金将用于医用同位素生产基地建设[19] 产品发布与业务进展 - 阿里云发布一站式Agentic AI基础设施平台“函数计算 AgentRun”,称其平均TCO(总拥有成本)可降低60%[20] - 小米集团回应“进军AI教育”传闻,称相关招聘岗位实为强化其Redmi Pad 2乐学版平板电脑和小米米兔儿童手表的产品服务[5] 行业观点与监管动态 - 比尔·盖茨警告AI估值存在泡沫,指出部分公司市盈率远超标普500公司平均25倍的水平(例如Palantir和特斯拉市盈率超200倍),认为高竞争将淘汰部分公司,但肯定AI技术将带来深刻社会效益[18][19] - 马斯克的脑机接口公司Neuralink聘请前美国食品药品监督管理局(FDA)神经与物理医学设备办公室主任大卫·麦克马伦担任医疗事务负责人,以推动技术合规与应用[18] 其他行业与市场数据 - 泡泡玛特宣布,LVMH大中华区集团总裁吴越获委任为公司非执行董事[7] - 《2025闲鱼卡牌年度报告》显示,今年前三季度卡牌交易规模同比增长21%,其中集换式卡牌和球星卡交易额涨超84%,哪吒卡牌年销售额达1亿元人民币[20] - 乘联分会数据显示,12月1-7日全国乘用车市场零售29.7万辆,同比下降32%;新能源市场零售18.5万辆,同比下降17%[20]
前字节AI负责人潘欣加入美团负责多模态创新
36氪· 2025-12-10 15:11
公司核心人事变动 - 前字节跳动视觉大模型AI平台负责人潘欣近期已加入美团 [1] - 潘欣在谷歌大脑、百度、腾讯、字节跳动及闪极科技等公司拥有丰富的AI技术研发与平台构建经验 [1] - 入职美团后,潘欣负责多模态AI创新工作,并主导了LongCat App等多个相关应用的开发 [1] 公司AI战略与进展 - 2025年美团的关键词是外卖大战与AI [1] - 公司创始人王兴表示,美团在AI技术上的战略定位是积极进攻而非消极防御 [1] - 在2025年一季度电话会上,王兴首次披露了公司AI大模型LongCat(龙猫)的相关进展 [1]
国产多模态AI再开源,实测截图转网页、搜图购物,价格减半
36氪· 2025-12-09 20:04
智谱AI发布GLM-4.6V系列多模态大模型 - 公司于12月8日晚开源了GLM-4.6V系列多模态大模型,包括面向云端与高性能集群场景的基础版GLM-4.6V(106B-A12B)以及面向本地部署与低延迟应用的轻量版GLM-4.6V-Flash(9B)[1] - 公司于12月9日上午还开源了AutoGLM智能体,该智能体在去年10月发布时被视为“全球首个具备手机操作能力的AI Agent”[1] 模型核心能力与架构升级 - GLM-4.6V能够完成智能图文混排与内容创作、识图购物与导购、前端复刻与多轮视觉交互开发以及长上下文的文档与视频理解等任务[3] - 该系列模型将训练时上下文窗口提升到128k tokens,并首次在模型架构中将Function Call(工具调用)能力原生融入视觉模型[4] - 在同等参数规模下,GLM-4.6V系列模型在多模态交互、逻辑推理和长上下文等关键能力上取得SOTA表现[5] 模型性能基准测试表现 - 在覆盖通用视觉问答、多模态推理、多智能体、多模态长文本、图表识别以及空间定位能力的34项测试中,9B版本的GLM-4.6V-Flash有22项的分数超过Qwen3-VL-8B[5] - 106B参数12B激活的GLM-4.6V表现与有着2倍参数量的Qwen3-VL-235B相接近[5] - 具体基准测试数据显示,在MMBench V1.1测试中,GLM-4.6V得分为88.8,GLM-4.6V-Flash得分为86.9[6] 定价策略与成本优势 - GLM-4.6V系列相较于GLM-4.5V降价50%[7] - GLM-4.6V的API调用价格低至输入1元/百万tokens,输出3元/百万tokens,GLM-4.6V-Flash则全面免费[7] - 根据价格表,GLM-4.6V在输入长度[0, 32]千tokens区间,输入单价为1元/百万tokens,输出单价为3元/百万tokens[8] 实际应用体验与功能评估 - 在智能图文混排与内容创作的实际体验中,GLM-4.6V生成文字和网页的速度快、内容准,但所生成的图片一直无法显示[3][9] - 在识图购物与导购功能中,GLM-4.6V能自动调用工具进行全网搜索并形成比价表格,但商品名信息冗余未做整理,且对于模糊指令的理解存在偏差[11] - 在前端复刻能力上,GLM-4.6V可根据截图丝滑生成HTML代码和网页预览,并支持通过自然语言指令进行多轮视觉交互修改,但在修改图标等细节时会出现错误[13][18] - 在长上下文文档理解测试中,GLM-4.6V能同时处理多篇中英文论文并生成逻辑清晰的学习笔记,128k上下文约等于150页文档、200页PPT或一小时视频[21] - 在视频理解能力上,GLM-4.6V能快速解析200M以内的MP4视频内容,并给出准确完整的分析和建议[22][27] 行业竞争与市场影响 - 在当前各家AI能力越来越接近的情况下,谁能把体验做得更顺畅、成本更低,谁就可能吸引更多开发者[29] - GLM-4.6V系列通过大幅降价和提供免费轻量版,降低了视觉模型的接入门槛,对于想尝试多模态AI的个人或小团队来说更具吸引力[28] - 公司宣布本周为其开源发布周,将会有更多成果开源[30]
研报掘金丨渤海证券:首予虹软科技“增持”评级,深耕AI视觉算法,多曲线驱动增长
格隆汇APP· 2025-12-09 16:22
公司业务与定位 - 公司专注于计算机视觉领域,为行业提供算法授权及系统解决方案 [1] - 公司是全球领先的视觉人工智能企业 [1] 业务板块与增长驱动 - 移动智能终端视觉解决方案是公司营收主要来源 [1] - 智能汽车解决方案作为新兴业务板块,近年呈现高速增长态势 [1] - 公司紧跟多模态AI与AIGC行业发展浪潮,积极布局AI眼镜及AI商拍等前沿业务 [1] - 公司深耕AI视觉算法,多曲线驱动增长 [1] 市场地位与产品 - 在智能手机领域,公司已构建起覆盖当前主流机型的视觉人工智能算法产品矩阵 [1] 财务表现 - 2025年前三季度,公司实现归母净利润1.42亿元,同比增长60.51% [1] 发展前景 - 未来有望实现多业务场景深度赋能 [1]