日日新V6.5

搜索文档
半年报看板 | 商汤科技亏损大幅收窄 生成式AI收入占比提升至77%
中国金融信息网· 2025-08-30 12:46
财务表现 - 上半年总营收同比增长36%至24亿元人民币 [1] - 生成式AI收入连续第三年高速增长 增幅达73% [1] - 经调整亏损净额同比下降50% 环比亦大幅收窄 [1] - 应收款回款金额创新高达32亿元人民币 同比增长96% [1] - 贸易应收账款周转天数同比缩短49% [1] - 总现金储备达132亿元人民币 [1] 业务战略 - 深化"1+X"战略布局 "1"指生成式AI与视觉AI双引擎 "X"聚焦智能驾驶/智慧医疗/家用机器人/智慧零售四大创新赛道 [1] - 生成式AI占营业收入比重提升至77% [1] - 视觉AI板块服务国内外客户660余家 复购比例57% 海外商机储备与新订单按年显著增长 [2] 产品进展 - "日日新"大模型围绕生产力工具和互动工具两大场景提升渗透率 [1] - 生产力工具以"小浣熊"为代表 提供金融/教育/政务三大版本 用户数突破300万 [1] - "日日新V6.5"实现文本与音视频融合 多模态实时互动时长年内增长510% [2] - 视觉AI板块实现利润与现金流双向改善 [2]
全球科技业绩快报:商汤1H25
海通国际证券· 2025-08-28 23:25
报告行业投资评级 - 报告未明确提及对商汤或行业的投资评级 [1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16] 核心观点 - 生成式AI业务成为核心增长引擎 收入同比大幅增长72.7%至18.16亿元 占总收入比重提升至77% [1][10] - 亏损幅度显著改善 经调整净亏损同比减少50.0%至11.62亿元 经调整EBITDA亏损同比减少72.5%至5.21亿元 [1][10] - 算力基础设施持续升级 大装置总算力达2.5万PetaFLOPS 国产芯片集群实现5000卡规模稳定运行 [2][11] - 多模态大模型技术实现突破 推理性能可比肩国际先进模型 模型性价比提升约3倍 [3][12] - 现金储备充裕达131.58亿元 贸易应收款项回款同比增95.5% 运营效率显著提升 [1][10] 战略与基础设施 - 构建"算力—模型—应用"三位一体战略 平台SenseCore 2.0获中国泰尔实验室4+级最高认证 [2][11] - 异构集群利用率约80% 训练效率达95% 平台实力位列国内前三 [2][11] 大模型与应用 - 发布日日新V6.0至V6.5版本 实现图文交错思维链与多模态强化学习技术规模化落地 [3][12] - 小浣熊办公产品用户数突破300万 在政府、金融、教育行业加速渗透 [3][12] - 多模态流式交互时长年内增长510% 新应用三个月内用户规模扩大15倍 [3][12] 视觉AI与创新业务 - 方舟平台覆盖近200个城市和3万个园区/楼宇 日调用量超1亿次 [4][13] - 赋能2.5亿台安卓手机和102万台智能汽车 在智能座舱领域保持龙头地位 [4][13] - X创新业务实现市场化突破 绝影世界模型量产 元萝卜与迪士尼联名 善萃医疗落地新加坡 [4][13] 未来展望 - 生成式AI与视觉AI共同构建"模型×场景"双轮驱动格局 [5][14] - 关键发展聚焦四大方向:日日新V6.5垂直领域推广、算力建设与成本下降、方舟平台商业化、创新业务融资优化 [5][16]
生成式AI收入占比77%!商汤最新发布
证券时报· 2025-08-28 23:20
财务表现 - 2025年上半年公司实现收入23.58亿元 同比增长35.6% [1] - 经调整亏损净额11.62亿元 同比和环比均大幅收窄 [1] - 毛利9.08亿元 毛利率38.5% [4][6] - 贸易应收回款额31.59亿元 同比增长95.5% 创历史新高 [6] - 现金储备131.58亿元 [6] 业务结构 - 生成式AI业务收入18.16亿元 同比增长72.7% 占总收入比例77% [4] - 视觉AI服务国内外客户660余家 复购比例57% [5] - X创新业务聚焦智能驾驶、医疗、机器人、零售等赛道 [6] 技术进展 - 日日新大模型多模态能力跻身世界前沿 [5] - 生产力工具"小浣熊"用户数突破300万 提供金融、教育、政务三大版本 [5] - 多模态实时互动时长年内增长510% [5] - 在中国计算机视觉市场份额连续九年第一 汽车座舱视觉AI软件市场连续五年第一 [5] 战略布局 - 采用"算力基础设施—大模型研发—大模型应用"三位一体闭环模式 [4] - 生成式AI与视觉AI形成双引擎战略 [6] - 通过X创新业务板块孵化创新生态 向生态企业提供计算服务、基础AI模型与专家服务 [6] 行业动态 - 通用与多模态大模型进入"强推理+多智能体协作"新阶段 [4] - 生成式AI应用渗透持续提速 以工程化路径穿透产业场景"工业红线" [4] - 行业从"试点验证"加速迈向"规模落地" 生态分工与能力边界被重塑 [4] - 国务院印发《关于深入实施"人工智能+"行动的意见》 加速人工智能普及与应用 [6]
阿里通义千问再放大招
21世纪经济报道· 2025-08-20 09:45
多模态大模型发展现状 - 阿里通义团队推出Qwen-Image-Edit模型,基于20B参数的Qwen-Image,支持双语文本修改、风格迁移及物体旋转,拓展生成式AI在专业内容创作中的应用 [1] - 阿里半年内连续推出Qwen2 5-VL、Qwen2 5-Omni、Qwen-Image等多模态模型,行业多模态大模型在2025年迭代加速 [1] - 谷歌研究报告显示,预计2025年全球多模态AI市场规模将达24亿美元,2037年底将达989亿美元 [1] 国内厂商布局 - 阿里开源升级版视觉理解模型Qwen2 5-VL,72B版本在13项权威评测中视觉理解能力超越GPT-4o与Claude3 5 [3] - 阿里发布首个端到端全模态大模型Qwen2 5-Omni,支持文本、图像、音频、视频实时交互,可部署于手机等终端 [3] - 阶跃星辰发布Step 3基础大模型,原生支持多模态推理,其Step系列基座模型矩阵中多模态模型占比达70% [5] - 商汤发布日日新V6 5大模型,多模态推理与交互性能大幅提升,从6 0版本开始全部为多模态模型 [5] - 智谱推出开源视觉推理模型GLM-4 5V,涵盖图像、视频、文档理解等任务 [5] - 昆仑万维一周内发布六款多模态模型,覆盖数字人生成、世界模拟等核心场景 [5] 技术进展与挑战 - 多模态模型Qwen-Image-Edit基于20B参数模型训练,实现图片中文字精准编辑,兼具语义与外观双重编辑能力 [4] - 当前多模态领域仍处于发展初期,视觉数据表征空间达百万维度连续空间,远超文本数万维度的离散符号系统 [7] - 视觉数据缺乏天然语义信息,需建立跨模态映射关系,但缺乏标注数据支持 [8] - 当前多模态模型主要依赖语言推理,图形和空间结构推理能力薄弱,无法解决简单空间问题 [9] 行业趋势 - 业内普遍认为多模态融合是通向AGI的必经之路,2025年下半年或将迎来多模态模型全面普及 [1] - 中国企业在多模态领域集体崛起,改变由OpenAI、Google主导的AI创新叙事,在视觉推理、视频生成等细分领域领先 [7] - 2025年被视为AI应用商业化元年,多模态技术驱动数字人直播、医疗诊断、金融分析等场景落地 [7]
阿里通义千问再放大招 多模态大模型迭代加速改写AGI时间表
21世纪经济报道· 2025-08-19 20:57
多模态大模型发展现状 - 阿里通义团队推出Qwen-Image-Edit,基于20B参数的Qwen-Image,专注于语义和外观编辑,支持双语文本修改、风格迁移及物体旋转 [1] - 阿里半年内连续推出Qwen2 5-VL、Qwen2 5-Omni、Qwen-Image等多模态模型 [1] - 谷歌研究报告显示,预计至2025年全球多模态AI市场规模将飙升至24亿美元,2037年底预计将达到989亿美元 [1] - 商汤科技联合创始人林达华表示未来多模态模型甚至能在纯语言任务上超越单一语言模型 [1] 国内厂商布局 - 2023年12月谷歌原生多模态Gemini 1 0模型上线,将AI竞赛由文本领域带入多模态领域 [2] - 阿里推出Qwen2 5系列强化多模态能力,Qwen2 5-VL在13项权威评测中视觉理解能力全面超越GPT-4o与Claude3 5 [3] - 阿里发布首个端到端全模态大模型Qwen2 5-Omni,支持文本、图像、音频、视频的实时交互 [3] - 阶跃星辰发布Step 3基础大模型,原生支持多模态推理,其多模态模型占比达7成 [4] - 商汤发布日日新V6 5大模型,多模态推理与交互性能大幅提升 [4] - 智谱推出开源视觉推理模型GLM-4 5V,涵盖图像、视频、文档理解等任务 [5] - 昆仑万维一周内连续发布六款多模态模型,覆盖数字人生成、世界模拟等场景 [5] 技术挑战与发展 - 多模态领域仍处于发展初期,诸多基础性问题尚未解决 [6] - 视觉数据表征空间达到百万维度的连续空间,与文本存在本质差异 [6] - 视觉数据本身不包含语义信息,需要建立跨模态映射关系 [7] - 当前多模态模型对于图形和空间结构的推理能力薄弱 [7] - 主流多模态模型后续思考推理过程仍主要依赖纯语言推理 [7] 行业趋势 - 2025年被业内人士普遍视为"AI应用商业化元年",多模态技术是核心驱动力 [6] - 多模态能力将成为AI系统的标配,如何转化为实际生产力是产业界下一步重点 [8]
阿里通义千问再放大招,多模态大模型迭代加速改写AGI时间表
21世纪经济报道· 2025-08-19 20:21
多模态大模型发展现状 - 阿里通义团队推出Qwen-Image-Edit,基于20B参数的Qwen-Image,支持双语文本修改、风格迁移及物体旋转,拓展生成式AI在专业内容创作中的应用 [1] - 阿里半年内连续推出Qwen2.5-VL、Qwen2.5-Omni、Qwen-Image等多模态模型,Qwen2.5-VL 72B版本在13项权威评测中视觉理解能力全面超越GPT-4o与Claude3.5 [3] - 阿里Qwen-Image-Edit登上AI开源社区Hugging Face模型榜单首位,成为全球热度最高的开源模型 [3] 行业竞争格局 - 谷歌原生多模态Gemini 1.0模型上线,将AI竞赛由文本领域带入多模态领域 [2] - 阶跃星辰发布Step 3基础大模型,原生支持多模态推理,其基座模型矩阵中多模态模型占比达7成 [4] - 商汤发布日日新V6.5大模型,从6.0开始全部为多模态模型 [5] - 智谱推出开源视觉推理模型GLM-4.5V,昆仑万维一周内发布六款多模态模型 [5] 市场规模与趋势 - 预计2025年全球多模态AI市场规模将达24亿美元,2037年底预计达到989亿美元 [1] - 2025年被业内人士视为"AI应用商业化元年",多模态技术是核心驱动力 [7] - 中国企业在视觉推理、视频生成等多个细分领域已排在权威榜单前列 [7] 技术挑战 - 多模态领域仍处于发展初期,诸多基础性问题尚未解决 [8] - 视觉数据表征空间达到百万维度的连续空间,与文本的数万维度存在本质差异 [8] - 当前多模态模型对于图形和空间结构的推理能力薄弱,无法解决简单空间问题 [10] - 多模态模型思维方式主要依赖逻辑推理,缺乏空间感知能力 [10] 发展方向 - 多模态能力将成为AI系统标配,如何转化为实际生产力和社会价值是下一步重点 [10] - 未来多模态模型可能在纯语言任务上超越单一语言模型 [1] - 2025年下半年或将迎来多模态模型的全面普及 [1]