视觉生成大模型

搜索文档
可灵AI推出可图2.1模型 多维能力跃升、会员限时7天免费
财富在线· 2025-07-10 17:24
可图2 1模型升级 - 公司推出可图2 1模型 图片生成能力全面跃升 包括指令遵循能力大幅提升 人像美感和电影质感显著增强 支持超180种不同风格 同时优化文字生成效果 [1] - 新模型面向所有会员用户限时免费开放7天 时间为7月10日至7月17日 涵盖文生图 单图参考 多图参考等功能 [1][11] 技术性能突破 - 指令遵循能力表现突出 能精准捕捉复杂提示词中的多种元素 颜色位置等细节 生成高质量图像 实测案例显示可准确呈现"海底火山爆发"等史诗级灾难场景的微缩沙盘模型 [1][3] - 画面质量显著提升 清晰度 元素丰富度 细节真实感达到新高度 人像生成尤其出色 能细腻呈现肌肤纹理和自然光影效果 [3][5] - 电影质感增强 可生成具有大片氛围的广角镜头画面 如复现韦斯·安德森风格的东京车站场景 通过高级构图和光影色彩赋予独特美学调性 [5][6] 应用功能扩展 - 文字生成能力升级 支持设计感中英文文字 便于制作营销海报 电影海报 唱片封面等 实现图文流畅融合 [8] - 风格覆盖范围扩大 支持180+种风格响应 包括特殊材质 数字艺术 绘画技法等 满足复古摄影 未来感数字艺术等多样化创作需求 [10] 市场数据与行业地位 - 可灵AI为快手旗下多模态创意平台 上线一年多迭代超20次 具备AI图片 视频 音频生成能力 [11] - 平台累计生成3 44亿图片和1 68亿视频 此次模型升级进一步巩固其在图片生成领域的技术领先地位 [11]
国内首个移动端视觉生成大模型“橘洲”V1端侧版在长沙上线
快讯· 2025-05-21 11:08
行业动态 - 国内首个基于国产算力预训练的视觉基座大模型"橘洲"V1端侧版在长沙正式上线 [1] - 该模型能在手机端实现1024×1024分辨率图像的秒级生成 [1] - 模型具有成本低、质量高、速度快、轻量级、可离线等特点 [1] 公司技术 - "橘洲"大模型由湖南汇视威智能科技有限公司自主研发 [1] - 依托中科曙光(603019)算力完成开发 [1] - 在较短时间内完成了近4000万张图片训练 [1] 行业突破 - 成为全国首个在国产算力上完成整体训练和推理过程的视觉基座大模型 [1] - 实现移动端部署的视觉基座大模型 [1]
手机能畅玩,“橘洲”有多硬核?
长沙晚报· 2025-05-21 08:20
产品发布 - 湖南汇视威智能科技有限公司发布纯国产视觉基座大模型"橘洲"V1端侧版本 适配智能手机端 可实现1024×1024分辨率图像的秒级生成 [1] - "橘洲"是国内首个基于国产算力预训练的视觉基座大模型 能在移动端实现部署和推理 [1] - 公司计划每月迭代一个版本 并在开发者社区开源对应推理模型 逐步扩展至文生视频、视频理解等功能 [10] 技术优势 - "橘洲"采用轻量化架构 生成同样质量图片的体积和时间仅为国外主流开源模型的1/20 [8] - 模型参数量为云端解码模型的1/50 训练时间压缩至20小时 速度提升5倍 [14] - 使用跨模型结构极限蒸馏技术 在移动端保持图像生成质量 出图步数压缩至4步 [13][14] - 在安卓和IOS端均实现秒级生成图片 IOS端256像素图片生成仅需2.5秒 [14] 市场定位 - "橘洲"定位为面向开发者的B端大模型底座 旨在降低视觉大模型边端推理成本 [9] - 公司计划与生态合作伙伴共同打造多模态视觉模型服务矩阵 赋能虚拟换衣、企业海报制作等行业场景 [9][10] - 目标是用大模型赋能千行百业 未来三年瞄准万亿级大模型产业 [14] 研发背景 - 公司前身专注于视觉算法开发 已完成智慧园区、智慧社区等12大行业板块布局 突破数十项关键技术 [7] - 2024年下半年启动"橘洲"项目 入选湖南省100个标志性数字新基建项目 [7] - 与中科曙光达成战略合作 使用近70P国产算力进行模型训练 [12][13] 基础设施 - 采用中科曙光浸没液冷计算机技术 数据中心能耗降低30% [12][13] - 构建了包含4000万张图片的高质量图文数据集 采用高效能并行分布式训练策略 [13] - 嵌入了独特的中国文化基因库 更符合国人使用需求 [14]