Workflow
昇腾算力平台
icon
搜索文档
南大联合LibLib.ai、中科院自动化所,共同提出布局推理与精准编辑「海报设计大模型」PosterCopilot
机器之心· 2025-12-10 16:13
核心观点 - 南京大学等机构联合研发了首个解耦布局推理与多轮可控编辑的图形设计大模型PosterCopilot,旨在解决现有AI设计工具在专业工作流中的核心痛点,构建智能设计助手 [2] - 该模型通过创新的三阶段训练策略和生成式智能体架构,实现了专业级的版式生成、多轮精细化编辑及从灵感到素材的自动化落地,并在多项评测中全面超越现有商业与学术竞品 [14][34][35] 行业痛点与现有方案短板 - 当前以文生图模型为代表的AI工具无法处理分层结构,导致用户素材失真且缺乏精细化控制,难以融入专业工业设计流程 [6] - 现有的多模态布局模型存在四大根本性缺陷:1) 将连续坐标量化为离散Token,破坏了几何连续性,导致对齐错误与比例失调;2) 训练缺乏视觉反馈,模型处于“盲推”状态;3) 强迫模型向单一真值回归,扼杀了布局多样性与创造力;4) 不支持图层级迭代编辑,修改时“牵一发而动全身” [8][10][12] 解决方案:PosterCopilot框架与训练 - 提出渐进式三阶段训练策略,将布局生成从回归问题转化为分布学习与强化学习结合的范式 [14][15] - **阶段一(PSFT)**:通过引入高斯噪声扰动,让模型学习坐标分布,修复因Token化导致的几何空间扭曲 [15] - **阶段二(RL-VRA)**:引入基于DIoU和元素保真的奖励信号,修正元素重叠和比例失调等“幻觉”问题 [15] - **阶段三(RLAF)**:利用美学奖励模型进行偏好对齐,鼓励模型探索比训练数据真值更具视觉冲击力的布局方案 [15] - 构建了包含16万张专业海报、总计260万个图层的高质量分层数据集,通过OCR辅助技术解决了图层过度碎片化问题 [32] 核心功能与智能工作流 - **生成式智能体架构**:模型包含“接待模型”和“T2I模型”,可将用户抽象构思自动拆解为详细规划,并生成精准提示词以驱动素材生成,实现从灵感到物料的无缝转化 [16][17] - **全素材海报生成**:当用户提供完整素材时,模型专注于布局推理,进行符合美学规律的精准排列,并保障用户素材零失真 [21] - **缺素材智能补全**:在素材缺失的冷启动场景下,能理解设计意图,自动生成风格统一的背景或前景装饰层 [23] - **多轮精细化编辑**:支持精准单层编辑(如仅更换模特发色),同时完美“冻结”其他非编辑区域,打破了传统模型无法局部修改的限制 [31] - **全局主题迁移**:可将海报主体(如从“棒棒糖”切换为“冰淇淋”)及相关元素进行替换,同时保留原有排版骨架 [28] - **智能尺寸重构**:只需更改画布尺寸参数,模型即可根据新长宽比智能重新推理布局,一键适配不同媒体版面 [29] 性能表现与评测结果 - 模型以Qwen-2.5-VL-7B-Instruct为骨干,在涵盖布局合理性、文本可读性、素材保真度等六大维度的评测中表现卓越 [34] - **人工评测综合胜率**:对比微软Microsoft Designer、Nano-Banana及学术界SOTA模型(如CreatiPoster、LaDeCo),平均胜率超过74% [35] - **详细指标胜率**:在与其他主流模型的对比中,PosterCopilot在各项关键指标上均取得高胜率,例如在布局合理性上对Qwen-2.5-VL-72B胜率为96.8%,对Creatiposter胜率为92.8% [37] - **GPT-5评测**:在GPT-5的打分中,PosterCopilot在布局合理性和风格一致性上均大幅领先Qwen-VL-2.5-72B和Gemini 2.5 Pro [37] 技术落地与产业意义 - 该研究已获得华为-南京大学鲲鹏昇腾科教创新孵化中心支持,并完成了对国产昇腾算力平台的适配与部署,推动了国产AI设计技术的落地 [3] - 该框架为智能设计工具树立了新基准,通过让大模型掌握专业设计师的“图层思维”,为未来AI辅助创意工作流提供了新范式 [40]
从高交会到金博会 “深圳创新四姐妹”各握AI“王牌”
21世纪经济报道· 2025-11-23 08:37
文章核心观点 - 深圳高交会意向成交与投融资金额突破1700亿元,金博会部分项目意向与投融资金额达10.55亿元 [1] - “深圳创新四姐妹”(华为、腾讯、中国平安、比亚迪)集体展示AI领域最新成果,以多元路径推动AI深度融入千行百业 [1] - 四家企业AI布局各异:华为提供“超级底座”,腾讯打造“超级入口”,平安推出“超级客服”,比亚迪重构“超级终端” [1] 华为AI布局:“超级底座” - 公司提出全面智能化战略,核心是打造领先的ICT算力底座,使能百模千态 [2] - 在金融行业,AI在关键业务领域渗透率已达70% [2] - 联合12家生态合作伙伴,为金融行业打造安全可靠的“数字底座” [3] - 基于昇腾算力平台,与金融行业客户在三百多个创新应用场景展开实践,例如银行财富助手场景使客户覆盖面增加30%,重点场景成交率提升60% [3] - 招商证券使用昇腾部署模型,将年报撰写审核工作时间从4小时降低到20分钟 [3] 腾讯AI布局:“超级入口” - 微信AI化战略目标是推出一个AI智能体,让用户在生态内完成从需求理解到服务交付的全流程 [4] - 截至2025年9月30日,微信及WeChat合并月活跃账户数达14.14亿,同比增长2% [4] - 微信拥有强大的通信、社交、内容、商业和支付生态系统,为打造AI“超级入口”奠定基础 [4] - 腾讯元宝AI产品在今年前十月投放素材量位列中国大陆AI应用市场Top1 [5] - 国内尚未有AI应用能稳定突破亿级日活,对比ChatGPT全球周活跃用户超8亿 [5] 中国平安AI布局:“超级服务” - 公司公开“三大AI服务”:超级客服、家庭医生、养老管家,其中“AI超级客服”旨在提供管家式体验 [12] - “AI超级客服”将打造统一AI入口,连接平安全量金融、医疗、养老与生活服务,整合500多项线上线下服务 [12][13] - 针对安全合规,公司开发“AI质量合规大模型”,对全量数据质控,明确AI回答边界,当前AI回答准确率达98%-99% [13] 比亚迪AI布局:“超级终端” - 公司将AI深度融入辅助驾驶、智能座舱等核心环节,推出天神之眼辅助驾驶系统等颠覆性技术 [15] - 今年1-9月,公司全球累计销量达326万辆,同比增长18.64%,完成全年460万辆目标的70.87% [16] - 自2025年初推出天神之眼辅助驾驶系统,截至9月累计搭载车型销量已突破170万辆 [16] - 在车载生态方面,公司全品牌车型上线手车互联功能,并深度合作阿里云应用通义大模型 [15] 深圳市人工智能产业规划 - 《深圳市加快打造人工智能先锋城市行动计划(2025—2026年)》明确,到2026年,全市人工智能企业数量超3000家,独角兽企业超10家,产业规模年均增长超20% [2]
数据转价值、应用规模化,华为提出“ACT三步走”路径为企业智能化转型解题
环球网资讯· 2025-09-22 10:35
行业智能化核心痛点 - 企业在智能化转型中普遍面临投资难见回报、数据难转价值、应用难规模化三大痛点 [1] - AI产业发展的关键瓶颈从“为什么使用AI”转变为“如何创造实实在在的商业价值” [3] - 企业推进智能化转型必须跨越确保AI投资产生可衡量回报、将专有数据转化为核心竞争力、使AI应用从实验室试点成长为支撑核心业务三大障碍 [3] 行业实践案例与价值验证 - 在电力行业,南方电网基于华为昇腾算力平台与MindSpore AI框架开发“大瓦特”行业大模型,将缺陷识别效率提升5倍,图片识别准确率提高至90%以上 [4] - 在医疗领域,AI病历一体机方案在华西医院实现最快1秒生成病历,医生审核阶段平均修改不超过4处,大幅压缩问诊时间并提升病历质量 [5] - 案例证明AI价值落地需与行业核心业务深度绑定,以技术突破解决真实业务痛点,而非追求“炫技式”试点 [5] 行业智能化五大关键发现 - 场景选择至关重要,AI价值在于与核心生产场景深度融合以重塑流程和交付方式 [6] - 垂域数据质量决定行业模型能力,企业需基于自身高质量数据对通用模型训练调优以构筑差异化竞争力 [6] - 智能体正在快速规模化,驱动对大规模推理的旺盛需求,人机协作成为新的组织范式,系统化治理与风险管理是必须守护的底线 [6] ACT三步走实施方法论 - 评估高价值场景阶段,华为提出AI场景选择评估框架,从商业价值、场景成熟度、业务与技术融合度三个维度量化评估,已帮助客户落地1000多个AI核心生产场景 [7] - 结合垂直行业数据校准模型阶段,华为提供完整工具链,通过Model Arts开发平台和Data Arts数据治理平台支持多模态数据处理与知识图谱集成,并利用“湖仓一体”平台MRS将原始数据转化为可用资产 [8] - 规模化部署AI智能体重塑业务阶段,华为一站式Versatile平台可自动生成100多个步骤的智能体与业务流程,并建立系统化AI人才发展体系让业务人员深度参与 [8] 生态合作与行业解决方案 - 华为已汇聚6300多家鲲鹏伙伴、2700多家昇腾伙伴、70多家行业咨询公司及750家独立软件开发商,形成覆盖技术研发、方案落地、咨询服务的完整生态链 [11] - 联合伙伴发布9大行业智能化解决方案,覆盖城市、科技、医疗、银行等关键领域,例如钢铁高炉炉温预测解决方案通过AI模型实时预测炉温,油气智慧勘探开发解决方案结合地质数据与AI算法提升勘探准确率 [11] 行业智能化发展趋势 - 华为提出的路径与发现将智能化拉回“价值驱动”,以高价值场景为起点,垂域数据为核心,规模化落地为目标 [13] - 随着路径落地与解决方案推广,行业智能化或将告别碎片化试点阶段,进入规模化复制的新阶段,推动数字经济与实体经济深度融合 [13]
华为提出行业智能化「三步走」路径,为产业AI落地破题
36氪· 2025-09-20 21:50
文章核心观点 - 华为提出产业AI落地的“三步走”路径,旨在帮助企业将AI技术转化为核心业务驱动力和商业价值 [2][8] - 企业智能化转型成功的关键在于将AI与高价值核心生产场景深度融合,而非零散的技术应用 [2][5] - 华为通过全栈技术能力和开放生态,为行业提供可复制、可落地的AI解决方案,成为产业智能化的“黑土地” [13][16] 华为的智能化转型关键发现 - **场景选择至关重要**:AI价值在于与核心生产场景深度融合,重塑流程并推动智能产品与服务交付 [5] - **垂域数据质量决定行业模型能力**:企业需基于高质量行业数据训练通用模型,构建差异化竞争力 [5] - **智能体规模化驱动推理需求**:AI Agents快速普及,催生对大规模推理的旺盛需求 [5] - **人机协作成为新组织范式**:智能化转型推动人机协同的工作方式变革 [5] - **系统化治理与风险管理是底线**:需建立有效治理机制确保AI应用安全、可持续、可信赖 [5] 华为的“三步走”落地路径 - **评估高价值场景**:以业务本质为导向选择战略场景,避免技术点缀 [6][8] - **垂直行业数据校准模型**:利用行业数据对通用模型进行训练调优,形成专属行业模型 [8] - **规模化部署AI智能体**:通过智能体重塑关键业务流程,实现AI价值规模化 [8] 华为的AI基础设施与行业实践 - **全栈技术能力**:提供从底层算力(昇腾集群)、操作系统、开发平台(ModelArts、DataArts)到行业应用的端到端解决方案 [9][13] - **电力行业案例**:与南方电网开发电力大模型“大瓦特”,处理问题图片效率达传统算法10倍(每分钟100张),秒级生成电网异常处置预案 [11] - **医疗行业案例**:为润达医疗打造AI病历一体机,在华西医院实现1秒生成病历,医生审核阶段平均修改不超过4处 [11] 华为的生态合作体系 - **合作伙伴规模**:生态体系汇聚6300多家鲲鹏伙伴、2700多家昇腾伙伴、70多家行业咨询公司及750家独立软件开发商 [15] - **生态协同模式**:华为提供技术平台,合作伙伴贡献行业Know-how,共同将通用AI技术转化为定制化解决方案 [15] - **正向循环效应**:生态扩大可吸收最新需求反哺技术能力,形成增长飞轮 [15]
华为提出行业智能化「三步走」路径,为产业AI落地破题
36氪· 2025-09-20 21:34
产业AI落地挑战与华为解决方案 - 企业普遍面临AI技术供给与业务价值之间的巨大鸿沟,真正能将AI转化为核心竞争力的企业凤毛麟角[3][8] - 华为提出产业AI落地的核心在于让AI在真实业务场景中运行并创造商业价值,而非单纯比拼模型参数或算法[3] - 华为联合伙伴发布了涵盖政务、教育、医疗、金融、制造等9大行业解决方案,致力于打造可复制、可落地的行业标准范式[5][6] 智能化转型关键发现 - 场景选择至关重要:AI价值在于与核心生产场景深度融合,重塑流程,推动智能产品与服务交付[9] - 垂域数据质量决定行业模型能力:企业需基于自身及行业高质量数据训练通用模型,形成专属行业模型以构筑差异化竞争力[9] - 智能体(AI Agents)正快速规模化,驱动对大规模推理的旺盛需求[9] - 人机协作成为新的组织范式,系统化治理与风险管理是必须守护的底线[9] - 通用模型如同"毛坯房",深厚行业数据积累才是智能化的质量根基,几乎不存在放之四海皆准的标准化解决方案[10] 华为"三步走"实施路径 - 第一步评估高价值场景,第二步结合垂直行业数据对模型进行校准,第三步规模化部署AI智能体以重塑关键业务[13] - "三步走"路径将AI从技术概念转化为业务价值的系统性工程,需依托面向AI的ICT基础设施覆盖全流程[15] - 华为提供完整工具链如ModelArts一站式AI开发平台、DataArts数据治理平台,帮助企业将原始数据转化为知识再转化为模型[15] 行业应用案例与成效 - 电力行业:华为与南方电网开发电力行业首个自主可控大模型"大瓦特",每分钟处理100张问题图片,效率达传统AI算法10倍,可秒级生成电网异常处置预案[18] - 医疗行业:润达医疗基于昇腾推理服务器打造AI病历一体机,最快1秒生成一份病历,医生审核阶段平均修改不超过4处,极大提升诊疗效率[18] - AI已成为驱动业务增长的关键引擎,贯穿研发、生产、服务全价值链,而非单点创新[19] 华为全栈技术能力与生态优势 - 华为是业界少有能提供从底层算力、操作系统、开发平台到行业应用的端到端解决方案厂商[21] - 全栈技术布局确保各层深度协同优化,降低系统集成复杂度,提供一站式、高性能、稳定可靠的AI底座[21] - 生态体系汇聚6300多家鲲鹏伙伴、2700多家昇腾伙伴、70多家行业咨询公司及750家独立软件开发商,合作伙伴将通用AI技术"翻译"成定制化解决方案[24] - 华为以技术为肥、开放生态为壤,与伙伴共同培育智能创新森林,为产业构建生生不息的"黑土地"[25][26]