即梦图片3.0

搜索文档
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-06-13 21:11
模型动态 - OpenAI推出o3-pro实测和4o思考模式两项新模型技术 [2] - Meta发布V-JEPA 2世界模型 聚焦多模态理解能力 [2] - Mistral AI推出Magistral推理模型 强化商业场景应用 [2] - 面壁智能发布MiniCPM 4.0模型 参数规模未披露 [2] - 小红书开源dots.llm1模型 布局社区生态 [2] - 智源研究院推出悟界系列模型 专注认知智能研究 [2] 应用进展 - OpenAI上线高级语音拟人功能和AI数学天才应用 [2] - 字节跳动迭代豆包大模型至1.6版本 同步推出即梦图片3.0工具 [2] - 谷歌发布Veo 3 Fast版视频生成工具 ElevenLabs升级v3语音引擎 [2][3] - 智谱AI推出CoCo企业助手 DreamTech发布影视级3D模型系统 [2] - Figure AI展示机器人进展 Krea AI推出1代创意设计平台 [2] - 夸克开发高考志愿大模型 厦大联合企微推出校园AI万事通 [3] - 苹果更新Xcode 26开发工具 美团发布NoCode低代码平台 [3] 科技突破 - Figure研发劳动力系统 理想汽车布局空间与穿戴机器人 [3] - 英伟达推出量子CUDA-Q平台 苹果发布六大OS系统更新 [3] - 中科院开发启蒙系统 荣耀宣布进军机器人领域 [3] 行业观点 - Altman预测AGI技术发展时间线 Ilya Sutskever提出AI全能化假说 [3] - 苹果质疑当前AI推理能力 OpenAI探讨人类对AI的依赖性 [3] - a16z分析生成式引擎优化趋势 Richard Sutton预言经验主导时代 [3] 资本与事件 - Meta投资Scale AI并重建超级智能研究小组 [3][4] - Midjourney面临版权诉讼 Meta签署大规模核电合作协议 [4]
即梦图片3.0又重磅更新,这可能是对普通人最有用的一次。
数字生命卡兹克· 2025-06-06 09:08
即梦图片3 0智能参考功能更新 - 核心功能升级:即梦图片3 0新增智能参考功能 支持用户上传图片作为垫图进行二次创作 实现字体、海报等设计的快速修改[1][24][28] - 操作流程简化:用户仅需上传图片后选择"智能参考"选项 无需复杂设置即可调用图片3 0模型进行生成[24][26][28] - 灰度测试状态:当前功能处于内测阶段 部分用户可能无法使用图片3 0 但预计1-2周内全量上线[29] 中文设计场景应用突破 - 字体设计革命:模型可识别原图地标元素(如北京天坛)并自动替换为目标城市特征(如上海东方明珠) 实现"一句话改字"效果[4][5][8] - 电商海报生成:支持将随手拍的商品图(如面包、奶茶)一键生成4种风格海报 具备红橙撞黄背景等精准风格控制[15][17][19][32] - 表情包自由:可修改麻将牌文字("发发发"→"胡胡胡")或调整表情包文案 实现零门槛创作[11][13][54] 技术能力与成本优势 - 中文处理领先:模型在中文字体生成方面达到"孤独求败"水平 文字准确率接近100% 支持"宇宙电波"等复杂文案修改[9][21][58] - 成本效益突出:生成4张图仅需2积分 结合每日赠送66积分的机制 普通用户基本无需付费[36][60] - 格式优化建议:使用透明底PNG图片可获得最佳效果 需避免webp格式导致的锯齿问题[44] 行业影响与设计范式变革 - 效率提升显著:传统需数小时完成的字体设计现可通过AI一键生成 覆盖90%中文出图场景(商品图、电影海报等)[8][58] - 工作流重构:设计师可通过组合不同AI风格快速匹配甲方需求 减少重复修改环节[71][72] - 创意门槛降低:用户可用大白话描述需求(如"软萌也能暴走") 无需专业设计术语即可获得高质量输出[36][60] 模型性能细节 - 生成质量控制:需通过3轮(12次)生成筛选才能获得理想排版效果 反映审美维度仍需人工干预[34] - 复杂场景局限:对设计感极强的特殊字体修改成功率仍偏低[56] - Prompt优化建议:详细描述(200+字)可获得更精准输出 推荐结合GPT等工具优化指令[32][38]