Workflow
Skywork UniPic
icon
搜索文档
豆包图像编辑模型3.0发布,扣子正式开源;1688全面AI化丨AIGC日报
创业邦· 2025-07-31 08:08
火山引擎AI产品升级 - 火山引擎发布豆包图像编辑模型3.0、同声传译模型2.0及豆包大模型1.6系列升级,满足企业多元业务场景需求 [1] - 开源扣子核心能力,发布企业自有模型托管方案、Responses API等多个模型服务和工具产品,为构建Agent提供基础设施 [1] 微软Edge浏览器AI功能 - 微软在Edge浏览器中推出Copilot模式,增强AI功能包括阅读和理解网页内容、生成对比表格及语音功能 [2] - Copilot模式处于实验阶段,提供限时免费使用,微软认为浏览器是构建AI代理的最佳方式 [2] 昆仑万维多模态模型 - 昆仑万维推出并开源多模态统一预训练模型Skywork UniPic,融合图像理解、文本到图像生成、图像编辑三大核心能力 [3] - 模型基于大规模高质量数据进行端到端预训练,具备良好的通用性与可迁移性 [3] 1688全面AI化 - 1688推出"1688AI版"App和免费查企工具"88查",并对现有App进行全面AI化升级 [4] - 新App集成AI搜索、AI选品、AI创款、AI图搜、AI查企等五大核心功能,聚焦创业与拿货场景 [4]
腾讯研究院AI速递 20250731
腾讯研究院· 2025-07-31 00:03
生成 式 AI 一、 ChatGPT「学习模式」火爆上线,24小时的导师免费用 1. OpenAI上线ChatGPT新功能"学习模式",采用苏格拉底式逐步引导方式,帮助用户深入理 解复杂概念; 2. 所有免费版、Plus版、专业版和团队版用户均可免费使用,功能包括交互式提示、分步解 答和个性化支持; 3. 该模式背后的提示词被开发者Simon Willison发现并公开,系统会根据用户的教育背景和 知识基础调整教学策略。 https://mp.weixin.qq.com/s/_tdb7OORoHRQxQ-5jg7s5Q 二、 Grok即将推出了「Imagine」视频功能,挑战谷歌Veo 3 1. 马斯克的xAI即将为Grok iOS应用推出全新图像视频生成功能"Imagine",支持带音频的视 频生成,可一次性生成4段视频; 2. 数据集将3D高斯技术与自研空间大模型SpatialLM深度融合,打通"现实-虚拟-现实"闭 环,使其成为具身智能领域的"ImageNet"; 2. 实测效果逼真,细节丰富,支持多种风格生成,用户可通过语音或文字描述进行创作; 3. Imagine将拥有独立标签页,提供近乎实时的图像 ...
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
量子位· 2025-07-30 12:48
AIGC 的范式,已经被悄然 改变。 从割裂地处理文本、图像、声音,到现在,大众在应用领域的反馈已经证明, AI需要以更接近人类认知的方式,融合多模态信息 。 新的技术趋势值得关注,也有人第一时间开源了对新范式的深入思考: 鱼羊 西风 发自 凹非寺 量子位 | 公众号 QbitAI 听说了吗,GPT-5这两天那叫一个疯狂造势,奥特曼怕不是真有些急了 (doge) 。 但有一说一,回顾上半年最火AI事件,GPT-4o带来的"吉卜力"风暴,还是热度TOP。 △ 数据来自微信指数 不仅由"万物皆可吉卜力"为始,GPT-4o生图功能被网友们疯玩至今,更重要的是,还引发了更深的技术思考: 昆仑万维已开源 多模态统一模型Skywork UniPic ,和GPT-4o呈现出类似的图像一体化能力,在单一模型里实现 图像理解、文本到图像生 成、图像编辑 三大核心能力的深度融合。 对生图提示词的理解力,是这样的: 提示词:两位寿司师傅在江户时代熙攘的街市投掷彩虹寿司。他们头顶的纸灯笼明灭闪烁。整个场景呈现出像素化的复古游戏画风。 把图片转换成吉卜力风格,也很有内味儿: 并且相比狂卷大参数量的同类模型,Skywork UniPic ...