Workflow
歸藏的AI工具箱
icon
搜索文档
藏师傅教你用 Lovart x Seedream4.0 搞定终极自媒体神器
歸藏的AI工具箱· 2025-09-13 11:54
Lovart平台功能特点 - Lovart平台与Seedream 4.0模型结合,可将长文和文档一键转换为适合小红书等社交媒体平台的套图,支持通过文字精准控制内容生成[3] - 平台支持生成风格统一的3:4比例信息卡片,第一张卡片包含醒目标题和主题简介,后续卡片分章节展示内容,适用于学术论文、古文等多种题材[9][27][33] - 生成内容支持中英文双语输出,英文小字生成清晰度高,适合出海媒体使用[9][10] - 通过Magic Canvas功能可实现精准修改,用户可在图片上添加评论指定修改需求,如图标添加、文字调整或错误修正[16][18][19][24] 模型与活动推广 - Seedream 4.0模型在9月10日至9月20日期间免费开放使用,不扣除积分[4] - 9月20日前开通基础会员可全年不限量使用Seedream 4.0及Nano Banana模型[4] - Veo3模型全系三折优惠,Pro+会员可免费使用可灵和hailuo模型至9月20日[4] 多场景应用案例 - 学术内容转换:生成扁平化现代风格信息图,适用于论文解读,卡片包含标题、副标题及详细文字解释[9][10][14] - 古文教育应用:生成中国风水墨风格卡片,配合竖排宋体文字展示古文内容,如《爱莲说》三等分画面设计[24][27] - 人物传记生成:基于联网搜索能力自动整理信息,如生成12张苏轼生平卡片,按时间顺序展示关键节点[29][32][33] - 科普内容创新:将科学家事迹转化为仙侠小说风格,包含仙号、定场诗及科研场景仙侠化设计,如奥本海默"仙号"及爱因斯坦人像ID一致性[34][35][36] 内容生产优化 - 长文档处理建议先通过LLM总结以优化结构清晰度[9] - 支持TTS口播稿生成,结合视频模型可低成本产出完整视频内容[36][38] - 提示词可灵活调整主题、风格、文案等要素,实现多玩法混搭[38]
顶级邪修|万字教程|教你速通豆包・图像创作模型 Seedream 4.0
歸藏的AI工具箱· 2025-09-09 15:47
产品发布与市场定位 - 火山引擎上线豆包・图像创作模型Seedream 4.0 支持图片生成、连续图片编辑、多图参考的全能图像创作功能 [2] - 模型具备优秀的美学表现、世界知识、提示词遵循、一致性保持、精准编辑能力及完美中文支持 可自定义生成比例并直出4K图片 被定位为当前中文用户T0级别图像创作模型 [2] - 企业客户可通过火山引擎MaaS平台火山方舟接入Seedream 4.0 该渠道为唯一支持4K直出的版本 个人用户可通过豆包、即梦APP体验 4K版本于当晚20:00开放 [3] 核心功能与应用场景 - 模型支持精细化AI修图 可响应光影、滤镜、装造、发型等组合提示词 例如分割光、环形光、伦勃朗光等复杂打光方式 [5][9][12][18] - 支持连续图像生成与视频分镜创作 在生成6张图后仍能保持人脸ID一致性 结合Seedance首尾帧视频模型可生成转场效果 [22][23][25][26] - 具备PPT内容转视觉图像能力 通过多模态模型生成提示词 输出符合思维模型(如金字塔、垂直面板、协同环形等)的磨砂玻璃或高质感金属材质设计 [29][32][34][35][36] - 支持个性化定制功能 包括玻璃质感头像图标生成、宠物幻化山海经神兽护身符、玄学鼠标垫设计、创意头像制作及无痛Cosplay [46][51][55][58][63][67] - 可基于图像内容自动生成手帐风格日记 结合日期、天气及自拍图像生成拼贴画风格记录 [73][74] - 支持UI设计稿及海报修改 可根据配色参考图或主题指令(如星巴克主题)自动调整设计元素 [78][79][82][83] 内容创作与商业化应用 - 提供多风格知识卡片生成模板 涵盖仙侠古籍、现代信息图、游戏装备、塔罗牌、技术蓝图、博物学家手册及教科书插图等风格 适配不同受众及概念解释需求 [86][89][90][94][96][97][100][102] - 模型支持将任意生活碎片(如草图、声音、视频截帧)转化为可交付产品 通过简短提示词实现质感转换 降低内容创作门槛 [107][108][109][110] - 已有用户基于模型功能实现商业化 包括接单定制头像、制作视频分镜及开发自动化工作流 [3][27][61]
量大管饱!让藏师傅疯狂涨粉的 Nano Banana 玩法合集 02
歸藏的AI工具箱· 2025-09-05 17:12
核心观点 - Nano Banana作为多模态AI模型在图像生成、视频制作和3D建模等多个创意领域展现出强大能力 其应用范围从艺术创作扩展到实用工具开发 显示出在内容生成市场的巨大潜力[1][3][73] AI艺术创作应用 - 利用书法字帖和人物姿势生成具有中国风意境的AI舞蹈视频 通过特定提示词控制人物风格和光影效果[4] - 使用即梦图片3.1模型生成基础图像 提示词包含CG厚涂风格、精致五官、瓷白肌肤等详细视觉要求[4] - 通过可灵2.1首尾帧生成视频 配合专业转场提示词实现平滑过渡 支持A类关联性强的原地演变和B类差异巨大的运镜驱动转场策略[12][14][15] 3D建模与可视化 - 将建筑平面图转换为等距摄影级3D渲染图 使用Hyper3d工具生成GLB格式3D文件[17][24][26] - 基于3D俯视图生成指定视角的室内渲染图 如从餐桌看向卫生间的视角 并支持家具样式替换[19][20][22] - 通过Cursor和GPT-5开发前端网页 实现3D模型交互展示 点击特定位置可显示对应渲染图[28] 营销与内容创作 - 创建夸张广角镜头效果的视频封面 通过前景物品放大技术提升点击率 比平时封面效果更好[33][35] - 利用视觉推理能力实现照片位置反推和地标图像生成 基于地图标记生成对应实景照片[37][38][39] 产品设计与转换 - 车辆改装功能可指指定涂装参考图更改车辆配色、轮毂设计和拉花装饰 并生成多阶段改动图片[41] - 将饮品图像转换为柔软充气玩具设计 采用哑光织物纹理和细微缝线强调充气效果[51][52] - 建筑转换为等距3D图标风格 支持任意建筑照片转换而非仅限于地标建筑[49] 教育内容生成 - 生成多张涂鸦风格图像解释"期货"概念 采用统一的手绘风格和英文文本 适合制作知识卡片[54] - 开发专用网页工具支持3:4比例图片导出 可直接用于小红书内容发布[56] 实体产品可视化 - 将汽车渲染图转换为收藏级手办模型 包含印刷包装盒和3D打印机场景[58][59][60] - 动漫角色转真人cosplay并手持手办 保持发型、配饰和服装的高度还原[62][63] 时间序列预测 - 预测建筑100年后荒废状态的形象生成 视频形式展现更具表现力[65][66][68] 多图像融合技术 - 混合无关图像生成连贯故事分镜 保持美学表现和人物一致性 across 9张连续画面[69][71] - 支持即梦智能多帧视频生成 实现多场景串联和角色整合[73]
Nano Banana 邪修之王最强科研成果!教你自定义生图比例!
歸藏的AI工具箱· 2025-09-02 12:59
核心观点 - 通过特定提示词和垫图方法可有效控制Nano Banana生成图像的比例 解决原模型输出比例不可控的生产应用难题 [2][4][12] 技术原理 - 多图输入时输出比例会随机匹配其中一张图的特性 通过垫图方式实现比例控制 [4] - 需准备两张图片:待修改原图(首位)和比例模板图(次位) 顺序不可颠倒 [6][8][16] - 使用GLif启发的方法但扩展至图生图场景 支持对已生成图片进行二次比例调整 [4] 操作流程 - 提示词需明确指令:"Redraw the content of Figure 1 onto Figure 2, add content to Figure 1 to fit the aspect ratio of Figure 2, completely clear the content of Figure 2, and only retain the aspect ratio of Figure 2" [13][15] - 在AI Studio或Gemini APP(推荐Gemini2.5 Pro模型)中操作 后者效果更优 [15] - 若出现蓝色背景异常 通过多次抽卡可解决 [15] 资源支持 - 提供覆盖常见比例的模板图集 支持自定义比例(需通过Figma制作) [8] - 模板图集可通过网盘下载(链接:https://pan.quark.cn/s/163037f38e88 提取码:7tJV) [18]
把 Nano Banana 塞进 Lovart 能有多离谱?藏师傅周末带你免费玩
歸藏的AI工具箱· 2025-08-29 22:24
Lovart平台与Nano Banana模型集成功能 - Lovart平台在Nano Banana模型上线后迅速完成适配并推出周末免费活动 用户可免费使用该模型而不消耗积分 [1] - 平台提供模型选择功能 用户需单独勾选Nano Banana以避免调用其他付费模型 [2] Nano Banana模型的核心技术能力 - 支持通过涂鸦替代提示词的方式实现图片精确修改 与Lovart的Magic Canvas功能高度契合 [2] - 具备强大的世界知识 可识别地图和地标建筑 例如能根据谷歌地图上的箭头标记生成祈年殿图像 [3][4][6] - 支持多物品替换与生成的一致性保持 例如将7件家具按示意图精确摆放到房间指定位置并保持细节一致 [8][10] - 默认输出分辨率较低 但可通过Lovart的Upscale功能直接放大图像 [6] 多模型联动应用案例 - 汽车改造案例:从白模汽车开始 通过分步提示实现配色更改、轮毂改造、拉花添加及场景转换 生成5张高细节图像 再通过可灵2.1首尾帧模型生成连贯视频并添加配乐 [13][15][16][17] - 食谱生成案例:将冰箱食材图片输入后 自动生成包含食材标签、准备步骤图标和成品展示的极简风格食谱信息图 进一步生成餐桌展示图和完整烹饪教程视频 [19][22][23][26][28][30] 创作效率提升与行业影响 - 大幅降低设计门槛 用户无需专业设计软件即可通过涂鸦和文字输入实现复杂创意表达 [8][10] - 自动化流程实现多模态内容生成(图像、视频、音频)的端到端整合 极大提升内容创作效率 [15][28][30] - 技术应用场景扩展到家居设计、视频制作、美食教程等多个垂直领域 [10][19][30]
顶级邪修倾囊相授!藏师傅教你速通Nano Banana
歸藏的AI工具箱· 2025-08-27 15:26
大家好,这里是歸藏(guizang),今天教大家如何最大程度发掘最强图片编辑模型 Nano Banana 的潜力。 昨晚我们期盼了很久的图像编辑模型终于上线了,大家不再需要从竞技场吭哧瘪肚抽卡,可以爽 玩,而且谷歌一如既往的发挥了财大气粗的优势,可以让你疯狂白嫖。 在做了一晚上的通宵测试之后,发现这玩意真的很离谱。直接把 Adobe 和一众修图软件整麻了。 以往复杂的修图操作现在都可以一句话搞定,而且人脸的相似度相对于 FLUX Kontext 高了一截。 不多逼逼,先来总结一下这期教学内容: 如何使用 Nano Banana 首先来看一下如何使用 Nano Banana ,优先推荐在谷歌的 AI Studio ( https://aistudio.google. com/ )上使用,因为免费而且不会掺水。 进入页面后,我们在页面最右侧将模型切换到 Gemini 2.5 Flash Image Preview 这个模型,没错 这就是 Nano Banana的官方名称。 用 Nano Banana 帮你修图:祛痘、瘦身、瘦脸、都不在话下 烂片拯救者,用 Nano Banana 一键让你的普通照片变大片 用简洁高 ...
藏师傅教你用 Nano Banana 编辑图片做手办
歸藏的AI工具箱· 2025-08-23 17:24
文章核心观点 - 介绍使用Nano Banana模型在LM Arena平台进行图像编辑和手办图制作的具体方法 重点包括上传图片 输入提示词 选择最佳结果以及利用可灵2 1首尾帧模型增强视觉效果 [1][2][3][10] 操作流程 - 访问LM Arena平台并选择Image模式以触发图像模型功能 [3] - 上传需要修改的图片并输入提示词 提示词需包含具体场景描述如角色骑亚洲虎 PlayStation游戏盒 电脑显示游戏界面等元素 [3][4] - 平台每次生成两张不同模型的图片 用户需在输入框上方选择最佳结果并确认模型名称 若未出现Nano Banana模型需重复生成流程 [7] 效果增强 - 利用可灵2 1首尾帧模型将静态图片转换为视频 通过提示词实现手办从实体到CG画面的动态转化过程 包括反重力漂浮 材质变化及环境转换等特效 [10] - 通过添加原始CG画面和音乐进行剪辑 进一步提升视觉表现力和整体观感 [12][13]
可灵 2.1 首尾帧藏师傅外挂教程:两张图→大片,附万能提示词
歸藏的AI工具箱· 2025-08-22 17:10
可灵2.1首尾帧模型技术能力 - 模型在提示词理解和遵循以及图片转换自然度方面表现优异 基本达到首尾帧功能天花板[1] - 支持完全无关两张图片的顺滑转换 但前后关联图片能带来更强视觉冲击[2] - 生成效率极高 单条视频从制作到生成仅需半小时 期间可并行处理其他任务[2] 图片素材获取方法论 - 采用相同提示词抽卡方式 利用模型多图生成时种子一致特性 可获得相似度高图片 特别适合展示类视频[9] - 通过修改提示词抽卡 先生成尾帧图片后再逆向调整部分元素 实现人物或物品的移动与消失效果[12] - 运用FLUX Kontext等图像编辑模型 通过自然语言指令精确控制图片编辑 实现材质添加与背景更换[15] 提示词生成系统 - 开发差异化提示词生成策略 自动判断图片关联性(A类关联性强/B类差异巨大)并匹配对应转场方案[28] - A类图片采用"原地演变"策略 聚焦主体状态风格或环境变化 避免使用摄像机移动[29] - B类图片采用"运镜驱动转场"策略 强制使用推拉摇移等镜头运动连接画面 并附加特效变化增强关联性[29][32] 商业化应用场景 - 电商领域可实现模特产品一致性展示 解决手部细节问题 可用性极高[18] - 支持文字特效生成 通过材质替换和环境同步变化提升视觉表现力[21][23] - 玩偶变装等娱乐化应用展现技术泛化能力[25] 工作流优化方案 - 建议将流程固化为标准化模板(首尾帧链接+差异分类+提示词+成片链接) 实现10秒出提示词和半小时出片的高效生产[39] - 强调从"特效思维"转向"叙事思维" 通过构建因果关联使视频单价提升5倍[41] - 三张王牌拿图法(同提示词/改提示词/图像编辑)结合万能提示词形成完整解决方案[40]
今天起,不用下载飞书也能用飞书多维表格了!
歸藏的AI工具箱· 2025-08-21 12:50
产品战略升级 - 飞书多维表格作为独立产品开放 无需下载或注册飞书即可使用 支持跨平台接入第三方IM系统[3][4][6] - 产品保留完整功能 包括仪表盘、工作流、高级权限及AI能力 有效降低企业数字化成本[8] - 目标成为零代码自主定制业务系统的新起点 适用于不同规模企业[6][18] 核心功能优势 - AI功能全面覆盖 包括AI字段捷径、仪表盘AI分析和AI生成公式 大幅降低使用门槛[11] - 专业级BI分析能力 具备BI主题和组件 完整覆盖专业软件常用功能[13] - 高性能数据库底座 可承载高速增长且结构复杂的核心业务[15] - 零代码搭建系统 无需编程能力即可实现业务创新[17] 市场应用案例 - 永旺使用产品替代亿元级自研派遣员工管理系统[17] - 伊芙丽与珂蒂丝的会员管理系统周活超2000人[17] - 海底捞、雅迪等国内外知名企业均已落地应用[17]
谷歌Pixel发布汇总:硬件与软件全面AI化,那谁你就学叭
歸藏的AI工具箱· 2025-08-21 12:50
核心观点 - 谷歌2025年硬件发布会全面展示AI与硬件深度融合 产品覆盖手机、手表、耳机及智能家居设备 端侧模型广泛部署 功能聚焦健康管理、影像处理和多设备协同 [1][30][32] - AI功能实现从被动触发到主动建议的转变 系统级应用深度整合 支持自然语言交互和实时数据分析 [17][24][32] - 公司通过自研Tensor芯片强化本地AI算力 但芯片架构选择导致性能提升受限 [15] AI健康管理功能 - Gemini驱动个人健康教练 提供个性化健身计划 实时调整训练目标 基于睡眠数据生成适应性睡眠计划 [4][5] - 健康教练支持实时签到调整 主动分享健康趋势洞察 解答科学依据的个性化问题 [5] - Pixel Watch 4集成Gemini健身教练 通过抬腕交谈功能提供主动健身指导 基于手表指标数据 [26] AI影像处理能力 - 自然语言修图功能支持语音或文字指令编辑照片 可实现背景替换、添加创意元素等操作 [7] - 拍照教练提供构图、光线等逐步引导建议 帮助提升拍摄质量 [9] - Pixel 10 Pro系列配备100倍数码变焦 通过本地扩散模型补充放大后的细节 [11] 多模态端侧AI部署 - 所有Pixel 10手机搭载Tensor G5芯片 本地运行Gemini Nano模型 [15] - Voice Translate功能实现实时通话翻译 模仿对方音色 目前不支持中文 [19] - 录音机应用可基于哼唱生成音乐 支持风格选择 [26] 智能家居与设备协同 - Gemini for Home智能大屏设备支持环境视觉识别 模糊指令媒体播放 复杂智能家居控制 [13] - Magic Cue功能串联谷歌应用信息 在合适场景建议一键分享 [17] - NotebookLM与截图、录音应用整合 自动建议内容收藏至笔记本 [24] 硬件产品AI升级 - Pixel Buds Pro 2耳机内置Tensor A1芯片 支持嘈杂环境通话 自动调节降噪 通过头部动作接听电话 [28] - Call Screen功能为未接来电提供实时转录 AI识别留言并建议后续操作 [21] - Gemini Live更新支持摄像头物品高亮 Veo3模型生成视频 [23]