歸藏的AI工具箱 - 财报，业绩电话会，研报，新闻

歸藏的AI工具箱

搜索文档

歸藏的AI工具箱· 2025-09-25 18:25

GPT-5 Codex性能表现 - 美学表现直接拉满，仅修改一次即可获得直接给设计稿链接的结果[1] - 即使没有设计稿，单纯使用提示词，其设计风格也与其他模型有显著区别[3] - 根据Qwen 3 MAX播客文章内容生成的网页效果非常出色[3] Figma远程MCP服务升级 - 最大更新是不再需要复杂的添加流程和本地Figma客户端[5] - 传输信息相当多，连设计稿素材图都变成图片链接返回[15] - 需要订阅用户才能使用，中国暗网"闲鱼"可解决订阅问题[8] 工具集成与配置方法 - GPT-5 Codex已有API，常见AI IDE如Cursor等已集成，选择后可直接使用[5] - Cursor配置需在设置的MCP标签页添加特定JSON代码[5][6] - Claude Code配置需在终端输入命令添加MCP，并使用/MCP命令选择登录选项[9][10] 网页生成优化策略 - 生成HTML时最好加上Tailwind CDN和Apache ECharts 5 CDN以节省Token[13] - 复杂页面可让AI分部分完成，先搭建关键组件和页面框架再填充内容[15] - 设计稿质量影响输出，若未使用自动布局或层级关系有误，生成效果会受影响[16] Vibe Coding基建发展前景 - 成熟设计系统设计稿和对应前端组件库配合MCP可极大降低Token消耗[21] - AI接入后效率提高，但对使用者的审美和基本功知识仍有需求[21] - 基建仍有非常大的增长空间[21]

可灵2.5Turbo实测｜顶尖AI视频模型，真能打平CG吗？

歸藏的AI工具箱· 2025-09-23 18:37

可灵2.5 Turbo模型性能提升 - 模型提示词理解能力显著增强，尤其擅长处理包含复杂因果和时间关系的指令 [1] - 在超高速战斗和复杂运镜场景下，视频生成稳定性更高 [1] - 图生视频功能风格保持相当稳定，生成视频的风格一致性更强 [1] - 高品质模式5秒视频生成价格从35积分降至25积分，降价幅度约29% [1] 复杂动作与时序理解能力 - 模型能够准确执行复杂提示词序列，如规定运镜方式后连续完成伸手攻击、怪物扑咬等动作 [2][3] - 在执行复杂动作如人物转身时，主体角色完全避免变形或溶解等问题 [3] - 能够根据首帧图片不清晰的怪物形象，脑补并生成后续画面中清晰完整的怪物形象 [3] - 处理服装平滑变换等复杂时序提示词时过渡顺滑，服装变化采用生长动画和蒙版等自然方式 [6][7] 与世界顶级CG渲染作品对比 - 在还原世界渲染大赛Top 5作品时，模型能把握照明弹触发场景变亮的核心亮点，并丰富水晶生长等细节 [10][11] - 对于固定机位的复杂战斗场景，模型能准确分析画面视觉元素，使所有应该运动的物体都在运动，并模仿原始CG运镜 [11][12] - 在人物奔跑、躲避攻击等动作表现上相当自然流畅，甚至能主动添加提示词未要求的"踉跄"步伐以符合物理逻辑 [13][17] - 变狼形生物的动作处理几乎与CG同步，人物和狼的运动及动作切换无误，背景元素运动自然 [14][17] - 在处理龙骑士航拍镜头时，尽管首帧龙身不全导致龙形态变化，但在镜头调度和运动表现上甚至优于原CG [15][17] - 追车场景还原度最高，汽车落地后模型自动添加甩尾漂移动作，镜头跟随表现突出 [16][17] AI视频模型的技术突破意义 - 模型开始理解动作背后的"为什么"，表现出对真实物理世界的底层理解，如对"失衡-恢复"逻辑的自发补全 [17] - 内化了"材质-运动"的关联规则，如公主长裙的变化遵循布料重力下垂的渐进式展开而非粗暴形变 [17] - 在形变瞬间的镜头模糊和肌肉膨胀帧率完全同步，显示对"形变需要信息补偿"的隐性认知 [18] - AI模型的思考和创作方式更接近人类，在CG解微分方程时，AI已学会"凭感觉"进行创作 [18]

Notion 3.0 ｜AI转型最成功的互联网产品是怎么做的？

歸藏的AI工具箱· 2025-09-19 21:26

Notion 3.0 AI核心能力升级 - 公司将产品定位为拥有用户所有上下文的通用Agent产品，用户可在其中使用所有顶尖AI模型完成任务 [2] - 产品支持选择所有当前顶尖模型，例如GPT-5或Claude 4.1 [2] - 核心功能是允许用户添加任意上下文，包括上传文件、选择指定Notion数据库或添加多个数据库 [4] - 用户可通过Notion链接其他软件获取额外上下文，例如Gmail、Github和Linear等海外常用工具 [4] 上下文集成与智能交互 - AI能力可嵌入任何页面，通过右下角图标启动后能直接引用当前数据库或页面的上下文 [7] - 在页面输入斜杠命令可启用新增的AI速记功能，能实时转录和总结会议内容，会议录音和转录文件均保存在同一文件中 [13] - 用户可直接选中特定内容让AI进行处理，例如润色文案或提问 [16] - 在新一行开头按空格键可触发一系列预制AI能力，包括总结、生成待办事项、制作表格和流程图等 [15] 数据库与表格智能管理 - AI不仅能回答问题和辅助写作，还能帮助生成和修改数据库表格格式，例如根据查询结果主动建议创建逾期视图 [9] - AI具备理解复杂图表需求的能力，能准确识别用户指向的特定图表并创建符合意图的可视化结果，如将任务进度分类按月份分组的图表改为更直观的每月任务数量条形图 [10] - 用户可在表格的函数列使用自然语言描述需求，AI会帮助创建复杂的表格函数 [30] 自定义Agent创建与生态 - Notion 3.0主要升级之一是Agent创建功能，用户可通过页面下方图标或AI页面内的头像旁图标进入自定义设置 [17] - 每个Agent的提示词都是一个独立页面，页面内可添加数据库表格甚至@特定用户，极大拓展提示词能力且易于理解 [20] - 用户可为Agent添加图标配饰，这些配饰会直接显示在Notion AI图标上，在保持形象一致性的同时提高区分度 [18] - 公司将Agent提示词页面化后，创作者可将Agent模板发布到Notion市场实现变现，目前市场上已有大量官方和创作者制作的模板 [22] 高级Agent协作与系统集成 - 公司发布了Custom Agent能力，支持多个Agent相互嵌套和协作，并增加了触发器与自动化功能 [25] - 该能力可应用于企业场景，例如在周三周会前自动总结所有人周报内容，创建数据库提取需讨论问题并按重要性排序，同时生成会议讨论框架文档 [25] - Notion官方MCP（模型控制协议）已更新，现在接入MCP的产品（如Cursor）不仅能查询Notion信息，还能主动修改和写入内容 [27] - 该集成允许AI在完成代码编写后将更新日志自动写入Notion对应文档，或将其他AI生成或搜索的结果直接保存至Notion [28] 行业竞争与商业模式 - 公司依托强大的模板分销网络和生态，使高质量提示词能通过Agent模板市场快速变现，激发创作者的推广热情 [32] - 工具软件推广的关键要素（降价、卖模板、卖课）仍适用，如何与产品能力和AI能力结合是行业需要思考的方向 [32] - Custom Agent能力对B端用户尤其重要，能大幅降低自定义功能和服务成本，复杂Agent系统将更具商业价值 [32]

Artificial Intelligence

Artificial Intelligence

藏师傅教你用 Lovart x Seedream4.0 搞定终极自媒体神器

歸藏的AI工具箱· 2025-09-13 11:54

Lovart平台功能特点 - Lovart平台与Seedream 4.0模型结合，可将长文和文档一键转换为适合小红书等社交媒体平台的套图，支持通过文字精准控制内容生成[3] - 平台支持生成风格统一的3:4比例信息卡片，第一张卡片包含醒目标题和主题简介，后续卡片分章节展示内容，适用于学术论文、古文等多种题材[9][27][33] - 生成内容支持中英文双语输出，英文小字生成清晰度高，适合出海媒体使用[9][10] - 通过Magic Canvas功能可实现精准修改，用户可在图片上添加评论指定修改需求，如图标添加、文字调整或错误修正[16][18][19][24] 模型与活动推广 - Seedream 4.0模型在9月10日至9月20日期间免费开放使用，不扣除积分[4] - 9月20日前开通基础会员可全年不限量使用Seedream 4.0及Nano Banana模型[4] - Veo3模型全系三折优惠，Pro+会员可免费使用可灵和hailuo模型至9月20日[4] 多场景应用案例 - 学术内容转换：生成扁平化现代风格信息图，适用于论文解读，卡片包含标题、副标题及详细文字解释[9][10][14] - 古文教育应用：生成中国风水墨风格卡片，配合竖排宋体文字展示古文内容，如《爱莲说》三等分画面设计[24][27] - 人物传记生成：基于联网搜索能力自动整理信息，如生成12张苏轼生平卡片，按时间顺序展示关键节点[29][32][33] - 科普内容创新：将科学家事迹转化为仙侠小说风格，包含仙号、定场诗及科研场景仙侠化设计，如奥本海默"仙号"及爱因斯坦人像ID一致性[34][35][36] 内容生产优化 - 长文档处理建议先通过LLM总结以优化结构清晰度[9] - 支持TTS口播稿生成，结合视频模型可低成本产出完整视频内容[36][38] - 提示词可灵活调整主题、风格、文案等要素，实现多玩法混搭[38]

自媒体

Artificial Intelligence

Artificial Intelligence

Lovart

Seedream 4.0

Nano Banana

顶级邪修｜万字教程｜教你速通豆包・图像创作模型 Seedream 4.0

歸藏的AI工具箱· 2025-09-09 15:47

产品发布与市场定位 - 火山引擎上线豆包・图像创作模型Seedream 4.0 支持图片生成、连续图片编辑、多图参考的全能图像创作功能 [2] - 模型具备优秀的美学表现、世界知识、提示词遵循、一致性保持、精准编辑能力及完美中文支持可自定义生成比例并直出4K图片被定位为当前中文用户T0级别图像创作模型 [2] - 企业客户可通过火山引擎MaaS平台火山方舟接入Seedream 4.0 该渠道为唯一支持4K直出的版本个人用户可通过豆包、即梦APP体验 4K版本于当晚20:00开放 [3] 核心功能与应用场景 - 模型支持精细化AI修图可响应光影、滤镜、装造、发型等组合提示词例如分割光、环形光、伦勃朗光等复杂打光方式 [5][9][12][18] - 支持连续图像生成与视频分镜创作在生成6张图后仍能保持人脸ID一致性结合Seedance首尾帧视频模型可生成转场效果 [22][23][25][26] - 具备PPT内容转视觉图像能力通过多模态模型生成提示词输出符合思维模型（如金字塔、垂直面板、协同环形等）的磨砂玻璃或高质感金属材质设计 [29][32][34][35][36] - 支持个性化定制功能包括玻璃质感头像图标生成、宠物幻化山海经神兽护身符、玄学鼠标垫设计、创意头像制作及无痛Cosplay [46][51][55][58][63][67] - 可基于图像内容自动生成手帐风格日记结合日期、天气及自拍图像生成拼贴画风格记录 [73][74] - 支持UI设计稿及海报修改可根据配色参考图或主题指令（如星巴克主题）自动调整设计元素 [78][79][82][83] 内容创作与商业化应用 - 提供多风格知识卡片生成模板涵盖仙侠古籍、现代信息图、游戏装备、塔罗牌、技术蓝图、博物学家手册及教科书插图等风格适配不同受众及概念解释需求 [86][89][90][94][96][97][100][102] - 模型支持将任意生活碎片（如草图、声音、视频截帧）转化为可交付产品通过简短提示词实现质感转换降低内容创作门槛 [107][108][109][110] - 已有用户基于模型功能实现商业化包括接单定制头像、制作视频分镜及开发自动化工作流 [3][27][61]

量大管饱！让藏师傅疯狂涨粉的 Nano Banana 玩法合集 02

歸藏的AI工具箱· 2025-09-05 17:12

核心观点 - Nano Banana作为多模态AI模型在图像生成、视频制作和3D建模等多个创意领域展现出强大能力其应用范围从艺术创作扩展到实用工具开发显示出在内容生成市场的巨大潜力[1][3][73] AI艺术创作应用 - 利用书法字帖和人物姿势生成具有中国风意境的AI舞蹈视频通过特定提示词控制人物风格和光影效果[4] - 使用即梦图片3.1模型生成基础图像提示词包含CG厚涂风格、精致五官、瓷白肌肤等详细视觉要求[4] - 通过可灵2.1首尾帧生成视频配合专业转场提示词实现平滑过渡支持A类关联性强的原地演变和B类差异巨大的运镜驱动转场策略[12][14][15] 3D建模与可视化 - 将建筑平面图转换为等距摄影级3D渲染图使用Hyper3d工具生成GLB格式3D文件[17][24][26] - 基于3D俯视图生成指定视角的室内渲染图如从餐桌看向卫生间的视角并支持家具样式替换[19][20][22] - 通过Cursor和GPT-5开发前端网页实现3D模型交互展示点击特定位置可显示对应渲染图[28] 营销与内容创作 - 创建夸张广角镜头效果的视频封面通过前景物品放大技术提升点击率比平时封面效果更好[33][35] - 利用视觉推理能力实现照片位置反推和地标图像生成基于地图标记生成对应实景照片[37][38][39] 产品设计与转换 - 车辆改装功能可指指定涂装参考图更改车辆配色、轮毂设计和拉花装饰并生成多阶段改动图片[41] - 将饮品图像转换为柔软充气玩具设计采用哑光织物纹理和细微缝线强调充气效果[51][52] - 建筑转换为等距3D图标风格支持任意建筑照片转换而非仅限于地标建筑[49] 教育内容生成 - 生成多张涂鸦风格图像解释"期货"概念采用统一的手绘风格和英文文本适合制作知识卡片[54] - 开发专用网页工具支持3:4比例图片导出可直接用于小红书内容发布[56] 实体产品可视化 - 将汽车渲染图转换为收藏级手办模型包含印刷包装盒和3D打印机场景[58][59][60] - 动漫角色转真人cosplay并手持手办保持发型、配饰和服装的高度还原[62][63] 时间序列预测 - 预测建筑100年后荒废状态的形象生成视频形式展现更具表现力[65][66][68] 多图像融合技术 - 混合无关图像生成连贯故事分镜保持美学表现和人物一致性 across 9张连续画面[69][71] - 支持即梦智能多帧视频生成实现多场景串联和角色整合[73]

Nano Banana 邪修之王最强科研成果！教你自定义生图比例！

歸藏的AI工具箱· 2025-09-02 12:59

核心观点 - 通过特定提示词和垫图方法可有效控制Nano Banana生成图像的比例解决原模型输出比例不可控的生产应用难题 [2][4][12] 技术原理 - 多图输入时输出比例会随机匹配其中一张图的特性通过垫图方式实现比例控制 [4] - 需准备两张图片：待修改原图（首位）和比例模板图（次位）顺序不可颠倒 [6][8][16] - 使用GLif启发的方法但扩展至图生图场景支持对已生成图片进行二次比例调整 [4] 操作流程 - 提示词需明确指令："Redraw the content of Figure 1 onto Figure 2, add content to Figure 1 to fit the aspect ratio of Figure 2, completely clear the content of Figure 2, and only retain the aspect ratio of Figure 2" [13][15] - 在AI Studio或Gemini APP（推荐Gemini2.5 Pro模型）中操作后者效果更优 [15] - 若出现蓝色背景异常通过多次抽卡可解决 [15] 资源支持 - 提供覆盖常见比例的模板图集支持自定义比例（需通过Figma制作） [8] - 模板图集可通过网盘下载（链接：https://pan.quark.cn/s/163037f38e88 提取码：7tJV） [18]

把 Nano Banana 塞进 Lovart 能有多离谱？藏师傅周末带你免费玩

歸藏的AI工具箱· 2025-08-29 22:24

Lovart平台与Nano Banana模型集成功能 - Lovart平台在Nano Banana模型上线后迅速完成适配并推出周末免费活动用户可免费使用该模型而不消耗积分 [1] - 平台提供模型选择功能用户需单独勾选Nano Banana以避免调用其他付费模型 [2] Nano Banana模型的核心技术能力 - 支持通过涂鸦替代提示词的方式实现图片精确修改与Lovart的Magic Canvas功能高度契合 [2] - 具备强大的世界知识可识别地图和地标建筑例如能根据谷歌地图上的箭头标记生成祈年殿图像 [3][4][6] - 支持多物品替换与生成的一致性保持例如将7件家具按示意图精确摆放到房间指定位置并保持细节一致 [8][10] - 默认输出分辨率较低但可通过Lovart的Upscale功能直接放大图像 [6] 多模型联动应用案例 - 汽车改造案例：从白模汽车开始通过分步提示实现配色更改、轮毂改造、拉花添加及场景转换生成5张高细节图像再通过可灵2.1首尾帧模型生成连贯视频并添加配乐 [13][15][16][17] - 食谱生成案例：将冰箱食材图片输入后自动生成包含食材标签、准备步骤图标和成品展示的极简风格食谱信息图进一步生成餐桌展示图和完整烹饪教程视频 [19][22][23][26][28][30] 创作效率提升与行业影响 - 大幅降低设计门槛用户无需专业设计软件即可通过涂鸦和文字输入实现复杂创意表达 [8][10] - 自动化流程实现多模态内容生成（图像、视频、音频）的端到端整合极大提升内容创作效率 [15][28][30] - 技术应用场景扩展到家居设计、视频制作、美食教程等多个垂直领域 [10][19][30]

顶级邪修倾囊相授！藏师傅教你速通Nano Banana

歸藏的AI工具箱· 2025-08-27 15:26

产品功能与性能 - 图像编辑模型Nano Banana(官方名Gemini 2.5 Flash Image Preview)具备强大修图能力可处理祛痘、瘦身、瘦脸、肤质修复等需求[4][15][19] - 人脸ID一致性大幅增强小幅修改时相似度显著高于FLUX Kontext模型[19] - 支持多图片上传及连续编辑但连续编辑4-5次后可能因上下文超限导致效果下降[7][9] - 支持通过文本提示词、标记、框选、涂鸦等多模态方式精准控制图像修改[28][31][34] 应用场景与案例 - 电商领域表现突出可精准修改商品佩戴效果且保持细节还原如首饰佩戴测试中商品比例问题较FLUX Kontext大幅改善[31][46] - 支持穿搭展示与移植可生成平铺展示图或将博主穿搭还原到用户照片[22][25] - 具备古早动漫与照片修复超分能力例如成功修复《攻壳机动队》动画截图[48] - 可生成AR介绍特效利用内置世界知识为地标建筑(如泰姬陵、悉尼歌剧院)添加信息卡片[43][44] - 支持生成白色轮廓贴纸用户可基于PNG文件找电商店铺打印实体贴纸[40][41] 技术实现与生态 - 通过姿势涂鸦控制可生成角色互动图像对动画制作和精准动作控制有显著帮助[34][35] - 结合视频模型(如可灵2.1)可处理首尾帧生成视频特效并添加讲解语音[39][45] - 除谷歌AI Studio和Gemini APP外已通过API服务商(如FAL、Krea)上线但需注意无独立官网[11][14] 行业影响与定位 - 被描述为"烂片拯救者" 可将普通照片修成大片级效果[5][15] - 直接冲击Adobe等传统修图软件市场复杂修图操作可一句话完成[2] - 适用于视觉表达相关行业包括电商图片、本地生活、教育、婚庆、影视、印刷、旅游等领域[50]

Artificial Intelligence

Nano Banana

Gemini APP

FLUX Kontext

Artificial Intelligence

Nano Banana

Gemini APP

FLUX Kontext

藏师傅教你用 Nano Banana 编辑图片做手办

歸藏的AI工具箱· 2025-08-23 17:24

文章核心观点 - 介绍使用Nano Banana模型在LM Arena平台进行图像编辑和手办图制作的具体方法重点包括上传图片输入提示词选择最佳结果以及利用可灵2 1首尾帧模型增强视觉效果 [1][2][3][10] 操作流程 - 访问LM Arena平台并选择Image模式以触发图像模型功能 [3] - 上传需要修改的图片并输入提示词提示词需包含具体场景描述如角色骑亚洲虎 PlayStation游戏盒电脑显示游戏界面等元素 [3][4] - 平台每次生成两张不同模型的图片用户需在输入框上方选择最佳结果并确认模型名称若未出现Nano Banana模型需重复生成流程 [7] 效果增强 - 利用可灵2 1首尾帧模型将静态图片转换为视频通过提示词实现手办从实体到CG画面的动态转化过程包括反重力漂浮材质变化及环境转换等特效 [10] - 通过添加原始CG画面和音乐进行剪辑进一步提升视觉表现力和整体观感 [12][13]