Workflow
歸藏的AI工具箱
icon
搜索文档
不看这藏师傅篇深度拆解,你永远不知道Lovart AI有多可怕(有邀请码)
歸藏的AI工具箱· 2025-05-13 16:42
Lovart AI产品能力分析 - 产品定位为通用设计Agent 兼顾设计小白和专业用户 大幅降低设计门槛 [2][3] - 用户群体覆盖个体户老板 营销人员 设计师 电商从业者等 仅需文字描述即可获得高质量设计产出 [3] - 测试案例显示 仅用几十字提示词就能生成完整视频广告所需的分镜素材 完成度极高 [4] 工作流程深度解析 - 分析阶段远超预期 包括产品信息提取 视觉风格定义 视频脚本创作等专业流程 [6] - 设计前进行详细调研 包括广告主角设定 分镜场景描述等 专业度超过多数调研Agent [9] - 图片生成阶段自动选择合适模型和Lora 主动维持人像一致性 技术实现难度高 [13] - 创新性生成解释性网页 以长截图形式展示分镜设计 保持统一视觉风格 [19] 视频生成技术突破 - 在超长上下文环境下稳定运行 8个分镜生成耗时十几分钟 体现强大技术优化能力 [22] - 实现全流程自动化 包括分镜生成 背景音乐创作 口播语音合成等 完成度远超行业水平 [24] - 测试案例中成功将T恤图像移植到模特身上 并自动生成多分辨率广告图 展示强大图像处理能力 [28] 行业竞争壁垒分析 - 专业度构成核心壁垒 需深度理解垂直领域需求 图像视频模型工作流及Agent技术 [29] - 非依赖预训练模型 而是通过各环节专业优化建立竞争优势 形成难以追赶的技术积累 [29] - 产品响应速度快 能迅速实现用户反馈的功能改进 如4o图片去黄处理等 [28]
AI也需要"记笔记":Karpathy从Claude 1.6万字提示词中看到的未来
歸藏的AI工具箱· 2025-05-12 16:28
系统提示词对比分析 - Claude的系统提示词长达16,739个单词,远高于OpenAI的ChatGPT中o4-mini系统提示的2,218个单词(仅为Claude的13%)[2][3] - Claude的提示词包含大量非结构化修改痕迹,疑似针对热点事件或问题修复的临时补丁,维护复杂度高[5] - 提示词中工具定义占比最高,详细规定了14个MCP工具的使用规范(如谷歌Drive搜索说明超1700字),其次是用户偏好和风格指引[8] 大语言模型学习范式革新 - 当前LLM主要依赖预训练(获取广泛知识)和微调(优化行为习惯),均需调整模型参数[9] - Karpathy提出"系统提示学习"新范式:类比人类通过显式笔记总结经验,而非直接改写大脑参数[10] - 理想状态下模型应自动生成/优化提示词,但当前Claude提示词仍完全由人工编写,效率低下[10][18] 系统提示学习的潜在价值 - 优势包括:更高维的数据利用(通过显式复盘吸收反馈)、更强的任务泛化能力[19] - 可能解决LLM现存痛点:如《记忆碎片》式依赖参数记忆,缺乏外部备忘录机制[12] - 需攻克技术难点:自动编辑提示词算法、提示编辑系统的自学习机制、显式知识向参数习惯的转化[20] 提示工程实践启示 - 结构化指令效果更优:Claude提示词使用列表/格式/示例,明确工具调用规则和用户交互边界[8][15] - 精准指令胜于模糊表达,需具体说明需求与限制条件(如知识截止日期、诗歌创作规范)[8][14] - 提示工程本质是沟通技巧延伸,非高深技术,普通用户可通过学习Claude提示词提升效果[16][17] 行业资源链接 - Karpathy推文探讨系统提示学习[21] - 第三方网页解析Claude提示词内容与结构[21]
生成网页可以垫视频了?教你用 Gemini 2.5 最强大的能力
歸藏的AI工具箱· 2025-05-09 16:34
Gemini 2 5 Pro 0506版本核心能力 - 根据网页交互视频生成还原度极高的网页效果 显著提升前端开发效率[1][4] - 多模态能力与代码生成产生化学反应 实现复杂交互动画的自动还原[5][6] - 在AI Studio中选择Gemini 2 5 Pro 05-06版本可体验该功能 需注意视频压缩和长度控制[13] 技术特性 - 前端代码美观度显著提升 仅需设计稿无需优化提示词即可生成完美还原网页[4] - 视频多模态理解能力行业领先 可捕捉Hover动画、图标高亮等复杂交互细节[7][8] - 输出格式支持HTML/CSS/JS三合一文件 浏览器直接预览简化开发流程[12] 应用案例 - 邮箱地址交互案例: 成功还原图标高亮效果 但存在间距和变色细节缺失[7] - 翻译工具Hover案例: 完美捕捉动态翻译卡片效果 仅字体大小需微调[8] - YouTube科普视频转化案例: 实现从视频到互动网页的端到端生成[5] 使用优化建议 - 提示词需明确标注重点效果(如淡蓝色圆角背景)以弥补视觉细节识别不足[11][12] - 动画效果需增加缓动参数 图标库通过CDN引用提升还原度[11] - 适用场景包括但不限于动效生成 开发者可拓展更多创新应用[14]
设计师的 ChatGPT 时刻:Figma 这次把“设计即代码”玩成现实
歸藏的AI工具箱· 2025-05-08 16:55
AI编程产品分类 - AI编程产品分为两类:一类是Cursor和Windsurf等AI IDE,具备完整IDE功能并附加AI补全、chat、Agents能力,即使不用AI也能正常开发[1][2] - 另一类是V0和Lovable等Vibe Coding产品,主要依赖与AI编码Agents对话生成代码,用户覆盖范围更广但存在语言描述需求不精准、术语理解有限等问题[3][5] - Vibe Coding产品当前多模态能力不足,如Gemini 2.5 Pro仍难以从设计稿精准还原颜色、描边等细节[5] Figma Make产品特性 - Figma基于设计生态推出Vibe Coding产品Figma Make,支持左右分栏交互界面,左侧采用Claude 3.7模型处理图片/Figma画板/文字输入,右侧实时预览和修改[7][8] - 核心能力包括直接导入Figma设计稿生成网页,自动传递布局/变量/组件语义,完美还原设计稿中的插画和图片素材,显著提升生成网页表现力[10] - 提供设计稿编辑工具精准迭代,支持点击修改元素样式或通过AI指令局部调整,避免全局重写造成的Token浪费和错误扩散[11][12] Figma战略布局 - 公司同步推出可视化低代码工具Figma Site,结合Make的AI能力实现设计稿到网站的快速发布,并支持复杂逻辑功能补充[18] - 产品战略聚焦设计生态优势,明确"Design as Prompt"方向,相比Adobe更清晰界定技术边界[19] - 未来可能开放API和私有大模型接入,强化企业级定制能力,推动设计师角色向Prompt Engineer转型,前端工程师转向架构整合[19]
一图展示全部信息:提示词 + Figma 十秒精修,让长网页秒变封面(内有白嫖福利)
歸藏的AI工具箱· 2025-05-06 16:09
生成网页教程 - 利用Gemini高级版免费福利可试用至2026年 需通过edu邮件验证[1] - 基于藏师傅3.0网页生成提示词拓展 新增"尽量在一页展示全部信息"要求[6][8] - 需准备模型论文/博客文档 支持PDF或Markdown格式[4][5] - 首次生成结果至关重要 需调整主题色匹配品牌调性(如Qwen用白底紫高亮 Grok用暗底橙高亮)[6] 设计规范 - 采用苹果发布会Bento Grid风格 响应式兼容1920px以上屏幕[9] - 视觉元素要求:超大字体突出核心数据 中英文混用(中文粗体大字号) 高亮色4D6BFE[9] - 技术实现:HTML5+TailwindCSS 3.0+ 禁用emoji图标 引用专业图标库[9] - 布局问题示例:标题未加卡片边框 部分卡片未占满空间(如Deepseek案例)[8][9] Figma优化流程 - 使用html.to.design插件导入网页 需替换中文字体为Pingfang SC[12][14] - 删除冗余元素(如Youware导航栏) 解构Iframe图层保留有效内容[15][16] - 调整技巧:统一卡片宽度1472px 复制属性快速应用样式[18][19] - 数学公式计算间距(如350+398-24自动修正模型规模卡片宽度)[21] - 导出前统一边距32px 使用postspark工具添加渐变边框[22][23] 案例验证 - 已验证方法适用于Gork 3和千问3模型介绍 生成单页展示效果[2] - Orange成功将千问3内容转化为苹果风格PPT一图流[1]
设计速度提升100倍,质量翻10倍:豆包超能创意1.0体验
歸藏的AI工具箱· 2025-04-29 16:18
豆包超能创意1.0升级核心功能 - 图片生成效率和修改效率大幅提升 显著降低设计门槛 [1] - 新增批量生成能力 支持不同内容、比例和风格的批量生成 速度比4o模型快很多 [2][5] - 智能增强功能使模型能自动联想和获取知识 无需详细提示词 [12] - 具备上下文理解能力 可基于前序生成结果进行连续修改 [19] - 支持从小说内容直接转换分镜图片 保持人物形象一致性 [19][23] 批量生成能力 - 可针对同一设计生成不同比例的社交媒体图片 [5] - 基于同一内容生成不同风格图片 或同风格不同内容图片 [5] - 一次性生成10个不同品牌的胶囊图片 自动识别品牌主营业务 [1][2] - 一次性生成10种不同风格的字体设计海报 [8] - 基于线稿批量生成12张同风格空状态插图 [10] 智能增强功能 - 模型自动补充常识性内容 如根据3个样机案例生成其他样机 [12] - 根据示例自动发散生成其他案例 如基于星巴克门店生成4个国内茶饮品牌门店 [17] - 模仿图像风格生成8个世界著名景点插画 自动替换地标和景色 [14] 上下文理解能力 - 保持角色形象一致性 如星尘猫IP可变换为不同风格 [20][23] - 自动规划分镜脚本 如30秒洗发水广告的12个连贯分镜 [25] - 支持风格转换 如将写实分镜变为日式赛璐璐风格 [25] 应用场景拓展 - 营销图片生成 如品牌胶囊图片 [1] - 字体设计 如10种风格字体海报 [8] - UI设计 如空状态插图 [10] - 广告创意 如洗发水分镜脚本 [25] - IP形象设计 如星尘猫系列 [20][23]
AI 工具堆里最豪横的那一个:纳米 MCP 万能工具箱上手(内有邀请码和藏师傅手搓智能体)
歸藏的AI工具箱· 2025-04-28 18:45
上周真是 MCP 诞生以来热度最高的一周,大家扎堆发布 MCP 的 Agents 工具。 纳米也发布了自己基于 MCP 驱动的 Agents 服务 "MCP万能工具箱"。 这个工具箱不仅包含纳米AI自研的十几个MCP工具,还引入了近百个第三方MCP工具,工具总量目前位居国内第一。 MCP 工具覆盖办公协作、学术研究、生活服务、搜索引擎、金融、媒体娱乐、数据抓取等多个领域。 今天终于有空详细玩了一下,还基于纳米的能力做了一个 Agents 帮大家生成藏师傅同款的展示网页。 深度研究智能体 先来看一下深度研究智能体,这部分直接就可以用不需要你任何配置,直接调用纳米的规划、搜索能力最后帮你生成各种形式的展示内容。 你可以在纳米 AI 客户端左侧智能体的部分找到深度研究智能体的入口,然后点击使用就行。 这里除了可以搜索网上内容外,也支持搜索你自己个人知识库的内容,比如我这里就让他基于网络和我自己的知识库搜索 MCP 的相关内容并且生成对应的网页解 释和 PDF 文件。 他经过 20 分钟的搜索和思考之后给了一个非常详细的报告,PDF 里面的内容非常丰富,总共消耗了 47 万 Token,而且这些都是免费的。 比如 M ...
从搜索到解决方案:解锁火山 DeepSearch 的“三连跳” MCP 玩法
歸藏的AI工具箱· 2025-04-24 17:34
最近真是捅了 MCP 窝了,上周火山开了一次开发者见面会,发布了挺多东西的,主要有: RTC 硬件这个也不太好测试,主要我也不懂,而且需要硬件,这次主要试一下 DeepSearch 服务。 其实现在所谓的 Agents 服务主要的任务和内容还是基于AI 搜索信息的加工和再整理,这部分是核心,也是 非常吃技术能力的地方。 火山把这部分能力变成应用之后对于开发者来说省了很多事情,人人都能搞 DeepSearch 了。 效果怎么样 先来一个最常见的问题和测试旅游规划。 即使这种看起来简单的任务很多 AI 搜索其实做的不好,看着内容输出很多,很多都是各个景点介绍的废话。 用户其实需要的是实时性比较强的信息,比如交通怎么安排,怎么样可以顺路,一些危险的项目需要准备哪些 东西等。 正式发布了豆包深度思考模型 Doubao-1.5-thinking-pro 和全新的视觉理解模型 Doubao-1.5-vision- pro,这个咱们上周介绍过了,视觉推理非常强大, 感兴趣可以去看我的测试 。 还发布了方舟 × RTC 硬件:把端侧自动唤醒与云端大模型语音能力一次打包,让玩具、家居、穿戴等设备 一键升级为能与人自然实时对话的 ...
藏师傅的网页生成提示词 3.0| 原来 Gemini 2.5 Pro 这么强
歸藏的AI工具箱· 2025-04-23 16:32
早上群里有个朋友说自己用 Gemini APP 里面的深度研究搞了一个特斯拉 Q1 财报的分析文档,另一个朋友 说转成网页,我就说我试试。 我直接把他的文档和我最近探索出来的提示词就放到了 Chatwise 里面,以往我都是用 Claude 3.7 生成网页 的,这次默认是 Gemini 2.5 Pro,我也没看就按下了回车。 没想到生成的网页炒鸡惊艳,Gemini 的网页内容很多同时理解了提示词提到的设计风格,非常漂亮。 可以看图也可以在这里预览: https://kueaqan0fo.app.yourware.so/ | | | | | | $0.41 | 可比 -13% YoY | 同比 -16% YoY 网比 +154% YoY | | Acknowledged uncertainty, 94 update planned. Unusual admission of political/brand impact. | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | FRITTY les a 2025 01 ...
不会 3D 也行?教你用AI创建非常酷炫的 NFT 3D 卡片动画
歸藏的AI工具箱· 2025-04-23 16:32
昨天在推特上刷到一个老哥用 4o 和可灵做的的品牌 3D 卡片看起来很惊艳。 所以昨天下午就尝试复刻和发散看看有什么其他玩法,没想到真的搞出来了,整个工作流还是很有价值的,而 且这套思路可以用在很多其他地方,这里教大家一下。 先看一下结果,我这里发散的是生成类似 NFT 的装备卡片,然后我们可以给这些装备卡片编一个背景故事搞 一个网站展示,让这些视频看起来更具价值一些。 我们先来看第一部分这部分的主要学习的部分是 json 的提示词写法,他把需要修改的部分都抽象成了变量 名,这样我们就不需要管核心部分的提示,只需要在改变的时候填写下面卡片内容的部分就行。 另外这种方法也可以快速创建很多风格一致的图片,比如我上面的三个卡片都是一样的风格。 这里我改了一下提示词,将整套提示词的主题变为了游戏装备这样的话整体做成视频之后表现力会好些,而且 更加契合。 用 Json 方式的提示词,这样方便产出一致性很高的图片,只需要改参数部分的文案就行 将图片用可灵 1.6 的首尾帧生成视频,首帧和尾帧一样的图片和提示词写法需要学习 最后是视频的展示部分,这部分是我加的,教大家用剪映让你的视频更出彩 把跟展示无关的部分改为了中文方便 ...