Workflow
歸藏的AI工具箱
icon
搜索文档
一图展示全部信息:提示词 + Figma 十秒精修,让长网页秒变封面(内有白嫖福利)
歸藏的AI工具箱· 2025-05-06 16:09
生成网页教程 - 利用Gemini高级版免费福利可试用至2026年 需通过edu邮件验证[1] - 基于藏师傅3.0网页生成提示词拓展 新增"尽量在一页展示全部信息"要求[6][8] - 需准备模型论文/博客文档 支持PDF或Markdown格式[4][5] - 首次生成结果至关重要 需调整主题色匹配品牌调性(如Qwen用白底紫高亮 Grok用暗底橙高亮)[6] 设计规范 - 采用苹果发布会Bento Grid风格 响应式兼容1920px以上屏幕[9] - 视觉元素要求:超大字体突出核心数据 中英文混用(中文粗体大字号) 高亮色4D6BFE[9] - 技术实现:HTML5+TailwindCSS 3.0+ 禁用emoji图标 引用专业图标库[9] - 布局问题示例:标题未加卡片边框 部分卡片未占满空间(如Deepseek案例)[8][9] Figma优化流程 - 使用html.to.design插件导入网页 需替换中文字体为Pingfang SC[12][14] - 删除冗余元素(如Youware导航栏) 解构Iframe图层保留有效内容[15][16] - 调整技巧:统一卡片宽度1472px 复制属性快速应用样式[18][19] - 数学公式计算间距(如350+398-24自动修正模型规模卡片宽度)[21] - 导出前统一边距32px 使用postspark工具添加渐变边框[22][23] 案例验证 - 已验证方法适用于Gork 3和千问3模型介绍 生成单页展示效果[2] - Orange成功将千问3内容转化为苹果风格PPT一图流[1]
设计速度提升100倍,质量翻10倍:豆包超能创意1.0体验
歸藏的AI工具箱· 2025-04-29 16:18
豆包超能创意1.0升级核心功能 - 图片生成效率和修改效率大幅提升 显著降低设计门槛 [1] - 新增批量生成能力 支持不同内容、比例和风格的批量生成 速度比4o模型快很多 [2][5] - 智能增强功能使模型能自动联想和获取知识 无需详细提示词 [12] - 具备上下文理解能力 可基于前序生成结果进行连续修改 [19] - 支持从小说内容直接转换分镜图片 保持人物形象一致性 [19][23] 批量生成能力 - 可针对同一设计生成不同比例的社交媒体图片 [5] - 基于同一内容生成不同风格图片 或同风格不同内容图片 [5] - 一次性生成10个不同品牌的胶囊图片 自动识别品牌主营业务 [1][2] - 一次性生成10种不同风格的字体设计海报 [8] - 基于线稿批量生成12张同风格空状态插图 [10] 智能增强功能 - 模型自动补充常识性内容 如根据3个样机案例生成其他样机 [12] - 根据示例自动发散生成其他案例 如基于星巴克门店生成4个国内茶饮品牌门店 [17] - 模仿图像风格生成8个世界著名景点插画 自动替换地标和景色 [14] 上下文理解能力 - 保持角色形象一致性 如星尘猫IP可变换为不同风格 [20][23] - 自动规划分镜脚本 如30秒洗发水广告的12个连贯分镜 [25] - 支持风格转换 如将写实分镜变为日式赛璐璐风格 [25] 应用场景拓展 - 营销图片生成 如品牌胶囊图片 [1] - 字体设计 如10种风格字体海报 [8] - UI设计 如空状态插图 [10] - 广告创意 如洗发水分镜脚本 [25] - IP形象设计 如星尘猫系列 [20][23]
AI 工具堆里最豪横的那一个:纳米 MCP 万能工具箱上手(内有邀请码和藏师傅手搓智能体)
歸藏的AI工具箱· 2025-04-28 18:45
MCP工具热度及纳米AI的布局 - 上周是MCP诞生以来热度最高的一周,多家公司集中发布MCP Agents工具 [1] - 纳米AI发布"MCP万能工具箱",包含自研的十几个MCP工具和近百个第三方MCP工具,工具总量位居国内第一 [1] - MCP工具覆盖办公协作、学术研究、生活服务、金融、媒体娱乐等众多领域 [1] 纳米AI的MCP核心能力 - 深度研究智能体:具备自主规划能力,可生成PPT/PDF/Word/网页等多种形式的报告,47万Token的搜索和思考过程完全免费 [5][7] - MCP万能工具箱:内置丰富工具,用户无需配置API即可直接调用 [7] - Agents自定义功能:支持用户基于纳米MCP能力创建个性化工具 [7] 特色MCP服务 - Minimax MCP服务支持免费生成视频/图片/音频,如为5岁儿童生成高质量绘本 [8] - 纳米AIbrowser MCP可访问和抓取任何网页内容,支持本地调用浏览器绕过机器人验证 [10] - 智能体广场提供大量预置MCP服务,降低用户使用门槛 [12] 自定义Agents功能 - 用户可创建个性化智能体,需填写角色介绍并选择对应MCP服务和知识库 [14] - 调用MCP时需明确调用顺序和具体名称以确保功能实现 [14] - 示例案例"藏师傅的AI网页生成"可将搜索结果或上传文件转化为定制网页 [15] 用户体验设计 - 通过"深度研究智能体-智能体广场-自定义智能体"的三步走策略,满足不同能力用户需求 [16] - 完全不懂开发的用户也可通过多MCP调用和提示词实现强大Agents效果 [16] - 提供5个邀请码(J83VU4等),每个可用10次 [16]
从搜索到解决方案:解锁火山 DeepSearch 的“三连跳” MCP 玩法
歸藏的AI工具箱· 2025-04-24 17:34
火山开发者见面会发布内容 - 公司发布RTC硬件和DeepSearch服务 其中DeepSearch服务将AI搜索信息加工和再整理能力应用化 大幅降低开发者使用门槛 [3] - 公司正式发布豆包深度思考模型Doubao-1.5-thinking-pro和视觉理解模型Doubao-1.5-vision-pro 其中视觉推理能力表现突出 [5] - 推出方舟×RTC硬件解决方案 实现端侧自动唤醒与云端大模型语音能力打包 可快速升级智能设备对话能力 [5] - 深度搜索复合应用服务DeepSearch集成联网搜索、知识库、网页解析、Python代码执行器等丰富MCP服务 开发者无需配置即可直接调用 [5] DeepSearch服务功能特点 - 在旅游规划场景中 服务能精准搜索实时信息 如交通安排、行程顺序、危险项目注意事项等 避免输出景点介绍的冗余内容 [4] - 针对特定需求(如必须前往雨崩村和南极洛) 服务会分步骤精准搜索相关信息 避免一次性搜索导致上下文遗忘 [6] - 在新能源汽车行业数据查询测试中 服务诚实反馈未找到17-24号上险量数据 但准确提供13-20号数据 并合理组织产业新闻、总体数据、厂家动态等内容 [10] - 服务能根据问题复杂度自动调整任务拆解层数 最多支持10步 并支持通过提示词优化实现个性化 [16] 技术实现方案 - 底层同时挂载Doubao-1.5-thinking-pro、Doubao-1.5-pro和DeepSeek-R1等多模型 实现复杂逻辑与摘要生成的协同 [20] - 采用API网关安全鉴权 Supervisor Agent生成Planning并分配子任务 Work Agent调用外部能力的技术架构 [20] - 所有MCP插件符合统一协议 新插件可被Supervisor自动编排 开发者可一键复制广场模板并部署 [21] - 服务对外暴露OpenAI兼容接口 实现前端、Bot、业务后台的零改动集成 [21] 开发者生态建设 - 公司上线MCP Servers广场 提供大量MCP服务 支持一键体验和安装 并提供Trae等IDE的安装命令 [23] - 通过火山方舟平台 开发者可快速体验和应用DeepSearch等能力 大幅降低MCP使用门槛 [12][16][18] - 行业趋势显示 国内大厂正加速拥抱MCP技术 并通过生态整合降低使用门槛 使AI能力探索周期从月级缩短 [24]
不会 3D 也行?教你用AI创建非常酷炫的 NFT 3D 卡片动画
歸藏的AI工具箱· 2025-04-23 16:32
3D卡片生成教程 核心观点 - 利用4o和可灵工具生成风格一致的3D装备卡片 并通过视频剪辑增强展示效果 整套工作流可应用于NFT类数字收藏品创作 [3][5][17] 技术实现流程 4o图片生成 - 采用JSON格式提示词模板 将卡片主题、材质、颜色等参数抽象为变量 仅需修改parameters部分即可批量生成同风格图片 [5][7] - 示例提示词包含未来感赛博朋克风格设计要素:半透明全息玻璃材质、霓虹光晕、物品3D模型悬浮效果及底部反射等 [9][10] - 关键参数包括:物品名称(item_name)、稀有度(rarity)、材质描述(item_material)、颜色组合(colors)等 中英文混合输入确保AI理解 [10] 可灵视频合成 - 使用可灵1.6版本的首尾帧功能 输入相同图片生成循环动画 提示词需指定卡牌水平轴360度旋转效果 [11][13] - 视频特性包括:静态镜头、环境霓虹光、卡片边缘光泽反射、平滑运动循环 需多次抽卡获取最佳效果 [13][15] 剪映后期处理 - 将不同运动类型的视频片段(光效变化/旋转)通过时间轴拼接 采用子弹时间和蒙太奇曲线变速实现动态过渡 [16] - 使用智能补帧技术(光流法)解决变速导致的帧率不足问题 最终输出流畅的展示视频 [17] 应用扩展 - 生成的3D卡片可配合背景故事构建网站展示 增强数字藏品的叙事性和商业价值 [3][17] - 该方法适用于游戏装备、数字收藏卡等场景 通过修改JSON模板的style和parameters部分快速切换主题 [5][7]
藏师傅的网页生成提示词 3.0| 原来 Gemini 2.5 Pro 这么强
歸藏的AI工具箱· 2025-04-23 16:32
特斯拉Q1 2025财报分析 - 2025 Q1财务状况严峻 营收和EPS显著低于预期 汽车业务营收同比下降20% 净利润骤减71% 交付量下降13% [1] - 汽车业务营收13.97亿美元 同比下降20% 能源业务营收2.73亿美元 环比增长67% 服务及其他业务营收2.64亿美元 同比略增 [1] - 总毛利率(GAAP)为16.3% 低于上季度的17.4% 汽车毛利率(除信贷)为11.3% 能源业务毛利率达28.8%创历史新高 [1] - 自由现金流为+0.66亿美元 期末现金储备达370亿美元 运营利润率为2.1% 大幅下滑 [1] 战略调整与未来规划 - 公司加速推出经济型车型 时间提前至2024年底/2025年初 强调FSD、Robotaxi和Optimus的潜力 [1] - FSD(Supervised)V12已推出 中国区上线 Robotaxi/Cybercab将于2024年6月在奥斯汀试点 专用车辆计划2026年推出 [1] - Optimus机器人计划2025年底工厂应用 2026年销售目标 公司裁员超10%以节省成本 [1] - 利用现有平台生产线加速产品上市 降低资本支出 比原计划更节省成本 [1] 市场反应与估值争议 - 尽管业绩不佳 财报后股价大幅上涨4%-13% 市场更关注未来叙事而非Q1数据 [1] - 财报前分析师情绪谨慎/看跌 财报后初步反应转为谨慎乐观 投资者关注战略转向 [1] - 估值争议持续 汽车公司vs科技(AI)公司定位未决 Q1业绩支持汽车公司观点 但电话会议叙事偏向科技公司 [1] 能源业务表现 - 能源业务创纪录盈利 预计增长快于汽车业务 2025年全年增长目标20.4GWh [1] - 能源业务显著提升整体毛利率 掩盖了核心汽车业务的疲软 [1] 风险与挑战 - 公司撤回2025年新量增长指引 承认存在不确定性 [1] - 已识别风险包括贸易政策/关税 变化的政治情绪(品牌影响) 宏观经济环境 [1] - 核心汽车业务面临压力 盈利能力依赖监管信贷(5.95亿美元) [1]
沉浸式翻译再发神器,PDF翻译终极解决方案,重要的是依然良心
歸藏的AI工具箱· 2025-04-23 16:32
沉浸式翻译产品功能 - 提供网页多语言对照翻译功能,支持连按三下空格将输入框中文翻译为英文[1] - 免费提供几乎无限量的谷歌翻译额度,适配所有模型API,用户可自定义填写[2] - 新功能Babeldoc支持翻译PDF时保持原始排版,完整提取图表、脚注、公式等非文本元素[2] Babeldoc技术突破 - 通过解析PDF结构并记忆布局信息,智能匹配字体、字号、行距,实现翻译内容无缝替换原文[33] - 采用AI排版引擎重新渲染生成新文档,格式与原始文档高度一致[33] - 开源项目登上Github Python语言排行榜第一[33] 产品性能测试 - 学术论文翻译测试显示,标题、摘要、图表、公式等复杂排版均能精准还原[2][7] - 处理谷歌提示词教程PDF时,字号、段间距、行间距与原文一致,仅代码部分字体未识别[17][18][21] - 成功翻译456页斯坦福HAI人工智能报告,包含多列排版、图表、角标等复杂元素[22][24][29] 商业化方案 - 免费版每月提供1000页PDF解析翻译额度,使用GLM-4-FLASH模型[35] - Pro会员每月10000页额度,接入DeepSeek高级翻译模型[35]
藏师傅 AI 编程全流程教学:Trae重磅更新MCP和Agent能力
歸藏的AI工具箱· 2025-04-22 11:08
AI编程工具Trae的功能更新 - Trae发布四大重磅功能包括MCP、自定义规则、智能体和上下文理解 其能力已与Cursor、Windsurf看齐甚至体验更胜一筹 [3] - 智能体创建支持基于提示词和MCP工具自定义智能体 通过@即可使用 无需每次输入复杂指令 [6] - 智能工具(MCP)支持内置常用功能 只需点击即可使用 同时支持自定义配置如Figma MCP [6][12] - 新增联网搜索和文档集上下文理解能力 使AI能够搜索不懂的编码框架和文档 [6] - 支持配置个人规则和项目规则 无需反复强调基础编码要求 [6][10] Vibe Coding方法论 - Vibe Coding指通过自然语言描述需求让AI完成所有编码工作 问题修复仅通过提示词完成 属于非专业开发者的AI辅助编程方式 [7] - 核心原则包括聚焦单一功能 首次提示词决定成败 采用分步迭代优化等 [40] - 开发流程包含配置IDE环境 梳理需求 生成PRD提示词 测试结果 修复问题和部署上线等步骤 [9] - 需求梳理需使用结构化模板如"我想开发一个【应用类型】主要用于【核心目的】"并详细描述功能需求 [19][21] Trae实操指南 - 环境配置需下载Trae IDE 新建英文项目文件夹 并设置规则文档和MCP服务 [8][10] - MCP配置支持通过API Key添加服务如Figma AI Bridge 实现设计稿参考功能 [12][14] - 生成阶段需结合功能需求和设计开发要求 选择Builder模式或自定义智能体进行代码生成 [24][26] - 测试阶段需系统性验证功能完整性 交互元素和响应式设计等 发现问题后采用单点修复策略 [28][29] - 部署可选择yourware快速服务或Netlify等自定义方案 建议业务数据抽离为JSON文件便于维护 [36][37] 优化建议 - 问题修复时需精确指明修改内容 如使用文件锚点定位 并提供完整报错信息 [31][33] - 每次对话只解决一个问题 发现模型跑偏立即使用"回到发起前"功能回滚 [29][40] - 敏感信息处理建议采用运行时输入而非硬编码 复杂项目建议使用Claude 3.5等大模型 [40] - 持续收集3-5个目标用户反馈 记录卡壳点进行迭代优化 [40]
扣子空间体验-带你看没有繁琐配置的MCP有多强大!
歸藏的AI工具箱· 2025-04-21 10:57
还记得第一次被我的 MCP 案例惊艳到的瞬间吗? "MCP 真强,想象力无限"——这句话我说了太多次,但每次向朋友们展示时,却总被卡在了"你先装个 环境""申请个 API ""改一下命令"这些门槛前。前天晚上教橘子的时候折腾好久,他还算有技术能力 的。 对没有开发背景的普通人来说除了打字提需求前面的每一步都很难。 好在大厂都不是傻子,都从Demo里面看到了机会。 扣子空间( https://space.coze.cn/ )来了,它不只是一个工具,而是你的"AI工作搭子". 可以直接调用内置的MCP服务让AI结合多个MCP完成非常复杂的任务,比如调研之后把结果做成PPT 或者网页,甚至网页内还能嵌入生成的音频和图片。 用户对于AI能力的需求是没有止境的,显然在看到很多MCP的Agents案例轰炸后,大家已经都不满足 于只是用能够使用有限工具的模型了,周五一上线直接就爆火,每个群都在找邀请码。 这篇内容除了 介绍基础的使用方式 以外,藏师傅还会用自己之前玩MCP的经验 教你用三个案例探索 扣子空间的能力上限, 文章最后有邀请码 。 基础用法 先来简单介绍一下扣子空间怎么用。 进入到页面之后除了你输入提示词需要的输 ...