Workflow
ComfyUI
icon
搜索文档
马斯克疯狂点赞,Lovart凭什么是世界上第一个设计智能体?
搜狐财经· 2025-07-12 13:18
Lovart的核心定位与市场表现 - 产品在海外科技圈迅速引爆 官方视频播放近百万 推特引发5000条讨论 马斯克点赞 24小时内超2万名用户申请试用邀请码 [3] - 区别于现有AIGC工具 定位为"创意团队"而非单一工具 重构AI时代创意工作生产关系 [3][8] - 创始人陈冕提出"SaaS本质是服务由人提供 而AI成为服务主体" 商业价值在于提升甚至替代特定职业生产效率 [8] 产品创新与交互设计 - 采用"画布+对话框"交互范式 左边无限大画布(桌子) 右边对话框 支持自然语言指令修改作品 [9][10] - 交互设计复刻"甲方站在设计师旁指点"场景 将复杂工作流封装为自然沟通方式 [9][11] - 不同垂直领域AI需要不同交互界面 设计领域需共享视觉空间 纯对话交互不足 [11] 竞争策略与行业洞察 - 避开与Adobe、Midjourney等巨头正面对抗 聚焦创意个体户和Prosumer群体 [14] - 选择"价值链条最长、最痛苦、最依赖人工协作"领域 用AI Agent端到端打通 [13] - 判断Midjourney代表1.0时代已成熟 ComfyUI的2.0时代门槛过高 果断下注Agent代表的3.0时代 [15][16] 行业变革与未来展望 - 从取代单一工具到取代个体职业 最终可能取代具有协作能力的团队 重构生产关系 [19] - 让顶尖设计能力突破价格壁垒 向所有人平权开放 [19] - 创始人经历互联网行业大战后 认为AI浪潮是创业者的救赎机会 [19]
放弃国企工作,创办一人企业:我一定能用AI挣到钱!丨AI转型访谈录
腾讯研究院· 2025-06-20 15:33
核心观点 - AI工具虽然降低了影视制作行业的门槛,但要实现商业变现仍需结合影视基础、绘画基础、审美能力和创意思路等核心能力 [4][22][45] - AI在影视制作中主要起到提升效率的作用,可提速约80%,但创作思路短期内无法被替代 [4][70][76] - 成功转型AI的关键在于持续学习、客户服务质量和作品质量,而非单纯依赖工具 [25][45][72] - AI影视制作行业已实现商业化落地,从业者月收入可达4-5万元,主要客户包括企业、媒体和机构 [24][20][26] 行业现状 - AI影视制作已形成完整产业链,从业者通过社群、平台和转介绍获取订单 [26][29][31] - 主流工具包括Midjourney、Stable Diffusion、DALL-E 3等生图工具,Pika等视频工具,每月工具成本达数千元 [44] - 行业存在分层现象:基础图片制作单价低至10元,商业广告片可达数千元 [12][14][38] - AI短剧被视为潜在风口,但当前技术尚无法与真人剧集抗衡 [66][68] 商业模式 - 典型项目周期从半天到两个月不等,紧急商业广告可在6小时内交付 [38][41] - 主要收入来源包括企业宣传片、商业广告、媒体合作等,头部从业者月均收入4-5万元 [24][20] - 获客渠道多元化:平台接单占比约30%,转介绍和社群渠道占比70% [26][29][31] - 团队采用灵活协作模式,核心成员1-2人,项目制招募临时成员 [27][28] 核心能力 - 需要掌握至少3-5种AI工具的深度应用,并能组合使用解决复杂需求 [44][45] - 影视行业基础技能(剪辑、运镜、脚本)仍是核心竞争力 [22][45][46] - 客户需求转化能力至关重要,需将模糊需求转化为可执行方案 [33][45] - 持续学习能力是关键,需每天跟踪行业新技术和新工具 [72][78] 发展趋势 - 工具迭代速度加快,从业者需保持每月20%以上的学习时间投入 [58][72] - 行业呈现专业化分工趋势,开始出现文案、生图、视频等细分领域 [44][68] - 内容质量要求持续提升,市场开始淘汰低质量批量生产内容 [68][77] - 三四线城市从业者通过远程协作实现业务突破 [20][64]
618想换电脑跑AI?先听我一句劝。
数字生命卡兹克· 2025-06-04 23:08
本地AI部署与设备选择 核心观点 - 本地部署AI模型需考虑算力需求和隐私安全两大核心因素[5][6] - 参数量与显存关系决定本地可行性:1B模型需4GB显存(FP32),量化后8B模型仅需16GB显存[11] - 14B及以上模型本地运行需高端显卡(如4090/5090),14B以下需评估显存匹配度[14] 模型部署场景分析 - **本地适用场景**: - 涉及商业机密/医疗数据等隐私敏感场景[16] - 影视工业案例:《流浪地球3》剧本AI辅助需本地5090D部署[17][18] - 免费无限使用优势,如ComfyUI图像生成工具[24] - **云端适用场景**: - 企业级大模型部署(如Qwen2.5 72B需4张48GB显存卡)[24] - 临时算力需求可通过AutoDL租用云服务器(4090实例¥2.4/小时)[25] 硬件配置标准 - **显存计算公式**: | 精度类型 | 参数量 | 显存需求 | |---|---|--| | FP32 | 1B | 4GB | | FP16/INT8 | 8B | 16GB | [11] - **显卡推荐阈值**: - 基础需求:5060Ti/5070(12GB显存)支持7B模型[19][22] - 高性能需求:5090D处理工业级工作流[18] 主流模型性能数据 | 模型类型 | 代表模型 | 参数量 | 显存需求 | |---|---|---|---| | **语言模型** | DeepSeek-R1-Qwen3-8B | 8B | 16GB | [11][13] | **图像生成** | SDXL | 6.6B | 8-12GB | [16] | **视频生成** | Wan 2.1 | 1.3B | 16-24GB | [16] 618高性价比设备推荐 | 价格档位 | 机型 | 核心配置 | 折扣价 | |---|---|---|---| | 5000元 | 机械革命极光X | 5060 8G+i7-13700HX | ¥5332 | [26] | 7000元 | 华硕天选6 Pro | 5070 12G+8940HX | ¥7599 | [33] | 8000元 | 机械革命蛟龙 | 5070Ti 16G+R9-8945HX | ¥7873 | [36]
小米卢伟冰:SU7发布这么久没对手,一个能打的都没有;谷歌回应在AI搜索里塞广告:用户觉得有用;夸克健康大模型通过副主任医师考试
雷峰网· 2025-05-28 08:26
兴业银行私人银行实习计划争议 - 兴业银行私人银行推出"2025菁英实习计划",要求非私行客户新增行外资金1000万元以上或存量客户新增500万元以上,可提供摩根大通、中金资本等名企实习机会[4] - 该计划引发公众质疑后被暂停,银行回应称推广表述不完整造成误解[6] - 字节跳动等企业澄清未与兴业银行有此合作,强调实习录用需符合官方招聘需求[6] 小米集团业绩与汽车业务 - 2025年Q1小米集团总收入达1113亿元创历史新高,同比增长47.4%,经调整净利润107亿元同比增长64.5%[8] - 智能电动汽车业务收入181亿元,SU7系列累计交付超258000台,Q1交付75869辆[8] - 卢伟冰表示SU7尚无直接竞争对手,产品力保障利润率,目前产能仍严重不足[12] 汽车行业动态 - 深蓝汽车因向48万老车主推送车机广告引发争议,CEO承认决策错误并承诺停止此类推送[9][10] - 李书福强调吉利坚持价值战而非价格战,持续投入传统内燃机与新能源双线发展[13] - 长安汽车称阿维塔59%用户来自BBA,计划在新汽车领域投入超2000亿元[18][19] 互联网与科技行业 - Meta的Llama创始团队14名核心成员中11人离职,公司推迟Behemoth模型发布并重组AI团队[25][29] - 谷歌在AI搜索结果中插入广告引发讨论,公司称数据显示用户认为广告有帮助[27] - 小红书成立hi lab实验室,组建AI人文训练师团队提升大模型人文素养[20] 国际车企动态 - 沃尔沃汽车宣布裁员3000人以应对成本压力,主要影响瑞典办公室岗位[27] - 日产汽车2024财年净亏损6709亿日元,计划出售总部大楼等资产筹措资金[30][31] - 三星电子将停止消费级MLC NAND闪存供应,重点转向汽车电子领域[32] 其他行业要闻 - 京东与美团市值总计蒸发约1000亿美元,外卖市场竞争加剧导致业绩承压[13][14] - 夸克健康大模型通过国家副主任医师考试,展示医疗辅助应用潜力[22] - 国内手机激活量份额显示苹果以21.5%占比重返第一,618活动带动增长[21]
国家网络安全通报中心:ComfyUI存在多个高危漏洞
快讯· 2025-05-27 10:37
ComfyUI安全漏洞事件 产品定位与技术特点 - ComfyUI是一款专注于图像生成的AI绘图工具 通过图形化节点设计简化深度学习模型工作流程 提升用户操作直观性 [1] 安全漏洞详情 - 系统存在5个历史高危漏洞(CVE-2024-10099至CVE-2024-21577) 涉及任意文件读取和远程代码执行风险 [1] - 攻击者可利用漏洞获取服务器权限 导致系统数据被窃取 [1] 攻击事件动态 - 境外黑客组织已利用该漏洞对中国网络资产实施攻击 目标为窃取重要敏感数据 [1] - 北京市网络与信息安全信息通报中心确认漏洞威胁并发布预警 [1]
独家对话Lovart创始人陈冕:我们没有产品经理,只有设计师
Founder Park· 2025-05-16 17:22
产品定位与核心优势 - Lovart是AI设计领域的垂直Agent产品,将多模态职业工作流内化为Agent形态,主打"画布"交互概念[2][21] - 产品24小时内获得2万waitlist申请,推特讨论量达5000条,视频播放量近百万[1] - 核心差异化在于垂直领域认知深度和交互创新,而非简单跟随通用Agent趋势[12][56] AI图像产品演进路径 - 1.0阶段:Midjourney等单点图片生成工具[13] - 2.0阶段:ComfyUI等工作流产品串联多种模型能力[14] - 3.0阶段:Lovart等Agent产品实现工作流自动规划执行[4][14] - 当前处于3.0早期,模型能力不足但存在先发窗口期[16] 交互设计与产品哲学 - "画布"设计还原原始创作场景,模拟甲方与设计师的桌面协作[18][19] - 现阶段保留传统Edit工具箱作为专业用户补充手段[21] - 未来目标是通过模型能力提升实现完全自然语言交互[22] 技术实现与产品规划 - 依赖GPT-4o等基础模型提升图像理解能力[47] - 已实现图片/视频生成,即将推出3D模型和音频功能[28] - 最终形态定位为多模态"创意团队",整合设计师/导演/摄影师角色[29][31] 商业模式与市场策略 - 采用订阅制,优先拓展海外市场[33][34] - 核心指标关注付费转化率和用户留存[37] - 计划在几周内推出付费功能控制运营成本[36] 团队构建与行业认知 - 团队取消传统产品经理角色,由设计师直接训练AI[43][46] - 认为垂直领域专业知识比通用产品能力更具壁垒[40][56] - 数据价值体现在工作流记录而非原始素材积累[51]
腾讯研究院AI速递 20250508
腾讯研究院· 2025-05-07 23:55
生成式AI - Gemini 2 5 Pro在LMeana基准测试中全面领先,首次在文本、视觉、WebDev Arena三大领域超越Claude 3 7 [1] - 新版本强化编程能力,可将图片视频转化为交互式应用,VideoMME测试得分84 8% [1] - 开发者可通过Google AI Studio和Vertex AI使用更新版本,已上线Gemini App并支持Canvas功能 [1] ComfyUI功能升级 - 新增原生API节点功能,支持10+模型系列和62个新节点,可直接调用Veo2、Flux Ultra等付费模型 [2] - 完成品牌视觉更新,新Logo采用连接方块元素设计,融入90年代动漫与Y2K风格 [2] - 即将推出用户自定义API Key、工作流并行执行功能,并增强视频处理能力 [2] Kevin模型开源 - Cognition AI开源32B参数量的Kevin模型,基于QwQ-32B通过GRPO强化学习训练,生成CUDA内核性能超越o3和o4-mini [3] - 在KernelBench数据集上平均正确率达65%,解决89%的任务,测试中实现1 41倍加速比 [3] - 在二级任务上表现尤为突出,达到1 74倍加速,显著优于其他模型 [3] 学生免费计划 - Cursor Pro和Gemini Pro向学生免费开放一年完整专业版使用权限,可节省约2000元人民币 [4][5] - 此举旨在争夺未来用户市场,通过培养学生使用习惯提前布局市场份额 [4] - 申请渠道已开放,Gemini Pro将在2025年8月重新验证学生身份 [5] 腾讯元宝功能升级 - 推出对话分组功能,支持按主题创建文件夹和历史对话归类整理 [6] - 每个分组可设置独立提示词指令,定制专属语气风格和任务目标 [6] - 全平台上线文生图功能,支持混元和DeepSeek模型生成图片,增强图文一致性和画质 [7] AI科研应用 - Anthropic启动AI for Science计划,提供最高2万美元API积分支持生物系统、遗传数据、药物研发等领域研究 [8] - 开放所有Claude系列模型,重点推动AI在科学研究的突破性应用 [8] 机器人大模型 - 清华ISRLab与星动纪元联合开发AIGC机器人大模型VPP,获ICML2025 Spotlight并全部开源 [9][10] - 在Calvin ABC-D基准测试中实现4 33平均任务完成长度,超越先前技术41 5% [10] - 支持跨本体学习,可完成100+种灵巧操作任务,具有较强可解释性和调试能力 [10] AI社会影响 - 专家警告AI正在经济、文化和社交领域取代人类,可能导致人类失去对文明的控制 [11] - 建议采取跟踪AI影响、监管AI实验室、加强人类组织能力等措施应对 [11] 软件开发革新 - Bolt new从年收入70万美元快速增长至2000万美元ARR,主打基于浏览器的快速Web应用开发 [12] - 60-70%用户为非开发者,利用Web containers技术实现100毫秒内启动开发环境 [12] - 15人团队聚焦核心产品体验,通过免费试用实现病毒式增长 [12]