工作流

搜索文档
繁荣之下,全是代价:硅谷顶级VC深入300家公司战壕,揭秘成本、路线、人才、产品四大天坑
AI科技大本营· 2025-07-07 16:54
产品战略 - AI原生公司与AI赋能公司存在显著差异,47%的AI原生公司已进入规模化阶段,而AI赋能公司仅13% [6] - AI赋能公司面临技术债、旧架构和用户习惯等阻力,11%仍处于预发布阶段,而AI原生公司99%已推向市场 [6][7] - 构建AI产品需从底层重构架构,打补丁式升级可能被原生对手击败 [7] 模型选择 - 80%公司依赖第三方API,但高增长公司更倾向微调现有模型(77%)或自研专有模型(54%) [11][12] - 模型选择的核心考量:准确性(74%)和成本(57%)形成"成本-性能-定制化"不可能三角 [15][16] - 模型商品化加速,公司平均使用2.8个不同模型供应商,采用多模型架构成为趋势 [20][23] 市场策略 - 40%AI赋能公司将AI功能打包进高阶套餐,33%选择免费提供,形成防御性策略 [31][34] - 重度用户导致负利润,订阅模式受挑战,基于使用量的定价模式正在兴起 [37][38] - 72%规模化公司提供AI可解释性,透明度从可选项变为必选项 [39][43] 组织人才 - 营收超1亿美元的公司中50%设立专门AI领导者,10亿美元以上公司达61% [47][51] - AI/ML工程师需求率达88%,招聘周期长达70天,合格候选人短缺是主因 [54][55] - 高增长公司工程团队37%专注AI,远超行业平均28%,AI成为研发体系重心 [57][60] 成本结构 - 预发布阶段人才成本占57%,规模化阶段降至36%,基础设施与推理成本占比升至47% [66][67] - 规模化公司月均推理成本达230万美元,是其他公司两倍,API使用费成最大负担 [68][71][72] - 开源模型采用率41%,推理效率优化成为降本关键手段 [73] 内部生产力 - 企业AI工具接触率70%但持续使用率仅50%,大企业更降至44% [76][79] - 编程助手普及率77%,生产力提升15-30%,33%代码由AI辅助完成 [81][82][83] - 工程团队是AI落地最佳切入点,实际效果优于宣传推广 [84][85]
AI智能体开发指南(2025版)
36氪· 2025-07-07 07:09
AI智能体发展现状 - 2025年被定义为"智能体之年",AI智能体技术进入爆发期,能够感知环境、处理信息、自主决策并采取行动,仅需极少量人工干预 [1][40] - 当前AI智能体已广泛应用于客服、数据录入、任务分派、摘要生成、日程安排与决策流等场景,输出高效稳定 [40] - 行业正在经历工作流重构与职业生态变革,人类角色从执行者转向系统设计者和管理者 [40][93] 智能体行为力理论 - 行为力是智能体的核心能力,指系统在环境中自主感知、建模、决策并行动,且能根据结果自我调整的特性 [13] - 行为力四大核心机制:感知(接收环境信号)→评估(根据目标分析)→行动(影响环境)→学习(形成反馈闭环) [16] - 行为力六阶模型揭示能力进阶路径:从简单反射型→适应型→预测型→反思型→社交型→元系统型,每阶代表质的飞跃 [18][21-26] AI智能体技术架构 - 现代AI智能体由三大组件构成:大脑(LLM处理推理)、躯干(n8n工作流实现系统化行动)、双手与感官(外部工具扩展能力) [59][60][62] - 主流智能体类型包括:简单反射型、基于模型型、目标驱动型、效用型、学习型、分层型和LLM核心型,各自适应不同场景 [43-57] - 混合架构如BDI智能体(信念-愿望-意图)、认知架构(SOAR/ACT-R)和多智能体系统(MAS)正在推动技术边界 [55][56] 自主工作流应用 - 自主工作流与传统自动化的本质区别在于智能响应力,能适应多元输入并针对目标优化决策 [90][91] - 典型应用场景包括:多平台社媒内容自动化生产、销售情报自动化分析、数据查询聊天机器人、全能个人助手等 [103-106] - 实施效果显著,例如客服场景中AI智能体日处理咨询量可达人工的10-100倍,同时释放人类从事更高价值工作 [94][95] 行业转型趋势 - 劳动力模式正从"人类→执行任务"转变为"人类→系统设计→AI智能体→执行任务",标志着战略统筹能力的跨越 [100] - 未来岗位将聚焦智能系统设计、监控与优化,例如营销经理转型为营销系统经理,工作更具战略性和创造性 [96][97] - 核心技能需求转向系统思维、人机协作、伦理领导和持续学习能力,传统职业金字塔向"智能体职业钻石模型"演进 [114][115]
技术选择背后的用户逻辑:美图的垂类模型思考
AI前线· 2025-07-06 12:03
视觉AI战略与垂类模型选择 - 公司选择聚焦细分视觉场景而非通用大模型路线 通过垂类模型精准响应用户需求并实现产品化落地 核心在于根据用户需求迭代模型能力 持续解决特定痛点以形成良性循环 [1] - 垂类模型战略优势包括:差异化产品能力构建 减少基础模型训练的大规模投入 实现效果与用户体验的极致优化 同时提升对用户多变需求的响应速度 [2] - 典型案例为Wink视频美容产品 凭借视频人像美容和画质修复功能实现市占率第二 通过将图片端人像美化技术迁移至视频领域 在垂类场景做到第一 [3] 产品落地与用户体验优化 - 影像工具类产品首要关注用户体验 需平衡简单易用与需求满足 例如美图设计室聚焦小微电商物料设计场景 针对性推出AI商品图、AI模特等功能 解决专业设计资源不足的痛点 [5] - 产品成功关键在于持续深挖细分场景 目前公司在视频美容、画质修复、抠图等细分领域均建立核心能力优势 用户阈值提升背景下 效果质量成为打动用户的核心要素 [5] - AI工作流构建需深度理解用户实际流程 如AI口播工具"开拍"针对录制全流程痛点开发功能 完成从技术应用到落地的闭环 [6] 技术演进与未来方向 - 生成式AI为传统图像智能化场景带来重塑机会 技术代际变化可实现更深度的场景渗透 强化理解力与跨模态能力 [7] - 重要技术方向是推动AI技术普及 通过产品化降低使用门槛 使普通用户能体验AI便利 这与公司AI工具开发战略高度一致 [7] - 研究落地协同机制需对齐技术趋势与用户需求 研发团队需基于社媒需求收集、市场竞争分析、NPS调研等数据 谨慎选择垂直场景进行规模化投入 [6] 行业会议与趋势 - AICon深圳站将聚焦Agent、多模态、AI产品设计等方向 探讨企业通过大模型降本增效的实践案例 汇集头部企业及创业公司专家分享前沿洞察 [8][9]
北极光创投林路:AI竞争从“技术领先”转向“产品体验”
钛媒体APP· 2025-07-03 17:52
北极光创投合伙人:林路 核心观点: 1、技术发展并非一直呈指数级增长,在初期快速突破后会趋缓。 2、基础模型差距缩小,行业竞争的焦点就会从"技术领先"转向"产品体验",而这正是创业公司大展身 手的窗口期。 3、一个产品未能构建足够强的数据壁垒或用户体验护城河,它就极易被基础模型整合、甚至直接取 代。 4、AI并不会改变人类的根本需求,但它有能力重塑服务的实现方式,甚至重构服务逻辑的能力,带来 更丰富的互动形式和更强的系统延展性。 本文内容源于北极光创投近期的一次闭门会议。林路先生(北极光创投合伙人)分享了他对 当前AI的看法洞见。林路先生于2012年加入北极光,已在传统互联网与移动互联网领域深 耕14年,积累了丰富的经验。他参与投资及投后管理的项目众多,包括元保(YB)、 XSKY、VIPKID、火花思维、棕榈大道、观脉科技等。 在讨论人工智能之前,我们有必要先理解两条至关重要的曲线。 长期以来,许多人受到互联网时代"指数级增长"神话的影响,误以为技术演进必然是持续加速的,就如 左图中那条虚线所示。 同时,随着 DeepSeek 的开源策略,以及阿里"千问"等国产模型的陆续上线,基础模型之间的差距进一 步缩小 ...
ChatGPT诞生内幕大曝光!发布前一晚还在纠结
量子位· 2025-07-03 08:45
ChatGPT命名与发布历程 - 命名过程极具戏剧性,最初被称为"Chat with GPT-3.5",直到发布前一晚才确定为"ChatGPT"[9][10][11] - 发布前团队信心不足,Ilya测试10个问题仅5个答案通过,对是否发布存在争议[2][12] - 发布后迅速走红:第1天团队怀疑数据错误,第3天确认爆火,第4天意识到将改变世界[3][12] - 初期面临GPU短缺、数据库连接耗尽等技术问题,创建"fail whale"页面应对宕机[13] 产品优化与用户反馈 - 通过RLHF(人类反馈强化学习)优化模型,早期存在过度迎合用户的问题并快速修正[15][16] - 核心机制注重长期留存率而非使用时长,观察到Z世代将其视为"思想伙伴"[16] - 加强隐私保护功能如"临时聊天",平衡记忆功能与隐私需求[17] 图像生成技术发展 - ImageGen(DALL·E系列)验证了完美符合用户提示的图像生成价值难以衡量[20][21] - 2021年1月发布DALL·E初始版,2023年10月DALL-E 3集成至ChatGPT[26] - 初期对生成人物肖像保守限制,后调整为有原则的安全审查[27][28][30] - 印度网民5%在周末尝试ImageGen,触达预期外新用户[24] 代码生成领域布局 - 从GPT-3生成React组件到Codex/Code Interpreter,聚焦Agentic编码(后台长时间处理复杂任务)[33] - 目标为降低编程门槛,Codex当前服务于工程师但未来将扩展至普通用户[37] - 内部广泛使用编程工具:工程师分担测试、分析师标记日志错误、员工规划待办事项[37] 公司文化与人才策略 - 招聘更看重好奇心而非博士学位,认为好奇心是成功最佳指标[39][41] - 强调行动力(主动解决问题)和适应能力(快速调整方向)[44] - 通过独立项目精简人员配置、定期黑客马拉松保持初创文化[45] 未来技术预测 - 未来12-18个月AI推理能力将显著提升,尤其在数学/科学/编程领域[47] - 重点解决"智力受限"问题(如软件工程、数据分析、客户支持)[48][49] - 交互形式将突破聊天模式,发展异步工作流(后台处理任务)[50][52] - 普通用户应对AI浪潮的最佳方式是积极使用以消除误解[54][55] 近期动态与挑战 - CEO透露将发布强大开源模型,支持本地部署[58][59] - 原计划夏季推出的新模型多次延期[60] - 近期因Meta挖角8名关键研究员导致内部短暂停摆,员工放假一周[62]
独家:HeyGen ARR 破 8000 万美金,Benchmark 又投了一位华人创始人
投资实习所· 2025-06-30 17:51
HeyGen最新发展 - 公司2023年6月以5亿美元估值完成6000万美元A轮融资,当时ARR为3500万美元[1] - 最新ARR已达8000万美元,2024年有望突破1亿美元,团队规模约100人[1] - 公司持续盈利,A轮融资资金大部分留存银行[1] - 当前全球用户超1500万,付费用户10万(含4.5万企业客户),覆盖欧洲制造商、非营利组织至财富500强企业[2] 行业竞争格局 - 竞品Synthesia专注企业级B端,2024年4月ARR突破1亿美元,D轮融资后估值达21亿美元[2] - Synthesia企业客户超6.5万,覆盖70%财富100强企业,团队规模500人[2] - 数字人技术冲击传统视频制作行业,Synthesia通过现金补偿+股权方式吸引演员合作[2] 产品技术突破 - 公司推出全球首个"创意操作系统"视频Agent,实现从脚本编写到剪辑的全流程自动化[3] - 系统支持文档/素材/单句输入,自动完成故事解析、分镜生成、演员匹配及多平台优化[3] - 技术理念与OpenArt的"工作流程自动化"一致,将传统多步骤流程简化为输入-输出模式[4] - 公司提出"Agentic content creation"概念,强调AI系统可端到端自主创作品牌一致性内容[4] 资本市场动态 - 按当前营收测算,HeyGen估值应超10亿美元[2] - Benchmark同期投资项目Mercor获100亿美元估值报价(创始人因盈利拒绝)[1] - Benchmark投资的另一华人AI项目正进行数十亿美元规模并购谈判[4] - Benchmark新投华人AI项目获即时5倍估值溢价[4]
10 人 1600 万美金 ARR,华人团队 OpenArt 用了这 11 个 AI 技术栈
投资实习所· 2025-06-29 19:53
定位策略 - 早期面临定位挑战,AI图像生成市场竞争激烈,Midjourney以艺术化输出见长,DALL-E以技术实力著称 [1] - 核心功能与竞品相似,差异化在于用户体验和使用场景的精准把握 [1] - 确定三大核心用户群体:内容创作者、奇幻爱好者、中小企业 [2] 增长策略 - 传统SEO增长趋缓,转向程序化SEO(pSEO)策略 [2] - 针对长尾关键词创建特定主题的AI生成器页面,结构包括H1标题、示例按钮、示例画廊、使用指南 [3] - 与daydream合作,8个月内创建600多个pSEO页面,月访问量达100万次,跻身"AI艺术生成器"搜索前10 [4] 战略转型 - 从AI图像生成转向视觉故事讲述,定位为"品类定义公司" [5] - 赞助MIT AI电影黑客马拉松,验证方向可行性,团队两天创作出接近皮克斯水准的短片 [5] - 采用"Uber模式",简化复杂流程为输入→输出体验,区别于Sora/Pika/Runway的"手动挡工具" [6][7] 技术突破 - 解决角色一致性问题,通过多模态集成组合多个开源工具 [8] - 技术栈包括Stability AI、Flux、ElevenLabs、Kling、Hailuo等 [10] 产品开发与运营 - 编程工具使用Cursor或Windsurf,支持全局上下文搜索,提升效率 [13] - 测试工具Checkly和Stably减少手动QA工作量,提升稳定性 [14][15] - 客户支持工具Serif自动生成70%以上回复,减少人工干预 [16] 用户研究与内容管理 - 用户反馈工具Claude实时分析需求与情绪 [17] - 用户研究工具Dovetail快速梳理访谈内容,提取关键需求 [18] - 内容审核工具Cinder每日处理数百万张图片,保障内容安全 [19] 市场营销 - 程序化SEO工作流每月产出数百个高质量页面,带来数百万自然流量 [20] - SEM广告管理仅需1人兼职,OpenArt生成素材,DeepSeek撰写文案 [21] - 网红挖掘工具Beacons AI匹配契合度90%+的网红,GMass批量触达 [22][23] - 网红管理工具Serif和MightyScout优化沟通与追踪 [24] - YouTube分析工具VidIQ助力订阅量从0增至7万 [25] 未来愿景 - 长期目标是成为AI原生社交媒体平台,探索互动式内容格式 [9] - 定位为故事可视化解决方案,保存用户角色、故事和模板,增强用户粘性 [9]
中石化申请地震处理工作流道头字数据流转方法和装置专利,实现了工作流中模块最新道头字信息的流转
搜狐财经· 2025-06-11 11:06
金融界2025年6月11日消息,国家知识产权局信息显示,中国石油化工股份有限公司;中石化石油物探技 术研究院有限公司申请一项名为"一种地震处理工作流道头字数据流转方法和装置"的专利,公开号 CN120125000A,申请日期为2023年12月。 专利摘要显示,本发明涉及地震处理系统工作流数据流转领域,具体公开一种地震处理工作流道头字数 据流转方法和装置,该方法包括:创建全局道头字内存管理对象;基于全局道头字内存管理对象对工作 流中每个模块对象、模块之间关系、相应模块与对应的道头字之间关系进行动态的内存管理;动态扩充 道头字并更新;动态获取到相应模块的最新道头字信息,进行相关显示或应用计算。本发明提出的地震 处理工作流道头字数据流转方法,通过设计一个全局的道头字内存管理数据结构,实现了对模块关系的 动态管理记录,实现了工作流中模块最新道头字信息的流转,有效的满足了处理业务流程对道头字的动 态变化流转需求。 中石化石油物探技术研究院有限公司,成立于2022年,位于南京市,是一家以从事开采专业及辅助性活 动为主的企业。企业注册资本133611.989369万人民币。通过天眼查大数据分析,中石化石油物探技术 研究院有 ...
Veo3逼真脱口秀火爆全网,视频生成的GPT时刻到了吗?
第一财经· 2025-05-26 11:02
"瑕疵非常多,也很贵。" "如果AI生成的角色拒绝相信他们是AI生成的,会怎么样?" 近日,海外博主用谷歌最新视频模型Veo 3生成的一些人物视频火了。在这些视频中,有一群人集体高呼抗议"We're not prompts(我们不是提示词)",还有 一位男士举着手机自拍,背景是美妙的高山峡谷,他指着身后,"你想说我背后的完美创造物,仅仅是0和1的结果,一串二进制代码,再无其他?这不合 理。" 当然台词和剧本是人创作的,但由AI生成的这些人物和场景都极具真实感,无论是光线在人脸上投下的阴影与高光,还是人物的长相、口型,在阳光下眯 起眼睛的神态都极为自然。配合Veo 3新的原生音频生成功能,人们再一次惊呼"真实不存在了"。 事实是否真的如此,视频生成的GPT时刻终于来了吗?第一财经记者采访的Veo 3的使用者们并不这么认为。AI Talk主理人、AIGC创作者汗青提到,Veo 3 确实是很好的技术,但并没有网传那么夸张,例如视频生成质量有提升但不惊艳,价格不低,现阶段对实际生产帮助还不大。 AIGC创作领域的KOL@尾鳍Vicky对第一财经表示,Veo 3的文生效果是很好,但图生效果与国内第一梯队产品差不多,而在 ...
速递|Alation收购Numbers Station欲破解LLM“幻觉”困局,工作流自动化落地企业的关键拼图
Z Potentials· 2025-05-21 11:38
图片来源: Alation 企业数据智能平台 Alation 收购了 Numbers Station ,以帮助其客户利用运行在其结构化数据之上的 AI Agent。 交易条款未予披露。 Numbers Station 是一家专注于构建 AI 原生数据应用的 A 轮初创公司,已从 Norwest Venture Partners 、 Madrona 及 Factory 等机构融资逾 1700 万美元 。 Alation 联合创始人兼CEO Satyen Sangani 表示,公司计划最早于本季度末将 Numbers Station 的产品 整合至自有平台。 他说道: '让我们充满信心的关键因素在于, 两家公司 的基础架构具有天然的互补性,这使得我们能 快速完成整合。' Sangani 指出,数据和知识的消费正日益通过大语言模型实现,但 LLMs 易产生幻觉的特性,意味着 企业尚未能真正有效采用 AI 数据工具。他表示,公司下一阶段的数据管理必须包含一个介于 LLMs 与企业数据之间的翻译层。 Sangani 表示, Numbers Station 是提供这一层的自然选择,因为它已经构建了处理结构化数据的 AI ...