Workflow
工作流
icon
搜索文档
繁荣之下,全是代价:硅谷顶级VC深入300家公司战壕,揭秘成本、路线、人才、产品四大天坑
AI科技大本营· 2025-07-07 16:54
整理 | 王启隆 出品 | CSDN(ID:CSDNnews) 投稿或寻求报道 | zhanghy@csdn.net AI 热潮的另一面是什么? 在聚光灯无法照亮的角落,那些真正用代码、数据和不眠不休的夜晚构建着AI未来的"Builder"们,他们正在经历什么?他们的"Playbook"(战术手 册)上,写下的究竟是通往圣杯的地图,还是九死一生的航海日志? 最近,硅谷顶级投资机构 ICONIQ Capital 发布了一份名为 《The Builder's Playbook》 的 2025 年度 AI 报告。他们没有采访那些在发布会上侃侃 而谈的 CEO,而是深入了战壕,对全球 300 家正在构建 AI 产品的软件公司(包括工程主管、AI 负责人和产品负责人)进行了对话。 这份长达 67 页的报告,描绘一个高歌猛进、势如破竹的黄金时代,而是用冷静到近乎残酷的数据,揭示了繁荣之下的真相: 每一步看似光明的进展,背后都标记着惊人的代价、艰难的权衡和巨大的不确定性。 报告将围绕构建者最关心的五个核心问题展开,这也是报告的五大支柱: 产品战略: 造什么? 在 AI 领域,所有构建者首先面临一个根本性的身份选择题: 你是 ...
AI智能体开发指南(2025版)
36氪· 2025-07-07 07:09
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:2025年是智能体之年。本文从理论到实践对AI智能体开发进行了全面介绍,为你从外行变成专家提供了完整指南。文章来自编译。 学习用n8n创建低代码AI智能体,实现工作自动化。 我们再也掌控不了机器了。 是它们在控制我们。 ——京特·安德斯(Günther Anders) 初识通用人工智能的那一夜 2022年12月1日, 我死死盯着屏幕,又瞥了床头柜一眼。 凌晨3:26 死寂卧室里回荡,耳鸣嗡嗡作响。 19岁熬夜本属寻常——学习、打工、派对狂欢。 但我干的不是这些。我浑身冒汗。 眼袋浮肿,但跟压力和咖啡因无关。 是因为别的什么东西... ...某种尚未命名的存在。 感觉有点像机械蝴蝶。 那或许是我第一次触到通用人工智能的火花。 我被迫开灯驱散耳鸣。 看着刚发布的ChatGPT-3.5在屏幕上逐字吐露答案。 多数人对此毫无觉察。 杨立昆(Yann LeCun)视之为随机鹦鹉。 于我而言,这是人类史上最重大的时刻。 顿悟如洪流席卷—— "x他妈的...这玩意是活的?" 一道泪痕划过脸颊。 我凝视着空无一物的镜 ...
技术选择背后的用户逻辑:美图的垂类模型思考
AI前线· 2025-07-06 12:03
作者 | 曲晓超 策划 | 罗燕珊 在视觉 AI 快速演进的当下,从底层算法到场景落地,技术与用户需求之间的连接正变得愈发紧密。 不同于一味追逐"通用大模型"趋势,美图选择聚焦于多个细分视觉场景,通过垂类模型深入挖掘用户 价值,实现精准响应与产品化落地。 InfoQ:美图选择在多个细分视觉场景上部署垂类模型,而不是一味追随通用大模型路线。这个选择 背后的判断标准是什么?您怎么看垂类模型的长期价值? 围绕垂类模型的价值判断、视觉 AI 的产品演进、AI 工作流的构建机制以及未来图像智能化的新趋 势,日前 InfoQ 与 美图公司高级计算机视觉专家曲晓超 进行了简单交流,了解其背后的技术选择与 实践路径。 8 月 22~23 日的 AICon 深圳站 将以 "探索 AI 应用边界" 为主题,聚焦 Agent、多模态、AI 产品设计 等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自头部企 业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更 多可能,发掘 AI 驱动业务增长的新路径! 曲晓超: 根据用户需求迭代模型能力和产品功能,打造真正落地的 ...
北极光创投林路:AI竞争从“技术领先”转向“产品体验”
钛媒体APP· 2025-07-03 17:52
北极光创投合伙人:林路 核心观点: 1、技术发展并非一直呈指数级增长,在初期快速突破后会趋缓。 2、基础模型差距缩小,行业竞争的焦点就会从"技术领先"转向"产品体验",而这正是创业公司大展身 手的窗口期。 3、一个产品未能构建足够强的数据壁垒或用户体验护城河,它就极易被基础模型整合、甚至直接取 代。 4、AI并不会改变人类的根本需求,但它有能力重塑服务的实现方式,甚至重构服务逻辑的能力,带来 更丰富的互动形式和更强的系统延展性。 本文内容源于北极光创投近期的一次闭门会议。林路先生(北极光创投合伙人)分享了他对 当前AI的看法洞见。林路先生于2012年加入北极光,已在传统互联网与移动互联网领域深 耕14年,积累了丰富的经验。他参与投资及投后管理的项目众多,包括元保(YB)、 XSKY、VIPKID、火花思维、棕榈大道、观脉科技等。 在讨论人工智能之前,我们有必要先理解两条至关重要的曲线。 长期以来,许多人受到互联网时代"指数级增长"神话的影响,误以为技术演进必然是持续加速的,就如 左图中那条虚线所示。 同时,随着 DeepSeek 的开源策略,以及阿里"千问"等国产模型的陆续上线,基础模型之间的差距进一 步缩小 ...
ChatGPT诞生内幕大曝光!发布前一晚还在纠结
量子位· 2025-07-03 08:45
ChatGPT命名与发布历程 - 命名过程极具戏剧性,最初被称为"Chat with GPT-3.5",直到发布前一晚才确定为"ChatGPT"[9][10][11] - 发布前团队信心不足,Ilya测试10个问题仅5个答案通过,对是否发布存在争议[2][12] - 发布后迅速走红:第1天团队怀疑数据错误,第3天确认爆火,第4天意识到将改变世界[3][12] - 初期面临GPU短缺、数据库连接耗尽等技术问题,创建"fail whale"页面应对宕机[13] 产品优化与用户反馈 - 通过RLHF(人类反馈强化学习)优化模型,早期存在过度迎合用户的问题并快速修正[15][16] - 核心机制注重长期留存率而非使用时长,观察到Z世代将其视为"思想伙伴"[16] - 加强隐私保护功能如"临时聊天",平衡记忆功能与隐私需求[17] 图像生成技术发展 - ImageGen(DALL·E系列)验证了完美符合用户提示的图像生成价值难以衡量[20][21] - 2021年1月发布DALL·E初始版,2023年10月DALL-E 3集成至ChatGPT[26] - 初期对生成人物肖像保守限制,后调整为有原则的安全审查[27][28][30] - 印度网民5%在周末尝试ImageGen,触达预期外新用户[24] 代码生成领域布局 - 从GPT-3生成React组件到Codex/Code Interpreter,聚焦Agentic编码(后台长时间处理复杂任务)[33] - 目标为降低编程门槛,Codex当前服务于工程师但未来将扩展至普通用户[37] - 内部广泛使用编程工具:工程师分担测试、分析师标记日志错误、员工规划待办事项[37] 公司文化与人才策略 - 招聘更看重好奇心而非博士学位,认为好奇心是成功最佳指标[39][41] - 强调行动力(主动解决问题)和适应能力(快速调整方向)[44] - 通过独立项目精简人员配置、定期黑客马拉松保持初创文化[45] 未来技术预测 - 未来12-18个月AI推理能力将显著提升,尤其在数学/科学/编程领域[47] - 重点解决"智力受限"问题(如软件工程、数据分析、客户支持)[48][49] - 交互形式将突破聊天模式,发展异步工作流(后台处理任务)[50][52] - 普通用户应对AI浪潮的最佳方式是积极使用以消除误解[54][55] 近期动态与挑战 - CEO透露将发布强大开源模型,支持本地部署[58][59] - 原计划夏季推出的新模型多次延期[60] - 近期因Meta挖角8名关键研究员导致内部短暂停摆,员工放假一周[62]
独家:HeyGen ARR 破 8000 万美金,Benchmark 又投了一位华人创始人
投资实习所· 2025-06-30 17:51
去年 6 月份,HeyGen 正式以 5 亿美金估值完成由 Benchmark 领投的 6000 万美金 A 轮融资,当时其公 布的 ARR 为 3500 万美金《 3500 万美金 ARR,什么驱动了 HeyGen 的新一轮快速增长? 》。 之后基本上就没有公布除了产品更新以外的其它数据了,不过我最新了解到的信息是, HeyGen 的 ARR 已经达到 8000 万美金,今年有望突破 1 亿美金,团队 100 人左右 。 由于公司一直盈利,据说 HeyGen 上一轮融的钱基本上都在银行里吃利息。这和 Benchmark 投资的 AI 招 聘平台 Mercor 类似,已经有投资人给 Mercor 报价 100 亿美金估值,但是被创始人拒绝,原因是公司本 身盈利,融资过程太分心《 拿 6000 万美金的 AI 语音产品在 VC 圈火了,Mercor 最新估值 100 亿美金 》。 按照最新的营收来估算,HeyGen 估值超过 10 亿美金应该很正常了。根据 HeyGen 最新提供的信息, 目 前其全球用户超过了 1500 万,付费用户则超过了 10 万,其中企业客户 4.5 万 ,涵盖了多个行业,比方 说欧洲的 ...
10 人 1600 万美金 ARR,华人团队 OpenArt 用了这 11 个 AI 技术栈
投资实习所· 2025-06-29 19:53
华人团队做的 OpenArt,在 10 人团队的情况下已经将 ARR 做到了 1600 万美金,其 CEO Coco Mao 陆 陆续续分享了不少经验,这几点我觉得挺有价值: 1.定位:如何找准自己的定位 早期,OpenArt 面临的问题是定位:在一个快速演进的市场中,如何找到自己的定位?当时的 AI 图像生 成市场群雄并起——Midjourney 凭借其艺术化的输出赢得了设计师的青睐,DALL-E 以技术实力著称,而 无数新创公司都在争夺这个看似无限大的蛋糕。 最初的几个月里,我们每天都在问自己同一个问题:OpenArt 与 Midjourney 或 Ideogram 有什么不 同?说实话,在核心功能和技术层面,所有产品都非常相似。 从表面看,OpenArt 确实很难与竞争对手区分开来——都提供文本到图像的生成功能,都使用类似的 AI 模型,都面向创意工作者。但很快她意识到, 真正的差异化往往不在于技术本身,而在于用户体验和使用 场景的精准把握。 经过几个月的探索和用户反馈,OpenArt 团队确定了三个核心用户群体: 2.增长:SEO 驱动的爆发式增长 到 2024 年底,OpenArt 已经在 AI 图 ...
中石化申请地震处理工作流道头字数据流转方法和装置专利,实现了工作流中模块最新道头字信息的流转
搜狐财经· 2025-06-11 11:06
金融界2025年6月11日消息,国家知识产权局信息显示,中国石油化工股份有限公司;中石化石油物探技 术研究院有限公司申请一项名为"一种地震处理工作流道头字数据流转方法和装置"的专利,公开号 CN120125000A,申请日期为2023年12月。 专利摘要显示,本发明涉及地震处理系统工作流数据流转领域,具体公开一种地震处理工作流道头字数 据流转方法和装置,该方法包括:创建全局道头字内存管理对象;基于全局道头字内存管理对象对工作 流中每个模块对象、模块之间关系、相应模块与对应的道头字之间关系进行动态的内存管理;动态扩充 道头字并更新;动态获取到相应模块的最新道头字信息,进行相关显示或应用计算。本发明提出的地震 处理工作流道头字数据流转方法,通过设计一个全局的道头字内存管理数据结构,实现了对模块关系的 动态管理记录,实现了工作流中模块最新道头字信息的流转,有效的满足了处理业务流程对道头字的动 态变化流转需求。 中石化石油物探技术研究院有限公司,成立于2022年,位于南京市,是一家以从事开采专业及辅助性活 动为主的企业。企业注册资本133611.989369万人民币。通过天眼查大数据分析,中石化石油物探技术 研究院有 ...
Veo3逼真脱口秀火爆全网,视频生成的GPT时刻到了吗?
第一财经· 2025-05-26 11:02
"瑕疵非常多,也很贵。" "如果AI生成的角色拒绝相信他们是AI生成的,会怎么样?" 近日,海外博主用谷歌最新视频模型Veo 3生成的一些人物视频火了。在这些视频中,有一群人集体高呼抗议"We're not prompts(我们不是提示词)",还有 一位男士举着手机自拍,背景是美妙的高山峡谷,他指着身后,"你想说我背后的完美创造物,仅仅是0和1的结果,一串二进制代码,再无其他?这不合 理。" 当然台词和剧本是人创作的,但由AI生成的这些人物和场景都极具真实感,无论是光线在人脸上投下的阴影与高光,还是人物的长相、口型,在阳光下眯 起眼睛的神态都极为自然。配合Veo 3新的原生音频生成功能,人们再一次惊呼"真实不存在了"。 事实是否真的如此,视频生成的GPT时刻终于来了吗?第一财经记者采访的Veo 3的使用者们并不这么认为。AI Talk主理人、AIGC创作者汗青提到,Veo 3 确实是很好的技术,但并没有网传那么夸张,例如视频生成质量有提升但不惊艳,价格不低,现阶段对实际生产帮助还不大。 AIGC创作领域的KOL@尾鳍Vicky对第一财经表示,Veo 3的文生效果是很好,但图生效果与国内第一梯队产品差不多,而在 ...
速递|Alation收购Numbers Station欲破解LLM“幻觉”困局​​,​​工作流自动化落地企业的关键拼图
Z Potentials· 2025-05-21 11:38
图片来源: Alation 企业数据智能平台 Alation 收购了 Numbers Station ,以帮助其客户利用运行在其结构化数据之上的 AI Agent。 交易条款未予披露。 Numbers Station 是一家专注于构建 AI 原生数据应用的 A 轮初创公司,已从 Norwest Venture Partners 、 Madrona 及 Factory 等机构融资逾 1700 万美元 。 Alation 联合创始人兼CEO Satyen Sangani 表示,公司计划最早于本季度末将 Numbers Station 的产品 整合至自有平台。 他说道: '让我们充满信心的关键因素在于, 两家公司 的基础架构具有天然的互补性,这使得我们能 快速完成整合。' Sangani 指出,数据和知识的消费正日益通过大语言模型实现,但 LLMs 易产生幻觉的特性,意味着 企业尚未能真正有效采用 AI 数据工具。他表示,公司下一阶段的数据管理必须包含一个介于 LLMs 与企业数据之间的翻译层。 Sangani 表示, Numbers Station 是提供这一层的自然选择,因为它已经构建了处理结构化数据的 AI ...