Workflow
海外独角兽
icon
搜索文档
多邻国的「AI-first」到底是什么?|AGIX投什么
海外独角兽· 2025-05-27 19:03
• 产品、软件工程师和设计这三个角色会因为 AI 的出现越来越融合,最新推出的国际象棋课程就是 由两位没有 coding 经验的团队成员在 AI 工具的帮助下推动项目在 9 个月内上线; • Duolingo 内部很鼓励员工使用各种 AI 产品来提升效率,Severin 还专门提到了 Cursor 、 Decagon 这 两款产品; • 出于产品效率和用户体验,Duolingo 最终选择围绕"学习"场景构建出一个 Super App,而不是 App 矩阵; 编译:yuhao 编辑:Siqi 海外独角兽原创编译 转载请注明 本篇内容是「AGIX 投什么」系列的第 7 篇。 AGIX 指数 从全球上千家科技上市公司中精选出的 40 家左右最能把握 AGI 价值整理的公司,AGIX 指数组合即是定位 AGI 进程的坐标,也能够为投资者 捕捉 AI-alpha 提供价值工具。在「AGIX 投什么」板块,我们会对 AGIX Index 的组合公司进行深度 分析,输出全面的 AI 投资参考。 作为 AGIX 覆盖公司,多邻国一直是 AGIX 重要 增长动力贡献之一 ,在"AGIX 潜力模型"中评分极 高。前不久,多邻国 ...
Agent Infra 图谱:哪些组件值得为 Agent 重做一遍?
海外独角兽· 2025-05-21 20:05
作者:Lai、bryan、haozhen 编辑:penny 我们之前已经研究了 Browserbase 、 E2B 等公司,本文是我们对于 Agent Infra 领域图景更全面的 Mapping。我们划分出了 Environment、Context、Tools、Agent Security 这四大赛道,逐步分析每个环 节的价值和值得关注的初创公司: • Environment 的作用是给 Agent 执行任务提供容器,是一个 Agent-native computer; • Context 层是在 Agent 工作中赋予记忆 Memory 和领域知识的重要中间层; • Tools 由于 MCP 协议的统一而百花齐放,同时目前 Tools 的核心用户还是开发者,普通用户的使用 门槛太高; 2025 年以来,Agent 开发量和使用量都有明显提高。Agent 的爆发带来了 Agent Infra 需求的爆发。在 过去 1-2 年,Agent 开发大多依赖开发者手动使用传统 Infra 搭建,开发工程量大、流程复杂,但随 着越来越多 Agent-native Infra 涌现,Agent 开发的难度和周期都在缩小 ...
单月涨幅 20%,为什么还是要坚定押注 AI?|AGIX Monthly
海外独角兽· 2025-05-15 21:04
Something New : 为了更好地沉淀 AI 时代的投资 insights,我们上线了 「AGI 投资手册」知识库( 点击文末阅读原文链接查看 ),欢迎留下建议与 ideas,共建 AGI 时代的投资指南。也可以评论区留 言你认为最值得关注的 AI 股票,我们会为留言的朋友送出最新「 AGI 投资报告」 PDF。 关税博弈告一段落,AGIX 在过去 3 天内共上涨 9.19% ,最新的 YTD 为 3.66%,跑赢 Nasdaq100 (+1.46%)、S&P500(+0.19%),以及 Dow&Jones(-1.16%)在内的所有大盘指数。 在这次市场调整中,AGIX 表现出了明显的"高弹性":最大回撤为 -31.48%,但在宏观情绪基本出尽 后快速止跌,过去一个月中增长了 23.15%,5 月至今更是已经实现了 14.94% 的增长,是 Nasdaq 100 (QQQ ETF 追踪指数)的 1.64 倍: • "前沿科技落地和快速应用是时代不确定性中的最大确定性",如果要对本轮震荡做一个总结的话, 我们认为这句话是最大的 take away: 这次止跌到上涨的过程中,DUOL、PLTR、SAP 、 ...
Manus 背后的重要 Infra,E2B 如何给 AI Agents 配备“专属电脑”?
海外独角兽· 2025-05-09 20:16
编译:haozhen 编辑:Siqi 海外独角兽原创编译 转载请注明 Multi agent 系统正成为新的突破方向的过程中,agent infra 也成为落地关键。在 computer use 带来范式创新的趋势下,virtual machine 将成为潜在创业机会, E2B 就是这个领域的新兴参与者。 E2B 之所以受到市场关注很大程度上是因为 Manus,Manus agent 完成任务过程中的 virtual computer 支持正是来自于 E2B。E2B 成立于 2023 年,作为一个开 源基础设施,允许用户在云端的安全隔离沙盒中运行 AI 生成的代码。E2B 本质上是一个可以快速启动(~150 毫秒)的 microVM,它的底层类似于 AWS Firecracker 这个代表性的 MicroVM,在此基础上, AI Agents 可以在 E2B 中运行代码语言、使用浏览器、调用各种操作系统中的工具。 随着 Agent 生态的繁荣,E2B 的 沙盒月创建量一年内从 4 万增长到 1500 万,一年内增长了 375 倍。 为什么 AI agents 需要专属的"电脑"? 为了更好地理解这个问题,我们 ...
OpenEvidence,医疗领域诞生了第一个广告模式 Chatbot
海外独角兽· 2025-05-08 20:01
核心观点 - OpenEvidence是一款专为医生设计的AI专业诊断Copilot,致力于解决医学知识爆炸式增长和临床信息过载问题,帮助医生提高诊断效率与决策质量[4] - 公司采用直接面向医生的增长策略,通过精准功能设计和口碑传播实现病毒式增长,商业模式是与制药企业、医疗器械厂商合作嵌入精准广告[5] - 公司已完成7500万美元A轮融资,投后估值突破10亿美元,由Sequoia Capital独家投资[4] 01 背景 - 医学知识每5年更新一次,PubMed已索引3600万篇摘要,每年新增100万篇,Google Scholar包含约4亿篇文章[9] - 低收入国家医生接触前沿医学证据频率仅为高收入国家的1/9,美国乡镇医院临床决策系统渗透率不及教学医院的1/7[10] - 65岁以上患者平均服用5种以上药物,药物交互作用可能性超过3亿种组合,传统诊疗指南覆盖率不足7%[10] - 通用AI大模型在医疗领域存在明显局限性,在150个病例测试中诊断准确性曲线下面积仅为66%[11] 02 产品和技术 - 产品提供"护理指南"与"临床证据"双模式回答,每个问题答案后列出可能的Follow-up问题[12] - 症状分析模块可快速解析模糊症状,治疗决策支持功能基于最新研究推荐治疗方案[12] - 系统内置50+临床计算器,覆盖疾病评分、药物剂量计算等高频场景[12] - 医学知识跟踪学习功能通过每日精选新发表论文生成可视化图表与专科分类总结[13] - 产品在美国医学执照考试(USMLE)中得分超过90%,错误率比ChatGPT低77%[16] - 采用小型专业化模型技术路径,专注医学领域高质量压缩,确保信息准确性和可靠性[19] - 数据来源仅基于FDA和CDC等政府机构医学文献及顶级期刊,杜绝公共互联网连接[20] 03 商业化与竞争 - 采用直接面向医生免费产品策略,避开了传统医疗SaaS复杂采购流程[21] - 在一年内覆盖美国10%-25%执业医生,每月约10万名医生使用,MAU达30-40万[22] - 与《新英格兰医学杂志》建立独家战略合作,获得梅奥诊所平台加速器支持[23][24] - 商业模式是通过面向制药企业、医疗器械厂商的精准广告投放实现变现[25] - 广告内容与临床决策场景紧密结合,如查看免疫疗法论文时推荐相关药企广告[26] - 主要竞争对手UpToDate年收入约5760万美元,企业版收费50-100美元/用户/月[27] 04 团队与融资 - 创始人Daniel Nadler拥有哈佛大学经济学博士学位,曾创立Kensho Technologies并以5.5亿美元被收购[30] - 团队多来自哈佛、MIT顶尖实验室,CTO Zachary Ziegler是哈佛大学计算机科学博士候选人[34][35] - 2025年2月完成7500万美元A轮融资,投后估值超过10亿美元,由Sequoia Capital独家投资[36] 05 结语 - 公司利用AI破解医疗领域"信息爆炸"与"索引低效"矛盾[37] - 商业模式将专业用户池转化为高度场景化的精准广告场[37] - 为AI应用创业企业提供"垂直领域精准变现"的新思路[38]
医疗 Agent 最全图谱:AI 如何填补万亿美金“效率黑洞”
海外独角兽· 2025-05-07 19:29
Healthcare 是美国最大的行业之一,支出占 GDP 的 17%,雇佣 1/10 的美国劳动力。它也极其低效,美国每年 4.5 万亿美元的医疗支出中,有高达 25%,也 就是 1.1 万亿美元被视为无效或可避免的浪费。在某些情况下,healthcare 从业者用于保险账单处理的时间成本可能占账单收入的 1/7。碎片化的系统、低 效的运营流程和人力密集的环节,是 AI Agent 的天然切入点。如果 AI 能切掉哪怕一小部分,就可能创造几千亿级别的新市场空间。 过去一年,GenAI 在医疗行业的渗透加速了。本文我们系统梳理了 Healthcare AI 的产业结构,重点聚焦了在哪些环节 AI 能够真正创造价值、并且拥有明 确预算,识别了值得优先关注和投资的细分方向和公司。 医疗行业的独特性决定了 AI 的扩散路径和传统软件或消费级应用并不同。目前 Healthcare AI 的高价值切入口,集中在 高频刚需、非临床环节 ,一方面是 前台任务 ,如提升医生效率的 Patient Copilot ( Case Study 包括 Abridge、Ambience、OpenEvidence );另一方面是 后台基 ...
o3 深度解读:OpenAI 终于发力 tool use,agent 产品危险了吗?
海外独角兽· 2025-04-25 19:52
作者:cage, haozhen 我们在 2025 年 Q1 的大模型季报 中提到,在 AGI 路线图上,只有智能提升是唯一主线,因此我们持 续关注头部 AI Lab 的模型发布。上周 OpenAI 密集发布了 o 系列最新的两个模型 o3 和 o4-mini,开 源了 Codex CLI,还推出了在 API 中使用的 GPT 4.1。本文将着重对这些新发布进行解读,尤其是 o3 agentic 和多模态 CoT 新能力。 我们认为 OpenAI 在数次平淡的更新后,终于拿出了有惊艳表现的 o3。融合了 tool use 能力后,模型 表现已经覆盖了 agent 产品常用的 use case。Agent 产品开始分化出两类路线:一类是像 o3 那样把 和 o3 的发布模式一样, OpenAI 的 reasoning model 都是先训练出一个 mini reasoning 版本,再 scale 到 一个 long inference time、full tool use 能力的模型上。 而之前 GPT 模型总是先训练出最大的模型,再蒸 馏到小模型上。这个策略值得探讨其原因,我们的猜测是 RL 算法比较脆弱, ...
OpenAI:computer use 处于 GPT-2 阶段,模型公司的使命是让 agent 产品化
海外独角兽· 2025-04-23 20:41
编译:haozhen, Cookie AI agent 并不是一个新概念,但从 2024 年到今天,agent 的行动能力和交互方式发生了质变,头部模型厂商也正在将 agentic 能力融入模型,agentic 能 力会成为今年模型竞赛的重点之一, tool use 作为 agent 最重要的能力,一直是头部 AI labs 非常关注的方向。上周,OpenAI 发布了新一代模型 o3, o3 有最丰富的 tool use 方式。 本文是对 OpenAI agent 团队访谈的编译,OpenAI agent 产品和工程负责人分享了 OpenAI 在 agent 开发与工具生态方面的技术细节,以及他们对开发 者实践的观察与见解。他们认为,受益于 CoT 与 tool use 的结合,agent 获取信息的方式已经发生了巨变,agent 的下一步是能够接入数百个工具,并 能够自主判断调用哪个工具并确定如何使用。此外,multi agent 系统的工作效率会更高,且具有更高的可控性和优化潜力。 我们判断, multi agent 系统会在今年有大的突破,vertical agent 会因此直接受益,在 compute ...
代码即界面:生成式 UI 带来设计范式重构
海外独角兽· 2025-04-22 19:03
作者:张昊然,Motiff 妙多 Co-Founder、副总裁 编辑:Cage 曾被专业设计师看成"玩具"的生成式 UI,如今正在和 vibe coding 一起改写开发和设计工作流,需求- >代码->设计的新工作流开始出现。本文回溯了这场演变:从早期「拼乐高」式的模板化设计,到 Claude Sonnet 3.5 更新开始模型有了创造力、直接写出高美感和风格化的前端代码,到如今 AI 展现 出理解并遵循特定"设计系统"的能力。 AI 设计的表达力和风格多样性这两个维度上实现了跃迁式进步,让我们开始期待未来有 AI-native 的 设计编辑器,设计中的 70%+ 工作由 AI 完成,类似设计领域的 Cursor 甚至 Devin。设计师的价值不 再是操作设计工具进行构建,而是回归设计本身进行更多的思考、呈现更多的创意方案、推进更高 质量的决策。 本文是一篇读者投稿,来自 Motiff 妙多的 Cofounder 昊然。他基于这两年打造 AI-native 设计工具的 经验,对 AI+设计领域的未来可能性进行了推演,尤其是如何在模型能力的飞速进展下对业务方向 和技术路线作出决策。相信来自优秀读者朋友的实践和观 ...
Deep Research 类产品深度测评:下一个大模型产品跃迁点到来了吗?
海外独角兽· 2025-04-21 21:13
作者:Krystal 编辑:penny Deep Research 产品可被理解为 一个以大模型能力为基础、集合了检索与报告生成的端到端系统,对 信息进行迭代搜索和分析,并生成详细报告作为输出。 参考 Han Lee 的 2x2 分析框架,目前 Deep Research 类产品在 输出深度、训练程度 两大维度呈现分 异。 输出深度 即产品在先前研究成果的基础上进行了多少次迭代循环以收集更多信息,可进一步被 理解为 Agentic 能力的必要基础。 低训练程度 指代经过人工干预和调整的系统,比如使用人工调整 的 prompt,高训练程度则是指利用机器学习对系统进行训练。 从 2024 年末问世的 Google Deep Research,到 2024 年 2 月以来密集发布的 OpenAI Deep Research、 Perplexity、xAI Deep Search、Manus,Deep Research 成为各家 Agent 产品角逐的白热化赛道。 和传统 LLM Search 产品相比,Deep Research 是迈向 Agent 产品雏形的一次跃迁,可能也将成为具 有阶段代表性的经典产品形态。 ...