Deep Research

搜索文档
不要拿AI造工具,要建设“新关系”
虎嗅· 2025-07-05 21:01
今天团队给我的任务是"你这几年聊了所有 AI 领域的先锋创业者,能不能分享一下你的观察和收获"。 我先说说自己的感受吧,过去三年真的很"酸爽"。技术的进步和产品的创新,一开始是赏心悦目,转眼 就成了应接不暇。跟上时代不被"拉爆",需要加倍努力,其实每个人都很辛苦。 但这又是一个让人"爽"的时代。它允许极少数人为极其广泛的人群创造巨大的价值。这股强大的推力, 正是源自 AI。无论是"独立开发者",还是"一人独角兽"等概念,或许都在印证这句话:现在,寡者亦 可泽万众(so few can do so much for so many)。 今天 AGI Playground 的会场,已经座无虚席,但出了这个会场,外面的世界仍是一个"低光速宇宙"。 我们是"the few",是少数派,越是如此,越需要 stick together,需要聚拢在一起。 今年的 AGI Playground 我们邀请了 20 多个机构一起参与,有 60 多位嘉宾,有遍布 751 园区的很多个 分会场、展区、聊天区,甚至是各种官方或者非官方的 party。我们希望将 AGI Playground 变成一个"公 器",让属于这个时代的最优秀的 ...
从Token角度,测算AI算力需求
华泰证券· 2025-07-01 16:26
报告行业投资评级 - 科技行业投资评级为增持(维持)[5] - 计算机行业投资评级为增持(维持)[5] 报告的核心观点 - 推理算力需求增长速度快于单位算力成本的降低,持续看好推理端算力需求的加速增长[1][36] 根据相关目录分别进行总结 海内外大厂Token调用量增长迅速,推理算力需求加速放量 - 海外CSP厂商中,Google的Token月均调用量从24年4月的9.7万亿增长至25年4月的480万亿,增长50倍;Azure AI基础设施25年一季度处理超100万亿Token,较去年同期增长5倍,3月单月Token调用量达50万亿[2] - 国内互联网大厂中,25年5月字节火山引擎Token日均调用量为16.4万亿,是24年5月的137倍,AI工具类Token消耗快速增长,新场景实现日均百亿Token突破[12] 北美大厂Token调用量与算力需求测算 Google Token调用量与算力需求测算 - Google Token调用量增长主要源于AI搜索的拓展,25年5月和6月推理Token量将分别达到659/870万亿,环比增长37%/32%,二季度Token总量将达2009万亿,环比增长223%,较24Q2增长接近30倍[20] - Google推理Token主要包含AI搜索、Gemini 2C应用和其他推理需求三部分,AI搜索渗透率、AI Mode占比、Gemini Agent占比的增长将带动Token调用量快速增加[20][23] Google Token量快速增长有望带来资本开支持续高增 - 预计Google二季度推理算力需求环比+223%,总算力需求较一季度环比增长223%,推理算力资本开支环比+159%,主要因Token量大幅增长[24][25] - 单位算力成本呈下跌趋势,4/5/6月分别环比下降14%/13%/13%,影响因素主要有新款芯片迭代和算法迭代[26] 微软Token调用量与算力需求测算 - OpenAI Token调用量的提升主要源于ChatGPT网页访问量上升及Deep Research功能的渗透,预计25年第二季度微软总Token调用量有望达205万亿,环比增长约100%[29][32] 微软算力需求测算:年底等效H100芯片需求约为25年3月的两倍有余 - 预计微软二季度推理算力需求环比增长99%,2025年3月整体推理算力需求为15.3 Trillion TFLOPs,二季度总算力需求为65.6 Trillion TFLOPs[33] - 测算微软年底的推理算力卡需求量约为3月的两倍有余,2025年3月等效H100算力需求为4.3万张,未来月同比增速约为10%[33] 结论:推理算力需求增长速度快于单位算力成本的降低 - 算力支出受算力需求和算力成本影响,AI应用用户数量增长及Agent渗透驱动算力需求上升,硬件迭代与算法改进驱动推理成本下降,市场对整体算力支出存在分歧[35] - 测算推理算力需求增长速度快于单位算力成本的降低,未来算力支出将持续增长,看好推理端算力需求的加速增长[36]
北大发布学术搜索评测ScholarSearch:难倒一众DeepResearch的“开卷考试”
量子位· 2025-06-26 22:11
北京大学DS-Lab团队 投稿 量子位 | 公众号 QbitAI 北京大学DS-Lab 发布 ScholarSearch, 旨在对LLMs的检索、信息整合及推理能力进行综合性、极限性考验。 研究团队招募了来自北京大学各个学院的本科和研究生志愿者,并为他们提供了集中培训。志愿者从公开可访问的在线出版物和网站中选择材 料,以制定需要网络搜索解答的学术问题。 LLMs能当科研助手了? 北大出考题,结果显示:现有模型都不能胜任。 北京大学DS-Lab发布ScholarSearch,这是首个专门用于评估大语言模型在学术研究中复杂信息检索能力的数据集,包含223道高难度的学 术检索题目及其答案。 它对具备联网搜索能力的代表性模型及纯推理模型进行了评估,结果显示,顶尖的纯推理模型,如GPT-4.1、DeepSeek-R1,在处理这些问 题时准确率普遍低于9%。 具备搜索功能的模型,相较于其无搜索能力的版本,准确率有显著提升,例如,GPT-4o-mini的准确率提升超过四倍。 尽管浏览能力带来了显著改进,但即便是最先进的搜索增强型模型,如 GPT-4o-search-preview,其准确率仅为18.83% 。 方法 Ope ...
聊过 200 个团队后的暴论:不要拿 AI 造工具,要建设「新关系」
Founder Park· 2025-06-24 16:31
AI Native 产品的新目标 - AI Native 产品的核心是构建 AI 能力与人之间的新关系,而非单纯创造新工具 [13] - 系统提示词(System Prompt)成为定义 AI 与用户关系的关键,例如 NotebookLM、Manus、Cursor 等产品通过提示词设定人设和交互逻辑 [15] - AI 的「超语言能力」使其具备主体性,与人类形成「互为主体」的关系,这是高阶关系的核心 [18] 新关系带来的挑战 - 情商成为产品价值交付的一部分,例如 Cursor 通过系统提示词管理用户负反馈并提升交互体验 [21] - 生命感是增强 AI 产品主体性的关键,类宠物智能硬件通过传感器和简单反应创造情绪价值 [24] - 生命感的设计需多样化,涵盖顾问、朋友、宠物等关系类型,以低智能交付高情绪价值已被验证有效 [27] 新关系带来的机遇 - 跨次元混合价值交付:硬件与软件结合突破传统价值天花板,例如情绪管理可穿戴设备 [35] 和 Fuzzi 气囊支架 [36] - 新关系形成服务分发新通路,突破传统 ARPU 和 LTV 天花板,例如 Agent 产品按用量付费模式 [46] - 建设性关系需解放而非纵容人性,产品需避免隐藏议程以维持长期信任 [50][52] AI Native 产品的新管线 - 产品工程的核心是在不确定性中增强确定性,Broad Input(宽输入)和 Liquid Outputting(柔输出)是关键 [56][58] - 宽输入需多模态实时感知和高分辨率生活流捕捉,例如 Dia 浏览器通过主动获取标签页信息提升用户体验 [65][68] - 柔输出需分步交付并与用户协行,例如 Devin 追问需求、Deep Research 确认方案、YouWare 提供模板起点 [74][75] AI Native 的新价值模型 - 创业者需同时服务用户和 AI,通过产品工程释放 AI 能力 [82][84] - 价值模型从二维平面变为三维立体,AI 能力高度决定总体积 [85] - 传统产品经济学和管理学被颠覆,收费模式、组织形态等需重新思考 [95][97] 行业趋势与未来展望 - AI 推动生产力与生产关系的变革,3 年看生产力,10 年看生产关系 [95] - 极客公园通过社区支持技术创业者,探索新时代产品创新 [81] - 开放性问题如智能合约付费、价值创造新循环等预示行业未来方向 [95]
从技术落地到哲学思辨,AI Agent发展的关键议题
36氪· 2025-06-20 13:31
AI Agent行业现状与用户视角 - AI Agent定义需满足三大条件:工具调用能力、自主决策能力、多轮迭代的动态决策过程 [3] - 从合作视角看,Agent应作为端到端承接整条流程的系统,在关键节点主动介入并提供决策建议 [5] - 用户常用Agent分为三类:教练型(调研与深度思考辅助)、秘书型(非沉浸式任务处理)、搭档型(高频交互的专业工作协同) [9][10] - 音频处理类Agent如CreateWise已实现音轨自动剪辑、文案生成和跨平台内容适配等全流程功能 [12] - 通用型Agent产品如Manus和Genspark在旅游规划等场景展现差异化功能,但用户体验存在明显差异 [15][16] 技术挑战与产品设计 - 当前AI模型存在指令遵循不足(如强制添加"未完待续")、为AI而AI的设计倾向、缺乏人类世界暗信息三大痛点 [18][20][21] - 音频处理领域面临中文识别能力不足、多人播客多轨对齐困难、过度优化信息密度导致人情味缺失等问题 [23][25] - 产品设计需平衡行业经验积累(如网站设计需理解行业运营模式)与用户品位把握(如对"土"的差异化定义) [46][47] - 技术攻坚方向包括自我纠正学习、多Agent协作架构(需AI CEO统筹)、企业级安全治理层开发等 [41][42][45] - 预期管理是关键挑战,需通过垂直场景数据积累使AI从"清华实习生"进阶为成熟工作者 [32][33] 商业模式与竞争策略 - 新兴公司通过AI生成的高质量新数据(如医疗语音转结构化记录)可打破传统SaaS数据壁垒 [53] - 护城河构建路径包括:用户纠正数据形成的"默契"(如PPT主色系偏好)、端到端价值链延伸(从建站到帮助盈利)、工程化调优能力等 [56][57][62] - 垂直领域Agent可通过处理行业脏活累活(如工作流打通、私有数据处理)避免与大模型公司直接竞争 [67] - 盈利逻辑应以结果为导向(对比传统外包成本),企业市场需重视ROI验证与工作流程重构 [49][69] - 中立第三方平台在企业级市场具备优势,可解决客户对单一供应商锁定的顾虑 [65] 行业发展趋势 - 交互模式将从"流程搭建+分步审核"向"价值观对齐+放手执行"演变,需建立新型信任机制 [71][72] - "AI原生"设计(如密集代码文档)将成为竞争优势,类比无障碍设施对城市规划的影响 [75][76] - 人类独特价值体现在增量信息创造(未结构化数据)、真实体验传递、观点碰撞激发等维度 [80] - 管理能力将成为核心竞争力,需从"工具使用"思维转变为"团队领导"思维 [81] - 未来可能面临AI社会结构问题(如Agent间冲突解决机制)和人机混合管理体系等挑战 [86][88]
A股午评:创业板指半日跌1.10% 全市场超4600只个股下跌
快讯· 2025-06-19 11:32
A股三大指数早盘集体下跌,截至午盘,沪指跌0.86%,深成指跌1.01%,创业板指跌1.10%,北证50指 数跌0.99%。全市场半日成交额8058亿元,较上日放量432亿元。全市场超4600只个股飘绿。 板块题材上,固态电池、PCB概念、石油板块涨幅居前;核聚变、军工、减肥药板块跌幅居前。 NO.1 【比亚迪(002594)概念】 板块内8家涨停,2只连板股,最高连板数为3天3板,涨停股代表:诺 德股份、中京电子。 NO.2 【华为概念】 板块内8家涨停,1只连板股,最高连板数为9天6板,涨停股代表:东信和平、电科 网安(002268)。 盘面上,固态电池板块领涨,诺德股份(600110)、湘潭电化(002125)、丰元股份(002805)涨停。 稳定币概念局部活跃,东信和平(002017)涨停,楚天龙(003040)、安妮股份(002235)涨超5%。 AI硬件端涨幅靠前,逸豪新材(301176)、中京电子(002579)、凯旺科技(301182)涨停,核电板块 跌幅居前,合锻智能(603011)、中核科技(000777)跌停,哈焊华通(301137)跌近15%。减肥药概 念股集体调整,常山药业(3002 ...
Sam Altman透露GPT-5将在今夏发布
快讯· 2025-06-19 07:58
Sam Altman透露GPT-5将在今夏发布 金十数据6月19日讯,今天凌晨,OpenAI发布了其联合创始人兼首席执行官Sam Altman的40分钟深度专 访。本次访谈技术干货很足,Altman谈到了大家非常关心的核心产品GPT-5,大概率会在今年夏天发 布,但也会因为命名、安全测试、功能迭代等原因延长产品时间。也谈到了高性能的o3模型以及智能体 Deep Research,这些产品对实现AGI的重要性。此外,Altman还提到了OpenAI的其他创新产品,包括 Sora、DALL-E 3、ChatGPT Junior以及5000亿美元投资项目"星际之门"。基本上OpenAI所有重要产品、 现阶段规划和未来发展都出现在了本次访谈中。 (AIGC开放社区) ...
字节、百度涌入8500亿蓝海,Manus式的创业机会还有吗?
创业邦· 2025-06-11 11:20
「奔向AGI」 栏目聚焦AI大模型、AI agent、AI应用、芯片、机器人等前沿、热门的AI技术和商业创 新。 作者丨薛皓皓 编辑丨关雎 图源 丨Midjourney 近期, OpenAI 创始人山姆·阿尔特曼表示, 2025 年将是 AI Agent 大规模应用之年。" Agent 作 为'数字员工',将为各行业显著节省时间,提升效率,创造可观的商业价值。"他说。 简单而言, AI Agent 可替人执行查资料、订机票、 做 PPT 、写代码等任务,是能自主思考,替人 干活的"数字管家"。 今年, OpenAI 一口气推出两款 AI Agent 产品: Operator 可自主操作浏览器完成复杂任务,例如 在线订餐、购物和订票; Deep Research 能在半小时之内输出金融、科学、政策等领域的深度调研 报告。它还花 30 亿美元收购 了 编程 AI Agent 公司 Windsurf 。 在这疯狂增长的蓝海市场,有投资人认为创业机会在于垂直细分领域的 AI Agent ,而非定位于宽泛 to C 场景的通用 AI Agent ,矛头直指定位于通用 AI Agent 的 Manus 。 金沙江创投创始 ...
Open AI 更新:ChatGPT 推出会议记录功能,正式支持 MCP 协议
Founder Park· 2025-06-05 11:52
核心观点 - OpenAI对ChatGPT进行重大更新,旨在将其打造为智能协作平台,整合多平台数据并提升工作效率 [1][2] - 新增MCP协议支持,实现跨平台数据整合与智能分析 [1][5] - 推出会议记录模式,自动转录并结构化会议内容,提升会议效率 [1][10] MCP协议支持 - ChatGPT通过支持MCP协议直接连接GitHub、SharePoint、Gmail、Dropbox等常用工具,实现跨平台数据整合与搜索 [1][5] - 核心功能Deep Research允许用户进行广泛的网络搜索和分析,整合企业内部数据源如HubSpot、Teams等 [5][6] - Deep Research工作流程包括生成子查询、智能筛选多源数据并生成统一报告,标注来源便于验证 [8][9] - 高效搜索算法优先返回与查询意图最相关的结果,例如销售数据查询优先显示交易记录 [9] 会议记录模式 - 会议记录模式自动录音并实时转录为文字,生成结构化记录(关键点、行动项、决策) [10][11] - 支持时间戳功能,点击关键点可跳转至对应段落或播放原始音频 [11] - 会议数据仅存储于用户设备,未授权不共享,保障安全性与隐私性 [11] - 用户可会后编辑记录,添加注释或调整行动项优先级 [11] 其他功能 - macOS用户可使用会议记录模式转录会议、头脑风暴或语音笔记 [1] - Deep Research需考虑用户数据访问权限,仅返回授权内容 [8]
开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章
机器之心· 2025-06-04 17:22
智能体技术日益发展,但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流,这极大限制了其创造力、可扩展性与泛化能力。 近期,普林斯顿大学 AI Lab 推出了 Alita ——一个秉持「 极简即是极致复杂 」哲学的通用智能体,通过「 最小化预定义 」与「 最大化自我进化 」的设 计范式,让智能体可以自主思考、搜索和创造其所需要的 MCP 工具。 Alita 目前已在 GAIA validation 基准测试中取得 75.15% pass@1 和 87.27% pass@3 的成绩,一举超越 OpenAI Deep Research 和 Manus 等知名智 能体,成为通用智能体新标杆。Alita 在 GAIA test 上也达到了 72.43% pass@1 的成绩。 极简架构设计,最大自我进化 「让智能体自主创造 MCP 工具而不靠人工预设」,是 Alita 的核心设计理念。 现有的主流智能体系统通常依赖大量人工预定义的工具和复杂的工作流,这种方法有三个关键缺陷: 覆盖范围有限 : 通用智能体面临的现实任务种类繁多,预先定义好所有可能需要的工具既不可行亦不现实。而且预定义工具很容易过拟合 GAI ...