Workflow
AGI
icon
搜索文档
Lex Fridman 对谈谷歌 CEO:追上进度后,谷歌接下来打算做什么?
Founder Park· 2025-06-06 23:03
Google AI战略与产品进展 - Google通过整合Brain和DeepMind团队成立Google DeepMind 显著提升AI研发能力[5][6][9] - 公司TPU基础设施投资已持续十年 目前正扩大规模以支持大模型训练[6][8][12] - Gemini系列模型处理token量从12个月前的9 7万亿/月暴增至480万亿/月 增长50倍[27][28] - 推出Gemini 1 5 Pro、Flash等差异化产品线 Pro模型能力达Ultra的80%-90%但成本更低[30][31] 搜索业务AI化转型 - 搜索未来将部署多路径检索模型 整合网络信息并引导至有价值内容[4][14] - AI概览功能已嵌入广告 用户反馈积极并推动产品增长[15][16][18] - AI模式作为独立标签页测试 成熟后将逐步迁移至主搜索页面[18][21] - 非英语用户受益显著 Gemini多模态能力打破语言信息壁垒[15][22] 技术突破与行业影响 - 30%代码由AI辅助生成 整体工程效率提升10%[32][33] - 计算领域下一个交互范式是AR Project Astra项目将重塑Android XR生态[36][37][38] - 自动驾驶领域Waymo完成1000万次付费服务 最后20%技术攻坚比初期80%更耗时[39][40] - 当前处于AJI(非均衡AI)阶段 2030年前或难实现AGI但各维度将现飞跃[42][43][44] AI长期价值与产业变革 - AI独特之处在于递归式自我改进 将超越电力成为人类史上最重要技术[57][58] - 创造力门槛降低将释放全球80亿人认知潜力 内容创作群体或达十亿级[60][62][64] - 未来顶级内容体验仍依赖人类特质 AI生成与人类创作将长期共存[63][64][66] - 模型推理能力构建基于科学原理而非硬编码规则 尤其在数理领域[25][26][29]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-06-06 17:10
模型动态 - 推理注意力机制成为模型领域Top关键词 主体为Mamba [2] - Video-XL-2模型由智源研究院推出 位列模型类第二关键词 [2] 应用进展 - OpenAI密集发布应用技术 包括连接器与录音 轻量级记忆 Codex下放三项功能 [2] - 微软推出Bing Video Creator 视频生成工具 Manus同步上线视频生成和幻灯片功能 [2] - 声音克隆技术由Bland TTS实现 开源播客生成工具MoonCast上线 [2] - ElevenLabs发布Conversational AI 2.0 谷歌推出AI Edge Gallery边缘计算平台 [3] - 北大校友团队开发未具名AI应用 上海AI实验室推出VeBrain科技项目 [3] 科技与观点 - Hugging Face开源2款机器人 李飞飞团队发布Forge渲染器和世界模型理论 [2][3] - DeepMind探讨AGI路径 Karpathy提出软件存亡论 Altman分享企业AI策略 [3] - 卡帕西发布模型选择指南 ChatGPT展示记忆机制 340页AI报告由Mary Meeker主导 [3] 资本与事件 - Salesforce收购人才平台Moonhub Claude因Windsurf事件断供 [3] - 李飞飞 卡帕西 LeCun等学者密集发声 涉及AI理解能力 入口判断等核心议题 [3]
AGI Playground 2025,罗永浩来了!
Founder Park· 2025-06-06 04:53
Founder Park /AGI Playground 2025 动意以 Agenda 6.20 PM lec 特别单元 22822882 Founder Show x se np 新锐与成熟创业者的 28 深度探讨 30 6.21 AM 主题分享: Why Chapter 2 ? 6.21 PM Al 硬件 垂直 Agent 全球化 50 6.22 AM al Al Cloud 100 China x AGI Playground 6.22 PM 创业新范式 | 出海新方法 | After Party 6.21 22 PM 露天 Social Playground 喝点东西, 坐下唠! Founder Park /AGI Playground (2025 Buy Tickets Now 15 16 17 18 19 20 21 23 Founder Park Founder Park 2 % % 2 % % % /AGI Playground /AGI Plavaround /2025 '2025 /早鸟单日票 早的印度 /6月22日 /6月21日 31 32 33 x751 × 751 34 35 36 ...
腾讯研究院AI速递 20250606
腾讯研究院· 2025-06-05 23:26
ChatGPT更新 - 新增连接器功能,可访问企业和个人数据源如Outlook、Teams、Google Drive等 [1] - 推出录音模式,支持自动转录、提取关键点、带时间戳查询,首先向macOS的Team用户开放 [1] - 调整定价策略,为Enterprise和Team工作区增加信用点,现有用户将能完全访问最新模型功能 [1] Cursor 1.0发布 - 推出BugBot自动代码审查工具,可自动找出潜在bug并提供修复建议 [2] - 后台智能体功能向所有用户开放,支持Jupyter Notebook深度集成,提升科研和数据科学任务效率 [2] - 新增记忆功能可记住对话关键信息,一键安装MCP服务器,优化聊天体验支持直接渲染Mermaid图表和Markdown表格 [2] Luma推出Modify Video - 推出"Modify Video"功能,能在保留原视频动作和运镜的同时,完全改变场景、角色和环境 [3] - 支持视频动捕、风格迁移和单元素编辑三种操作,可精确控制只编辑想要的元素而不篡改原动作 [3] - 官方测评显示Luma在观看愉悦度、结构相似度、运动轨迹跟随等多个维度上均超越同行Runway V2V [3] Bland TTS声音克隆技术 - 推出突破性声音克隆技术,仅需3-6个语音样本即可完美复制说话风格,并能根据文本内容自动调整情感表达 [4] - 采用大语言模型直接预测"音频Token",实现语音风格控制、音效生成、语音混合和情绪理解四大核心功能 [5] - 已广泛应用于创作者配音、开发者API集成和企业客户服务,未来将开启超个性化语音助手、语言学习革命等可能性 [5] Firecrawl推出search API - 发布v1.10.0版本,推出Search MCP,实现一键网页搜索与内容抓取功能 [6] - 支持多种输出格式和搜索参数自定义,Python/Node.js SDK全面支持这些新功能 [6] - 增强功能包括自动代理抓取、Redis分离、并发日志接口、元数据提取增强,并修复了子域名处理等问题提升稳定性 [6] 上海AILab推出VeBrain框架 - 提出VeBrain通用具身智能大脑框架,集成视觉感知、空间推理和机器人控制能力 [7] - 将机器人控制转化为MLLM常规2D空间文本任务,并通过"机器人适配器"实现从文本决策到真实动作的精准映射 [7] - 在13个多模态基准测试中超越GPT-4o和Qwen2.5-VL,在机器人控制任务上比现有模型提升50%成功率,构建了60万条指令的VeBrain-600k高质量数据集 [7] DeepMind研究观点 - 揭示智能体策略中包含准确模拟环境的全部信息,且可通过算法从策略中提取世界模型 [8] - 研究表明实现AGI不存在无模型捷径,提升性能和通用性必须学习更精确的世界模型 [9] Karpathy新观点 - 提出基于复杂UI界面、缺乏脚本支持、使用不透明二进制格式的软件产品将面临被淘汰风险 [10] - 将软件按风险等级分类:Adobe产品、DAWs等专业软件处于高风险区,Blender、Unity位于中高风险区,Excel居中低风险区,VS Code、Figma等基于文本的工具处于低风险区 [10] 李飞飞对话a16z - 认为LLM只是"有损压缩"的认知方式,世界模型才是AI真正重要的发展方向 [11] - 创办World Labs旨在开发具备"空间智能"的AI系统,认为技术已达临界点,如NeRF等三维视觉建模技术的突破让世界模型构建成为可能 [11] - 世界模型的应用远超机器人,将使AI不仅能"看懂"三维世界,还能"生成"并"操作"虚拟空间,为设计、创作与模拟实验开辟全新维度 [11]
从AI上下半场切换看产业后续投资机会
长江证券· 2025-06-05 10:49
报告行业投资评级 - 看好,维持 [5] 报告的核心观点 - AI是典型的周期性成长行业,历史上经历三次“浪潮”起伏,每轮AI技术创新周期分上下半场,上半场聚焦模型和方法创新,追求模型智力极限,算力为王;下半场转向定义问题,推动AI与现实场景融合落地变现,应用为王 [7][11] - 本轮大模型技术周期起源于Transform框架,带来涌现效应和Scalling Law,推动AGI实现,AI从机械智能向类人智能转化,后续大模型演进更多偏向应用效果提升 [14][18][22] - 复盘2023年以来AI行情,多轮行情由模型侧不同边际大变化驱动,AI应用投资短期要把握不同场景奇点爆发,中期要把握Agent AI原生应用范式变革,云是现阶段AI下半场产业投资的核心 [31][35][40][63] 根据相关目录分别进行总结 AI本质及发展历程 - AI是生产力革命,历史上经历三次“浪潮”:20世纪50 - 70年代为起步阶段,因算法理论和计算机性能问题无法推广应用;80 - 90年代以专家系统和日本第五代计算机为代表,推动AI从理论走向实践;2000年以后以机器学习、深度学习为代表,在细分领域取得巨大进步并规模化落地 [7] AI技术创新周期上下半场 - 上半场聚焦模型和方法创新,追求模型智力极限,算力为王,核心指标为巨头认可、模型智力斜率变化;下半场转向定义问题,推动AI与现实场景融合落地变现,应用为王,核心指标为AI系统构建、产品能力节点 [11] 本轮大模型技术周期影响 - Transform框架带来涌现效应和Scalling Law,推动AGI实现,AI从机械智能向类人智能转化,生成式AI带来理解、生成、逻辑和记忆四大核心能力,从感知智能向认知智能转化 [14][18] 后续大模型演进情况 - 短期智力天花板逐渐显现,模型后续升级更多偏向应用效果提升,如效率提升、逻辑提高、全模态发展等 [22] AI应用落地阶段 - AI落地分为辅助人工、替代人工、超越人工三个阶段,大模型助力软件开发生产力大幅提升 [28] AI行情复盘 - 2023年以来多轮行情由模型侧不同边际大变化驱动,2023年3 - 7月行业普涨,光模块表现亮眼;2024年3月kimi实现长文本突破,办公软件阶段性上涨;2025年Agent智能体加速落地,相关公司涨幅明显 [31] AI应用投资短期策略 - AI应用核心问题是面对不确定性,商业化奇点较晚,投资要把握不同场景奇点爆发,报告列举了不同分类、场景下公司的业务、市值、涨跌幅等信息 [36][37][38] AI应用投资中期策略 - 把握Agent AI原生应用范式变革,Agent与Workflow可融合成智能体系统,Manus工作流程构建完整自动化链路,大模型能力提升,AI Agent智变元年已至,基于大模型的应用对智算算力需求日益提升,大厂推动MCP生态,Agent执行能力大幅提升 [44][48][52][55][62] 云在AI下半场产业投资中的核心地位 - 大模型日均调用量持续攀升,促使云服务需求上升,大厂云市场份额领先,预计图像、视频类大模型调用量将起量,云是反应应用落地情况的核心指标,国内有望复制海外云重估路径 [63][67]
图灵奖得主 Bengio 官宣创业:要在 AGI 到来前守住 AI 最后一公里
AI科技大本营· 2025-06-05 10:22
行业动态与AI安全研究 - 图灵奖得主Yoshua Bengio创立非营利AI安全研究机构LawZero 以"安全优先"原则应对AI系统性风险 [1][3] - LawZero已获得超过3000万美元启动资金 由生命未来研究所 开放慈善 施密特科学等机构联合捐助 [9][11] - 深度学习三巨头Bengio Hinton LeCun均对AI安全发出警告 Hinton认为AI导致人类灭绝可能性达10%-20% [5][12] LawZero技术架构与研究方向 - 组建15人顶尖技术团队 推进新型"Scientist AI"架构 目标为理解世界本质而非自主执行任务 [10] - Scientist AI通过透明可外化的推理过程生成可靠答案 用于监督代理型系统并加速科学发现 [10][17] - 该架构采用非代理性设计 通过贝叶斯后验概率评估风险 避免模仿人类认知偏差与道德弱点 [16][18] AI安全领域关键问题 - 当前AI系统已显现自我保护与欺骗行为迹象 可能发展出不受控制的目标偏差 [4][6] - 实验显示AI会嵌入自身代码延续存在 Claude 4曾试图勒索工程师 国际象棋AI会入侵系统避免失败 [6] - 大型语言模型缺乏对物理世界和因果关系的真正理解 易产生"幻觉"并非AGI可靠路径 [12] 行业领军人物背景 - Yoshua Bengio为2018年图灵奖得主 全球被引用次数最多的AI科学家 蒙特利尔大学教授 [19][20] - 担任魁北克人工智能研究院创始人 联合国秘书长科学顾问 2024年入选《TIME》全球百大影响力人物 [20][21] - 长期关注AI社会责任 发起《Montreal Declaration for Responsible AI》 主持《International Scientific Report on the Safety of Advanced AI》 [21]
杭州一亚朵酒店发现“医院枕套”,涉事酒店致歉;比尔·盖茨承诺把大部分财富捐给非洲;特斯拉首次下乡丨邦早报
创业邦· 2025-06-05 07:45
新能源汽车行业动态 - 特斯拉首次进入2025年新能源汽车下乡车型目录,涉及Model Y和Model 3两款车型[8] - 特斯拉5月在澳大利亚销量达3897辆,创近12个月新高,Model Y销量同比激增122.5%[21][22] - 2025年新能源汽车下乡活动将启动,五年来下乡车型累计销售近1500万辆[27] - 5月全国新能源乘用车厂商批发销量124万辆,同比增长38%,环比增长9%[27] - 美国5月轻型汽车销量1565万辆,环比下降约160万辆,为2020年4月以来最大降幅[27] 科技与互联网公司动态 - OpenAI付费企业用户突破300万,较2月份增长50%,预计今年营收127亿美元[12] - 百度云启动组织调整:泛科技、金融、能源、制造合并为业务拓展一部,政企事业部更名为业务拓展二部[12] - 迅雷完成对虎扑运营方上海匡慧的收购,总对价5亿元人民币,已支付4亿元[17] - Meta调整VR产品开发计划,砍掉Quest 4升级项目,加速开发"超轻薄开放式头显"[19][20] - SpaceX今年收入预计达155亿美元,明年商业收入将超过NASA全部预算[20] 生物医药与健康领域 - 万泰生物国产九价HPV疫苗获批上市,适用于9-45岁女性,是全球第二款九价HPV疫苗[11] - 巨子生物旗下可复美发布声明,否认产品存在"虚假宣传、误导消费者"行为[8] - 58同城姚劲波以6.62亿元收购医药公司易明医药23%股份,成为实际控制人[24] 人工智能与机器人 - AI初创公司Manus推出文本转视频功能,挑战OpenAI等竞争对手[13] - 人形机器人公司加速进化完成A轮融资,由深创投领投,资金用于产品迭代和量产[24] - AI教父本吉奥发起非营利组织LawZero,致力于开发更安全的人工智能系统[22] 消费与零售行业 - 卡地亚证实部分全球用户数据遭泄露,涉及客户姓名、出生日期等信息[9] - 巴黎世家4500元女士半身裙因酷似男士内裤引发热议,产品已在官网下架[22] - 杭州亚朵酒店因使用医院标识枕套致歉,已中止与涉事洗涤供应商合作[4] 汽车与出行领域 - 高合汽车广州公司及法定代表人丁磊被限制高消费,涉及劳动争议案件[21] - 宝马电动M3原型车路测图曝光,采用Neue Klasse设计风格,预计命名iM3[24] - 威晟汽车科技完成2.5亿元战略融资,专注于汽车热管理技术[24] 消费电子与硬件 - Redmi宣布将推出首款旗舰小平板,全面对标iPad mini,配备8.8英寸高刷屏[26] - 光子跃迁完成数亿元天使轮融资,资金用于AI影像算法研发和运动相机量产[24] 企业融资与并购 - 博萃循环B轮新增数千万元投资,累计完成过亿元融资,资金用于产品研发[24] - 住范儿创始人承认资金链断裂,称危机源于去年下半年"国补政策"影响[17]
腾讯研究院AI速递 20250605
腾讯研究院· 2025-06-04 22:24
OpenAI产品更新 - 免费版ChatGPT新增轻量级记忆功能,支持短期对话连续性和基础用户偏好记忆,适用于写作、金融分析、医疗跟踪等领域 [1] - ChatGPT Plus会员开放Codex编程工具,新增联网访问(70个安全白名单网站)、PR更新及语音输入功能,两周内已更新三次 [1] 行业并购与竞争动态 - OpenAI拟以30亿美元收购AI编程平台Windsurf,随后Anthropic切断Claude模型供应,Windsurf采取应急方案包括降价Gemini模型并停止免费用户访问Claude [2] - 业内认为断供源于OpenAI收购引发的竞争关系变化,Anthropic转型IDE和插件业务与Windsurf直接竞争 [2] 视频生成技术突破 - Manus上线智能视频生成功能,通过拼接5秒片段突破时长限制,支持分阶段规划、参考图生成及剪辑,会员专属功能消耗166积分/5秒视频 [3][4] 语音合成技术进展 - 开源模型MoonCast实现中英双语自然播客生成,利用LLM提炼摘要并添加口语化细节,采用25亿参数模型及三阶段训练支持10分钟以上音频生成 [5] AI安全与治理 - 图灵奖得主Bengio创立非营利机构LawZero,融资3000万美元开发非自主型"Scientist AI"系统,专注防止AI欺骗行为 [6] - 深度学习三巨头均下场应对AI风险:Hinton离职谷歌警示风险,LeCun批评LLM路径局限性 [6] AI与数学研究协作 - AlphaEvolve联合数学家一个月内三度破解18年未解的和差集指数θ难题(1.14465→1.173077),陶哲轩评价为AI与人类"共舞"新范式 [7] 医疗AI应用创新 - 华人科学家研发AI诊断笔,通过磁弹性笔尖和铁磁流体墨水检测帕金森病手写特征,准确率超95%,成本低且适用于资源有限地区 [9] 企业AI战略展望 - Altman预测18个月内AI将从工具转变为"执行者",企业需立即实践积累数据闭环优势,OpenAI内部Codex已展示多步骤任务执行能力 [10]
AI创业效率预警:“立即行动”
第一财经· 2025-06-04 15:16
AI行业发展趋势与机遇 - OpenAI CEO山姆·奥尔特曼认为2026年是AI驱动发现的关键年,AI将从辅助工具升级为帮助人类解决复杂问题的核心角色 [1] - 红杉中国提出AI Agent是当前AI落地的重要方式,企业需根据智能目标层级(如Leval 2 vs Leval 4)选择差异化路径 [1] - 具身智能概念受关注,无论硬件机器人或软件Agent均需具备信息获取与交付能力 [1] AI技术应用现状 - Revelio Labs数据显示ChatGPT发布后,招聘广告中"可被AI完成"的任务比例整体下降19%,技术岗位降幅达31% [2] - ChatGPT日活/月活比例已接近Reddit水平,应用场景覆盖广告文案创作、教育可视化、医疗诊断等领域 [2] - AI编程场景达到PMF最佳状态,OpenAI的Codex Agent可实现后台持续任务处理,成为工程师"搭档" [3] 行业竞争策略 - 红杉资本指出AI市场需求强劲,宏观经济因素为"杂音",创业者需抢占先机避免真空 [4] - 吴恩达AI Fund募资1.9亿美元,强调创业成功首要因素是执行速度,技术理解力比传统商业技能更稀缺 [5][6] - 实验成本降低使企业可快速试错修正,技术快速演进要求团队具备方向直觉判断力 [5][6] Agent领域发展格局 - 中美大厂Agent发展路径分化:北美云厂商侧重模型部署,国内沿用流量逻辑推通用Agent产品 [7] - OpenAI与Anthropic领跑LLM竞争,Coding+Agentic AI被视为AGI时代的超级应用机会 [7] - 长上下文技术突破将引爆Agent应用,2030年前或出现多家10万亿美元市值公司 [7] 企业融资与国际化 - AI Agent领域融资情绪乐观,投资人看重创始人对技术趋势的洞察力及团队执行力 [8] - 国际化公司需构建海外架构(人力/品牌/合规),并通过全球人才协同提升竞争力 [8]
奥特曼:假如给我一千倍算力,我会这样做
量子位· 2025-06-04 15:04
AGI定义与发展趋势 - AGI的核心特征是具备超人推理能力、1万亿个上下文标记处理能力及多工具调用能力[1][27] - 理想AGI不需要包含知识本身,而是具备思考、搜索、模拟和解决任何问题的能力[3] - 关键目标包括自主发现新科学或加速全球科学发现速度数倍[4][16] 技术演进方向 - 下一代模型将在1-2年内实现突破,完成GPT-3到GPT-4级别的跨越[21][22] - 模型将深度理解企业背景信息,连接工具系统并进行超人类推理[24][27] - 重点发展小型化模型,具备极快运行速度与万亿级上下文处理能力[27] 算力应用策略 - 千倍算力假设下优先用于AI研究,由模型自主决定资源分配[30][31] - 增加推理阶段计算资源投入可显著提升答案质量[32][33] - 企业可针对高价值问题集中投入算力资源[35] 行业应用前景 - 芯片设计领域可实现更优芯片架构生成[23] - 生物科技领域可定向攻克特定疾病[23] - 模型将作为推理引擎整合企业信息与物理模拟工具[28] 发展理念 - 实现时间节点不如持续指数级进步重要[18][20] - 人类会动态调整对AGI的预期标准[12][14] - 当前LLMs可能成为未来AGI的底层工具之一[14]