Workflow
AI科技大本营
icon
搜索文档
ChatGPT 为什么越来越“懂你”?一文解析它背后的记忆机制
AI科技大本营· 2025-06-03 19:00
ChatGPT记忆系统升级 - 核心观点:OpenAI对ChatGPT的记忆系统进行重大升级,使其能长期记忆用户信息并提供个性化响应,从"临时陪聊"转向"长期陪伴"[1] - 记忆架构由两大系统构成:显式的"保存记忆"和复杂的"聊天历史"[10] 保存记忆机制 - 用户通过"记住我…"等指令主动更新记忆,信息被注入系统提示词作为背景知识[3] - 仅进行基础检查(去重、避免冲突),允许相关记忆条目共存[4] - 疑似通过内部工具`bio`实现,可存储用户事实但限制敏感/短期信息[20][23] 聊天历史系统 当前会话历史 - 保存用户最近一天内发送的10条最新消息,可能直接注入模型上下文[6][7] 对话历史 - 可引用两周内的历史消息原文,超期则提供总结性描述[8][12] - 基于双重索引(对话摘要+消息内容)检索,无法严格按时间回溯[8] 用户洞察 - 隐性系统,通过聚类分析跨对话提炼用户特征(如技术偏好、提问模式)[14][17] - 生成带时间跨度和置信度的结构化洞察(例:用户擅长Rust异步编程)[15][16] 技术实现推测 - 保存记忆:通过`bio_transform`函数处理用户输入与现有事实列表[21][22] - 聊天历史: - 当前会话直接查询数据库按时间排序[25] - 对话历史使用三个向量空间(消息内容、对话摘要、综合摘要)实现检索[26][27][28] - 用户洞察: - 定期批处理聚类优化用户消息,生成结构化洞察[30][31] - 每周运行Lambda函数更新活跃用户洞察[32][34] 用户体验影响 - 记忆系统显著提升回应质量,用户洞察贡献度或超80%[36][38] - 自动捕捉用户偏好解决普通用户表达难题,实现"从告诉到理解"的转变[37] - 对话历史模拟人类记忆延续语境,但需精准提取有用信息[38]
图灵奖得主杨立昆:中国人并不需要我们,他们自己就能想出非常好的点子
AI科技大本营· 2025-06-02 15:24
作者 | https://www.youtube.com/watch?v=4__gg83s_Do 编译 | Eric Harrington 出品丨AI 科技大本营(ID:rgznai100) 在这个 AI 技术浪潮席卷全球,几乎人人都在谈论大语言模型潜能无限的时代,一个根本性的问题摆在我们面前:既然 AI "读完"了整个互联网,为何 仍未诞生下一个爱因斯坦?在原创性的科学发现上,这些大模型为什么仍如此"笨拙"?它们真的"理解"我们这个复杂而充满规律的物理世界吗?还是仅 仅在进行一场规模空前的模式匹配游戏? 如果你也曾对这些问题感到困惑,那么图灵奖得主、 Meta 首席 AI 科学家杨立昆( Yann LeCun )的这场深度对话,或许能为你拨开迷雾,提供一个 清醒而富有洞察力的视角。本文编译自 YouTube 频道 Big Technology Podcast 的精彩访谈,杨立昆此次并非简单地唱衰当前 AI 的成就,而是以一 位资深研究者的严谨和一位前瞻思想家的锐利,直指当前主流大模型( LLM )的"天花板"。 他深入剖析了为何仅靠"记住"海量文本不足以催生真正的智能,为何当前的 AI 架构难以进行真正的抽 ...
阿里云发布通义灵码 AI IDE,深度适配千问 3 大模型、新增编程智能体,可调用 3000+ MCP 服务
AI科技大本营· 2025-05-30 14:12
出品丨AI 科技大本营(ID:rgznai100) AI Coding 领域风云依旧,继 Cursor、Windsurf、字节的 Trae 等之后,阿里版的 AI Coding IDE 来了! 北京时间 5 月 30 日,阿里云发布旗下首个 AI 原生的开发环境工具通义灵码 AI IDE,深度适配了最新的千问 3( Qwen3 )大模型,全面集成通义灵 码插件能力,具备编程智能体、行间建议预测、行间会话等功能,不仅可以辅助写代码、修 Bug,还拥有自主决策、MCP 工具调用、工程感知、记忆 感知等能力,可帮助开发者完成复杂编程任务。 下载体验地址:https://lingma.aliyun.com/lingma/ 在模型层,通义灵码 AI IDE 支持最强开源模型千问 3,同时支持 MCP 协议,可以帮助开发者快速开发智能体应用。除此之外,通义灵码 AI IDE 还专 门为开发场景提供了长期记忆、行间建议预测、行间会话等能力。 在智能体模式下,开发者只需描述编码任务,通义灵码便可以自主地进行工程感知、代码检索、执行终端、调用 MCP 工具等,端到端地帮助开发者完 成编码任务。目前通义灵码深度集成了魔搭 MCP ...
78%主创跳槽!Llama 14名作者只剩3人,Meta最强开源模型团队大溃散引争议
AI科技大本营· 2025-05-30 14:12
Meta AI人才流失现状 - Llama模型最初的14位核心作者中已有11位离职,仅剩3人留任[1][3] - 离职人员包括论文第一作者Naman Goyal、资深研究员Guillaume Lample等关键人物[3][7] - 高层变动:领导Meta基础AI研究(FAIR)近8年的Joëlle Pineau于2024年4月宣布离职[6] 人才流向与竞争格局重塑 - 多名前Meta成员创办Mistral公司,获6.4亿美元B轮融资,估值达60亿美元[3][5] - 其他人才流向Anthropic、Google DeepMind、Microsoft AI等竞争对手[7] - 行业影响:开源社区势力版图重构,Mistral等新兴力量崛起[4][5] Meta技术研发困境 - Llama 4版本被内部员工爆料未达开源SOTA标准,存在赶工拼凑现象[8] - 旗舰模型"Behemoth"多次延期,工程团队遭遇能力提升瓶颈[10] - 开源优势受挑战:Llama系列下载量超10亿次但创新力遭质疑[8][10] 公司战略调整与资源分配 - 重组措施:裁减Reality Labs部门同时加大AI招聘力度[11] - 寻求外部合作:向微软/亚马逊等企业寻求Llama训练资金支持但反响冷淡[14] - 内容审核策略调整:取消第三方事实核查计划应对法律压力[13] 行业竞争态势 - 开源领域面临DeepSeek、阿里Qwen等新势力冲击[10] - AI研发成本压力显著,巨头需平衡现有业务与新技术投入[12][14] - 技术民主化趋势:Llama成为全球开发者重要工具但护城河减弱[8][14]
DeepSeek R1 迎来小更新大升级,性能直逼 OpenAI o3!
AI科技大本营· 2025-05-29 16:05
DeepSeek R1-0528大模型更新 - 公司低调发布DeepSeek-R1-0528版本并开启公测,未提供详细技术说明[1] - 新版模型在Hugging Face平台开放访问[2] 性能改进 - 推理能力增强:思维链(Chain-of-Thought)表现更结构化,逻辑性提升[4] - 文本输出质量接近Google等领先模型水平,语言风格更成熟[5] - 代码生成优化:编程任务中输出更连贯,质量更高[6] 用户反馈 - Reddit用户实测显示模型可单次对话生成完整可玩游戏,但抽象推理能力有所下降[6] - 响应时间略有增加,用户认为是为准确性作出的合理权衡[7] - 在LiveCodeBench基准测试中表现接近o3(high)水平[8] - 成为首个能稳定正确回答"9.9-9.11"数学问题的模型[9] 技术参数与开源生态 - 模型训练规模达1亿tokens且持续增长,提供免费版本[11] - 采用MIT开源协议,允许商业用途,推动AI技术普及[11] 行业活动 - 2025全球产品经理大会将聚焦AI产品落地等议题[14]
又要取代程序员了?这锅轮到 AI 背了
AI科技大本营· 2025-05-29 16:05
核心观点 - AI不会取代程序员,而是提升对开发者系统设计能力的要求,优秀者被放大,平庸者被边缘化 [2][4][5] - 代码是负债而非资产,AI加速生成代码的同时,能有效管理这些负债的系统设计者价值更高 [22][23] - 技术变革的规律是"重塑"而非"取代",历史证明NoCode、云计算等催生了更高薪的新岗位 [10][14][16] 技术变革历史规律 - NoCode运动未消灭开发者,反而催生NoCode专家岗位,薪资高于传统程序员 [10][13][14] - 云计算将系统管理员重塑为DevOps工程师,职责扩展至基础设施即代码,薪资翻倍 [10][15][16] - 海外外包热潮最终演变为精细化分布式协作模式,总体成本不降反升 [17][18] AI对编程的影响机制 - AI代码助手如同木匠的CNC机床,仅工具升级,核心设计能力仍依赖人类 [3][20][26] - 初级开发者依赖AI生成代码但缺乏架构,高级开发者用AI辅助系统设计与业务模型 [7][19][23] - AI擅长局部代码优化但无法判断全局架构,错误设计被快速固化的风险加剧 [23][24] 行业能力需求演变 - 技术迭代推动岗位升维:系统管理员→DevOps、后端开发者→云架构师 [25][26] - 穿越技术周期的核心能力始终是系统设计而非写代码,这是AI尚未突破的领域 [11][26][27] - 技术革新本质是能力升维而非职业灭绝,程序员将进化为更高维度创作者 [21][28][29]
30 年 FAANG 大神被 C++ Bug “虐”4年,竟被Claude Opus 4一招解决!
AI科技大本营· 2025-05-28 20:43
Anthropic发布Claude Opus 4 - Anthropic正式发布Claude Opus 4,并称其为"全球最强的编程模型" [1] - Claude Opus 4成功解决了一位资深C++开发者困扰四年的"白鲸Bug" [2][5] - 该开发者拥有30多年C++开发经验,曾在FAANG公司担任Staff Engineer [2] "白鲸Bug"的解决过程 - "白鲸Bug"是在重构6万行代码项目时引入的渲染异常问题,难以重现和定位 [4] - 开发者花费约200小时尝试解决该问题,但一直未成功 [5] - 使用Claude Opus 4后,仅用几个小时和约30次提示就成功定位并修复了该Bug [5][6] - Claude Opus 4通过对比新旧代码(共约200万行)发现了重构导致的非显式依赖丢失问题 [7][9] Claude Opus 4的技术表现 - 能够自动grep相关函数和路径,无需人工指定文件 [9] - 能够分析执行路径并对比新旧代码找出关键差异 [9] - 需要开发者提供约30条prompt进行引导,最长prompt超过1500行 [7][8] - 相比GPT-4.1、Gemini 2.5 pro和Claude 3.7表现更优 [6] AI在开发中的定位 - 被类比为"能干的初级程序员",需要持续指导和监督 [10][12] - 完成一个全栈项目需要约200个prompt,相当于新人6个月的工作量 [12] - 每月100美元订阅费相比资深工程师200小时2.5万美元成本更具性价比 [13] - 开发者仍倾向于选择人类高级程序员而非AI [12]
谷歌 CEO 皮查伊万字专访:AI 正重塑搜索引擎、Web 乃至整个互联网
AI科技大本营· 2025-05-28 20:43
【编者按】从全新升级的 Gemini 模型家族,到模型在 Android、Workspace、Search 等核心产品线 的深度融合,Google 正将"AI 原生"推进到 前所未有的战略高度。Google I/O 大会结束后,Google 首席执行官桑达尔·皮查伊(Sundar Pichai)接受了 The Verge 旗下科技栏目「 Decoder」 的专访, 就 Gemini 模型的产品战略、AI 如何重塑搜索、Web 生态、AI 原生体验的演进,以及硬件与边缘计 算中的模型部署等关键话题,进行了全面深入的阐释。这场对话不仅展现了 Google 对 AI 技术未来 的系统思考,也揭示了全球科技巨头在生成式智能时代的最新路径选择。 责编 | 梦依丹 出品丨AI 科技大本营(ID:rgznai100) 在 2025 年 Google I/O 开发者大会结束后,《The Verge》主编 Nilay Patel 再次与 Alphabet 及 Google CEO 桑达尔·皮查伊(Sundar Pichai)进行了一场面对面的深度对话。这也是《Decoder》 播客连续第三年在 I/O 大会后专访这位掌舵人。但 ...
微软 CEO 萨提亚·纳德拉:智能体即产品,SaaS 已死?
AI科技大本营· 2025-05-27 20:20
【编者按】 继成功领导微软云计算、开源等多次重大转型后,微软 CEO 萨提亚·纳德拉(Satya Nadella)近日在 Build 大会后接受知名科技媒体人 Matthew Berman 的深度专访, 纳德拉在采访中坦言:"我们正在经历一场软件与智能的范式巨变。AI 驱动的智能体网络将重塑企业软件的未来,SaaS 终 将融入其中。" 原文:https://www.youtube.com/watch?v=XSy7ry-x5pA 整理 | 梦依丹 软件和技术栈的深度重构: 他强调需"从第一性原理出发"为 AI 重构整个技术栈,将 Azure 升级为"AI 工厂",并将 Microsoft 365 转变为 AI 新 界面、多人协作中心和沉浸式工作环境(如内嵌聊天功能的 IDE)。 SaaS 模式的颠覆与智能体网络的崛起: 他预言应用层将"坍缩并融入智能体",传统 SaaS 应用需适应这种转变,成为智能体网络中的"后端之 一",通过新协议(如 MCP)实现多智能体编排,最终聚焦于业务流程的整体完成。 负责任的 AI 与普惠未来: 纳德拉指出,公司将拥有 AI 智能体的知识产权,需将其纳入现有 IT 管理框架。他坚信 ...
ChatGPT 评估员工绩效,评得是真能力吗?
AI科技大本营· 2025-05-27 20:20
【编者按】绩效考核季,越来越多管理者开始用大模型生成绩效评语,省时省力,甚至还觉得"说得比我好"。但你有没有想过,这种看似高效的操作,可 能正在悄悄腐蚀你作为管理者最核心的能力? 本文来自科技博客 Stay SaaSy,以犀利的语言和第一手观察,提出一个令人警醒的观点:把关键管理工作交给 AI,不是进步,而是一种"职业肌肉"的萎 缩。 原文链接: https://staysaasy.com/management/2025/05/26/AI-management.html 责编 |梦依丹 出品丨AI 科技大本营(ID:rgznai100) 绩效考核季来了,我眼看着一些管理者亲手"砍掉"自己的职业上限。 真正优秀的管理者,就像爵士乐手随兴而弹反馈旋律,张口即来,得体自然。那种"即兴的从容",只能来自数千小时的"痛苦练习":艰难对话、字斟句 酌、面对人的不确定性还能稳准狠。 绩效评语,是管理的浓缩精华:它要求精准的判断、体贴的同理心、和面向未来的战略感。 一旦你把它交给 AI,你省下的不是时间,而是自己"练功"的机会。你的团队或许听到了"没问题"的内容,你却一点"教练值"都没加。 老练的管理者知道:写绩效,不只是为 ...