Workflow
AI科技大本营
icon
搜索文档
李建忠:关于AI时代人机交互和智能体生态的研究和思考
AI科技大本营· 2025-08-18 17:50
大模型推理范式转换 - 主流模型从训练模型转向推理模型,OpenAI o1通过强化学习实现推理能力大幅提升,DeepSeek R1成为全球首个开源推理模型[9] - 推理模型具备"讲逻辑"的慢思考能力,强化学习推动AI进入"经验数据时代",突破人类知识边界[11][13] - 强化学习在测试时和强化学习阶段的Scaling Law叠加,推动模型性能持续攀升[14] - 主流SOTA模型内置Agent和Tool Use能力训练,向智能体模型迭代[16][18] 应用开发范式转换 - 软件开发从AI辅助编程(AI Copilot)转向非专业人士使用的"氛围编程"(Vibe Coding)[22] - 氛围编程将开创"可塑软件"新市场,允许用户通过自然语言对软件底座进行个性化定制[24][26][27] - 上下文工程取代提示词工程成为发挥推理模型能力的关键,需提供全面准确的上下文信息[29][32] 人机交互范式转换 - 自然语言对话界面将成为AI时代的主要交互入口,涵盖智能眼镜、汽车语音等多种形态[36][38][39] - 传统GUI应用将演变为API服务,由Agent直接调用,打破孤立App壁垒[43][45][47] - 生成式UI(GenUI)将取代传统GUI,专注于图形化呈现结果而非交互和数据收集[54] - 交互设备可能进入"多元设备"时代,不同场景使用不同专用设备而非单一中心化设备[59] 智能体生态演进 - 智能体平台需要规划、工具、协作、记忆、行动五大能力矩阵[64][66][67] - MCP协议成为智能时代HTTP协议,标准化智能体与传统软件的交互[66] - A2A协议支持智能体间拟人化协作,构建去中心化智能体网络[66][70] - 智能体执行时长将从秒级扩展到数小时甚至数年,采用伴随式异步交互模式[73][75] - 互联网将从"信息网络"重构为"行动网络",网站主要访问者变为智能体[67]
AI不会重写所有传统软件,但在重构产品逻辑!2025全球产品经理大会圆满收官
AI科技大本营· 2025-08-16 18:07
大会概况 - 2025全球产品经理大会在北京威斯汀酒店举行,汇聚40+顶尖专家和近千名资深产品经理,探讨大模型驱动的AI产品形态与构建路径[1] - 腾讯、百度、字节跳动、科大讯飞等一线企业代表分享从产品设计到商业化落地的全链路经验,覆盖生成式AI、Agent设计、企业级应用等核心议题[1] - 大会成立奇点智能研究院,定位为AI前沿技术与产业落地的智库机构,目标是推动AI成为普惠性生产力工具[4] 主论坛亮点 - 奇点智能研究院院长李建忠、昆仑万维CEO方汉等专家探讨技术浪潮对产业格局的重塑,以及产品设计中的人性化思考[6] - 主题演讲涵盖大模型生态创新、生成式AI终极形态(Skywork Super Agents)、GenAI交互设计等方向[7][8][9] - 圆桌论坛聚焦AI下半场的产品创新与颠覆,讨论设计实践与行业趋势[11] 分论坛专题 生成式AI产品 - 专题探讨模型能力向商业化产品转化的路径,案例包括腾讯混元大模型、智谱Agentic LLM架构、支付宝智能共创平台等[14][15][16][17] - 火星电波、HeyBoss等企业分享全AI驱动商业体、Agent CEO等创新实践[18][19][20] Agent智能体设计 - 专题聚焦Agent作为"数字员工"的潜力,字节跳动扣子、百度秒哒等产品展示其在视频生成、应用开发等场景的落地[24][25][26][27] - 小鹏汽车推出数字员工IRON,实现业务智能协同[32] 企业级AI应用 - 快手、WPS、科大讯飞等企业分享AI在营销、办公、知识管理等场景的实践,如WPS基于Agentic AI的智能化知识库[35][36][37] - 360AI展示大模型时代企业知识库构建方案[39][40] 具身智能与硬件 - Rokid、vivo、出门问问等企业探索AI+AR交互、智能OS、AI伙伴等硬件创新,重新定义人机互动方式[48][49][50][51] 行业落地实践 - 京东零售AIGC产品设计、小猿AI教育场景重构等案例展示跨行业应用路径[58][60][62] - 索云AI分享Agentic AI在制造业和教育出版的进化实践[59] 生态与合作 - 鸿蒙生态宣布HarmonyOS 6开发者Beta版本上线,推出创新赛和开发者激励计划,总奖金超亿元[64] - 大会合作伙伴包括万兴科技、声网等企业,共同推动产品经理群体成长[64] 未来展望 - 大会预告2025全球机器学习技术大会将于10月在北京举行,聚焦AI技术演进与产业应用[66]
Agent引爆产品新思维、奇点智能研究院正式成立!2025 全球产品经理大会首日精彩速览
AI科技大本营· 2025-08-15 21:56
产品经理角色演变 - PC时代产品经理角色更偏向"需求分析师",移动互联网时代转向"用户体验设计者"[1] - 大模型和Agent技术正在重塑产品经理工作方式,打破角色边界并升级思维模式[1] - 2025全球产品经理大会汇聚40余位专家及1000多位与会者,探讨AI产业趋势[1] 奇点智能研究院成立 - 由CSDN与Boolan联合发起,定位为人工智能前沿技术和产业落地的创新研究机构[3] - 聚焦计算范式、开发范式和交互范式转换,设立六大研究领域[5][7] - 与华东师范大学合作成立"开源创新与变革联合实验室",计划发布全球开源发展报告等研究成果[5] 大模型驱动的AI产业生态 - 基础大模型经历从"训练"到"推理"范式转换,强化学习推动"经验数据时代"[10] - SOTA模型内置Agent和Tool Use能力,大模型从Chatbot进化到Agentic模型[11] - Vibe Coding(氛围编程)创造增量市场,有望实现"可塑软件"和低成本编程[12] - 自然语言对话界面重构智能应用形态,带来应用服务化等新趋势[13] - 未来智能体生态可能由多元设备(眼镜、手机、汽车等)作为交互入口[14] 生成式AI与生产力革命 - 昆仑万维发布全球首款AI Agent架构Office智能体Skywork Super Agents,将8小时工作量缩短至8分钟[18] - 昆仑万维开源多款多模态模型,覆盖音频驱动数字人、交互式世界模型等领域[19] - 海外AI API调用统计显示编程类占比87%,角色扮演类占5.4%[20][22] - 行业化大模型是必然趋势,通用Agent难以覆盖所有行业[23] - ToB场景核心是"增效",ToC场景核心是"降本"[23] GenAI应用交互设计 - 当前GenAI产品多以"助手"形态存在,受现有环境约束明显[25] - 交互设计核心任务:高效获取任务与上下文、便捷审核与应用结果[26][29] - 鼠标双击唤起助手可能成为GenAI时代的新型交互方式[28] AI时代的产品人味 - 当前AI工具存在交付模式单一、环境感知不足、交互设计不直观等问题[34] - 产品设计需平衡"天道(环境)、人道(人类需求)、AI道(技术)"[34] - YouMind通过多模态优化和内容可编辑性提升"人味",实现AI与用户双向协作[36][37] AI时代的产品经理机遇 - AI时代产品方法论面临跳跃式颠覆,产品经理既是受益者也是被颠覆者[40] - 技能边界被打破,"一人公司"模式可能普及[41] - 开源模型推动全产业链协作式创新,对产品经理具有战略意义[44][45] Chat BI与数据挑战 - Chat BI最大挑战是企业数据基础薄弱,原始数据质量影响分析结果[46][47] AI产品用户体验 - AI产品需明确功能优化与数据能力的边界,避免过早依赖语言模型升级[48] - 创业公司应集中资源在关键节点形成差异化优势[49] 行业应用与合作伙伴 - 大会设置12大专题,覆盖生成式AI、Agent设计、企业级应用等领域[51] - 鸿蒙生态、万兴科技等合作伙伴展示创新成果[51]
OpenAI联合创始人Greg Brockman:对话黄仁勋、预言GPT-6、我们正处在一个算法瓶颈回归的时代
AI科技大本营· 2025-08-13 17:53
行业演进与公司发展 - 计算机行业正经历从个人魔法到工业革命的演进,OpenAI驾驭十万GPU集群标志着AI基础设施的成熟[3] - Stripe早期通过第一性原理突破传统限制,24小时完成银行需9个月的技术对接,体现硅谷创新精神[15][16] - OpenAI构建了研究-工程双引擎文化,工程能力与研究洞见同等重要,共同推动AGI发展[27][28][29] 技术突破与创新 - 深度学习从AlexNet开始颠覆传统规则,神经网络在多个领域超越人类设计的系统[24][25] - 强化学习(RL)和混合专家模型(MoE)成为解决算法瓶颈的关键方向,推动AGI研究进入新阶段[49][48] - Codex已贡献OpenAI内部10%代码合并请求,外部GitHub日处理24000个PR,重塑软件开发流程[42] 基础设施与硬件需求 - AI基础设施需兼顾高计算量任务与低延迟响应,催生专用加速器需求[45][47] - 模型规模扩大带来系统复杂性挑战,检查点机制和可靠性设计成为训练长周期智能体的关键[43][44] - 黄仁勋提出未来数据中心需支持多样化工作负载,包括多模态AI和实时交互系统[45][46] 产品化与生态发展 - AI产品化面临模型与产品的鸿沟,需结合领域专业知识构建垂直智能体生态[52][53] - GPT-4o图像功能5天获1亿用户,反映AI应用病毒式传播特性与规模化挑战[35][36] - 经济将因AI驱动产生10倍增长,医疗、教育等领域需定制化解决方案[54][55] 研发趋势与瓶颈 - 基础研究回归成为核心,算法瓶颈重新成为制约AGI进展的关键因素[49][50] - 当前研发受计算资源、数据、算法、电力等多维度限制,需动态平衡[49] - GPT-4暴露可靠性问题,显示AI需突破"隔玻璃观察"的学习模式[50][51]
别再空谈“模型即产品”了,AI 已经把产品经理逼到了悬崖边
AI科技大本营· 2025-08-12 17:25
行业现状与挑战 - AI产品领域存在宏大叙事与落地现实之间的巨大鸿沟,表现为技术理想与用户留存率低下的矛盾[1] - 行业呈现两极分化:部分从业者聚焦AGI终极形态,另一部分则面临不稳定API和用户高期待的实际挑战[2] - 当前AI浪潮类比"淘金热",多数参与者难以找到可持续商业模式,部分产品如AI Pin和Rabbit R1已遭遇市场困境[3] 行业活动与解决方案 - 全球产品经理大会将于8月15-16日在北京举行,汇集12大专题分享,覆盖互联网大厂和AI创业公司实战经验[14][16] - 活动将发布可能影响行业格局的重要产品,并通过深度探展和街采捕捉从业者真实困惑[8] - 多位行业领袖将分享实战经验,包括久痕科技CEO汪源、YouMind创始人王保平等,内容涵盖技术路径与商业化方法论[4][5] 产品经理职业转型 - 传统产品技能如原型设计正被AI快速替代,未来需具备战略判断、人机协作编排和用户心理洞察等复合能力[9] - 行业处于关键转折点,从业者需重新定位核心价值,把握技术浪潮方向与情感需求挖掘的双重机遇[9][10] 行业趋势与机会 - 技术演进迅速,GPT-5、Kimi K2长文本处理、Genie 3等多模态生成技术不断突破现实边界[1] - 商业模式探索从"提示词工程"向"上下文工程"进化,部分已验证路径可为行业提供参考[3] - 直播活动将揭示最新行业动态,包括腾讯混元大模型、百度秒哒等头部企业的应用实践[4][5]
官宣!2025 全球机器学习技术大会北京站首批嘉宾出炉,重磅来袭!
AI科技大本营· 2025-08-11 15:16
大会概述 - 2025全球机器学习技术大会·北京站将于10月16-17日举办,由CSDN与Boolan联合主办,聚焦大模型、多模态、智能体、AI Infra、具身智能等前沿方向[1] - 大会延续高品质议题设置与高规格嘉宾阵容,旨在探讨AI演进路径与产业落地实践[1] - 设置12大专题,覆盖AI最具前沿性与工程挑战的关键领域,强调"技术可解释×工程可复制×场景可落地"的价值导向[2][3] 核心专题 - 大语言模型技术演进与大模型应用开发实践[4] - 多模态大模型前沿与GenAI产品创新[4] - AI Infra与大模型工程架构[4] - DeepSeek技术解析与行业实践[4] - AI智能体与具身智能硬件[4] - 算力基建优化及大模型行业落地[4] 演讲嘉宾阵容 学术界与企业界代表 - **赵健**:中国电信AI研究院多媒体认知学习主任,发表CCF-A类论文41篇,谷歌学术被引4900次,H指数40,主持7项国家级项目[8][9] - **周盼**:理想汽车多模智能负责人,专注语音识别与多模态大模型,曾任腾讯/搜狗算法研究员[10][11] - **冷大炜**:360 AI研究院副院长,主导多模态大模型研发,成果落地360全量业务场景,服务亿级用户[15] - **王召德**:阿里MNN团队架构师,主导端侧AI推理引擎MNN(12.5k Star)优化,获IEEE AICAS竞赛冠军[16][17] 技术应用与创新 - **蒋宇东**:哔哩哔哩智能创作技术负责人,推动生成式AI在内容产业应用[18] - **陈赢峰**:网易伏羲机器人算法负责人,研发工程机械机器人,发表顶会论文60余篇,获50+专利[19] - **张恒**:小米资深算法专家,CVPR竞赛5项冠军,推动芯片视觉算法落地[20] - **肖朝军**:清华大学MiniCPM4主要作者,谷歌学术引用3000+次,专注高效端侧大模型[23] 生态合作与参与 - 大会开放演讲申请通道,邀请技术社区贡献案例与见解[24][25] - 提供企业合作平台,支持展览展示、技术交流与项目对接[27] - 配套资源包括全套PPT资料预约与多种联系方式(购票/合作/媒体)[29][30]
GPT-5 之后,我们离 AGI 更近了,还是更远了?
AI科技大本营· 2025-08-08 13:58
GPT-5发布背景 - GPT-4发布于2023年3月15日 引发行业震动 但仅是AI技术爆发的序章[1][2][3] - GPT-5于2025年8月8日发布 距离GPT-4发布间隔939天 行业期待值极高但实际反响复杂[4] - 发布会基调从"聊天"转向"做事" 强调实用主义 定位为"随需应变的博士级专家团队"[6] 技术架构创新 - 采用统一智能系统架构 包含快速模型(gpt-5-main)和深度推理模型(gpt-5-thinking) 通过实时路由器动态调度[7] - 提供三种API模型规格(常规/迷你/纳米)和四种推理级别(最小/低/中/高) 输入限制272k token 输出限制128k token[7][9] - 淘汰旧有"模型动物园"模式 建立统一协同的智能有机体[9] 性能表现 - 基准测试成绩突出:AIME 2025数学测试94.6% SWE-Bench编程测试74.9% MMMU多模态理解84.2%[16] - 发布会现场出现数据可视化错误 69.1%柱状图比52.8%更短 引发质疑[13] - 马斯克宣称Grok 4在ARC-AGI-2测试中击败GPT-5[15] 核心能力聚焦 - 专注三大核心场景:编程/写作/健康咨询 其他多模态功能(音频/图像)暂不整合[19][28] - 编程能力显著提升 可完成生产级代码修改 在复杂项目中表现优于Gemini 2.5 Pro和Claude 4 Opus[21] - 写作能力存在争议 不及情感特化的GPT-4.5 但Sam Altman宣称已有显著改进[24][25][27] 商业策略 - API定价极具侵略性:每百万输入Token仅1.25美元 较GPT-4o降价50%[21] - 对比此前失败的GPT-4.5(原价180美元/百万输出)形成强烈反差[22] - 采取以利润换市场策略 意图快速建立开发者生态[21] 技术挑战 - 模型幻觉问题持续改进 通过"安全完成"训练方法和诚实应答机制降低错误率[28][30] - 提示注入攻击防御能力达56.8% 但仍有较大改进空间[32][34] - 行业观点认为Transformer架构可能已达瓶颈 需要新的架构突破实现AGI[36] 行业影响 - 标志AI发展进入"工业时代" 从探索期转向专业化应用阶段[37] - 对开发者形成利好 提供更可靠的生产力工具[38] - 普通用户DAU持续增长 但专业用户评价分化[4][35]
跨平台革命!看 Qt 如何用一套代码征服全场景生态?
AI科技大本营· 2025-08-07 16:31
HarmonyOS与Qt技术融合 - HarmonyOS凭借分布式架构和全场景能力重塑移动生态格局[1] - Qt作为30年历史的跨平台开发框架与HarmonyOS深度融合[1] 技术研讨会内容 - 展示Qt应用在HarmonyOS平台的成功案例 证明生态融合潜力及三方应用上架突破[1] - 解析Qt for HarmonyOS技术框架 保持跨平台特性实现"一次开发 随处部署"[1] - 分享适配过程中的技术难点与创新解决方案 包括多窗口 应用生命周期 开发工具适配[3] - 介绍未来支持计划[3] - 演示经典Qt demo在HarmonyOS上的运行效果[3] 目标受众与活动信息 - 面向软件架构师 UI/UX设计师 研发工程师 产品经理 项目经理 测试验证团队[2] - 8月8日举办 提供技术指引与商业洞察 探索跨平台解决方案[7] - 活动含技术白皮书领取[2]
所谓“氛围编程”,不过是“技术债”的新马甲
AI科技大本营· 2025-08-06 14:12
人工智能时代编程的演变 - "氛围编程"(Vibe Coding)本质是生成难以维护的遗留代码(legacy code),其特点是开发者沉浸于模糊指令而忽视代码可理解性 [1][4][10] - 行业出现AI编程策略进化趋势,包括"氛围编程"、"AI智能体编程"及"智能体舰队"等概念,预测传统编程方式可能被替代 [2][4] - 安德烈·卡帕西定义"氛围编程"为开发者依赖AI生成超出理解范围的代码,仅适用于一次性项目 [6][7][9] 编程的本质与技术债 - 编程核心是"理论构建"(Theory Building),即开发者需建立清晰的问题模型,而非单纯生成代码行数 [11] - "氛围编程"加速技术债累积,因缺乏可维护性,仅适合原型或短期项目 [11][13] - 长期项目若依赖"氛围编程"会导致维护困境,需反复依赖AI修复,形成恶性循环 [13] AI工具与人类角色的平衡 - 行业存在矛盾:既倡导"创始人模式"(深入细节)又鼓励将工作授权给AI智能体,两者难以兼容 [16] - 工具优于智能体,应通过AI开发增强人类能力的工具,而非外包思考 [17] - 代码作为精确媒介不可替代,自然语言过于模糊,代码强制精确思考并促进创造力 [19][20] 未来编程的发展方向 - 开发者面临选择:关闭大脑导致能力萎缩,或最大化脑力投入高层次设计 [21][22] - 理想模式是将AI作为"结对编程"伙伴,处理重复任务,释放人类创造力 [22] - 人类大脑仍是编程核心,AI应作为增强工具而非替代者 [23]
AI 的「成本」,正在把所有人都拖下水
AI科技大本营· 2025-08-05 16:49
大模型成本与AI付费订阅困境 - 核心观点:大模型成本虽逐年下降10倍,但AI公司难以通过固定月费模式实现盈利,因用户始终追逐最新最贵模型且算力消耗呈指数级增长[4][6][15] 成本下降与市场需求错配 - 旧模型成本确实下降:GPT-3.5价格仅为过去十分之一,但用户99%需求转向最新发布的"地表最强"模型如GPT-4/Claude 3 Opus[7][13][14] - 顶尖模型价格稳定:GPT-4发布价60美元,半年内降价至1.5美元,但新一代Claude 3 Opus仍定价75美元,形成价格锚点[12][15] - 用户认知贪婪性:用户倾向为最高质量模型付费,不愿为节省成本选择低配版本[16] 算力消耗爆炸式增长 - 任务复杂度提升:单任务token消耗量从1000增至10万,Claude 3 Opus简单问候可触发20分钟"思考"[18][21] - 智能体使用范式改变:用户从交互式聊天转向批量任务派发,单用户日耗算力可达72美元(2027年预测)[21][22] - 真实案例:Anthropic用户单月消耗1790亿token,相当于阅读125万遍《战争与和平》[25][26] 商业模式失效与行业困境 - 固定月费模式崩溃:20美元订阅费无法覆盖用户实际算力消耗,Anthropic被迫取消200美元不限量套餐[6][30] - 囚徒困境显现:全行业被迫补贴超级用户,按量计费公司被包月模式挤压生存空间[32][34] - 垂直整合案例:Replit通过捆绑AI与云服务实现盈利,将算力成本转化为获客手段[40][42] 潜在解决方案 - 企业级高转换成本:Devin通过深度嵌入高盛等客户工作流锁定长期合同,规避价格战[37][39] - 新云商(Neocloud)模式:在基础设施层盈利,AI仅作为引流工具[50] - 行业警示:单纯依赖"成本下降10倍"预期的公司将面临现金流断裂,需重构单位经济模型[44][47][49]