Workflow
Agent范式
icon
搜索文档
2026 奇点智能技术大会上海站来袭,解码AI Agent、世界模型与氛围编程等新范式
AI科技大本营· 2026-02-02 16:46
文章核心观点 - 行业正经历一场规模为工业革命十倍、速度更快的“十倍速”范式转移,AI正从赋能工具进化为变革企业流程与组织范式的力量[1] - 传统的“前端”、“后端”、“全栈”等开发职位概念将消失,未来将只有“AI Agent工程师”[1] - 为应对此变革,由CSDN与奇点智能研究院联合举办的全球机器学习技术大会已升级为“奇点智能技术大会”,旨在推动从“传统研发”到“Agent工程师”的代际跃迁[2][3] 大会概况与目标 - 2026奇点智能技术大会·上海站将于4月17-18日召开,汇聚50多位技术领袖与1000多位来自金融、智造、汽车、通信等行业的精英听众[3] - 大会聚焦AI从技术突破走向规模化落地的核心逻辑,即如何利用Agent范式驱动企业增长,并将算力投入与万亿级Token消耗转化为组织的正向投资回报率[5] - 大会基于“AI原生软件研发成熟度模型 AISMM”设立了十二大专题,作为“Agent工程师”在2026年的认知地图[5][6] 技术专题方向 - **大语言模型技术演进**:关注大语言模型的技术发展路径[5] - **多模态与世界模型**:涉及多模态理解及对物理世界的建模[5] - **AI计算平台与性能优化**:聚焦底层算力基础设施与效能提升[5] - **AI原生软件研发与氛围编程**:探讨以AI为核心的新型软件开发范式[5] - **智能体系统与工程**:专注于AI Agent的系统化构建与工程实践[5] - **AI原生应用创新与开发实践**:涵盖基于AI原生产品与应用的创新开发[5] - **智能体使能的DevOps**:研究智能体如何赋能开发运维一体化流程[5] - **大模型系统架构**:关于大型模型系统的架构设计[5] - **AI Infra基础设施与运维**:涵盖人工智能基础架构的搭建与维护[12] - **具身智能与智能硬件**:涉及智能体与物理实体结合的技术[12] - **开源模型与框架**:关注开源生态中的模型与工具框架[12] - **AI+行业落地实践**:聚焦人工智能在各垂直行业的实际应用案例[12] 专题出品人阵容 - **段楠(京东集团副总裁、探索研究院副院长)**:原微软亚洲研究院资深首席研究员,研究方向包括自然语言处理、代码智能、多模态基础模型、智能体[9][11][13] - **李永彬(阿里巴巴通义实验室对话智能&代码智能负责人)**:负责通义星尘、通义灵码、通义晓蜜、通义听悟等产品的大模型技术,发表90余篇国际顶会论文[14][16] - **汪晟杰(腾讯云开发者AI产品负责人)**:负责腾讯CodeBuddy产品,拥有丰富的软件架构设计、产品管理与AI研发提效经验[17][19] - **何万青(清程极智副总裁)**:曾任燧原科技高级总监、英特尔首席工程师、阿里云高性能计算负责人,专注高性能计算与AI应用性能调优25年[20][22][23] - **陈景东(蚂蚁集团基础智能部技术总监)**:负责多模态大模型技术研发,其项目曾获CCF科技进步二等奖,论文引用量超过5300次[25] 首批演讲嘉宾 - **李建忠(奇点智能研究院院长,CSDN高级副总裁)**:大会主席,提出科技创新的“范式转换立方体 ParaShift Cube”[29][31] - **王炳宁(腾讯微信搜索AI算法研究方向负责人)**:前百川智能预训练负责人,主导发布的模型在GitHub上超过1万Star,HuggingFace下载量超过2000万次[32][34] - **张俊林(新浪微博首席科学家及AI研发部负责人)**:中国中文信息学会理事,技术书籍作者[36][38] - **邓金秋(京东定价算法负责人)**:曾任Uber和Bloomberg算法专家,其团队荣获2024年INFORMS Prize,是该奖项设立34年来首个获奖的亚洲团队[39][41][42] - **陆承强(小红书AI搜索生成算法负责人)**:研究方向包括大模型预训练/后训练、Agent、RAG等,谷歌学术被引用次数约六千余次[43][45] - **许辰人(北京大学博雅长聘副教授)**:研究领域为超视智能(具身智能物联网与多模态驱动科学与工程智能),其研究成果获CCF技术发明一等奖(2025)并已在华为鸿蒙、阿里物流等系统大规模商用[46][48] - **宫叶云(微软亚洲研究院人工智能推理组负责人)**:发表超过80篇顶级会议论文,其研究成果广泛应用于微软广告业务和Bing搜索服务[50][52] - **王佳琦(京东探索研究院研究总监)**:多模态理解大模型研发团队负责人,发表论文60余篇,Google Scholar引用次数超过20,000次[54] - **刘树杰(微软亚洲研究院(MSRA)香港首席研究员)**:研究方向包括口语语言处理、多模态大语言模型以及医疗人工智能,发表论文100余篇,研究成果应用于Microsoft Translator、Skype等多款产品[55][57][58] - **黄浩洋(京东集团多模态基础模型团队负责人)**:曾主导微软亚洲研究院多语言与多模态基础模型研发,推出覆盖100种语言的Unicoder及全球首个多语言多模态预训练模型M3P[59][61] 目标受众与合作 - 大会欢迎在AI原生软件研发、多模态世界模型、具身智能、AI Infra性能优化等领域攻坚,且其AI Agent已为企业带来实际增长的团队领导者参与分享[63] - 大会同步开放技术生态合作伙伴、企业专场共建、行业解决方案联合展示等多种合作形式[65][68]
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 20:02
技术原理 - 强化学习(RL)是用于解决多步决策问题的算法框架,与传统机器学习不同,无标准答案但有反馈机制评判结果[3][7] - 大语言模型(LLM)本质是预测下一个词,存在不遵从指令的缺陷,通过与 RL 结合解决该问题[8][9][10] 行业应用 - RL+LLM 应用广泛,海外 OpenAI 的 RL 已从纯推理进化到 Agent 范式,实现多轮交互和上网互动[21] - 国内豆包和 DeepSeek 等团队在探索 RL+LLM 的新可能性,不同公司在该路径上出现编程、Agent、通用泛化能力等分支[21][26][27][28] 发展趋势 - 预训练的规模法则收益变小,但仍有数据和模型小型化两个发展方向;RL 的规模法则处于初始阶段,决策能力将持续提升[26] 人才与基建 - RL 人才稀缺,因门槛高、工业界应用少、对工程要求高;开源工作可降低使用门槛,如 AReaL - boba 框架[33][34][35][36] 训练与评估 - RL 训练中基建最重要,其次是数据和算法;评估可看准确率和多轮交互体验[29] 组织架构 - 大模型团队最好将 LLM 和 RL 两条线融合,至少设预训练和后训练团队,再按目标细分[31]