AI科技大本营
搜索文档
报名倒计时!一键 GET 2025 全球机器学习技术大会参会指南
AI科技大本营· 2025-09-28 18:59
大会概况 - 2025全球机器学习技术大会将于10月16-17日在北京威斯汀酒店举办 由CSDN与奇点智能研究院联合主办[1] - 大会汇聚超50位重磅嘉宾 包括AI技术奠基者 学术领军者 顶会顶刊作者 一线科技产品技术实战派和开源先锋[1] - 预计将有超1000名听众参与 覆盖50多个演讲主题[8] 核心议题聚焦 - 大会设置十二大专题 全面呈现AI领域最具突破性与实践价值的研究与应用成果[3] - 核心专题包括大语言模型技术演进 智能体工程与实践 多模态与世界模型 AI赋能软件研发与氛围编程 大模型应用开发实践 GenAI产品创新与探索等[3] - 专题设计兼具前沿方法论与一线落地经验 旨在搭建科研 技术与产业的交流平台[4] 主会场核心议程 - 10月16日上午主会场重量级嘉宾包括OpenAI研究科学家 GPT-5 GPT-4和Transformer共同创始人Lukasz Kaiser 奇点智能研究院院长 CSDN高级副总裁李建忠 小米集团AI实验室主任 NLP首席科学家王斌 面壁智能副总裁贾超[6] - 核心议题涵盖大模型技术思考与AI产业范式洞察 推理模型的历史 现在与未来等[12] - 设有圆桌对话"AI产业范式转变的核心命题" 由CSDN&《新程序员》执行总编唐小引主持 探讨大模型在全球技术演进中的关键趋势与挑战[12][14] 分会场技术专题 - 10月16日下午设四大分会场 专题包括大语言模型技术演进 多模态与世界模型 智能体工程与实践 AI赋能软件研发与氛围编程[15] - 分会场A聚焦智能体技术 议题包括前OpenAI研究员吴翼分享面向智能体的合理推理 字节跳动杨晨分享扣子罗盘Agent效果评测等[18] - 分会场B关注大模型实践 议题包括新浪微博张俊林分享可验证奖励强化学习 腾讯郑茂分享混元翻译模型经验 清华大学肖朝军分享高效端侧大模型MiniCPM等[19] - 分会场C侧重多模态应用 议题涵盖360冷大炜分享面向大规模搜厂推的高精度图 小红书张道鑫分享多模态大模型在搜索中的应用 理想汽车周盼分享实时语音对话大模型技术等[20] - 分会场D探讨AI赋能编程 议题包括北京大学李戈分享面向程序逻辑推理的大语言模型能力 阿里彭佳汉分享新一代Agentic Coding平台Qoder 腾讯夏伟分享AI Coding人机协作新范式等[20][21] 次日议程重点 - 10月17日上午分会场A聚焦具身智能与智能硬件 议题包括星尘智能王佳楠分享类人操作 群睿科技唐睿分享相关技术 无问芯穹张权路分享面向具身智能的训推一体化强化学习框架等[24] - 分会场B关注开源模型与智能体协议 议题包括百度张军分享文心4.5开源大模型 常高伟深度解析智能体协议 中国人民大学陈旭分享基于大模型智能体的社会模拟系统等[25] - 分会场C探讨AI Infra大模型基础设施 议题包括Google喻世炜分享行星级别的人工智能复力基建 清程极智于广华分享大模型压测技术 腾云智算王超分享训练推理优化技术等[26] - 分会场D围绕AI赋能软件研发 议题包括ClackyAI李亚飞分享全球AI Coding发展趋势 智谱AI张少博分享LLM Agent在软件领域的应用 百度陈一言分享Coding Agent落地实践等[26] 产业落地实践 - 10月17日下午分会场A聚焦大模型+行业落地实践 议题包括微软亚洲研究院研究员分享PIKE-RAG私域知识管理 驭势科技研发总监分享大模型助力打破L4级自动驾驶困局 百度资深工程师分享飞桨PaddleOCR技术与产业实践等[28][29] - 分会场B继续深入智能体工程与实践 议题包括小红书AI搜索生成算法负责人分享Agent时代LLM应用 居公万维算法总监分享构建高质量智能体经验 阿里云高级技术专家分享Apache RocketMQ AI事件驱动Agent等[29] - 分会场C关注GenAI产品创新 议题包括快手安全算法中心负责人分享相关技术 哔哩哔哩智能创作技术负责人分享AI动画模型技术实践 国星宇航AI技术CTO分享AI视觉算法产品落地研究等[29][30] - 分会场D探讨开源模型与框架及AI Infra 议题包括阿里淘天集团技术专家分享移动端大语言模型推理框架MNN-LLM vLLM核心维护者分享人人可用的推理引擎 字节跳动工程师分享灵活高效的大模型强化学习编程框架verl等[30]
从模型到生态:2025 全球机器学习技术大会「开源模型与框架」专题前瞻
AI科技大本营· 2025-09-26 13:49
开源与闭源AI模型性能趋势 - 2025年开源与闭源模型的性能差距已从常见的8%缩小至1.7% [1] 2025全球机器学习技术大会专题设置 - 大会特设“开源模型与框架”专题,聚焦底层构件的开源创作与实践 [1] - AI竞争已扩展至数据、模型、系统和评测四大支柱 [12] - 大会设置十二大前沿专题,覆盖大模型技术演进与智能体工程实践 [13] 参会机构与行业参与度 - 参会机构包括北大、清华、百度、阿里、腾讯、字节跳动等国内顶尖机构 [12][13] - 来自Meta、谷歌、阿里等公司的生态竞争围绕未来“AI操作系统”展开 [12] 重点开源项目与技术方向 - MNN-LLM项目专注于移动端大语言模型推理框架 [7][23] - vLLM项目致力于提供人人可用、快速且低成本的大模型推理服务 [7][23] - verl项目是灵活高效的大模型强化学习编程框架 [10][23] - SpecForge是用于训练投机采样模型的工具 [23] 大会核心演讲嘉宾与议题 - Lukasz Kaiser将分享推理模型的历史、现在与未来 [17] - 议题涵盖可验证奖励强化学习、腾讯混元翻译模型优化、MiniCPM端侧大模型等 [17][18] - 智能体相关议题包括AReaL异步强化学习、扣子罗盘效果评测、通义DeepResearch构建方法论等 [18]
CSDN 创始人蒋涛:中国开源十年突围路、模型大战阿里反超 Meta,数据解析全球开源 AI 新进展
AI科技大本营· 2025-09-25 11:33
全球开源生态发展格局 - 全球开发者总量突破1.5亿,GitHub活跃开源开发者达2280万,美国为核心力量,中国活跃开发者超400万,总开发者1200万,规模全球第二[11] - 高影响力开发者美国310人居全球第一,中国从2016年3人跃升至2025年94人,增长超30倍,跻身全球第二梯队[1][16] - 开源项目数超4亿代码仓,活跃仓数从2016年193万增至2025年近600万,增长超3倍,AI大模型、云基础设施、前端与交互技术、编程语言与开发工具为四大技术驱动力[16] 区域与国家贡献分析 - 印度和中国增长显著,印度十年达6倍增长,中国达3倍增长,巴西作为拉美代表增幅超5倍[12] - 美国在OpenRank贡献度2021年达峰值后逐年下降,中国贡献度十年大幅上升,其余国家稳步增长[12] - 美国在影响力格局持续领先,德国稳居欧洲第一,中国、印度快速上升,巴西与日本体现区域共同发展[12] 企业开源影响力 - 全球企业OpenRank排行榜TOP100中,美国企业65家居首,中国企业16家次之,华为全球第二,阿里巴巴TOP8[19] - 微软以OpenRank 87234.62居首,华为61039.42次之,谷歌31402.94第三[20] - 中国企业开源进展快速,华为、阿里巴巴等在高影响力企业中表现突出[19] 技术领域影响力 - AI与大模型以OpenRank 535,299居技术影响力榜首,远超云基础设施333,165和前端与交互式314,618[21] - 编程语言与开发291,487、应用与解决方案218,783、区块链与Web3 167,408分列第四至第六[21] - 数据库系统129,806、RISC-V与硬件112,327、大数据与数据工程111,791进入前十技术领域[21] 开源项目影响力 - OpenHarmony以OpenRank 40192.24居全球开源项目影响力第一,中国9个项目进入TOP100[21][22] - Azure22155.91、.NET14479.13、NixOS13148.25分列第二至第四[22] - 中国开源从使用走向贡献,项目影响力显著提升[21] 大模型技术体系开源影响力 - 大模型开源影响力榜单涵盖数据、模型、系统、评测四维度,Meta、阿里巴巴、谷歌位列模型榜前三[2][29] - 模型下载量向量模型占41.7%,语言模型31%,多模态模型18.3%,UKP Lab下载量最高[31] - 阿里巴巴千问系列下载量2025年6月后飞速增长,超越Meta,DeepSeek保持稳定[31] 数据与系统生态 - 数据榜单Ai2、上海人工智能实验室、谷歌前三,智源综合性数据开放突出[37][40] - 语言数据集1-4月为下载主力,纯视觉数据集比例快速下降,具身数据集增势显著[43] - 系统榜单智源贡献突出,Meta和谷歌紧随其后,百度、阿里、华为、上海人工智能实验室进入TOP10[45] 评测与综合影响力 - 评测榜单上海人工智能实验室、Hugging Face、智源前三,中国学术机构投入大[50][52] - 综合榜单Meta第一,谷歌第二,智源第三,智源在多芯片支持的系统维度优势显著[55] - 大模型生态美国贡献比例37.41%,中国18.72%,位居前两位[60]
为什么40%的智能体项目难逃废弃?8位一线专家教你构建高质量、鲁棒的AI Agent
AI科技大本营· 2025-09-24 16:46
智能体行业现状与挑战 - 当前AI大模型领域,智能体是企业实践的重点方向,部分企业已从中获益,部分企业仍处于探索阶段 [2] - 麦肯锡对50个真实项目的调研发现,企业在开发智能体时常陷入两大陷阱:过度依赖单点演示而难以大规模应用,或急于追求炫酷功能而忽视工程与治理 [2] - Gartner预测到2027年超过40%的Agentic AI项目将被废弃,主要原因是成本、价值和工程化落地未能平衡好 [2] - 智能体并非即装即用的解决方案,而是一场需要长期积累的系统工程 [3] 2025全球机器学习技术大会:智能体工程与实践专题 - 专题旨在汇聚国内外顶尖学者与企业一线实践者,呈现从理论创新到产业应用的全景视角,帮助解决智能体落地的核心痛点 [3] - 专题将围绕智能体在大模型时代的工程方法、落地经验与技术路线选择展开深度探讨 [6] - 大会将于10月16-17日在北京威斯汀大酒店(亮马桥)举行 [8] 专题核心演讲嘉宾与议题 - 前OpenAI研究员、清华大学吴翼将分享“AReaL: 面向智能体的全异步强化学习框架” [12] - 通义实验室算法科学家乔子乐将介绍“通义DeepResearch: SOTA级AI智能体的全栈构建方法论” [12][14] - 字节跳动扣子罗盘服务端技术负责人杨晨将探讨智能体相关优化实践 [16] - 中国人民大学陈旭将展示“玉兰-万象:迈向下一代基于大模型智能体的社会模拟系统” [17] - ANP开源技术社区常高伟将深度解析智能体协议:MCP/A2A/ANP/AP2 [20] - 京东集团算法总监韩艾将介绍“OxyGent – 京东零售开源的多智能体协作框架” [20] - 昆仑万维算法总监邹敏将参与分享 [22] - 阿里云高级技术专家周礼也是专题嘉宾之一 [6] 大会整体价值与亮点 - 大会邀请了GPT-5与Transformer核心共同发明人Lukasz Kaiser等全球技术奠基者 [28] - 集结了来自北大、清华、百度、阿里、腾讯、字节跳动等国内顶尖机构的一线实践者,分享真实业务场景的经验与总结 [28] - 大会设置了十二大前沿专题,呈现最贴近当下开发者的AI技术全景图 [28] - 自2017年至今,大会已成为数万名AI同行的年度之约 [28]
最受欢迎的开源大模型推理框架 vLLM、SGLang 是如何炼成的?
AI科技大本营· 2025-09-24 10:01
文章核心观点 - 大语言模型推理阶段是决定模型实用性和广泛采用的关键 需要高效处理延迟、吞吐量和成本约束[2][3] - vLLM和SGLang作为领先的开源推理引擎项目 通过创新内存管理技术和优化调度设计显著提升推理性能[4][8][12] - 两个项目均起源于学术研究 现已发展为社区驱动的开源标杆 获得业界广泛采用和投资机构支持[7][16][31][34] 项目技术特性 - vLLM采用PagedAttention算法 借鉴操作系统分页缓存管理技术 实现精细化内存管理 官方测试显示比Hugging Face Transformers后端提升30倍吞吐量[8][9] - SGLang以RadixAttention为核心 重用过往请求的KVCache 在前缀匹配时大幅减少Prefill阶段计算量 即使关闭RadixAttention仍保持优秀性能[12] - 两者均支持Continuous Batching、Chunked Prefill、Speculative Decoding等先进特性 在功能算法层面日趋同质化[29] 社区发展数据 - vLLM于2023年6月开源 截至2025年8月获56,045星标 9,578分叉 1,465贡献者 12,393名社区参与者[15] - SGLang于2024年1月发布 同期获17,095星标 2,697分叉 638贡献者 2,754名社区参与者 规模不及vLLM五分之一[13][15] - 两项目中国开发者占比显著 vLLM达33% SGLang高达52% 社区活跃度高但待处理issue均超2000条[9][13][37] 学术与产业关联 - 项目核心发起人Woosuk Kwon(vLLM)和Lianmin Zheng(SGLang)均来自加州大学伯克利分校 师从Spark和Ray创建者Ion Stoica[16] - vLLM贡献主力来自Red Hat SGLang贡献主力来自xAI、Skywork、Oracle和LinkedIn 194名开发者在两项目间交叉贡献[18][19][20] - OpenAI工程师comaniac在vLLM提交77个代码请求 在SGLang提交17个请求 2024年3月后活跃度降低引发行业猜测[20] 性能演进历程 - vLLM在2024年9月发布v0.6.0 通过CPU调度优化实现2.7倍性能提升和5倍延迟下降 但架构复杂性导致增长放缓[23][25] - 2025年1月vLLM推出V1重构版本 结合DeepSeek V3/R1发布 与SGLang同步进入第二轮爆发式增长[21][25] - 性能竞争白热化后 双方转向强调可复现方法和真实工作负载端到端指标 鼓励第三方独立评测[26] 生态合作与投资 - a16z的Open Source AI Grant基金在2023年8月资助vLLM核心开发者 2024年6月第三批名单资助SGLang开发者[31][33] - 真格基金2024年7月向vLLM提供捐赠 Linux基金会将vLLM纳入PyTorch基金会 2025年3月SGLang加入PyTorch生态系统[40] - 两项目已成为Google、Meta、Microsoft、字节跳动、阿里巴巴、腾讯等顶尖科技公司首选推理方案[34]
从Transformer到GPT-5,听听OpenAI科学家 Lukasz 的“大模型第一性思考”
AI科技大本营· 2025-09-23 10:11
Transformer架构的诞生与影响 - 2017年论文《Attention Is All You Need》提出彻底抛弃循环神经网络,仅使用注意力机制处理语言,其提出的Transformer架构重塑了人工智能版图[2] - 该论文在Google Scholar上的引用次数高达197,159次,成为大模型理论的奠基性文章,开启了人工智能新纪元[2][17] - Transformer架构以其无与伦比的并行计算能力和对长距离依赖的出色捕捉,迅速成为自然语言处理领域的全新范式,并辐射到计算机视觉、语音识别等AI子领域[17] 核心人物Lukasz Kaiser的学术背景 - Lukasz Kaiser拥有波兰弗罗茨瓦夫大学计算机科学与数学双硕士学位,并在德国亚琛工业大学获得博士学位,专攻"自动结构上的逻辑与博弈"这一艰深领域[7] - 2009年其博士论文荣获E.W. Beth dissertation prize,这是全球逻辑、语言和信息领域的最高学术荣誉之一,证明其在纯粹理论科学领域达到世界顶尖水平[8] - 博士毕业后受聘于巴黎狄德罗大学LIAFA实验室,成为法国国家科学研究中心终身研究员,拥有稳定的学术职位和完全的研究自由[9] 从学术界到工业界的转型 - 2013年Kaiser辞去法国终身研究员职位加入谷歌大脑,这一决定源于对"重复"的厌倦和对"变革"的极度渴望,从"证明"转向"构建"的冲动[10][11] - 当时自然语言处理领域被循环神经网络统治,但RNN存在长距离依赖问题和串行处理缺陷,与GPU和TPU的并行架构不匹配[12][14] - Kaiser团队最初将注意力机制作为RNN的增强补丁,但最终提出完全基于注意力的新模型构想,彻底推翻了RNN的统治地位[14][15] Transformer八子的分化与Kaiser的选择 - Transformer八位作者中七位已踏上创业之路,成为AI产业浪潮中的商业巨擘,如Aidan Gomez创立Cohere、Noam Shazeer创立Character.ai等[4][24] - Lukasz Kaiser是八子中唯一未创业的科学家,于2021年离开工作八年的谷歌,加入以AGI为最终使命的OpenAI,继续坚守技术研究最前线[4][24][25] - 在OpenAI期间,Kaiser深度参与并主导了GPT-4、GPT-5以及代号为"o1"和"o3"的推理模型等核心研发工作[4][27] 通用人工智能的探索历程 - 2017年Kaiser参与发表论文《One Model To Learn Them All》,提出MultiModel单一模型同时处理八个不同任务,是AGI追求的第一次公开实践[20][22] - 该研究证明统一深度学习架构有潜力联合学习跨领域知识,尽管单项任务表现未超越专业模型,但为通用智能探索开辟了新方向[22] - Kaiser认为AI下一阶段关键在于教会模型"思考",通过生成更多中间步骤进行深度推理,而不仅仅是直接输出答案[29] 行业技术发展趋势 - AI发展经历了从2014年"证明可行性"到2017年"架构创新",再到2019年"自监督预训练"以及2021年"规模定律",最终到2023年"数据质量与RLHF"的进化路径[27] - 未来计算力将从大规模预训练转向在少量高质量数据上进行海量推理计算,预示着AI即将迎来又一次范式转移[29] - 多模态融合、模型规模持续提升以及AI能力通过API和云服务形式普及,已成为行业明确的发展方向[31]
AI Coding 的下半场,何去何从?
AI科技大本营· 2025-09-22 17:17
AI Coding发展演进 - 2023年AI编码范式被大型平台坐实,Copilot与ChatGPT将"人写-AI辅"协作方式带入日常,同时开源在边缘地带萌芽,初创公司开始探索"不仅会说,还要能做"的可执行代理[4] - 2024年Coding Agent成为主流,形成两股潮流:可执行Coding Agent开始对真实仓库交付完整闭环(如OpenHands),以及IDE内"许可式执行"成为交互共识(如Cline)[5][6][7] - 2025年AI Coding主线从"谁补得更准"转向"谁把一次变更稳妥地跑完",CLI形态成为主战场,因其天生贴合脚手架、测试与CI/CD,能压缩"读库→计划→修改→验证→提交PR"闭环[9] 市场前景与规模 - 全球AI编程工具市场规模预计将从2024年的62.1亿美元增长至2029年的182亿美元,对应复合年增长率为24.0%[13] 主流产品形态与代表项目 - CLI形态成为2025年主战场,代表项目包括Gemini CLI(Google开源命令行智能代理)、OpenAI Codex CLI、Claude Code等,优势在于可组合、可治理、可迁移[11][12][13] - IDE形态以商业化售卖为主,代表产品包括Cursor、Windsurf,国内大厂字节、阿里纷纷下场,Marimo是少数开源IDE[13] - 插件形态创业团队为主,通过无缝集成到现有开发环境提供服务,代表项目包括Cline、Continue等[13] - 协作开发工作流形态将AI能力融入项目管理、协作开发、代码审查等企业级研发效能管理环节,代表项目包括OpenHands、codename goose等[13] 技术发展趋势 - 协议/接口优先的项目扩散更快,如ACP/MCP生态、Actions一等公民[18] - 本地可控+多模型自由度带来开发者粘性,代表项目如opencode、Avante.nvim + Ollama[18] - 从原型到交付的链路被压缩,如bolt.new、Codex Web降低了"从想法到产物"的门槛[18] - AI Coding技术堆栈可分为五层:接口形态(IDE/CLI/Web)、执行内核(Agent Runtime)、上下文织层(Context Fabric)、标准与协议(MCP、ACP、ACI等)、模型与路由[31][40] 竞争焦点与护城河 - 下一轮竞争焦点在于执行闭环、上下文理解与开放生态[34] - 模型侧"降维打击"迫使开源项目最终进入"墓园",协议、流程与数据正在成为真正护城河[24] - 竞争回归三件事:推理与稳定性(复杂改动能否一把过)、工具/上下文生态(谁更懂代码资产)、开放与成本(能否以可控成本落进企业流程)[32]
谷歌与OpenAI同获ICPC 2025金牌!GPT-5满分夺冠,Gemini攻破人类队伍都没解出的难题
AI科技大本营· 2025-09-19 18:36
AI在算法竞赛中的突破性表现 - GPT-5在ICPC竞赛中取得满分,12道题全部解出,达到金牌水准,而人类最强队伍成绩为11/12 [1][8] - Gemini 2.5 DeepThink在677分钟内解出12题中的10题,达到金牌级别,成绩相当于全球第二 [2] - Gemini 2.5 DeepThink成功解出问题C,这是一道没有任何大学队伍解出的难题 [9] ICPC竞赛的权威性与挑战性 - ICPC是全球顶尖大学生编程赛事,汇聚全球高校顶尖算法天才,今年总决赛有来自103个国家、139所高校的战队参赛 [5] - 竞赛规则要求每支三人队伍在5小时内解答12道算法题,题目常涉及图论、数论、动态规划等前沿算法,难度极高 [5][6] - 历年来在ICPC拿到金牌的队伍几乎都成为全球科技公司的核心技术人才 [6] AI解题能力的技术意义 - GPT-5参赛时未针对ICPC做特别训练,在5小时内通过官方判题系统提交答案,其中11道题一次提交通过,最难一题在第9次提交时解出 [8] - Gemini 2.5 DeepThink解题思路具有原创性,通过设定优先级值、动态规划、极小化极大定理和嵌套三分搜索等步骤,展示了超越记忆的算法思维 [12] - 此次表现证明AI具备临场推理、抽象建模和创造性解题能力,而不仅仅是依靠记忆训练数据或海量算力 [14] 行业影响与未来展望 - AI在ICPC中的表现被视为"人机智力平权"的时刻,表明AI不再只是"会写代码的助手",而是具备与人类智力正面对抗的实力 [14] - 这与AI在SAT、律师资格考试、托福等人类考试中的高分表现不同,ICPC现场算法竞赛更能体现其真实能力 [13][14] - 此次突破标志着一个开始,AI是否能把这种能力扩展到更复杂的现实问题中还有待考验 [14]
从中国“霸榜”到全球开源,AI的新思考!GOSIM HANGZHOU 2025圆满收官
AI科技大本营· 2025-09-16 18:33
开源与AI技术发展 - 开源推动AI技术落地 包括具身智能走出实验室 新操作系统重写 AI应用渗透各行各业 互联网焕发活力[1] - 具身智能面临高质量训练数据缺乏 跨芯片适配与低时延计算难题 评测体系尚在起步阶段等共性挑战[8] - 大模型重塑信息世界 具身智能让AI融入现实 需解决算法 硬件 模型到实际应用场景的技术难题[12] 全球协作与生态建设 - 大会汇聚全球200余位开源与AI技术领袖 国际机构代表 产业先锋 超过1500名一线开源开发者[1] - 联合国 PyTorch基金会 CNCF基金会 Eclipse基金会 SpeakLeash基金会等国际组织深度参与 分享治理理念与技术标准[3] - 华为首席开源联络官指出 全球开源社区共同支撑大模型 产业算力 数千万开发者和Agent融合 建设软件AI超级工厂[7] 技术前沿与创新应用 - Rust语言十周年 RustGlobal与RustChinaConf首次同台亮相 近60位一线Rust技术专家分享工具链优化 操作系统实验 高性能网络等话题[15] - 智能体互联网论坛讨论可信机制 去中心化标识符 MCP与A2A协议等前沿议题 分享智能体互操作性 协议标准化与数据安全最新实践[13] - 端侧AI推理工作坊聚焦技术突破与未来趋势 嵌入式Rust与AI工作坊提供端侧智能与系统级开发实践路径[18][20] 开发者互动与实践 - 大会设计14场Workshop 涵盖昇腾计算与高性能推理 Flutter跨平台应用 仓颉编程语言 端侧AI推理等核心技术[17][18] - 4场黑客松围绕超级智能体 Code Alert Adora机器人 Adora LeRobot等主题 开发者组队敲代码 从构思到原型验证创意[22][23] - SGLang开源推理引擎举办中国首场Workshop 开发者与阿里云 科大讯飞 美团 华为昇腾 英伟达 字节跳动等企业专家深入交流[20] 产业应用与跨界融合 - 应用与智能体论坛分享AI应用前沿经验 呈现大模型在提升生产力方面的最新成果[14] - 下一代AI论坛汇集技术专家 艺术家与设计师 探讨教育 艺术 游戏和开源生态等领域的创新应用与变革潜力[14] - AI for Humanity Spotlight活动聚焦教育公平 心理健康 文化表达 无障碍设计等领域 收到200多份投稿 79个作品入围 6个获最受欢迎奖[24] 企业参与与技术支持 - NVIDIA 华为 谷歌 Hugging Face 字节跳动 OpenCV.org 智源研究院 宇树科技 蚂蚁集团 红帽 奇点智能研究院等产业力量展现技术与生态联动[3] - 企业参访活动走进阿里巴巴 宇树科技等中国AI科技企业 了解人工智能 智能制造 数字经济等领域的技术研发成果与产业应用实践[27] - 华为专家分享昇腾CANN底层优化 大模型训练推理性能提升 大模型能力密度提升等核心技术[17]
对话吴穹:软件开发的终局,是我们将迎来自己的“黑灯工厂”
AI科技大本营· 2025-09-15 08:50
软件工程方法论本土化 - 西方敏捷方法论在中国出现水土不服 因国内企业文化偏管控型 强调令行禁止的确定性 而西方崇尚试错和自组织[6][12] - 需将敏捷核心思想与本土实践结合 基于第一性原理重新设计适合中国土壤的农具 而非照搬最佳实践[7][14][15] - 华为在落地IPD时做了管理变革和创新 体现本土化必要性[13] - 推出Adapt方法论框架和《敏稳兼顾:数字化研发管理实战》著作 总结规模化敏捷本土落地经验[15] AI对软件工程的冲击 - AI工具存在悖论:对员工是摸魚神器 对老板却是提效神器 两者本质矛盾[9][35] - 生产力变革触及生产关系根基 需解决员工为何使用AI为公司创造价值而非提前下班的管理问题[9][35] - 私域知识质量差是AI应用短板 大多数软件开发项目有独特金融软件或电商系统实现方式等私域知识[18] - 上下文缺失是AI发挥作用的重要阻碍 老系统缺乏历史信息或历史上下文[18][20] - AI在代码补全场景高效 因已有明确修改点和意图上下文 但让AI纯粹处理任务则需大量上下文[19][20] - 短期困难包括AI幻觉和上下文不足 导致团队效率提升数据在10%-20%体感误差范围内[20] Agent专业化趋势 - 不会有通用Agent 最终会分化成专用Agent 如金融Agent 测试Agent 重构Agent[24] - 工程生产线需差异化 如特斯拉造车产线不会用于生产飞机 否则不经济[24] - 开发语言进一步专业化 自然语言编程提升抽象层次 但最终会出现领域特定语言(DSL)[25][26] - 描述和Agent都会分化 形成更专业化生产线[27] 组织管理变革 - 未来组织是1+N模式 即1位人类小队长带领N个AI特工协同工作[35][38] - 需把Agent当成员工管理 建立注册 KPI考核 任务冲突调解等管理机制[24][35] - 考核体系变化 人的效能不再是个人产出 而是带领多少Agent产出多少[38][42] - 兵种主建 战区主战 类似国家军事改革 在职能线上叠加交付型组织[30] - 科技团队不能孤立谈管理 需与PMO 财务等职能部门深度卷入 为整个公司治理服务[47] 技术债与质量管控 - AI可能加速技术债累积 如果过分强调效率或代码行数等指标 会导致低质代码更快产出[53] - 使用得当AI反而减少技术债 如AI生成单元测试能力非常强 形成自闭环[54] - 布设单元测试像铃铛 代码被不该改的地方触碰就会报警[54] - 需传统度量体系感知质量 如交付效率 缺陷修复时间 代码重复度等[53] 工具与平台演进 - 知微工具平台将Adapt方法论理念变为数字化工具 如分层需求体系 多维组织架构[49] - 知微是可配置零代码平台 像高级定制西装 根据客户情况量体裁衣 而非定制开发或盒装软件[52] - 知微会逐渐中台化 大模型也是其用户 通过API调用 成为组织流程资产中心[60] - 未来IDE和CLI是主入口 界面越来越少 因AI改善工具使用 根据工作上下文自动操作[60] 程序员能力重塑 - 未来重要能力是对AI的了解和沟通协同能力 需学会与AI有效沟通[66] - 程序员需放下对AI戒备和抵制 进行心理角色转换 从种地变为地主[77] - 与人沟通和团队协作能力变得非常重要 需补强[78] - 对业务理解至关重要 程序员现在创业更容易[78] - 有技术底色的程序员更具优势 因懂技术细节可不关心 但产品经理压根不懂则难做精准判断[74] - 马斯克 扎克伯格 比尔·盖茨等有编程能力者最终成为顶尖产品缔造者[75] 行业长远展望 - 软件工程终极图景是黑灯软件工厂 AI自主编码 人类负责指挥和规划[9][81] - 软件不会用后即弃 因承担产生数据使命 有长生命周期 形成领域知识[80][83] - 软件行业类比制造业 产能飞跃后可能解决更高阶问题 产生新需求 如星际旅行 可控核聚变 智能医药[82][83] - AI颠覆原有冯·诺依曼架构 LLM是全新概率引擎 从确定性输出变为合理可能结果 拓展软件能力边界[61][62] - 软件边界和形态发生变化 从服务顾问变为直接服务用户 从确定性软件变为能给出不确定结果的软件[63] - 测试和质量过程都需改变 因软件给出不确定结果[64]