Workflow
AI科技大本营
icon
搜索文档
自回归科学基座模型 BigBang-Proton,提出实现 AGI 的新路线
AI科技大本营· 2025-11-07 13:59
作者 | 超对称技术 出品丨AI 科技大本营(ID:rgznai100) GPT-5、DeepSeek 这些大语言模型能不能直接执行 AlphaFold 这样的真实世界专业科学任务?OpenAI 的 Sam Altman 在多个场合提到,ChatGPT 的主要目标是建造基于语言的通用推理机器 (General Reasoning Machine),再使用推理机器来调用专业科学模型如 AlphaFold 解决特定科学问题, 所以无法也没必要用 ChatGPT 直接执行 AlphaFold 的任务。 近日,专注于研发物质世界基座模型的公司超越对称(上海)技术有限公司(超对称)发布了新版基座模型 BigBang-Proton ,成功实现多个真实世 界的专业学科问题与 LLM 的统一预训练和推理,挑战了 Sam Altman 和主流的 AGI 技术路线。 BigBang-Proton 的结果展示,不仅 AlphaFold、AlphaGenome 这样的专业生物问题, 横跨所有物质尺度从微观粒子夸克、材料晶格到 DNA 蛋白质 到宏观地球系统的科学问题都可以整合在同一个自回归 LLM 上用 next-word-pred ...
“你们尽管做空 OpenAI!”奥特曼霸气喊话,纳德拉亲述微软百亿投资内幕 | 巨头对话
AI科技大本营· 2025-11-03 14:51
聊着育儿经、下注 1.4 万亿、揭秘新协议、规划 AGI……全球最强 AI 搭档的炉边谈话泄露了什么? 出品丨AI 科技大本营(ID:rgznai100) 来 源 | youtu.be/Gnl833wXRz0 今天外网最火的播客,毫无疑问是 Brad Gerstner 的 BG2 频道,能把萨提亚·纳德拉(Satya Nadella)和萨姆·奥特曼(Sam Altman)同时请来,坐 在一起聊一个小时,这事儿本身就挺不简单的。 这两个人,大家都不陌生。一个是微软的 CEO,一个是 OpenAI 的 CEO。平时看他们各自的采访,他们俩分开聊,我们都听得多了。 但坐在一起聊,感觉就不一样了。他们是 当今科技界最重要、最复杂、也最被外界议论纷纷的合作关系里的两个核心人物。 难得 同 框对话,说的每一 句话,甚至每一个表情,都值得玩味。 这场信息量爆炸的对话,开场却格外"柔软"。主持人没问什么 AGI、万亿参数模型,而是先关心起了萨姆刚出生的宝宝。不管你在外面掌管着多大的商 业帝国,搅动着多大的技术风云,回到最基本的生活层面,大家面对的喜悦和烦恼,其实都差不多。 这种充满生活气息的开场,让后面的"硬核"内容显得更加 ...
后端架构新范式!阿里云专家亲揭:用RocketMQ彻底搞定多Agent异步协同难题
AI科技大本营· 2025-10-30 18:55
Multi-Agent 协同的核心:Agent 能力发现与任务闭环 作者 | 周礼 出品丨AI 科技大本营(ID:rgznai100) 本文整理自 阿里云智能集团高级技术专家周礼 在 2025 全球机器学习技术大会 上的精彩演讲 《Apache RocketMQ x AI:面向异步化 Agent 的事件驱动架构》,介绍了如何基于 Apache RocketMQ 新特性构建异步化 Multi-Agent 系统,深入探讨了 Agent 间的异步通信、上下文隔 离、状态恢复与任务编排机制,并通过实际案例展示如何利用 RocketMQ 实现 Multi-Agent 的任务 调度。 随着大模型能力提升与推理成本下降,MCP、A2A 等协作协议的成熟,AI 迈入了 Agentic AI 的时 代,AI 应用也从"被动响应"进入了"主动决策、自主执行"阶段。这一演进催生了 Multi-Agent 架 构:任务由多个专业化 Agent 协同完成,不再依赖单一模型或固定流程,开发者得以在模型自主性 与业务可控性之间实现平衡。 与传统应用的固定编排不同,Agentic AI 具备自主规划能力,可将目标拆解为动态步骤,但规划又 依 ...
对话蚂蚁 AWorld 庄晨熠:Workflow 不是“伪智能体”,而是 Agent 的里程碑
AI科技大本营· 2025-10-28 14:41
文章核心观点 - AI行业当前陷入追求榜单分数的"应试狂热",真正的智能体技术必须超越考试逻辑,走向解决现实世界复杂问题的"实干" [2][7] - 智能体赛道存在泡沫,许多产品仅是传统工作流自动化的"套壳",但Workflow是智能体发展过程中的重要里程碑,而非终点 [3][10] - 群体智能被视为一条可能实现"弯道超车"的路径,其与基础大模型训练是螺旋上升的相辅相成关系,而非替代 [16][18][20] - 真正的智能体具备动态适应和问题解决能力,其核心标志是能够自主"绕路"应对意外情况,而非僵化执行预设流程 [23][24] - 开源是推动AI技术发展和建立行业生态的关键力量,代码背后的认知共享比代码本身更具价值 [32][33][35] 智能体技术与Workflow的关系 - 行业存在对智能体的质疑,认为其仅是Workflow自动化脚本的包装,即"智能体洗白",导致用户体验后迅速流失 [3] - 大模型的出现是分水岭,用基于概率的语义理解替代了过去难以维护的、僵化的手写规则图 [9] - Workflow被视为智能体发展前期的成熟技术阶段和必经的里程碑,但智能体终将超越Workflow [10] - 根本性转变在于从遵循固定标准作业程序的过程导向,演进为以最终结果好坏为评判标准的结果导向 [13] - 真智能体的标志是动态适应能力,例如在工具调用失败后能自主寻找替代方案(如自己写代码),而非像Workflow那样流程中断 [23][24] 群体智能与模型发展的战略路径 - 面对大模型军备竞赛的资源消耗,群体智能提供了一种"弯道超车"的非对称战略思路 [16] - 群体智能的核心是构建协同框架,使多个相对较小的智能体像专家团队一样合作,完成复杂任务 [17] - 群体智能与基础大模型训练是相辅相成、螺旋上升的关系:群体智能系统作为"数据工厂"产生的高质量数据可反哺基础模型,增强其推理能力;更强的基础模型又能提升群体智能中单个智能体的能力 [18][19][20] - 通用智能体与基础模型的边界相对模糊,智能体团队的核心价值在于完成技术到商业价值的"最后一公里",包括必要的模型后训练(post-train)和工程落地 [21][22] 智能体与真实世界的交互演进 - 智能体影响真实世界的三种介质包括:通过自然语言与人交互、通过API交互、以及通过GUI(图形用户界面)交互 [25] - API方式当前最主流但脆弱,依赖提供方且难以泛化;GUI方式模拟人类自然操作,泛化性和扩展性潜力最高,但实现难度也最大 [25][26][27] - 行业需要建立智能体间的通信与协作标准协议(如MCP、A2A),其最终形态可能由大公司推动或因其好用而形成稳定生态 [28] 开源策略与行业生态建设 - 开源是应对AI技术快速迭代、保持领先的关键方法论,其力量体现在集体智慧能加速AI发展,迅速缩小与闭源模型的差距 [32][33] - 开源项目超越代码本身,其核心价值在于共享背后的技术认知和设计哲学,接受检验并激发共创,是极佳的技术"名片" [35][37] - 智能体技术的硬性标准是"自己做出来的智能体自己能用",强调实际应用价值而非空谈 [38] 智能体技术的未来方向 - 未来智能体的关键挑战是完成"长程任务",即像独立个体一样7x24小时运行,处理持续数小时甚至更久的复杂任务,这将引出超长上下文管理、记忆等核心技术难题 [39] - 公司对智能体的未来规划聚焦于两点:一是让智能体在多种环境(如GAIA、IMO)中学习并沉淀经验至模型;二是将智能体作为开放的技术产品,让社区优先享受到技术红利 [40]
10月25日,亚马逊云科技带你玩转Agentic AI开发全流程
AI科技大本营· 2025-10-22 14:11
文章核心观点 - AI构建方式正被AI技术本身重构,行业进入由自主智能体主导的新阶段 [1] - 亚马逊云科技推出的AI原生IDE Kiro是这一趋势的代表,其作为AI构建伙伴能深度参与从想法到发布的完整应用开发链路 [1] - 2025长沙1024程序员节的主题与Kiro的构建理念高度契合,旨在帮助开发者掌握AI系统级构建能力 [1] Kiro作为AI构建伙伴的核心能力 - 采用Specs规范驱动,仅需一句提示词即可自动生成用户故事、验收标准与技术设计文档 [5] - 具备Hooks智能协同功能,在代码保存等事件触发时自动执行检测并与文档保持同步 [5] - 实现任务可视化,支持从规范到开发任务的全链路追踪,确保进度清晰可控和输出结果可信 [5] - 保持实时双向同步,确保规范文档与代码库始终一致,消除文档失效与维护负担 [5] 1024 AI构建者大会亚马逊云科技专场亮点 - 大会特色为体系化策略与实战化落地相结合,设置趋势洞察和动手实验等环节 [3] - 技术专家将深度拆解Agentic AI在需求理解、代码生成和测试验证等方面的能力 [3] - 动手实验环节邀请开发者现场深度体验Kiro,全流程实操解决任务拆解模糊等典型痛点 [3] 对开发者的价值与机遇 - 开发者能借助Kiro实现从零开始构建完整应用,是一次绝佳的体验机会 [5] - 通过动手实验直接掌握Kiro核心操作与Agentic AI应用开发流程,积累可复用实战经验 [5] - 能深度链接亚马逊云科技的AI技术生态,优先获取前沿工具的技术支持,为职业发展打开新通道 [5]
C++之父Bjarne Stroustrup亲临现场,2025全球C++及系统软件技术大会重磅官宣
AI科技大本营· 2025-10-22 14:11
C++语言演进历程 - 1979年Bjarne Stroustrup在贝尔实验室写下第一行C++原型代码,旨在解决性能与抽象的统一问题[3] - 2005年Bjarne在上海大会提出"C++0x方向"原则,包括通用性优于特殊化、新手与专家并重、以库为先等指导理念[7] - 2011年C++11标准发布被形容为"几乎是一门全新的语言",引入类型推导、智能指针、lambda表达式和并发支持等现代特性[8] - 2016年Bjarne推动Concepts标准化工作,为模板编程带来可理解性与类型安全,平衡高性能与可维护性[10] 行业技术发展趋势 - AI大模型浪潮推动C++在算力密集型场景复兴,OpenAI推理引擎、NVIDIA加速库、DeepSeek编译框架均依赖C++底层支撑[12] - 云原生架构重塑软件部署方式,开发者对内存与资源安全需求日益迫切[11] - 异构计算成为重要方向,C++标准委员会设立机器学习组(SG19)专门研究GPU应用开发和神经网络优化[27] - 大模型驱动软件开发成为新兴专题,反映AI技术对编程范式的深远影响[59] 技术大会核心内容 - 大会设置十二大技术专题,涵盖现代C++实践、架构演化、软件质量、AI算力优化、异构计算、高性能低时延等前沿领域[52][59] - 软件工程基石专题聚焦大型系统构建的质量与效能原则[53] - 性能优化专题直面AI与低时延场景的硬件压榨挑战[54] - 系统内核专题深入操作系统与底层硬件交界地带的技术奥秘[55] 行业专家阵容 - Bjarne Stroustrup作为C++之父持续指导语言演进,现任摩根士丹利技术部董事总经理和哥伦比亚大学客座教授[21] - Michael Wong领导C++机器学习委员会,主导制订SYCL异构编程标准并对PyTorch/TensorFlow底层优化有深刻见解[27] - John Lakos作为彭博集团BDE基础开发部掌门人,是大规模C++组件化开发方法的世界级权威[33] - David Sankel作为Adobe首席科学家,负责C++ Reflection TS项目编辑和模式匹配等语言特性提案[30]
跨平台与嵌入式开发痛点,一站式解决!更有技术白皮书免费领!
AI科技大本营· 2025-10-15 15:05
峰会核心信息 - Qt全球峰会2025中国站将于2025年10月24日在上海举行,主题为“全球视野,本土实践” [1] - 峰会旨在探讨跨平台开发技术,以应对应用在手机、平板、车载屏幕及工业设备上提供一致流畅体验的挑战 [1] - 活动汇聚Qt Group全球与本土技术专家及华为、金山办公、北斗智联等行业领军企业的技术负责人 [1] 技术探讨与开发者价值 - 探讨Qt深度适配HarmonyOS,分享大型应用向鸿蒙生态迁移的一手实战经验 [1] - 解析从Qt 5迁移至Qt 6过程中的渲染性能瓶颈与解决方案,确保移动设备应用流畅运行 [1] - 利用Qt Quick 3D等技术打造媲美原生的沉浸式交互体验,使应用在竞品中脱颖而出 [1] - 聚焦Qt Safe Renderer在汽车电子、轨道交通等安全关键领域的应用 [2] - 探讨下一代智能座舱架构演进及如何利用Qt构建未来感驾乘体验 [2] - 了解Qt在Wayland架构下的多进程、多窗口解决方案,应对复杂嵌入式显示需求 [2] - 学习使用Squish等工具为嵌入式软件构建全周期自动化测试体系,确保交付质量 [2] 会议议程与附加价值 - 会议议程包括主论坛、桌面/移动开发及嵌入式开发等专题 [3] - 参会者可获得与行业领袖和Qt核心团队面对面交流的机会 [2] - 参会者可免费领取Qt开发白皮书、谷歌提示工程白皮书等多份技术资料 [3]
2025 全球机器学习技术大会 100% 议程出炉,顶级嘉宾阵容 + 参会指南一键获取
AI科技大本营· 2025-10-14 19:14
大会核心信息 - 2025全球机器学习技术大会将于10月16-17日在北京威斯汀酒店召开 [1] - 大会由CSDN与奇点智能研究院联合主办 [1] - 会议日程为每日8:00开始签到,9:00正式开始嘉宾分享 [34][36] 参会嘉宾阵容 - 大会云集了来自OpenAI、Google、英伟达、微软、百度、阿里、腾讯、字节跳动等国内外顶尖机构与企业的技术领军人物 [1] - 核心演讲嘉宾包括OpenAI研究科学家、GPT-5、GPT-4和Transformer共同创始人Lukasz Kaiser [1][5] - 其他重要嘉宾包括奇点智能研究院院长李建忠、ISO人工智能技术委员会专家Michael Wong、前OpenAI研究员吴翼、前DeepMind研究员王佳楠等 [1][4][5][19] 主论坛核心议题 - 首日主论坛将围绕大模型、智能体工程、多模态推理等前沿议题展开 [3] - 奇点智能研究院院长李建忠将发布《奇点智能AI原生软件研发成熟度模型》报告 [4] - ISO专家Michael Wong将解析CUDA、PyTorch、ONNX、Triton等AI生态系统的成败逻辑 [4] - OpenAI科学家Lukasz Kaiser将分享推理模型的历史、现在与未来 [5] 专题分会场技术焦点 - 10月16日下午设有大语言模型技术演进、智能体工程与实践、多模态与世界模型、AI赋能软件开发等多个专题分会场 [12] - 参会企业包括字节跳动、微软、新浪微博、腾讯、小红书、理想汽车、京东、清华大学等 [13] - 10月17日专题涵盖具身智能与智能硬件、AI Infra大模型基础设施、AI赋能软件研发、大模型+行业落地实践等热门技术专题 [18] - 英伟达首席架构师将分享CUDA C++开发者工具箱,百度将介绍文心4.5开源大模型及关键训练技术 [22] 产业应用与实践案例 - 大会将展示AI技术在多个行业的落地实践,包括小红书的多模态搜索应用、理想汽车的座舱语音对话大模型、京东的开源多智能体协作框架等 [13][15][16] - 腾讯混元将分享翻译模型优化经验及3D生成大模型的研发布局与应用 [15][16] - 阿里Qoder技术专家将探讨新一代Agentic Coding平台如何推动AI Agent在软件研发中的真实应用 [16]
浙大提出Translution:统一Self-attention和Convolution,ViT、GPT架构迎来新一轮性能突破
AI科技大本营· 2025-10-14 16:17
核心技术突破 - 浙江大学与新加坡国立大学联合提出新型深度神经网络基础操作Translution 旨在融合Self-Attention的自适应建模优势与Convolution的相对位置建模能力 [1] - Translution的核心思想是将卷积操作中的固定权重核转变为由自注意力机制动态生成的自适应核 从而灵活捕获与数据本身内在结构相关且与绝对位置无关的表征 [5] - 该技术实现了Self-attention和Convolution两种操作的统一 被描述为合二为一的性能怪兽 [8] 性能表现 - 基于Translution构建的神经网络在ViT和GPT两大主流架构下均获得性能提升 展现出广阔应用前景 [3] - 在ImageNet数据集上 基于Translution构建的ViT取得明显优于Self-attention的效果 [4] - 在自然语言建模任务中 基于Translution构建的GPT模型在不同参数规模下均超越Self-attention 例如GPT-A-160架构下困惑度从60.40降至56.26 [4] 行业背景与影响 - 当前基于Self-Attention的Transformer是深度学习主流架构 但其Scaling Law红利正逐渐触顶 单纯增加参数和训练数据难以带来性能提升 [5] - Translution是对上述行业挑战的有力回应 被视为探索新型神经网络以持续推动深度学习繁荣的重要尝试 [5] - 该技术对算力特别是GPU显存提出更高要求 可能进一步加剧人工智能领域的资源差距 [6]
百度秒哒负责人朱广翔:AI开发革命的终局,是让创意本身成为唯一的“代码”
AI科技大本营· 2025-10-13 18:14
应用开发模式的演进与瓶颈 - 传统应用开发受困于“不可能三角”,即低成本、高质量、个性化三者难以兼得 [1] - 传统编码模式能保证高质量与个性化,但成本高昂,全球80亿人口中仅约3000万专业程序员 [8] - 模板化低代码平台降低了成本,但牺牲了个性化,用户创意被限制在有限模板库中 [8] - 聊天机器人模式成本低且具个性化,但交互体验简陋,难以达到高质量应用标准 [8] AI驱动的开发革命:Vibe Coding与AI UI - Vibe Coding理念的核心是开发者通过自然语言描述想法,AI将创意变为现实,流程从“规划->编码->审查”变为“自然语言描述->AI生成代码” [1][10] - AI时代的生产力公式为AI UI + Agent = AI App,AI UI是需求驱动的交互界面,Agent是执行复杂任务的智能体 [3][12] - AI原生应用需具备两大要素:由AI驱动生成、以用户需求为中心的交互界面,以及背后执行任务、连接工具的智能体 [3][12] - 秒哒通过多智能体协作模拟高效软件开发团队,包含产品经理、架构师、程序员等角色的AI智能体协同工作 [3][25] 市场机遇:释放长尾需求与全民创造 - 全球软件市场规模预计以11.8%的年复合增长率,从2023年的6592亿美元增长至2034年的22483亿美元 [5] - 传统软件开发聚焦于10%的高频刚需场景,而秒哒类工具将释放90%被忽视的长尾应用需求 [3][13][16] - 新产品重塑用户习惯,如AI写作已改变学生写作方式,从零到一创作变为在AI生成基础上修改 [7][30] - 用户群体从3000万专业程序员扩展到全球80亿人,对应应用需求从高频到长尾的转移 [13][16] 技术实现路径与产品哲学 - 秒哒通过多智能体协作破解“不可能三角”,专门智能体负责交互设计、任务执行、开发测试等环节 [25] - 产品不仅生成预期页面,还能补充页面背后应具备的信息和能力,如问卷生成工具会构思专业问题 [26] - 通过工具调用集成丰富服务,如调用百度地图添加导航信息,调用短信服务进行活动预约 [26] - 产品经理智能体的KPI衡量包括意图理解准确率、知识拓展丰富度、澄清沟通效率、PRD文档质量等指标 [27][28] 职业演变与未来展望 - AI不会取代程序员和产品经理,而是将其推向更高级形态,程序员更专注于复杂架构与逻辑设计 [4][20] - 产品经理可借助工具直接对接智能体实现原型,AI成为产品经理与程序员之间的沟通桥梁 [21][23] - 判断AI原生应用的标准是看其业务模式在大模型时代之前是否已存在,如AI写作属于原生应用,智能客服属于+AI应用 [29][30] - 创意和想法是基于行业经验产生的,是大模型短期内甚至长期都无法突破的领域,是人类的核心竞争力 [34]