Workflow
智能体协作
icon
搜索文档
大模型在自动驾驶后期的落地与研究方向有哪些?
自动驾驶之心· 2025-07-08 07:31
大模型在自动驾驶领域的应用 - 大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行自己的VLA、VLM方案 [1] - 下一代大模型需关注轻量化与硬件适配、知识蒸馏与量化加速、高效微调等方向 [1] - CoT方案是后期完成空间感知的重点,VLA+强化学习等高级推理范式受行业重点关注 [1] 大模型优化课程核心内容 - 课程系统探讨大模型前沿优化方法,聚焦参数高效计算、知识动态扩展和复杂推理三大方向 [2] - 参数压缩方面研究剪枝稀疏化和量化加速等轻量化方法 [2] - 知识扩展方面探索检索增强生成(RAG)和参数高效微调(PEFT)技术 [2] - 推理优化方面研究链式思维(CoT)和强化学习优化(GRPO)等范式 [2] 课程技术重点 - 结构化剪枝、低比特量化、动态检索、角色化智能体、多跳推理等关键技术 [2] - 使用LLaMA、GPT等主流大模型作为实验平台 [2] - 多智能体协作和多模态理解等前沿方向 [2][3] 课程安排与产出 - 12周在线小组科研+2周论文指导+10周论文维护期 [7] - 每周1-1.5小时课程,涵盖大模型剪枝、量化加速、PEFT、多智能体协作等主题 [18][20] - 最终产出包括论文初稿、写作方法论、投稿建议 [6][7] 学员收获 - 系统掌握大模型优化理论体系,解决知识零散问题 [6] - 获得导师提供的定制化研究idea和baseline代码 [7][17] - 提升Coding能力,掌握论文写作与投稿技巧 [6][7] 技术要求与资源 - 需具备PyTorch和Python基础,建议配备4张4090显卡 [13] - 提供公开数据集和Baseline代码,包括LLM-Pruner、LLaVA等开源项目 [15][16][17] - 必读论文涵盖GPTQ量化、Sheared LLaMA剪枝等前沿研究 [17][19]
MCP 已经起飞了,A2A 才开始追赶
AI前线· 2025-07-07 14:57
谷歌云捐赠A2A协议 - 谷歌云将A2A协议捐赠给Linux基金会 包含智能体交互协议、SDK和开发者工具的开源礼包 [1] - 捐赠决策被解读为对Anthropic MCP协议和OpenAI函数的战略应对 同时反映行业对共建智能体经济底层规则的共识 [1] - 部分观点认为A2A协议起步较晚 正在追赶已经成熟的MCP协议 [2][3] MCP协议技术解析 - MCP协议解决AI模型安全高效调用现实世界工具和服务的基础问题 不同于A2A侧重智能体间通信 [4] - 开发MCP Server最关键环节在于工具描述 需详细说明功能、参数及输入输出内容 [6][7] - 现有API系统改造和从零开发是两种典型实施路径 前者关注协议转换 后者需构建完整业务逻辑 [7][8] - 接入客户现有技术体系时应尽量减少干预内部治理生态 重点优化对外接口的工具描述 [9] 模型兼容性与优化 - 国内外大模型存在兼容性问题 中文描述适合国内模型 英文描述更适合国外模型 [10] - 通过多轮测试优化工具描述清晰度 是提升模型调用准确性的关键手段 [11][12] - API设计应遵循正交原则 功能独立且高内聚 描述需明确使用场景和预期输出 [12] 协议性能与安全 - Streamable HTTP协议支持有状态通信、服务端主动通知和流式输出 优化金融等高实时性场景 [15] - 敏感数据应避免通过MCP提供 非敏感数据授权可使用OAuth 2.0等现有验证机制 [28] - 行业需要建立安全标准应对MCP服务潜在的黑盒风险 确保生态健康发展 [43] MCP与A2A对比 - MCP解决工具层面问题 A2A构建Agent间通信和协作的生态层 [32] - MCP类似专用工具 A2A提供通用协议使不同框架的Agent能够相互发现和协作 [33] - 腾讯计划在产品研发流程中接入A2A协议 实现多Agent协作 [34][35] 未来发展趋势 - 预计80%核心软件将推出自有MCP 形成多样化工具端口 [40] - 多Agent架构将向主从模式发展 人类角色需明确界定和验证关键节点 [41] - MCP协议完善将加速企业SaaS能力释放 安全可信问题成为发展重点 [42]
大模型这个坑,还有哪些可以发论文的点?
具身智能之心· 2025-07-05 10:25
大模型优化课程核心内容 - 课程聚焦大语言模型(LLM)和多模态模型的前沿优化技术,涵盖参数高效计算、知识动态扩展和复杂推理三大方向 [1] - 关键技术包括结构化剪枝、低比特量化、动态检索、角色化智能体、多跳推理等,实验平台采用LLaMA、GPT等主流模型 [1] - 重点解决参数压缩(剪枝稀疏化/量化加速)、知识扩展(RAG/PEFT)和推理优化(CoT/GRPO)等核心挑战 [1] 课程结构与招生信息 - 采用12周在线科研+2周论文指导+10周维护期的教学模式,每期限招6-8人 [3][10] - 目标学员包括大模型方向本硕博学生、科研人员及AI从业者,需具备PyTorch和Python基础 [4][5] - 硬件要求最低配置2张NVIDIA 4090显卡,推荐4张或使用云服务器 [11] 课程产出与学术支持 - 学员将获得定制化研究idea、baseline代码及公开数据集,最终完成论文初稿 [10][13][14] - 论文指导覆盖SCI 1-4区和CCF A/B/C类会议,提供从选题到投稿的全流程方法论 [18] - 必读论文包括GPTQ量化(NeurIPS 2023)、Sheared LLaMA剪枝(ICML 2024)等前沿成果 [15][17] 课程技术模块 - 剪枝量化模块:涵盖结构化剪枝算法、GPTQ量化技术及TVM编译器优化 [15] - 知识扩展模块:通过RAG解决幻觉问题,采用PEFT实现垂类任务高效微调 [16] - 推理增强模块:包含Chain-of-Thought多步推理和GRPO强化学习优化 [16][17] - 多模态扩展:涉及LLaVA视觉语言模型和Flamingo多模态学习框架 [15][17] 教学安排与服务 - 每周1-1.5小时专题授课,包含多智能体协作、动态知识扩展等14个核心模块 [16][18] - 采用腾讯会议直播+小鹅通回放形式,提供6个月答疑周期和学术诚信监督 [18] - 课程产出包括顶会论文模板应用、动机凝练方法和选刊投稿策略 [18]
下一代大模型高效计算:参数压缩、硬件适配与多模态推理、CoT等方向论文指导班来啦!
自动驾驶之心· 2025-07-04 15:13
大模型优化课程核心内容 课程简介与目标 - 聚焦大语言模型(LLM)和多模态模型的前沿优化技术,涵盖参数高效计算、知识动态扩展、复杂推理三大方向[1] - 关键技术包括结构化剪枝、低比特量化、动态检索、角色化智能体、多跳推理等[1] - 采用LLaMA、GPT等主流模型作为实验平台,结合理论讲解与实验实践[1] 课程结构与内容 - 12周在线科研+2周论文指导+10周论文维护期的完整科研周期[11] - 每周1-1.5小时课程,覆盖剪枝稀疏化、量化加速、PEFT微调、RAG知识扩展、CoT推理等核心技术[16][18] - 提供公开数据集和Baseline代码,包括LLM-Pruner、GPTQ、LLaVA等开源项目[15] 学员收获与产出 - 系统掌握大模型优化知识体系,解决零散知识整合问题[5] - 获得定制化研究idea,完成论文初稿并掌握顶会论文写作方法论[11][18] - 提升coding能力,在baseline代码基础上开展创新实验[11] 招生要求与资源配置 - 每期限招6-8人,要求具备PyTorch和Python基础,熟悉深度学习框架[3][7] - 硬件建议配置4张4090显卡,最低要求2张4090[12] - 需完成Linux开发环境搭建,掌握CUDA基础语法和代码辅助工具[12] 核心技术与参考文献 - 重点论文包括GPTQ量化(NeurIPS 2023)、Sheared LLaMA剪枝(ICML 2024)、LLaVA多模态(NeurIPS 2023)等[15][17] - 涉及TVM编译器优化(OSDI 2018)、PagedAttention内存管理(SOSP 2023)等系统级优化技术[17] - 涵盖Flamingo多模态学习(NeurIPS 2022)、CoT推理(NeurIPS 2022)等前沿算法[17]
智能体不断进化,协作风险升高:五大安全问题扫描
21世纪经济报道· 2025-07-03 08:36
智能体发展现状 - 2025年被称为"智能体元年" 标志着AI从对话生成跃迁到自动执行阶段 智能体成为下一代人机交互范式和商业化锚点 [1] - 国产手机厂商华为 荣耀 OPPO vivo 小米 三星在2024年下半年推出AI手机 智能体可跨App完成订票 点餐等复杂任务 [3] - 行业普遍共识认为智能体可控性和可信度是关键指标 安全合规问题是重要考量因素 [2] 技术实现路径 - 手机智能体采用两种技术路线:基于API接口的"意图框架"和依赖系统级权限的"视觉路线" [4] - 视觉路线通过无障碍服务实现"读屏+模拟操作" 但存在权限滥用风险 多家厂商智能体结束任务后仍保持权限开启 [5] - 微软Copilot的"Recall"功能因安全漏洞被英国监管机构调查 显示PC端同样存在隐私风险 [5] 安全风险分类 - 风险分为内在安全(核心组件漏洞)和外在安全(外部交互风险) 大模型作为"大脑"其漏洞在动态环境中会被放大 [2] - 70%受访者担忧AI幻觉和错误决策 医疗领域3%误诊率在千万用户中可导致数十万例误诊 [2] - 加拿大航空AI客服错误决策导致法律纠纷 成为企业承担AI责任的标志性案例 [3] 行业合规进展 - 2025年3-6月密集出台多项规则:《智能体任务执行安全要求》《移动互联网服务可访问性安全要求》等 强调用户授权和最小必要原则 [5][6] - 中国信通院联合七大厂商发布生态倡议 重点推进智能体与三方应用的接口打通工作 [5] - 广东省标准严格禁止通过无障碍权限操作第三方App 要求API接口协作和"双重授权"机制 [6] 提示词注入攻击 - 攻击分为直接提示词注入(诱导输出敏感内容)和间接提示词注入(通过外部数据隐藏指令) 在OWASP十大风险中排名第一 [7][8] - MCP协议成为间接注入主要入口 瑞士公司测试显示可通过恶意MCP劫持WhatsApp聊天记录 [9] - 腾讯发现Fetch服务是最大攻击入口 智能体读取恶意网页内容后可能被劫持 [10] MCP协议生态 - 魔搭开源社区有4052款MCP服务 开发者工具占比1196款 独立导航网站mcp.so收录超15000款服务 [11] - 阿里云百炼实施功能合理性 稳定性等审核 而Dify等平台审核较宽松 仅依赖用户协议约束 [11] - OpenAI Google 阿里 腾讯加入MCP生态 推动智能体互联互通 但缺乏统一安全认证标准 [11][12] 多智能体协作 - 行业正在推进ASL(Agent Security Link)技术 为智能体互连提供权限 数据等安全保障 [14] - IIFAA联盟成立工作组 致力于制定跨智能体交互安全规范 目前该领域安全机制仍属空白 [14] - 互联网大厂产品已开始强调多智能体协作机制 预示个人拥有多个智能体的趋势 [13]
从 OpenAI 回清华,吴翼揭秘强化学习之路:随机选的、笑谈“当年不懂股权的我” | AGI 技术 50 人
AI科技大本营· 2025-06-19 09:41
受访者 | 吴翼 采访 | 王启隆 编辑 | 屠敏 出品 | CSDN(ID:CSDNnews) 人工智能的浪潮席卷而来,从大模型竞赛到智能体系统的探索,从生成模型到推理模型,技术巨头们 纷纷入场,推动着一场"AI 重新定义一切"的时代跃迁。但在这场热潮背后,真正推动技术向前的, 从来不是一场场轰动的发布会,也不是那些令人眼花缭乱的融资神话,而是一群敢于直面复杂性、埋 头钻研底层机制的工程师与研究者。 吴翼,就是其中一位。 1992 年出生的他,高中时期便在全国青少年信息学奥林匹克竞赛(NOI2009)中斩获金牌,并代 表中国参加国际信息学奥林匹克竞赛(IOI2010)。此后,他被清华大学交叉信息研究院提前"签 下",保送进入以"顶尖人才训练"著称的姚班,成为 图灵奖得主姚期智教授的桃李门生 。在本科阶 段,吴翼先后前往微软亚洲研究院、Facebook 实习,积累了丰富的经验。 2014 年本科毕业后,吴翼赴加州大学伯克利分校,攻读人工智能方向的博士学位,师从著名 AI 学 者 Stuart Russell,深入研究深度强化学习的泛化性以及多智能体学习。博士毕业后,他加入 OpenAI,成为全职研究员。 在 ...
百度心响上线iOS版,多智能体协作应用终于卷对地方了
量子位· 2025-05-27 11:53
产品发布与更新 - iOS版心响APP正式上线 苹果用户可通过APP Store搜索下载[2] - 安卓与iOS版本均实现完全免费且不限次数使用[3][4] - 新增网页生成功能 可自动将长文本转化为图文并茂的模块化网页[10] 核心功能与用户体验 - 支持多场景智能体协作 包括旅游攻略生成 深度研究 法律咨询 试题讲解等[14] - 旅游攻略功能可自动拆解任务 调用221篇攻略数据 节省用户37小时20分钟规划时间[17] - 深度研究功能可生成专业级分析报告 如小米3nm芯片报告包含技术解析 竞品对比 战略意义等模块[40] - 健康咨询功能集成多位医生AI分身 可逐步询问症状并生成综合诊断建议 覆盖100+检查报告类型[46][48] - 工伤赔偿计算功能依据地区法规自动生成赔偿方案 显示具体计算过程与法律依据[58][61] 技术架构与创新 - 采用1个主智能体+多领域智能体架构 主智能体负责任务拆解与调度[66] - 支持MCP Server接入 开发者可扩展智能体能力[66] - 实现完全自主执行 用户确认需求后可在后台自动运行并交付结果[62][69] - 当前覆盖10大场景200+任务类型 计划扩展至10万+任务类型[65] 市场竞争与行业趋势 - 智能体应用成为行业焦点 谷歌 Claude等厂商均重点布局[72][73] - 产品差异化体现在零门槛交互 无需邀请码/提示词工程 直接解决实际问题[69][79] - 未来将上线图片/文件输入功能 首页改版为个性化模式[70]
AgentUnion发布智能体通信协议ACP
搜狐财经· 2025-05-17 14:25
ACP协议核心架构 - ACP是中国首个落地可用的智能体通信协议,旨在解决Agent间通信协作问题,实现功能复用和效率最优,降低开发成本[2] - 协议包含六大规范:身份标识、接入机制、数据规范、通信协议、授权体系、安全规范,确保开放性、可靠性、可协作性[2] - 通过AID实现智能体唯一身份标识,采用二级域名形式,Agent通过AID相互寻址通信[2][3] 技术实现细节 - 接入点(AP)提供身份认证、寻址查找、通信支持等服务,智能体可在任意AP创建AID并接入网络[4] - 数据传输基于HTTPS协议,AP内置负载均衡能力,支持企业级大规模并发需求[5] - 面向搜索引擎原生友好设计,支持增量获取智能体元信息,实现无额外操作的智能体发现机制[7] 行业演进阶段 - 2022-2024年为智力爬升阶段,以聊天机器人为主,关注基座模型能力和上下文管理[10] - 2023-2025初为工具扩展阶段,Agent演变为企业问题解决工具,关注工具调用标准化[10] - 2025年起进入社会化阶段,核心特征是多智能体跨域协作,ACP协议加速该进程[10][11] 生态价值定位 - ACP类比TCP/IP协议,通过标准化通信协议为智能体社会化协作提供基础设施[11] - AgentUnion以构建"智能体互联网"为愿景,推动开放协议和去中心化协作网络建设[11] - 协议定义授权与交易流程规范,为未来Agent服务商业化奠定基础[8]
百度李彦宏:帮助开发者全面拥抱MCP
广州日报· 2025-04-28 03:06
公司动态 - 百度在Create2025开发者大会上发布文心大模型4.5 Turbo和X1 Turbo两款新模型,性能提升且价格最高下降80%[2][3] - 新模型具备多模态、强推理、低成本三大特性,其中X1 Turbo在性能提升同时价格再降50%[3][4] - 公司推出高说服力数字人、通用超级智能体心响App、内容操作系统沧舟OS等多款AI应用[2][5] - 百度宣布将帮助开发者全面拥抱MCP(模型上下文协议)[2][8] - 公司启动"文心杯"创业大赛,特别大奖投资额最高达7000万元,计划未来5年培养1000万AI人才[9][10] - 百度智能云启动"大模型行业合伙人计划",包括共享10亿商机、1000万专项资金、100万人次培训等[11] 产品与技术 - 文心4.5 Turbo训练吞吐达文心4.5的5.4倍,推理吞吐达8倍[4] - 飞桨文心开发者数量超2185万,服务67万家企业,创建模型110万[4] - 高说服力数字人具有声形超拟真、内容专业、互动灵活特点,在电商直播等领域应用潜力大[5] - 沧舟OS是全球首个内容领域操作系统,支持多模态AI笔记等功能[5] - 心响App是通用超级智能体,可一站式解决复杂问题,已覆盖200个任务类型[6][7] - 公司点亮国内首个全自研三万卡集群,可承载多个千亿参数大模型训练[10] 市场数据 - 百度文库AI功能付费用户超4000万,AI月活达9700万[5] - 百度网盘AI月活用户超8000万[5] - 秒哒无代码编程工具已向全社会开放[6] - 非遗武术大模型融合专业机构技术,实现武术动作数字化保存[10] 行业趋势 - 大模型厂商竞争激烈,开发者面临模型选择困难[3] - 多智能体协作被视为下一个高价值AI应用方向[6] - AI应用正从回答问题向任务交付转变[6] - 文博领域成为AI应用新场景,公司与文物机构合作开发专业智能体[10]
百度发布通用超级智能体「心响」,要做真正“长在用户手机和心里”的超级有用App
IPO早知道· 2025-04-26 10:16
心响App现已覆盖知识解析、旅游规划、学习办公等场景中200个任务类型。 本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 据 IPO早知道消息, 百度 在 4月25日举行的 Create2025百度AI开发者大会 正式发布 了 多智能体 协作 App 「 心响 」,其定位 一站式解决用户复杂问题的 "通用超级智能体" 。目前,心响已覆盖 知识解析、旅游规划、学习办公等场景中 200个任务类型。 百度创始人李彦宏在本次开场演讲中 强调, "未来真正统治这个世界的是应用,应用才是王者。" 更 进一步来讲, 多智能体协作是下一个高价值的 AI应用方向。未来的AI应用将从回答问题走向任务交 付,而任何一个复杂任务的交付,都需要多智能体的协作来解析需求、分拆任务、调度资源、规划执 行,最终交付结果。 鲜为人知的是, 这样一款能解决 从信息检索到任务完成 全部流程的 通用超级智能体 , 诞生 于百 度 一支仅有几十人的自发的内部创业团队, 且 这群人大部分都是 95后 。 短短 30天 内,这支小 团队 从零开始 打造出了这款产品 。 当然,鉴于这款产品前期打磨的时间较短,故现 ...