Workflow
AI 智能体
icon
搜索文档
传 DeepSeek AI 代理新模型年底发布;马斯克「金色擎天柱」首曝;比亚迪不回应销量下调传闻 | 极客早知道
搜狐财经· 2025-09-05 09:29
AI模型与智能体发展 - DeepSeek正在开发具备多步操作执行及自我学习能力的AI智能体模型 目标第四季度发布 旨在与OpenAI等美国竞争对手竞争 [1] - OpenAI向免费用户开放ChatGPT Projects服务 该服务可整合对话至主题文件夹并支持文件添加和自定义指令 [2] - 字节跳动为Seed部门AI大模型技术员工发放期权津贴 按月归属 每月价值9万/11万/13.5万元 首批连续发放18个月 总价值约170万至256万元 [6] - 字节Seed团队研究方向涵盖LLM、语音、视觉、世界模型等 其豆包大模型已支持超50个应用场景 [7] 人形机器人技术突破 - 特斯拉Optimus人形机器人展示全新金色外观和拟人手部设计 具备带路导航能力 被评价为可替代20万-50万美元人类工作的生产力突破 [4][5][6] - Figure机器人展示餐具整理能力 可处理杂乱堆叠物品并完成厘米级精度操作 此前已具备物流分拣和衣物折叠能力 [8][10] 企业战略与人力资源 - 小米集团今年接收7000名应届生 并为其提供月租1999元的青年公寓2600套 公司将应届生培养视为未来十年发展的战略性工作 [7][8] 新能源汽车动态 - 比亚迪被传将2025年销量目标从550万辆下调16%至460万辆 公司未予回应 前8月累计销量286.39万辆 同比增长23% [10] - 保时捷纯电卡宴将支持11kW无线充电 通过空气悬挂自动调节实现10-15厘米充电间距 特斯拉Cybercab亦计划支持该技术 [11] 消费电子新品 - 华为发布24999元三折叠屏手机Mate XTs非凡大师 配备手写笔并在智能、影像方面升级 目前占据中国三折叠屏市场100%份额 [13] - 华为同步推出MatePad Mini等产品 覆盖多尺寸屏幕市场 [13] 游戏产业热点 - 《空洞骑士:丝之歌》正式发售 售价76元 该游戏为2019年公布的动作游戏续作 长期位居Steam愿望单榜首 [17] 汽车产品创新 - 奔驰预告将推出G级敞篷版皮卡车型 采用四门设计配货箱 车顶可部分开启 预计在慕尼黑车展首发并全球发售 [15]
出海增长研坊、Google Cloud 初创企业峰会,近期优质 AI 活动都在这里
Founder Park· 2025-09-02 20:26
AI行业活动概览 - 9月20-21日在北京海淀举办出海增长研坊 专为0→1和1-10阶段出海团队设计 提供可落地增长实操经验[4][6][7] - 活动包含实战小组作业 覆盖创始人、产品、增长、研发、设计、运营等核心成员[10] - 邀请美国10年全栈增长专家Julia Yin和Lucius AI CEO赵赫等嘉宾分享[6] 云栖大会AI专题 - 阿里云在9月24-26日杭州云栖大会设Z世代创新者展区 展示50位Z世代创新者AI作品[8][11] - 面向从0到1打造产品的AI创新应用者及传统行业颠覆者 预计吸引全球6万名参会者[8][11][14] - 展区报名截止9月5日18:00 采用群像墙形式呈现年轻创造力的生长图鉴[8][11] 科技巨头生态活动 - Google Cloud初创企业峰会9月12日在深圳举办 聚焦AI与云端生态赋能初创企业出海[12][16] - 包含AI技术趋势分享、创业领军者实战经验交流及Google创新生态系统展示[12][16] - NVIDIA于9月10日在北京举办创业企业展示 提供Omniverse和Cosmos物理AI体验[17][18] AI竞赛与资源支持 - 中国人工智能学会主办AI Agent 2025竞赛 提供300亿Tokens免费算力及5亿媒体曝光资源[18][19] - 特等奖团队可获200万-500万投资意向书 并与NVIDIA、百度等企业进行产业对接[19] - 活动在北京、长三角、川渝、粤港澳大湾区开展巡回赛 包含项目路演和投融资对接[18]
A2A、MCP、Gemini……谷歌技术专家手把手教你搭建 AI Agent
Founder Park· 2025-09-02 18:21
活动主题 - Google Cloud AI专家分享AI智能体构建技巧 重点关注ADK A2A MCP和Agent Engine技术框架的应用[2] - 探讨如何利用Google最新AI技术打造协作性强 高效 可扩展的多智能体系统[2][6] - 探索智能体开发未来趋势 分析智能体对人机交互范式的重塑潜力[2][6] 目标受众 - AI初创企业及出海企业的业务负责人与技术负责人[6] - AI产品经理 解决方案架构师及AI工程师群体[6] - 开发者群体 活动需经审核且名额有限[3][6] 行业动态参考 - Intercom采用Founder Mode实现300%增长 体现按结果付费模式在AI转型中的成功应用[8] - 红杉美国重点关注五大AI赛道 反映资本对特定AI领域的战略布局[8] - a16z全球AI产品Top100显示DeepSeek增长放缓 中国开发者出海全球化成为新趋势[8]
季逸超亲述 Manus 构建之谜,一文读懂 AI 智能体的上下文工程
AI科技大本营· 2025-07-21 18:08
上下文工程的核心观点 - Manus团队选择基于上下文工程而非端到端训练构建AI Agent,将产品迭代周期从数周缩短至几小时,保持与底层模型发展的正交性[2][3] - 上下文工程是实验科学,团队通过四次重构Agent框架总结出"随机研究生下降"方法论,即通过手动调试提示词和经验猜测寻找局部最优解[3] - KV缓存命中率是生产级AI Agent最关键指标,直接影响延迟和成本,优化后可使Claude Sonnet模型输入token成本从3美元/百万降至0.3美元/百万[5][8] KV缓存优化策略 - 保持提示词前缀稳定性,避免在系统提示开头插入时间戳等可变元素导致后续缓存失效[13] - 采用只增不减的上下文管理策略,确保序列化过程确定性,避免JSON键顺序变化破坏缓存[13] - 明确标记缓存断点,在系统提示后设置断点以适配不支持自动增量缓存的推理框架[13] 操作空间管理 - 避免动态增删工具定义,工具变更会导致后续所有动作和观察结果的KV缓存失效[12] - 采用感知上下文的状态机进行logits掩码,而非直接移除工具,防止模型产生格式错误输出[15] - 设计统一工具名前缀(如browser_/shell_),便于在特定状态下强制选择某类工具[18] 外部上下文设计 - 将文件系统作为无限容量的外部记忆,训练模型按需读写文件实现结构化存储[23] - 采用可恢复的压缩策略,保留URL或文件路径等关键信息而非永久删除内容[26] - 状态空间模型若掌握基于文件的记忆能力,可能催生新型高效Agent架构[26] 注意力与错误管理 - 通过复述机制(如todo.md文件)将核心目标持续写入上下文末端,防止50次工具调用链中的目标漂移[27][31] - 保留失败尝试和错误信息在上下文中,使模型能隐式更新内部认知降低重复错误概率[35] - 错误恢复能力是衡量Agent智能的关键指标,但被多数基准测试低估[35] 少样本提示优化 - 少样本提示可能导致行为定式,如在简历审查任务中机械重复相似操作[36] - 通过引入序列化模板变体、调整措辞等增加多样性打破思维定式[37] - 上下文同质化会加剧Agent脆弱性,需保持受控随机性激活模型注意力[38]
计算机周观察20250629:香港虚拟资产服务相关牌照梳理-20250629
招商证券· 2025-06-29 20:43
报告行业投资评级 - 推荐(维持)[2] 报告的核心观点 - 数字资产随着监管立法推进,有望更快发展,和RWA充当传统金融和Web3桥梁,建议关注恒生电子、港交所等公司 [5] - 企业服务软件是AI Agent理想落地场景之一,建议关注金蝶国际、用友网络等企业级服务公司及垂类AI应用相关公司 [5][6] 各部分总结 香港数字资产监管立法持续推进 - 国泰君安国际成首家可提供全方位虚拟资产相关交易服务的香港中资券商,升级牌照后客户可交易多种虚拟资产 [5][9] - 41家机构获批牌照升级,多家中资券商积极申报,虚拟资产交易平台运营商VATP目前有11家 [5][10][14] - 《香港数字资产发展政策宣言2.0》发布,提出LEAP框架,涵盖法律与监管优化等四大核心范畴,推动相关领域发展 [5][15][16] 人工智能产业链更新 - 多家国内企业加速布局AI智能体赛道,商业化进程加速,英特尔计划将部分营销岗位外包给埃森哲以提升响应速度 [20][21] - 建议关注企业级服务及垂类AI应用相关公司 [24] 市场表现回顾 - 2025年6月第4周,计算机板块上涨7.71%,涨幅最大个股有天利科技等 [25] - 重点公告涉及纳思达、中科曙光、合合信息等公司 [27] - 重点新闻包括新能源汽车消费季活动、龙芯3C6000处理器发布、香港发表数字资产政策宣言等 [28] - 回顾往期公司和行业报告 [29]
海通晨报-20250530
海通证券· 2025-05-30 18:40
核心观点 - 公用事业北方火电业绩高增、水电盈利稳定性增强、绿电业绩承压、核电电价影响行业利润,维持“增持”评级 [2][18] - 零售义乌4月进出口数据改善,进口增速超50%,推荐小商品城 [2][9] - 航空4月客流同比增长、客座率提升,Q2盈利改善可期,25年供需向好,建议增持相关航司 [14][15][16] - 小鹏汽车强势产品周期开启,维持“增持”评级 [22] - 华恒生物持续丰富产品矩阵,生物加AI战略稳步推进,维持“谨慎增持”评级 [25] - 九华旅游定增撬动主业升级,释放成长空间,维持“增持”评级 [27] - 金融工程固收+产品业绩分化,各类策略有不同表现 [30][31][32] - 商业航天多颗卫星发射成功,二级市场表现较弱 [34] - 美国减税法案有融资、经济、信任三大风险 [40][41] - 啤酒旺季景气催化,推荐相关啤酒企业 [41] - 环保河湖治理有目标,推荐相关环保企业 [44] - 能源卡塔尔LNG产能扩张,推荐相关接收站资源公司 [49][50][51] - 山西对氢能货车高速通行费全额补贴,推动氢能产业发展 [54] - AI行业多领域有新进展 [57][59] - 继续看好中国A/H股市,新兴科技是主线,金融周期是黑马 [60][62] 公用事业行业 - 火电成本端改善,北方火电业绩高增,25Q1电量下滑,预计25Q2业绩修复,PE估值持续降低 [3][18] - 水电业绩稳定性增强,25Q1盈利高增速,PE估值先升后降,2025年主汛期来水待观察 [4][19] - 绿电受电价、风况影响业绩承压,2025年预计修复,行业估值下修;核电行业两公司表现有差异,25Q1售电毛利下降 [5][20] 批零贸易业 - 义乌1 - 4月进出口超2000亿,市场采购贡献突出,对主要贸易市场出口增长,进口结构优化,4月进口增速超50% [7][8][9] 航空行业 - 4月客流、客座率同比上升,4 - 5月需求好于担忧,Q2盈利有望改善 [14] - 25年供需向好,票价升油价降加速盈利恢复,旺季表现值得期待 [15] - 建议重视长逻辑,逆向增持相关航司 [16] 小鹏汽车 - 维持“增持”评级,预计2025 - 2027年营收和归母净利润情况,给予2025年1.9倍PS对应目标价 [22] - MONA M03新增版本,Max版有智能化优势,上市1小时大定超1万台 [22][23][24] 华恒生物 - 维持“谨慎增持”评级,调整2025 - 2027年EPS,给予25年30倍PE对应目标价 [25] - 2024年归母净利润同比减少,2025年一季度营收增、归母净利润减 [25] - 持续丰富产品矩阵,新产品取得突破,拟调整部分产能;打造研发体系,推进生物加AI战略 [25][26] 九华旅游 - 维持“增持”评级,预计2025 - 2027年EPS,给予25年25xPE对应目标价 [27] - 定增聚焦主业补短板,EPS短期摊薄后有望回升,有明确回报机制 [27][29] 金融工程 - 固收+产品规模、数量及上周业绩中位数表现分化,按风险等级划分收益不同 [30] - 大类资产配置和行业ETF轮动策略有不同观点和表现 [31] - 绝对收益策略中股债混合和量化固收+策略有不同收益表现 [32] 商业航天 - 国内多颗卫星发射成功,国外Impulse Space将发射SES卫星,4家企业获融资 [34][36][37] - 二级市场商业航天指数下跌,成交量下降,有涨幅和跌幅前三公司 [37] 宏观专题 - 美国减税法案稳定税收预期,增赤较预期“温和”,未改变债务扩张路径 [39] - 法案有融资、经济、信任三大风险 [40][41] 啤酒行业 - 旺季销量或改善,大单品表现好,价格逻辑弱化,利润率改善逻辑强化 [42] - 竞争格局加速分化,区域品牌份额提升,品牌加码新渠道、布局新赛道 [42] - 推荐青岛啤酒等企业,维持对重庆啤酒等企业“增持”评级 [41] 环保行业 - 河湖治理有目标,中央财政支持,推荐相关环境监测、污水处理、湖库治理企业 [44] - 环保板块上周涨跌幅情况,个股有涨幅和跌幅前五名 [46] - 全国碳市场和地方交易所碳配额、CCER成交情况 [47] - 国务院审议通过制造业绿色低碳发展行动方案 [48] 能源行业 - 卡塔尔LNG产能2026年后扩张大,2030年底前有望达1.42亿吨,影响全球市场 [49][50][51] - 推荐新奥股份等拥有接收站资源的公司 [51] 氢能产业 - 山西6月1日起对氢能货车高速通行费全额补贴,推动氢能产业发展 [54] - 全国多地有氢车高速补贴方案,山西新政有省级推广意义 [55][56] AI行业 - AI行业动态包括企业构建原则、收购、大会、融资等 [57] - AI应用资讯有国内外多个产品和功能推出 [57][59] - AI大模型资讯有多个模型升级或推出 [59] - AI科技前沿有新物质发现、机器人制造等进展 [59] 中国股市 - 继续看好中国A/H股市,资本市场改革提速,贴现率下降推动上升 [60] - 并购重组创新改革,产业整合与升级提速 [61] - 新兴科技是主线,推荐港股互联网等;金融周期是黑马,推荐券商等;还有内需消费等主题推荐 [62]
财信证券晨会纪要-20250523
财信证券· 2025-05-23 07:48
报告核心观点 市场延续指数震荡、大小盘股分化态势,沪指在银行等权重板块带动下表现较好,小微盘股明显调整,全市场成交额缩量,热点题材持续性一般,短期应对需谨慎;中长期看,指数有震荡向上空间,出口产业链、扩内需、高股息红利和并购重组方向可能反复活跃,操作上维持均衡配置,适当控制仓位,关注低吸轮动机会 [9] A股市场概览 - 上证指数总市值650258亿元,流通市值508288亿元,市盈率11.94,市净率1.24 [3] - 深证成指总市值217973亿元,流通市值183987亿元,市盈率20.11,市净率2.12 [3] - 创业板指总市值57931亿元,流通市值45653亿元,市盈率26.95,市净率3.75 [3] - 科创50总市值34081亿元,流通市值22294亿元,市盈率53.99,市净率4.11 [3] - 北证50总市值2976亿元,流通市值2054亿元,市盈率47.26,市净率4.69 [3] - 沪深300总市值575644亿元,流通市值434193亿元,市盈率11.20,市净率1.23 [3] 晨会聚焦 财信研究观点 - 市场层面:万得全A指数跌0.63%,上证指数跌0.22%,科创50指数跌0.48%,创业板指数跌0.96%,北证50指数跌6.15%,蓝筹板块跑赢,创新型中小企业风格跑输;上证50指数涨0.19%,中证A100指数跌0.16%,沪深300指数跌0.06%,中证500指数跌0.95%,中证1000指数跌1.08%,中证2000指数跌1.23%,超大盘股板块跑赢,小微盘股板块跑输;银行、传媒、家用电器涨幅居前,基础化工、社会服务、美容护理跌幅居前 [6][7] - 估值层面:上证指数市盈率14.64倍,处于历史后31.59%分位,市净率1.32倍,处于历史后9.03%分位;科创50指数市盈率140.34倍,处于历史后99.08%分位,市净率4.5倍,处于历史后34.68%分位;创业板指数市盈率31.27倍,处于历史后11.37%分位,市净率3.77倍,处于历史后19.79%分位;万得全A市盈率19.22倍,处于历史后42.29%分位,市净率1.56倍,处于历史后8.57%分位;北证50指数市盈率77.89倍,处于历史后100%分位,市净率5.05倍,处于历史后100%分位 [7] - 资金层面:万得全A指数882家公司上涨,4451家公司下跌,涨停51家,跌停18家,全市场成交额11397.05亿元,较前一交易日减少746.67亿元 [8] - 市场策略:大盘缩量震荡整理,小微盘股持续调整;银行板块走强,可逢低关注投资机会;AI智能体概念活跃,但持续性有待观察;短期应对需谨慎,中长期指数有震荡向上空间,可维持均衡配置,关注出口产业链、扩内需、高股息红利和并购重组方向低吸轮动机会 [8][9] 重要财经资讯 - 宏观经济:央行开展1545亿元7天期逆回购操作,操作利率1.40%,当日645亿元逆回购到期,单日净投放900亿元 [14][15] - 财经要闻:2024年9月到2025年4月,家电类商品零售额连续8个月保持两位数增长,4月份限额以上单位家电和音像器材类商品零售额同比增长38.8%;“创新积分制”帮助金融机构精准识别科技创新企业,7000多家企业签约贷款合同,签约贷款金额880亿元;截至3月末全国科技型中小企业贷款余额达3.3万亿元,同比增24%,全国专精特新企业贷款余额6.3万亿元,银行与企业签订的设备更新贷款规模达1.2万亿元;2025年1至4月我国全行业对外直接投资575.4亿美元,同比增长7.5% [16][19][20] 行业及公司动态 - 行业动态:9家股份制银行跟进下调存款利率,对定期整存整取3个月、6个月、1年期、2年期存款挂牌利率下调15个基点,对3年期、5年期存款挂牌利率下调25个基点,有利于降低金融机构负债成本,稳定银行业净息差水平;前四个月光伏装机量同比增长75%,截至4月底全国累计发电装机容量34.9亿千瓦,同比增长15.9%,太阳能发电装机容量9.9亿千瓦,同比增长47.7%,风电装机容量5.4亿千瓦,同比增长18.2% [23][25] - 公司跟踪:珀莱雅与Bota Bio恩和生物达成战略合作,聚焦合成生物学与AI技术融合应用,在化妆品和生物医美材料领域展开深度合作;恒瑞医药1类创新药瑞格列汀二甲双胍片(Ⅰ)/(Ⅱ)获批上市,适应症为配合饮食控制和运动,适用于适合接受磷酸瑞格列汀和盐酸二甲双胍治疗的2型糖尿病成人患者改善血糖控制 [26][28] 湖南经济动态 - 湘股动态:国科微筹划重大资产重组,通过发行股份及支付现金等方式购买资产并募集配套资金,标的公司从事特种工艺半导体晶圆代工及定制化芯片代工业务,预计构成重大资产重组,但不会导致公司实际控制人变更、不构成重组上市,公司股票自2025年5月22日开市起停牌,预计不超过10个交易日披露交易方案 [30][31] - 湖南省地方动态及政策:“油茶三年行动”带动湖南省110多万农民增收,筹措资金逾35亿元,建成国家级油茶种质资源库和油茶杂交种子园,建设油茶采穗圃27处、育苗单位100个,年产苗木2亿株以上,筛选出6个油茶国家主推优良品种,创新研发油茶意蜂授粉繁育技术,开发油茶衍生产品,获得多项专利,初步建立油茶生物产业基地,2024年全省油茶产业综合产值提升至943亿元 [32][33] 近期研究报告集锦 固定收益类 - 资金面先松后紧,央行公开市场净回笼4751亿元,R001收于1.65%,较前一周上行12.9BP,R007收于1.63%,较前一周上行4.5BP [35] - 国债、国开债收益率整体上行,1年期国债收益率收于1.45%,较前一周上行3.1BP,10年期国债收益率收于1.68%,较前一周上行4.4BP,1年期国开债收益率收于1.51%,较前一周上行3.1BP,5年期国开债收益率收于1.62%,较前一周上行6.0BP,10年期国开债收益率收于1.71%,较前一周上行4.9BP [35] - 中短票及城投债收益率曲线陡峭化,中短票1年期AA+、1年期AAA及1年期AA品种收益率下行幅度较大,7年期AA+、7年期AAA和7年期AA品种收益率上行;城投债1年期AAA、1年期AA及1年期AA+品种收益率下行幅度较大 [36] - 各类型企业债券及城投债信用利差整体收敛,非上市公司发行的债券信用利差下行较多,城投债AAA品种信用利差下行6.34BP,AA+品种信用利差下行7.20BP,AA品种信用利差下行7.20BP [36] - 利率债重回窄幅震荡行情,资金收紧或宽松空间有限,二季度GDP有望保持一定韧性,政策进入观察期;信用债票息杠杆策略性价比仍较优,中短端信用债可作底仓配置,可把握交易性机会,适度拉长二永债久期增厚组合收益 [37] 市场策略 大盘缩量震荡整理,小微盘股持续调整 [5][6] 基金研究 - 5月22日,LOF基金价格指数下跌0.38%,ETF基金价格指数下跌0.54%,上证50ETF上涨0.11%,沪深300ETF下跌0.05%,中证500ETF下跌0.78%,标普500ETF下跌1.04%,日经225ETF下跌0.48%,德国30ETF下跌0.32%,法国CAC40ETF下跌0.76%,黄金ETF上涨0.15%,豆粕ETF下跌0.16%,嘉实原油LOF下跌2.15% [11] - 22日,两市ETF总成交额约2004亿元,日内银行、游戏类ETF品种表现相对突出 [11] 债券研究 - 5月22日,1年期国债到期收益率持平在1.45%,10年期国债到期收益率上行0.9bp至1.72%,1年期与10年期国债期限利差走阔1bp至27bp,1年期国开债到期收益率上行0.3bp至1.51%,10年期国开债到期收益率上行0.9bp至1.72% [13] - DR001下行3.2bp至1.48%,DR007下行0.5bp至1.57%,国债期货10年期主力合约涨0.01%,5年期主力合约收平,2年期主力合约收平 [13] - 3年期AAA级信用利差下行0.89bp至20.68bp,3年期AA - AAA级等级利差持平在30.00bp [13]
熵基科技(301330) - 301330熵基科技投资者关系管理信息20250430
2025-04-30 17:34
业绩情况 - 2024 年度公司实现营业收入 199,120.04 万元,同比增长 1.07%;归属于上市公司股东的净利润 18,304.60 万元,同比增长 3.26% [2] - 2024 年度业绩增长较大的区域主要是亚太、中东和拉美等区域 [1] 产品研发 - 脑机技术聚焦教育、医疗、养老三大核心应用场景,运用 AI 驱动的多模态数据融合技术,围绕分析诊断、检测辅助康复、治疗三大方向开展产品研发,目前正处于研究开发阶段 [1] - 基于多模态 BioCV 核心技术,推出端侧智能体 ZALO 多维感知终端,实现与 AI 智能体的功能融合;推出 Ralvie AI 新一代智慧办公 AI 智能体,专为企业和个人的工作管理与高效运营打造;推出边缘侧智能体 RS 多维搜边缘 AI 服务器,全面赋能智慧空间业务 [1] 发展战略 - 坚持内生式增长提升业绩,也会根据业务需求考虑外延式并购机会,若有与公司有协同性的优质标的,会考虑并购并及时履行信息披露义务 [1] - 持续深度融合 AI 认知技术和多模态 BioCV 核心技术,提升产品智能化水平、用户体验和运营效率 [2] - 通过 AI 赋能公司核心技术及主营业务,巩固主营业务产品发展迭代 [2] - 通过 AI 赋能公司 BioCV 核心技术,持续推动技术创新以驱动公司业务发展 [2] - 推出多品牌战略,运营“ZKTeco 熵基”、“ZKDIGIMAX 熵基云联”、“NGTeco”、“Armatura”四大品牌 [2] - 持续推进全球化经营业务的广度和深度 [2]
李建忠:大模型技术创新驱动的 AI 生态和应用演进
AI科技大本营· 2025-04-24 11:39
AI发展阶段与生物智能演化对比 - AI发展分为五个阶段:1940年代符号主义起步[4]、2012-2018年感知AI(如AlexNet突破)[4]、2018-2024年生成式AI(如GPT-1.0和ChatGPT)[4]、2024-2030年AI智能体(强化学习驱动)[4]、2030年后物理AI(具身智能)[4] - 生物智能演化对应:5.5亿年前线虫大脑诞生[7]、5.4亿年前三叶虫视觉出现[8]、5000年前人类文字发明[8]、16-17世纪科学革命[9] - 两者均呈现"大脑→视觉→语言→推理"的加速发展路径,语言是智能跃迁核心[9][10] 自然语言在智能中的核心地位 - 人类文明因文字出现而腾飞,AI领域OpenAI押注自然语言路线,通过大模型实现智能突破[12] - Anthropic研究反驳统计学派:大模型内部存在规划逻辑(非简单概率输出)、跨语言泛化能力、语言映射共享概念区域(如"苹果"的抽象概念)[13][14][15] - OpenAI首席科学家Ilya Sutskever认为"语言是对人类智能的压缩",与维特根斯坦哲学观点一致[19] 大模型技术范式演进 - 三阶段划分:预训练(知识灌输)、后训练(价值观对齐)构成"快思考",推理(逻辑思维)构成"慢思考"[21] - Scaling Law持续有效:预训练受限于语料瓶颈,但强化学习(如OpenAI o1和DeepSeek-R1)通过合成数据推动新增长曲线[23] - 推理模型成为主流范式,DeepSeek-R1开源方案推动行业转向强化学习[19][21] AI应用生态与模态演进 - 生成式AI(AIGC)与AI智能体并行发展:前者提供情绪价值(toC娱乐),后者提供成就价值(toB效率)[25] - 内容模态遵循"文字→图片→音频→视频"路径,AI降低创作门槛(博客时代作者比例1%,短视频时代37.5%)[27] - 智能体五大能力:规划(推理驱动)、工具调用(MCP协议)、协作(A2A协议)、记忆、行动[28][31][33] Agent平台与协议生态 - MCP协议连接大模型与传统软件(结构化数据/中心化架构),A2A协议实现Agent间协作(自然语言/去中心化)[33][34] - Agent平台将成为大模型厂商竞争焦点,需整合MCP和A2A协议以链接传统服务与多Agent协作[35][37][38] - 传统软件需重构为"面向智能体+自然语言交互+消除割裂"的三要素,否则面临淘汰[42] AGI发展路径与组织协作 - OpenAI定义AGI五阶段:聊天机器人→推理者→智能体→创新者→组织者[45][50] - 强化学习推动AI从"人类数据时代"(知识回声)到"经验数据时代"(突破边界)[47][49] - 高阶智能体现为组织协作,未来或出现大规模Agent协作网络(如软件开发中需求分析、编码等角色Agent化)[53][55]
AI 智能体老“崩”?DeepSeek 前员工联手李飞飞等大佬开源新框架,教会模型真正推理
AI前线· 2025-04-24 11:03
AI智能体发展现状 - 2025年被普遍认为是"AI智能体元年",基于大语言模型(如OpenAI、Anthropic、Google、DeepSeek)的智能体系统将专注于特定任务[2] - 当前64.2%的企业AI智能体仍处于试点阶段("pilot purgatory"),仅4.6%接近规模化应用[3][4] - 行业面临核心挑战:强化学习训练易崩溃,模型易陷入重复输出相似内容的"回声陷阱"现象[18][19] RAGEN系统技术突破 - 由李飞飞团队联合西北大学、微软等机构开发,聚焦提升AI在企业应用中的稳定性和可靠性[5] - 采用StarPO强化学习框架,通过"状态-思维-动作-奖励"策略优化,强调完整决策路径训练而非单次回答优化[11] - 开源框架包含三项创新机制:优先选择模型"犹豫"的交互序列、移除KL惩罚项、非对称PPO剪裁,显著提升训练稳定性[27][28][29][30] - 实验基于阿里巴巴Qwen系列开源模型(1.5/2.5版本),确保结果可复现性[14] 测试环境与评估方法 - 设计三类符号化测试环境:Bandit(风险收益推理)、Sokoban(规划能力)、Frozen Lake(适应性思考)[23] - Bandit任务要求模型通过类比推理(如将"龙"关联力量、"凤凰"关联希望)预测奖励分布,而非依赖直接概率数据[25][26] - 测试环境剥离现实先验知识干扰,纯粹评估训练所得策略的有效性[24] 企业应用现实挑战 - 训练效果三大关键因素:情境多样性、交互粒度(支持多动作/轮)、rollout新鲜度(数据与当前策略同步)[33][34] - 当前奖励机制缺陷:过度关注结果正确性而忽视推理过程质量,导致多轮任务中推理能力退化[36][38] - 技术局限性:长任务场景仍可能崩溃,符号类问题解决方案向真实业务(如发票处理)迁移存在不确定性[40] 行业影响与开源生态 - RAGEN标志着向"具备自主推理能力智能体"迈进,重构大模型训练边界认知[41] - 项目采用MIT协议开源,GitHub已获1.4k星、102分支,主要代码为Python(88.7%)和Shell(11.3%)[16][17] - 核心开发者王子涵(前DeepSeek研究员)专注大语言模型自主性与长文本理解,曾参与DeepSeek-V2项目[6]