Workflow
智能体
icon
搜索文档
AI动态汇总:DeepSeek线上模型升级至V3.1,字节开源360亿参数Seed-OSS系列模型
中邮证券· 2025-08-26 21:00
量化模型与构建方式 1 **模型名称**:DeepSeek-V3.1混合推理架构[12] **模型构建思路**:通过单一模型支持“思考模式”与“非思考模式”两种推理方式,以适应不同复杂度的任务需求,提升计算资源分配效率[12] **模型具体构建过程**:模型基于Transformer结构进行深度改造,通过动态激活不同的注意力头来实现模式切换,并采用了思维链压缩训练技术以减少推理过程中的冗余token输出[12] 在非思考模式下,模型针对简单任务提供快速响应;在思考模式下,模型启动深度推理机制,适用于代码生成、复杂决策和多步逻辑推理等任务[12] 模型还将上下文长度从64K扩展至128K,采用了“两阶段长上下文扩展方法”,在原始V3模型检查点基础上新增了8400亿tokens的训练数据,其中32K上下文扩展阶段的训练量增加了10倍,128K扩展阶段增加了3.3倍[15] 2 **模型名称**:Seed-OSS-36B[22] **模型构建思路**:以360亿参数规模和原生512K超长上下文窗口为核心,旨在实现参数效率与性能的平衡,特别优化数学推理、代码生成和智能体任务[22] **模型具体构建过程**:采用稠密模型架构,参数分布于64层网络中,隐藏层维度为5120,词汇表扩展至155K以支持多语言与专业术语处理[22] 集成分组查询注意力(GQA)机制,通过80个查询头分组共享键值对,结合旋转位置编码(RoPE)技术原生支持512K上下文窗口[22] 训练阶段采用RMSNorm归一化与SwiGLU激活函数,使用12万亿tokens的训练数据[23] 引入“思考预算”机制,允许用户动态控制模型推理深度,开发者可设定512的整数倍token预算(如512、4K、16K),模型会实时反馈剩余计算资源并调整输出策略[24] 3 **模型名称**:WebWatcher[26] **模型构建思路**:构建一个能够同步解析图像与文本信息,并自主调用多种工具链完成多步骤任务的多模态深度研究智能体[26] **模型具体构建过程**:开发团队设计了一套完整的四阶段训练框架[27] 首先通过CRAWLQA模拟人类浏览权威网站如arXiv和Wiki来构建数据,随后进行轨迹采样以构建网页操作链,接着通过监督微调学习基础工具调用与决策逻辑,最后利用强化学习在动态环境中优化长期推理能力[27] 其关键突破在于E2HQA数据合成技术,通过由简到难的策略自动生成带验证的多步推理问答对[27] 4 **模型名称**:AutoGLM 2.0[32] **模型构建思路**:通过创新的云端架构和“云手机+云电脑”技术范式,构建一个能在手机端运行的通用智能体,实现人工智能从信息交互向行动执行的关键跨越[32] **模型具体构建过程**:其核心架构建立在“终端指令-云端执行-结果反馈”的闭环系统之上,为每位用户配备专属的云端虚拟设备(基于安卓环境的云手机和Ubuntu系统的云电脑),使任务执行与用户本地设备完全解耦[33] 由智谱最新开源模型GLM-4.5与GLM-4.5V协同驱动,GLM-4.5作为“决策大脑”负责任务规划与逻辑推理,GLM-4.5V作为“视觉执行器”通过计算机视觉识别GUI界面元素并精准映射操作动作[34] 两者通过端到端异步强化学习框架协同工作:模型在数千个并行云环境中自主试错,仅依赖最终任务完成的奖励信号优化策略[34] 5 **模型名称**:WeChat-YATT(gCore)[39] **模型构建思路**:专注于强化学习(RL)和多模态模型训练,旨在提供一套易扩展、简洁、高效且可靠的大模型训练解决方案,以应对大尺寸模型、长序列输入以及大规模数据集带来的挑战[39] **模型具体构建过程**:针对大模型分布式训练中的两大核心瓶颈提出解决方案[39] 首先是多模态场景下的可扩展性瓶颈,通过引入并行控制器(Parallel Controller)机制,由多个控制器协同管理数据任务,有效分散系统压力[39] 其次是动态采样与生成式奖励计算下的效率短板,通过部分共存策略(Partial Colocation)和异步交互机制,大幅减轻模型切换损耗和长尾任务的影响[40] 支持两种资源放置模式:全员共存(Full Colocation)与部分共存(Partial Colocation)[43] 全员共存模式采用串行调度机制,Actor Rollouts、生成式奖励模型(GenRM)与训练(Train)依次串行执行,每个角色完成后主动释放计算资源;部分共存模式则适用于Rollouts与GenRM需要高频交互、动态采样的复杂任务场景,Actor Rollouts与GenRM独立部署并通过异步方式进行高效交互[43] 6 **模型名称**:Qwen-Image-Edit[47] **模型构建思路**:基于Qwen-Image基础模型,通过创新的双重编码机制与多模态扩散Transformer架构(MMDiT),实现语义与外观双重编辑能力的深度融合[47] **模型具体构建过程**:采用双路径输入设计,将原始图像同时送入Qwen2.5-VL模型和VAE编码器[47] 前者负责提取高层语义特征,实现对场景、对象关系的理解;后者则专注于保留底层视觉细节如纹理与色彩[47] 引入链式编辑机制,用户可通过多次框选指定区域逐步调整,如修正书法作品[49] 7 **模型名称**:PROMPTQUINE框架[58] **模型构建思路**:提出一种颠覆传统大语言模型提示设计范式的新方法,通过将自然语言提示修剪成看似不连贯的“乱码”来提升模型在多样化任务中的表现[58] **模型具体构建过程**:该框架采用进化搜索算法,仅利用上下文中的token资源,自主发现有效的修剪策略[58] 将提示优化重构为引导式搜索问题,将搜索空间定义为原始提示的所有可能子序列,通过动态调整子序列长度来优化不可微的任务目标函数[59] 设计了基于遗传算法的搜索机制,其中二进制token掩码作为基因型,生成的ICL提示作为表现型,通过位翻转实现变异操作,基于精英选择指导后代生存[59] 模型的回测效果 (报告中未提供相关模型的量化回测性能指标,如年化收益率、夏普比率、信息比率(IR)、最大回撤等,因此此部分省略) 量化因子与构建方式 (报告中未涉及量化因子的构建与测试,因此此部分省略) 因子的回测效果 (报告中未涉及量化因子的构建与测试,因此此部分省略)
周鸿祎谈《关于深入实施“人工智能+”行动的意见》出台感想:为智能体发展提供有力支持
证券时报网· 2025-08-26 20:21
国家人工智能政策支持 - 国务院出台《关于深入实施"人工智能+"行动的意见》 体现国家推动人工智能融入经济社会各行业各领域的顶层设计和对智能经济、智能社会的强力支持 [1] - 政策明确发挥中国数据资源丰富、产业体系完备、应用场景广阔等优势 加快培育发展新质生产力 在培育新模式新业态、安全治理等方面作出详细部署 [1] - 政策设定2027年、2030年的智能体应用普及率目标 支持智能体广泛应用和发展"智能体即服务" [3] 人工智能技术发展现状 - 大模型已走过颠覆性创新的"指数爆发期" 进入能力增强、功能修补的"改良期" 投入边际效益递减 [2] - 国产大模型包括DeepSeek、千问、Kimi、智谱等集体发力 能力进入国际第一梯队 开源普惠生态逐步形成 [2] - 企业部署大模型成本从两年前天价降至几乎为零 人工智能进入规模化商业化应用时代 带来比互联网更大的机会 [2] 智能体技术演进与应用 - 智能体通过使用各种工具和具备记忆能力 解决大模型在企业核心业务应用的差距 相当于增加"手和脚" [2] - 智能体可自主理解任务目标、规划分解任务 完成复杂工作 成为人工智能落地应用的重要形式 [2] - 2024年是大模型之年 2025年是智能体之年 智能体已成为人工智能应用重要形式 [2] 企业战略与政策契合度 - 三六零实施"安全+AI"双主线战略 与政策安排部署高度匹配 [1] - 公司打造智能体工厂 为企业提供算力、大模型、知识库、工具等八项基础设施 [3] - 提供记忆、编程、多模态输出、安全等十大增强能力 让每个企业都能打造自己的智能体 [3] 人工智能安全治理 - 政策高度关注人工智能安全可控 共12处提到"安全" 明确要求打造安全治理多元共治新格局和提升安全能力水平 [3] - AI时代网络安全形势更为严峻 网络安全运营专家稀缺的同时出现"智能体黑客" [3] - 一名人类黑客可操控数十个"智能体黑客"发起攻击 网络攻防对抗从"人与人"演变为"人与机器" 加剧攻防不对称性 [3] 企业安全技术突破 - 三六零通过"以模制模"策略 利用专业安全数据、知识、工具、工作流、大模型和智能体打造平台 [4] - 在360安全大模型"大脑"上增加"手和脚"作用 打造360安全智能体 [4] - 该智能体补齐企业安全人才短板 有效应对"智能体黑客" 实现安全能力"质"的突破 [4]
我被AI智能体坑了7块9……
21世纪经济报道· 2025-08-26 15:29
行业技术发展 - 智谱推出最新智能体AutoGLM2.0 具备独立虚拟手机界面且所有操作在云端完成 通过调用工具执行点外卖等任务 [1] - 智能体与普通AI不同 不仅能进行问答聊天 还能调用工具解决问题完成任务 如点外卖、买机票和比价格 [1] - 智能体元年已到 赛博未来的现实感越来越强 [1] 产品功能特性 - AutoGLM2.0在实测中展示丝滑操作 但出现加购奶茶优惠券导致总价增加7.9元的情况 用户未注意到额外花费 [1] - 公司通过工程策略和权限边界防止超指令行为 支付和发布等高风险步骤默认不自动执行 最终支付需用户确认 [1] - 模型能力持续优化迭代 公司已反馈加购商品券识别准确性问题 并将提升性能 [1] 行业隐私与信任 - 传统智能体工作方式需读取屏幕内容并模拟人类操作 导致用户手机屏幕上所有信息包括银行卡密码和聊天记录完全暴露 [2] - 随着智能体价值增大 行业面临对AI信任度的挑战 需明确智能体为人类工作的边界 [2]
科股早知道:英伟达发布Spectrum-XGS以太网,打造十亿瓦级AI超级工厂
钛媒体APP· 2025-08-26 08:07
英伟达推出Spectrum-XGS以太网 - 英伟达推出NVIDIA Spectrum-XGS以太网 可将多个分布式数据中心组合成十亿瓦级AI超级工厂 [2] - 该技术将位于不同地点的数百万颗GPU组合成AI工厂 突破大规模AI基础设施性能和效率极限 同时降低能耗和运营成本 [2] - 山西证券研报显示 英伟达产业链龙头(工业富联/中际旭创/Lumentum/安费诺)业绩发布后 投资者上调2026业绩预期 [2] - AI行情整体保持高位小幅震荡 建议关注光模块/铜连接/OCS/液冷/HVDC/商业航天/端侧算力等赛道 [2] 钉钉推出AI办公应用钉钉ONE - 钉钉推出下一代AI办公应用形态钉钉ONE 作为人与AI通过自然语言对话的统一入口 [3] - 钉钉ONE打造以Agent驱动的工作信息流 智能体具备自主性/交互性/反应性和适应性特征 [3] - 国盛证券研报指出 DeepSeek/OpenAI等厂商模型进步多方面利好Agent落地 [3] - 华安证券认为DeepSeek V3.1版本长期有望拉动国内算力需求 助力国产算力生态建设 赋能垂类大模型研发 [3]
国产大模型崛起 机构称智能体是大模型产业重要方向
新浪财经· 2025-08-26 08:05
钉钉下一代AI办公应用 - 钉钉推出AI办公应用形态钉钉ONE 设计为人与AI通过自然语言对话的统一入口 打造以Agent驱动的工作信息流 [1] - 智能体具备自主感知、决策执行、自主性、交互性、反应性和适应性特征 能在复杂环境中独立完成任务 标志人工智能向更高级别自主智能迈进 [1] - 国盛证券研报指出DeepSeek/OpenAI等厂商模型进步多方面利好Agent落地 Agent是当下大模型产业重要方向 未来有三种Agent类型:用户自建、厂商提供、单位为员工构建 [1] 行业前景与算力需求 - 华安证券认为DeepSeek作为国产顶尖大语言模型发布V3.1版本 长期有望拉动国内算力需求 助力国产算力生态加速建设 [1] - 国产大模型发展将赋能垂类大模型研发 利好AI Agent商业化应用 [1] 相关上市公司业务进展 - 拓尔思智能体应用在多领域加速落地 独家承揽国有五大行之一的消保智能体项目合同 [1] - 拓尔思承接中国航发重要知识智能体项目 以及某国家骨干能源企业重点AI项目 [1] - 汉得信息基于AIPaaS融合平台 在财务管理智能化、自动化和精细化上持续突破 [2] - 汉得信息创新推出AI员工助手、AI智能填单、AI海外发票识别、AI附件识别、AI审批助手等财务智能体 [2]
从"炫技"到"实用":人工智能加速落地应用
政策与市场驱动 - 国务院常务会议审议通过《关于深入实施"人工智能+"行动的意见》,大力推进人工智能规模化商业化应用,推动其在经济社会各领域加快普及和深度融合 [1] - 2024年"人工智能"首次写入政府工作报告,2025年政府工作报告强调持续推进"人工智能+"行动,政策层面进一步深化 [1] - 2025世界人工智能大会和世界机器人大会显示政策与需求形成合力,推动人工智能从技术展示走向场景落地,从单点突破迈向规模化应用 [1] 技术突破与创新 - 人工智能创新呈现群体性突破,语言大模型、多模态大模型和具身智能等领域迭代加速,推动人工智能向更高效、强智能方向演进 [2] - 技术跃迁直接体现在终端、智能体及应用层面,智能化新产品与新场景密集涌现 [2] - 智能体已能完成从信息查询到复杂任务执行的全流程工作,从对话工具进化为行动主体 [6] 智能终端市场发展 - AI终端市场全面开花,政府工作报告将"发展新一代智能终端"列为重点,加速AI手机、AI眼镜、AI电脑等产品落地 [4] - 2025年新发布旗舰手机普遍搭载百亿参数级大模型,卖点转向解决实际问题,如离线翻译准确率提升至98%、文档处理效率提升3倍 [4] - Canalys预测2025年AI手机渗透率达34%,端侧模型精简与芯片算力升级推动向中端市场渗透 [4] - IDC数据显示2025年一季度全球智能眼镜出货148.7万台,同比增长82.3%,中国市场增速达116.1% [4] - AI电脑预计2025年出货量超1亿台,占PC总出货量40%,突破传统功能,执行生成式AI任务、构建个性化知识库、实时数据分析等 [5] - 工信部数据截至2025年5月,全国手机、平板电脑等数码产品带动销售超1400亿元,规模以上智能消费设备制造业营收同比增长13.1%,利润翻倍 [5] - 上半年自研AI终端超百款,以实用体验赢得市场认可 [5] 智能终端应用场景 - 手机相册AIGC消除功能智能识别并移除冗余元素,通话界面智能摘要快速生成多语种重点,扫描文档解析复杂内容 [3] - AI眼镜超广角镜头配合AI算法分析食物成分、热量及营养,博物馆精准识别展品提供专业讲解,景区推荐美食、指引路线,支持"看一眼"支付 [3] - 人形机器人等具身智能终端实现量产提速,园区安防、工业巡检场景广泛应用,家庭服务机器人完成精准递物、环境消杀等实用任务 [5] - 海尔、海信推出搭载AI大模型的智能家电,美的、科沃斯切入人形机器人赛道 [5] 智能体发展与行业应用 - 国内厂商推动智能体快速迭代,中国移动加强AI集群化协作,推动向"感知—记忆—决策—行动"闭环能力演进,构建开放共享智能体网络 [6] - 中国电信星辰智能体助力企业实现运营效率飞跃、客户互动体验优化 [6] - 联想"城市超级智能体"实现跨部门协作,覆盖政务、医疗、交通等场景 [6] - 研华科技"智慧工厂精益生产管理智能体"实现从数据采集、整合到智能化决策全流程优化 [6] - OPPO、vivo、小米、荣耀在定制系统中嵌入"星环""PhoneGPT"等智能体,打通搜索、外卖、打车、社交消息等高频场景,实现跨APP动态调度 [6] - 个人助理理解复杂指令并自主完成多步骤任务,如预订高铁票、预约接站车辆并告知家人行程 [7] - 教育领域AI导师实现个性化学习路径规划,北京12所试点学校应用后学生数学成绩显著提升 [7] - 医疗领域智能体辅助手术系统降低操作失误率,上海仁济医院骨科导航机器人完成高难度脊柱手术 [7] - 新药研发周期从10年压缩至1.5年,织布机瑕疵识别准确率提升3倍,金融风控毫秒级识别欺诈交易 [7] 行业影响与趋势 - 人工智能完成价值蜕变,从酷炫概念吸睛技术变为解决实际问题的实用工具,以终端、智能体等形式融入生产生活方方面面 [1] - 智能网联汽车、智能穿戴、智能家居等新一代终端持续升级,智能机器人进工厂、进家庭渐成趋势 [2] - 各类智能体深度融入生产生活,成为经济增长的新引擎 [2] - 人工智能从效率工具到共生伙伴,从实验室走向产业深处,从概念创新变为推动经济社会发展的现实力量 [7]
特斯拉大模型“上车”细节曝光:语音助手接入豆包与DeepSeek;全球最轻的MR头显发布,双目8K,价格有望9999?丨AI周报
创业邦· 2025-08-23 18:09
国内AI模型与产品更新 - DeepSeek V3.1发布 采用混合推理架构 用户可在思考模式与非思考模式间切换 输出token数减少20%-50% [4] - 新模型在工具调用和智能体任务中表现提升 编程与搜索Agent测评优于前代 基础模型新增8400亿tokens训练 [6] - API价格上调 自9月6日起取消夜间优惠 输入价格缓存命中为0.5元/百万tokens 未命中4元 输出价格由8元涨至12元/百万tokens [6] - 字节跳动开源大型语言模型Seed-OSS-36B 包含360亿参数 分布在64层网络中 支持15.5万词表 最大上下文长度可达512k tokens [12] - 百度蒸汽机2.0视频生成大模型上线 首次实现多人有声视频一体化生成 Turbo版、Lite版、Pro版及全系有声版全面开放 [12] - 智谱AutoGLM 2.0升级为全球首个手机Agent 开创Agent+云手机/云电脑新技术范式 由国产模型GLM-4.5、GLM-4.5V驱动 [19] - 百度文库网盘发布通用智能体GenFlow2.0 支持超100个专家智能体同时工作 3分钟并行完成超5项复杂任务 生成速度超主流同类型产品10倍 [25] 智能硬件与机器人进展 - vivo发布首款混合现实头显vivo Vision探索版 设备重量398克 搭载第二代骁龙XR2+平台 配备双目8K Micro-OLED屏幕 [8] - 智元机器人发布新款轮式双臂机器人灵犀X2-W 专为作业智能打造 [10] - 智元机器人推出三款四足机器人产品D1 Pro、D1 Edu和D1 Ultra D1 Pro重15kg 最大奔跑速度3.7m/s 能完成35cm高度跳跃 最大续航2小时 [23] - 智元机器人发布OmniHand 2025灵巧手 灵动款指导价1.48万元 首发限时9800元 灵动触觉款首发线上价1.48万元 [25] - 北京人形机器人创新中心具身天工Ultra获得世界机器人运动会100米短跑冠军 成绩21.50秒 采用全自主导航系统 [29] - Halo将推出始终在线AI眼镜 定价249美元 能实时聆听、录音并转录对话 实时显示相关信息 [35] - Meta配备显示屏的AI眼镜Hypernova将于下月发布 起售价或降至约800美元 [40] 企业合作与市场动态 - 特斯拉语音助手接入火山引擎Doubao大模型和DeepSeek Chat 实现更自然智能座舱交互体验 [7] - 国内多数AI模型训练使用中文数据占比超60% 有的模型达80% 高质量数据集超3.5万个 总体量相当于中国国家图书馆数字资源总量的140倍 [15][27] - 阿里巴巴前合伙人蔡景现以技术合伙人身份加入贝联珠贯 贝联珠贯致力于提供大数据、AI基础设施产品服务 [21] - 字节跳动辟谣与芯原股份并无AI芯片相关合作 [17] - 智己L4级Robotaxi上海国际旅游度假区专线正式运营 用户可通过享道出行APP一键呼叫免费体验 [17] - 北京AIGC视听产业创新中心启用 朝阳区登记注册文化企业达10万家 其中影视企业3274家 上半年规模以上影视企业实现收入超百亿元 [17] - IDC报告显示2024年中国大模型开发平台市场规模达16.9亿元人民币 市场前六厂商包括百度智能云、阿里云、商汤科技、智谱AI、电信AI及稀宇科技 [19] 海外AI发展与融资 - Meta回应冻结AI部门招聘传闻 称只是基本组织规划调整 将暂停部分招聘工作 [33] - Grok超37万条聊天记录泄露 用户上传照片、电子表格和其他文档被公开发布 [33] - 马斯克表示Grok 5将于下个月开始训练 特斯拉Autopilot V14将于下个月发布 [33] - 英特尔市值本月上涨28% 增加约240亿美元 动态市盈率达53倍 为2002年初以来最高 [37] - Databricks宣布进行K轮融资 估值超1000亿美元 较7个月前620亿美元估值大幅提升 [37] - 软银集团与英特尔签署20亿美元投资协议 软银以每股23美元价格购买英特尔普通股 [38] - ChatGPT移动应用自2023年5月推出以来已创造20亿美元收入 今年收入13.5亿美元 同比增长673% 平均每月营收接近1.93亿美元 [39] - OpenAI拟按5000亿美元估值出售约60亿美元股权 年化经常性收入已攀升至130亿美元 预计年底突破200亿美元 ChatGPT付费企业用户数量增长至500万 [40][42] - 本周全球披露AI融资事件19起 已披露融资金额事件14个 总融资规模115.87亿元人民币 平均融资金额8.28亿元人民币 [46] - 本周国内AI领域已披露融资总额6905万元人民币 融资额最高的为魔仓机器人 完成数千万人民币A轮融资 [53] - 本周海外AI领域已披露融资总额115.18亿元人民币 融资额最高的为Cognition 完成5亿美元C轮融资 [55]
在OpenAI炼Agent一年半,回国做出首个开源Agent训练框架!这个30岁清华天才却说:创业不是技术命
AI前线· 2025-08-23 13:32
吴翼个人背景与职业经历 - 吴翼拥有姚班、伯克利、OpenAI、清华等亮眼背景,是ACM世界奖牌得主和IOI教练,曾亲历Facebook 2012崛起、字节跳动2016-2018高速成长期以及OpenAI爆火前关键阶段 [2] - 创立的边塞科技在2024年被蚂蚁收购,团队4年规模化强化学习成果积累至开源项目AReaL,这是一个完全异步的强化学习训练框架,专为大型推理模型设计,在Github已收获2.4k stars [2] - AReaL完全围绕Agent打造,定位独特,自称没有竞品 [2] OpenAI工作经历与决策文化 - 加入OpenAI源于Google Headcount限制,OpenAI作为非盈利机构无此限制,面试后第二周即获录用 [4] - OpenAI内部以evidence驱动决策,强调bottoms-up、快速迭代、无master plan的文化,研究员被当作mini-CEO [12] - GPT系列工作较bottom up,如GPT早期由Alec Recford一人主导,ChatGPT原型几人开发后爆火,不在OpenAI原计划内 [12] - 团队目标明确后不过度规划,激进寻找evidence并调整迭代,资源富裕与否不影响组织逻辑,AI时代放大穷团队能力 [13] - Codex团队7周从0到1推出产品,体现创业精神,但创新是长跑,需慢跑寻找evidence后冲刺,盲目冲刺可能错过evidence [14][15] 强化学习与竞赛观点 - ICPC、IOI等竞赛被类比为sports programming,类似电子竞技,涉及技巧和心理因素,非纯粹算法思维和编程速度考验 [6] - 大模型在IMO、IOI等竞赛挂零因模型未ready即推出,通用推理模型如Google/OpenAI已实现IMO金牌,专用模型如字节也取得不错成绩,大模型攻克竞赛是迟早的事 [6] - Gemini和OpenAI在IMO夺金明确归功于RL训练,竞赛未来参考围棋/Dota发展,因AI出现可能产生新规定和训练方式变革 [7] 创业经历与行业观察 - 中国创业公司几乎无机会走OpenAI路线,创业需看客观机会和势,非主观导向,当前中国非技术创业好时机,纯AI技术创业需慎重 [19][25] - 边塞科技创业期间困扰多属人性层面,非技术或商业问题,团队私下交流多,强调共同做大蛋糕而非分蛋糕 [27] - 创业非技术命题,时间窗口关键,决策抓住时间点即成功,错过非主观错误,建议多尝试以提高概率 [28] - 硅谷资源更多,对技术创业者更友好,国内创业是身心灵修炼场,中国互联网时代创造过奇迹,AI时代仍有机会 [17] AReaL框架与技术路线 - AReaL是面向大模型智能体训练的强化学习框架,目标让人更快训练出更好Agent模型,一切围绕Agent设计,自称无竞品 [8][36] - 团队从2020年开始做开源规模化强化学习工作,从MAPPO、SRL、ReaLHF到AReaL一脉相承,均围绕RL scaling [34][35] - 好的RL框架需好且快(产出SOTA模型且快)和好用(用户简单修改代码完成定制),AReaL-lite发布后实现全面重构 [37] - 开源RL训练框架基本是中国人天下,但头部公司如OpenAI、Anthropic有更好infra和团队,资源更优 [38] - AReaL围绕Agent打造,但也可训练代码模型和泛化模型,Agent应用不一定需RL训练,但资源成本下降后RL可训练更好Agent模型 [39] Agent技术未来展望 - Multi-Agent是必要方向,因Agent workflow复杂需多智能体配合,智能体普及后交互和算法逻辑更复杂,带来更多算法和infra机会 [41] - Agent将成为大模型交互形式主流,从被动变主动,自主探索和工作时间空间扩大,算法提升空间大,新范式一定会出现 [42]
上市公司积极布局智能体
中国证券报· 2025-08-23 04:10
行业趋势 - 2025年被业内视为智能体元年 随着大模型能力提升和调用成本下降 智能体在医疗健康 金融智能化 电商数字人等垂直领域加速应用[1][2] - 生成式AI迈入以智能体为主导的新发展阶段 智能体推动人机交互方式从被动对话模式演进为主动思考-行动范式 重塑企业组织 商业模式和个体生产力[3] - 通用智能体难以实现 专业智能体更具生命力 需要多个基座模型协作提供智力支撑 更需要专业知识和数据支持[3] 技术进展 - DeepSeek发布V3.1版本 新模型能在更短时间内给出答案 工具使用与智能体任务表现有较大提升[1] - 微软上线Deep Research公开预览版 这款与OpenAI合作开发的智能体产品可实现复杂研究任务全流程自动化[2] - 飞书发布AI开发全家桶飞书开发套件 包含飞书妙搭 飞书aPaaS 飞书aily等[2] 公司布局 - 广电运通构建望道行业大模型 依托大模型做智能体应用 在数字审计 政务服务等场景实现落地[2] 通过悟道知识中台打造智慧审计 政务问询 设备运维等大模型智能体应用[3] - 远光软件发布知识智能问答 表单智能填报 业务智能审核等企业级通用智能体 实现对话即操作 指令即办理的全新交互体验[3] - 麒盛科技旗下舒福德品牌发布AI睡眠智能体AI小舒 通过AI算法 传感器创新与医疗资源整合 将智能床从被动监测向主动健康管理提升[3] - 朗新集团发布朗新九功AI能源大模型 深度融合时序预测与AI智能体双引擎技术 集成九大核心功能 实现从精准预测到智能决策的闭环优化 已广泛应用于广东 山东 浙江等电力现货市场核心区域[4] - 大华股份更新星汉大模型2.0版本 构建具备语言 多模态 视觉三大能力的智能体形态 推出端侧 边缘侧 云和中心侧的全栈大模型系列产品 相关方案已在城市治理 电力等行业落地[4]
A04·公司纵横
中国证券报· 2025-08-23 04:09
大模型技术发展 - 大模型能力持续提升 [1] - 技术迭代推动智能体应用场景扩展 [1] 上市公司战略布局 - 上市公司积极布局智能体领域 [1] - 行业加大技术投入与生态建设 [1]