Agent

搜索文档
生成式 AI 的发展方向,应当是 Chat 还是 Agent?
自动驾驶之心· 2025-07-11 19:23
Chat与Agent的区别 - Chat是主要由"大脑和嘴"构成的智能体,专注于信息处理和语言交流,如ChatGPT这样的系统,能理解查询并给出连贯回答但不直接执行任务 [1] - Agent是具有"手、脚"的智能体,能进行思考、决策并执行具体任务 [2] - Chat强调"说",Agent强调"做" [3] 技术发展趋势 - 人类对"让机器替人干活"的需求持续存在,OpenAI通过plugin、Function Calling、Assistant API等动作推动LLM从纯对话向任务执行扩展 [4] - 智能音箱发展路径类似:从基础语音功能(如播放音乐)逐步扩展到支付互通、智能家居控制、儿童教育等场景,成为智能生态核心 [4][5] - AI+RPA技术推动智能客服向数字员工进化,体现AI从单一对话到"说做结合"的融合趋势 [5] - 未来生成式AI将融合Chat和Agent特点,形成兼具高质量对话与复杂任务执行能力的自动化系统 [6] AI Agent的技术变革 - 颠覆传统软件开发模式:从预先定义逻辑转向由LLM自主支配运行,实现运行时学习与调优 [7] - 核心模块包括Memory(记忆)、Tools(外部工具)、Planning(计划)和Action(行动) [7] - 当前学习路径分为OpenAI技术路线和开源技术路线,建议技术人员选择一条深入实践 [9] 典型AI Agent项目案例 - AutoGPT:可拆解用户目标为子任务,通过搜索、脚本执行等方式自主完成任务 [11][12] - JARVIS:采用"模型选择"机制,调用Huggingface专家模型处理多模态任务 [13][15] - MetaGPT:模拟软件公司结构,分配产品经理、工程师等角色协作完成编码任务 [16] 开发者生态与机会 - 工具/平台成熟为个体开发者提供新舞台,使AI原生应用开发门槛降低 [16] - 自动驾驶领域已形成近4000人社区,覆盖300+企业与科研机构,涉及30+技术栈(如BEV感知、SLAM、轨迹预测等) [19][21]
Kimi新功能Deep Researcher海外引发热议 还被马斯克直播点名
搜狐财经· 2025-07-10 18:15
模型发布 - 马斯克旗下公司xAI正式发布最新旗舰模型Grok 4 [1] HLE测试表现 - OpenAI Deep Research在HLE测试中创下26.6%的新纪录,较之前最高分(o3-mini的13%)翻倍 [4] - Google Gemini 2.5 Pro在HLE测试中得分为21.64%,优于o3(20.32%)但落后于OpenAI Deep Research [4] - 月之暗面Kimi-Researcher以26.9%的成绩创下HLE测试新纪录,超越OpenAI Deep Research和Google Gemini [4] - AI行业在一年内HLE测试成绩从不足5%提升至超过25% [4] Kimi DeepResearcher产品特性 - 在执行研究任务时平均进行23次推理,筛选高质量信息并剔除冗余内容 [6] - 具备自动生成分析结论能力,拥有文献严谨性,可有效减少模型幻觉 [6] - 在xBench DeepSearch基准测试中达到69%的优异表现 [4] 行业评价 - AI从业者高度评价Kimi DeepResearcher,认为其视觉效果出色且研究能力精准 [3] - 海外研究者将Kimi列为中国AI领域前三强,与DeepSeek、字节跳动并列 [4] - 行业人士指出Kimi是基于模型的Agent产品,而非简单工具套用 [4]
让AI「真落地」,组织才会成为真正的智能体
36氪· 2025-07-10 17:00
飞书AI产品发布会核心观点 - 公司通过AI全家桶产品实现"组织熵减",目标是让一线员工拥有AI助手自助解决业务卡点[1][4] - 多维表格作为拳头产品实现10倍性能提升,单表容量达1000万行,加载速度从7.4秒降至0.94秒[12][14] - 新推出的飞书妙搭允许用户通过自然语言指令生成AI应用,如电商业务看板[19][20] - 公司提出AI应用成熟度模型(M1-M4),现有产品如知识问答达M3级,飞书妙记达M4级[33][34][40] 行业渗透与竞争格局 - 在新能源汽车行业渗透率达60%(销量前30品牌中),茶饮行业上市品牌覆盖5/6家[6] - 已获得DeepSeek、智元机器人等AI领域新客户[8] - 面临钉钉直接竞争,后者在发布会前突击上线AI表格产品[10] 多维表格升级亮点 - 处理能力可支持小型电商平台,直接管理1000万条SKU/订单数据[14] - 新增"应用模式"提供丰富组件,可快速搭建销售/人力/库存等管理系统[21][23] - 伊芙丽案例显示:98年员工用该产品搭建美妆业务系统,支撑全国数千人运营,节省百万开发费用[26] Agent战略布局 - 推出企业级Agent开发套件,飞书Aily支持私域数据配置,已落地公牛集团客服系统[36][37][39] - 明确Agent分级标准,解决行业概念模糊问题[29][32] - 基于aPaaS平台实现AI全流程助力业务系统开发[41]
真·能干活的Agent来了,飞书海量上新多款AI产品 | 最前线
36氪· 2025-07-09 19:32
AI行业趋势 - AI关注重点从大模型转向实际落地应用 企业更看重如何通过AI实现降本增效 [1] - 协同办公赛道竞争加剧 各平台加速布局AI和具身智能领域以抢占新用户心智 [6] 飞书产品更新 - 飞书发布知识问答、AI会议、飞书Aily、飞书妙搭等多款AI产品 并对多维表格等现有产品进行升级 [1][6] - 多维表格月活超1000万 单表容量提升至1000万热行(较2024年增长10倍) 加载速度从7.4秒优化至0.94秒(2万行规模) [11] - 新增"飞书妙搭"功能 用户可通过自然语言指令一键生成AI应用 并支持应用模式快速装修 [17][18] 行业渗透数据 - 新能源汽车销量前30品牌中60%使用飞书 茶饮行业6家上市品牌中5家为飞书用户 [6] - 飞书已拿下DeepSeek、智元机器人等AI领域新客户 [6] 竞品动态 - 钉钉突击上线AI表格产品 飞书宣布将在企微、钉钉平台上线多维表格功能 [10] Agent技术进展 - 飞书推出AI应用成熟度模型(M1-M4) 知识问答达M3级 飞书妙记达M4级 [24][29] - 飞书Aily支持私域数据配置 已在公牛集团落地客服Agent 接待能力提升30倍 [27] - 飞书aPaaS实现AI全程助力开发 通过AI Coding+PaaS优化效率与稳定性 [28] 产品技术突破 - 多维表格可替代中小企业的销售、客服、人力等系统 成为大模型+真实业务场景试验场 [16] - 应用模式内置丰富组件(列表/Tab/轮播图等) 使AI应用更接近可交互系统 [18][20]
云从科技业绩会:在泛AI领域探索新增长点
证券时报网· 2025-07-07 15:28
公司战略与业务布局 - 公司坚持前沿创新与实用落地深度结合的战略方向,以期为投资者带来可持续价值增长 [1] - 人工智能产业已从建设期步入运营期,公司认为Agent技术将带来更多有价值的产出和机会 [1] - 公司业务布局涵盖智慧治理、智慧金融、智慧出行、智慧商业及泛AI五大板块,正在深耕高毛利领域和强化产品策略 [1] - 公司自主研发的从容大模型在国际权威评测平台OpenCompass最新全球多模态榜单中以80.7分的综合成绩登顶榜首 [1] - 公司将通过混合模型(开源+闭源)和混合云(公有云+私有化部署)模式发挥视觉和多模态模型优势 [1] - 2025年经营策略包括技术落地与项目积累提升营收能力、强化回款与成本控制优化现金流、推进业务"双曲线"布局 [3] 财务与运营情况 - 公司核心业务"人机协同操作系统"2024年收入同比下跌55.86%,主要因主动收缩高投入、周期长、资金效率低的项目 [1] - 公司正通过优化成本结构、提高运营效率、加大盈利性项目推进力度来改善现金流状况 [1] - 2025年股权激励方案业绩考核目标为以2024年营业收入为基数,当年营业收入增长率不低于25% [2] - 公司持续致力于优化业务结构,加强成本控制,并积极拓展市场,目标实现扭亏为盈 [3] 研发与人才管理 - 公司核心技术人员张岭和姜迅相继离职,引发投资者对技术人员稳定性的关注 [1] - 公司将灵活调整研发团队规模,吸引顶尖人才,优化团队结构以保障研发效率和创新能力 [2] - 公司正推进研发投入优化工作,集中资源于核心研发领域,强化技术优势 [2] - 公司将通过股权激励计划和优化考核机制等措施加强人才梯队建设 [2] 行业与市场展望 - 泛AI行业收入占比增长显示公司在新行业的拓展成效 [1] - 2025年上半年小而美的应用需求逐步涌现,产品正在进行迭代 [1] - 公司在多个行业的人工智能模型和应用试点中看到机会和趋势 [3] - 公司产品和业务拓展有序进行,部分行业试点已取得成功 [2]
【兴证计算机】Agent:数据和场景为王,大模型加速驱动
兴业计算机团队· 2025-07-06 21:49
周观点聚焦 - 当前市场关注重点公司中报数据及产业边际变化,海外AI龙头如英伟达、微软及纳指创新高对国内科技股风险偏好形成正向支撑 [2] - 建议重视AI赛道龙头及中报预喜公司,中报预告窗口期成为关键观察节点 [2] AI产业催化 - 算力侧:沐曦股份、摩尔线程科创板首发申请于6月30日获上交所受理 [2] - 大模型侧:智谱获浦东创投集团和张江集团10亿元战略投资,Grok 4、GPT 5等重磅模型有望陆续发布 [2] - 世界人工智能大会将于7月26日在上海召开,产业催化密集释放 [2] Agent领域布局 - 北京市发布12个AI应用场景"揭榜挂帅"项目,总预算1.1亿元,推动Agent应用落地 [4] - Agent板块调整后投资性价比提升,建议聚焦拥有数据、场景及客户卡位优势的细分领域领军企业 [4] - 大模型持续迭代加速AI应用落地,数据和场景成为Agent领域竞争核心 [3][4]
离开百川去创业!8 个人用 2 个多月肝出一款热门 Agent 产品,创始人:Agent 技术有些玄学
AI前线· 2025-07-04 20:43
核心观点 - 徐文健从百川智能离职后创立火星电波,专注于AI音频内容生成领域,推出产品ListenHub [10][12][19] - 公司采用订阅制商业模式,重点布局海外市场,目前注册用户约1万,DAU超1000 [25][28][29] - 团队强调组织文化和价值观建设,采用扁平化管理模式,现有8名成员 [15][16][33] 创业历程 - 徐文健经历两次创业失败后加入百川智能,期间接触Agent技术并确立创业方向 [4][5][6][7][10] - 在百川期间主导开发国内第一代Agents Workflow,后因项目叫停选择离职创业 [10] - 与合伙人冯雷成立火星电波,两人在性格和专长上形成互补 [12][15] 产品技术 - ListenHub包含三个核心引擎:意图分析引擎、内容生成引擎和音频转换引擎 [19] - 产品研发周期仅2个月,性能较初期Demo提升5-6倍 [19][23] - 采用多模型组合策略,在音频生成质量上优于部分开源工具 [20][21] - 技术路线分三阶段推进:有人味→个性化→垂直领域深度定制 [14] 团队管理 - 招聘更看重成长性和自驱力而非学历背景,团队成员从大专到名校硕士均有 [15] - 采用目标导向型管理模式,强调文化价值观统一,实现高度自主运作 [16][17] - 团队规模控制在20人以内,追求"小而美"的组织形态 [33] 市场策略 - 避开与大厂直接竞争,定位为AI应用公司而非基础设施提供商 [31][32] - 初期通过AI播客场景切入,未来计划拓展完整的内容消费链路 [27][28] - 海外市场获20多位KOL自发推广,商业化重点放在付费意愿更强的国际用户 [29] 行业观察 - 认为Agent技术与大模型同等重要,将重构内容生产消费方式 [10][12] - 指出大模型公司与应用公司的本质差异在于专注领域不同 [32] - 观察到新一代AI创业者具备全球化视野,从创业初期就布局海外 [29]
喝点VC|红杉美国对谈OpenAI前研究主管:预训练已经进入边际效益递减阶段,其真正杠杆在于架构的改进
Z Potentials· 2025-07-04 11:56
AI技术发展现状与趋势 - 预训练、后训练和推理构成AI发展的"三位一体"框架 预训练已进入边际效益递减阶段 真正杠杆在于架构改进 后训练聚焦模型个性与智能表现 推理能力训练则引导AI自主摸索链式思维[4][8] - 2025年成为"推理之年" 各大实验室重点转向推理优化 但后续进展将越来越困难[5][7] - 预训练收益递减源于基本规律 模型智能水平与计算资源呈对数线性增长 提升智能需指数级增加计算资源[7][8] Agent商业模式与竞争格局 - Agent价格将趋近计算使用成本 普适性和性价比将颠覆传统人力密集型领域[6][18] - 简单重复性任务由AI完成 复杂需人类理解的服务保持价值稀缺性[19][26] - 创业公司机会在于构建网络效应和规模经济 而非依赖高价Agent[21][26] 机器人技术突破与商业化 - LLMs为机器人提供低成本语言接口 结合强大视觉编码器 赋予处理通用任务的先发优势[24][25] - 机器人领域正处于研究最后阶段 距离商业化仅数月到数年时间[22][25] - 技术突破使机器人能快速解决多样化任务 如叠衣服、搬运纸箱等[25] 编程领域变革与未来趋势 - 编程发展呈现非线性加速 未来将形成混合模式:人类主导设计+Agent自动编码[32][34] - Agentic工程师处理明确结果的任务如bug修复、代码重构 人类负责需"品味"的设计工作[34][35] - 关键挑战在于如何让Agent理解代码库 目前仍需人类进行高层次设计[33][35] 专有数据价值重估 - 专有数据价值被高估 "无限智能、无限耐心"的Agent可从公开数据重构替代信息[29][30] - 真正有价值的专有数据是具体客户的深度个性化信息 可辅助专业决策而非训练技能[31] - 垂直领域专属模型表现普遍不如下一代通用模型 因综合能力远超单纯记忆[29] 企业管理与文化构建 - 技术团队应消除研究员与工程师界限 建立平等环境促进全栈理解[37][38] - 管理者核心是真诚关心团队成员 建立忠诚度才能推动困难决策[50][51] - 高绩效人才管理需平衡个人创作欲望与团队协作目标[52] AI教育应用与人才培养 - AI最佳应用是帮助用户成为领域专家 同时减轻重复性工作负担[42][43] - 教育应聚焦学习过程和自主能动性培养 而非特定技能[43][44] - 即时响应式学习能抓住最佳学习时机 大幅提升教育效果[46] 安全防御新范式 - AI使攻击能力提升 防御措施需更加自主化和智能化[53] - 企业需重构业务流程以适应自主安全系统 这为创业公司创造机会[53]
MiniMax 进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 22:00
大模型行业趋势 - 大模型技术以常规技术乘十的速度进化,颠覆互联网时代的生态护城河、资金壁垒和规模效应,使创业公司也能站上世界舞台中心 [1] - 行业生存法则已转变为"创新至上",传统互联网玩法彻底失效,淘汰周期缩短至季度为单位 [2][3] - 百模大战后,Open AI、Anthropic、MiniMax、DeepSeek等创业公司占据SOTA榜单大半,巨头优势被灵活创新机制瓦解 [10] MiniMax技术突破 视频模型Hailuo 02 - 参数量较前代增长3倍,分辨率达原生1080P,支持10秒高清内容生成,涵盖复杂物理交互与专业级运镜 [6] - 在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅其1/9 [7] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [9] 大模型M1 - 4560亿参数,原生支持100万token输入(DeepSeek R1的8倍)和8万token输出(超Gemini 2.5 Pro) [11] - 采用混合注意力机制(1/8自注意力+7/8线性注意力),实现长上下文窗口技术突破 [16] - CISPO算法使强化训练仅需3周+512块H800 GPU(成本53万美元),推理算力为DeepSeek R1的25% [17][19] 商业化与生态构建 Agent应用创新 - Hailuo Video Agent支持超百种视频模板,实现创意构思到成片的全链路生产,连续6个月全球视频生成AI榜首 [21][23] - 通用Agent可完成长程复杂任务(如网页搭建、PPT制作),内部使用率达50%,具备跨模态理解与生成能力 [24] - 基座模型与Agent形成技术闭环,性能优化与成本控制优势显著 [25] 公司发展路径 - 2022年初成立并提前布局MoE模型,2024年推出国内首个MoE大模型 [26] - 开源Lightning Attention技术,突破Transformer架构限制 [26] - 创新驱动战略使M1半年内登顶开源模型全球第二,通用Agent解决跨模态长距离任务难题 [27][28]
MiniMax进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 21:54
大模型行业特征 - 大模型技术发展速度极快,3年时间从默默无闻到改变世界,具备工业革命特质 [2] - 行业竞争激烈,头部玩家快速更迭,百亿资本投入可能迅速沉寂 [2] - 传统互联网的护城河、资金壁垒、规模效应失效,创业公司有机会站上世界舞台 [2] - 行业生存法则为创新至上,淘汰周期以季度为单位 [3][4] MiniMax的技术突破 - Hailuo 02模型参数较Hailuo 01增长3倍,视频分辨率提升至原生1080P,支持10秒高清内容生成 [9] - Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅1/9 [10][11] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [12] - M1模型支持100万token输入长度,是DeepSeek R1的8倍,输出token达8万个打破Gemini 2.5 Pro记录 [16] - M1在工具使用场景(TAU-bench)中领跑所有开源权重模型,30多轮长链路任务稳定性极高 [18] 创新架构与训练方法 - 早期探索MoE架构和混合注意力机制,1/8用自注意力,7/8用自创Lightning Attention [20] - CISPO算法替代传统PPO/GRPO,仅用3周时间、512块H800 GPU完成强化学习训练,成本53万美元 [21][23] - 生成10万token时推理算力仅需DeepSeek R1的25%,数学和编程任务效率更高 [23] Agent应用创新 - Hailuo Video Agent支持超百种视频模板,涵盖艺术片、广告片等体裁,打通完整视频生产链路 [28] - MiniMax Agent具备长期任务规划能力,内部使用60天,50%员工用于PPT制作、网页搭建等 [31] - Agent能生成复杂跳转逻辑网页,支持多模态理解与生成,完成动画、广告片等任务 [31] 公司发展历程 - 2022年初成立,早于ChatGPT引爆全球的时间 [33] - 2023年将80%算力投入MoE开发,2024年初推出国内首个MoE大模型 [34] - 2024年1月开源Lightning Attention技术,6月M1模型拿下开源模型全球第二 [34] - 持续探索更高智能水平,创新驱动发展 [35][36]