Agent
搜索文档
让AI「真落地」,组织才会成为真正的智能体
36氪· 2025-07-10 17:00
飞书AI产品发布会核心观点 - 公司通过AI全家桶产品实现"组织熵减",目标是让一线员工拥有AI助手自助解决业务卡点[1][4] - 多维表格作为拳头产品实现10倍性能提升,单表容量达1000万行,加载速度从7.4秒降至0.94秒[12][14] - 新推出的飞书妙搭允许用户通过自然语言指令生成AI应用,如电商业务看板[19][20] - 公司提出AI应用成熟度模型(M1-M4),现有产品如知识问答达M3级,飞书妙记达M4级[33][34][40] 行业渗透与竞争格局 - 在新能源汽车行业渗透率达60%(销量前30品牌中),茶饮行业上市品牌覆盖5/6家[6] - 已获得DeepSeek、智元机器人等AI领域新客户[8] - 面临钉钉直接竞争,后者在发布会前突击上线AI表格产品[10] 多维表格升级亮点 - 处理能力可支持小型电商平台,直接管理1000万条SKU/订单数据[14] - 新增"应用模式"提供丰富组件,可快速搭建销售/人力/库存等管理系统[21][23] - 伊芙丽案例显示:98年员工用该产品搭建美妆业务系统,支撑全国数千人运营,节省百万开发费用[26] Agent战略布局 - 推出企业级Agent开发套件,飞书Aily支持私域数据配置,已落地公牛集团客服系统[36][37][39] - 明确Agent分级标准,解决行业概念模糊问题[29][32] - 基于aPaaS平台实现AI全流程助力业务系统开发[41]
真·能干活的Agent来了,飞书海量上新多款AI产品 | 最前线
36氪· 2025-07-09 19:32
AI行业趋势 - AI关注重点从大模型转向实际落地应用 企业更看重如何通过AI实现降本增效 [1] - 协同办公赛道竞争加剧 各平台加速布局AI和具身智能领域以抢占新用户心智 [6] 飞书产品更新 - 飞书发布知识问答、AI会议、飞书Aily、飞书妙搭等多款AI产品 并对多维表格等现有产品进行升级 [1][6] - 多维表格月活超1000万 单表容量提升至1000万热行(较2024年增长10倍) 加载速度从7.4秒优化至0.94秒(2万行规模) [11] - 新增"飞书妙搭"功能 用户可通过自然语言指令一键生成AI应用 并支持应用模式快速装修 [17][18] 行业渗透数据 - 新能源汽车销量前30品牌中60%使用飞书 茶饮行业6家上市品牌中5家为飞书用户 [6] - 飞书已拿下DeepSeek、智元机器人等AI领域新客户 [6] 竞品动态 - 钉钉突击上线AI表格产品 飞书宣布将在企微、钉钉平台上线多维表格功能 [10] Agent技术进展 - 飞书推出AI应用成熟度模型(M1-M4) 知识问答达M3级 飞书妙记达M4级 [24][29] - 飞书Aily支持私域数据配置 已在公牛集团落地客服Agent 接待能力提升30倍 [27] - 飞书aPaaS实现AI全程助力开发 通过AI Coding+PaaS优化效率与稳定性 [28] 产品技术突破 - 多维表格可替代中小企业的销售、客服、人力等系统 成为大模型+真实业务场景试验场 [16] - 应用模式内置丰富组件(列表/Tab/轮播图等) 使AI应用更接近可交互系统 [18][20]
【兴证计算机】Agent:数据和场景为王,大模型加速驱动
兴业计算机团队· 2025-07-06 21:49
周观点聚焦 - 当前市场关注重点公司中报数据及产业边际变化,海外AI龙头如英伟达、微软及纳指创新高对国内科技股风险偏好形成正向支撑 [2] - 建议重视AI赛道龙头及中报预喜公司,中报预告窗口期成为关键观察节点 [2] AI产业催化 - 算力侧:沐曦股份、摩尔线程科创板首发申请于6月30日获上交所受理 [2] - 大模型侧:智谱获浦东创投集团和张江集团10亿元战略投资,Grok 4、GPT 5等重磅模型有望陆续发布 [2] - 世界人工智能大会将于7月26日在上海召开,产业催化密集释放 [2] Agent领域布局 - 北京市发布12个AI应用场景"揭榜挂帅"项目,总预算1.1亿元,推动Agent应用落地 [4] - Agent板块调整后投资性价比提升,建议聚焦拥有数据、场景及客户卡位优势的细分领域领军企业 [4] - 大模型持续迭代加速AI应用落地,数据和场景成为Agent领域竞争核心 [3][4]
离开百川去创业!8 个人用 2 个多月肝出一款热门 Agent 产品,创始人:Agent 技术有些玄学
AI前线· 2025-07-04 20:43
核心观点 - 徐文健从百川智能离职后创立火星电波,专注于AI音频内容生成领域,推出产品ListenHub [10][12][19] - 公司采用订阅制商业模式,重点布局海外市场,目前注册用户约1万,DAU超1000 [25][28][29] - 团队强调组织文化和价值观建设,采用扁平化管理模式,现有8名成员 [15][16][33] 创业历程 - 徐文健经历两次创业失败后加入百川智能,期间接触Agent技术并确立创业方向 [4][5][6][7][10] - 在百川期间主导开发国内第一代Agents Workflow,后因项目叫停选择离职创业 [10] - 与合伙人冯雷成立火星电波,两人在性格和专长上形成互补 [12][15] 产品技术 - ListenHub包含三个核心引擎:意图分析引擎、内容生成引擎和音频转换引擎 [19] - 产品研发周期仅2个月,性能较初期Demo提升5-6倍 [19][23] - 采用多模型组合策略,在音频生成质量上优于部分开源工具 [20][21] - 技术路线分三阶段推进:有人味→个性化→垂直领域深度定制 [14] 团队管理 - 招聘更看重成长性和自驱力而非学历背景,团队成员从大专到名校硕士均有 [15] - 采用目标导向型管理模式,强调文化价值观统一,实现高度自主运作 [16][17] - 团队规模控制在20人以内,追求"小而美"的组织形态 [33] 市场策略 - 避开与大厂直接竞争,定位为AI应用公司而非基础设施提供商 [31][32] - 初期通过AI播客场景切入,未来计划拓展完整的内容消费链路 [27][28] - 海外市场获20多位KOL自发推广,商业化重点放在付费意愿更强的国际用户 [29] 行业观察 - 认为Agent技术与大模型同等重要,将重构内容生产消费方式 [10][12] - 指出大模型公司与应用公司的本质差异在于专注领域不同 [32] - 观察到新一代AI创业者具备全球化视野,从创业初期就布局海外 [29]
喝点VC|红杉美国对谈OpenAI前研究主管:预训练已经进入边际效益递减阶段,其真正杠杆在于架构的改进
Z Potentials· 2025-07-04 11:56
AI技术发展现状与趋势 - 预训练、后训练和推理构成AI发展的"三位一体"框架 预训练已进入边际效益递减阶段 真正杠杆在于架构改进 后训练聚焦模型个性与智能表现 推理能力训练则引导AI自主摸索链式思维[4][8] - 2025年成为"推理之年" 各大实验室重点转向推理优化 但后续进展将越来越困难[5][7] - 预训练收益递减源于基本规律 模型智能水平与计算资源呈对数线性增长 提升智能需指数级增加计算资源[7][8] Agent商业模式与竞争格局 - Agent价格将趋近计算使用成本 普适性和性价比将颠覆传统人力密集型领域[6][18] - 简单重复性任务由AI完成 复杂需人类理解的服务保持价值稀缺性[19][26] - 创业公司机会在于构建网络效应和规模经济 而非依赖高价Agent[21][26] 机器人技术突破与商业化 - LLMs为机器人提供低成本语言接口 结合强大视觉编码器 赋予处理通用任务的先发优势[24][25] - 机器人领域正处于研究最后阶段 距离商业化仅数月到数年时间[22][25] - 技术突破使机器人能快速解决多样化任务 如叠衣服、搬运纸箱等[25] 编程领域变革与未来趋势 - 编程发展呈现非线性加速 未来将形成混合模式:人类主导设计+Agent自动编码[32][34] - Agentic工程师处理明确结果的任务如bug修复、代码重构 人类负责需"品味"的设计工作[34][35] - 关键挑战在于如何让Agent理解代码库 目前仍需人类进行高层次设计[33][35] 专有数据价值重估 - 专有数据价值被高估 "无限智能、无限耐心"的Agent可从公开数据重构替代信息[29][30] - 真正有价值的专有数据是具体客户的深度个性化信息 可辅助专业决策而非训练技能[31] - 垂直领域专属模型表现普遍不如下一代通用模型 因综合能力远超单纯记忆[29] 企业管理与文化构建 - 技术团队应消除研究员与工程师界限 建立平等环境促进全栈理解[37][38] - 管理者核心是真诚关心团队成员 建立忠诚度才能推动困难决策[50][51] - 高绩效人才管理需平衡个人创作欲望与团队协作目标[52] AI教育应用与人才培养 - AI最佳应用是帮助用户成为领域专家 同时减轻重复性工作负担[42][43] - 教育应聚焦学习过程和自主能动性培养 而非特定技能[43][44] - 即时响应式学习能抓住最佳学习时机 大幅提升教育效果[46] 安全防御新范式 - AI使攻击能力提升 防御措施需更加自主化和智能化[53] - 企业需重构业务流程以适应自主安全系统 这为创业公司创造机会[53]
MiniMax 进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 22:00
大模型行业趋势 - 大模型技术以常规技术乘十的速度进化,颠覆互联网时代的生态护城河、资金壁垒和规模效应,使创业公司也能站上世界舞台中心 [1] - 行业生存法则已转变为"创新至上",传统互联网玩法彻底失效,淘汰周期缩短至季度为单位 [2][3] - 百模大战后,Open AI、Anthropic、MiniMax、DeepSeek等创业公司占据SOTA榜单大半,巨头优势被灵活创新机制瓦解 [10] MiniMax技术突破 视频模型Hailuo 02 - 参数量较前代增长3倍,分辨率达原生1080P,支持10秒高清内容生成,涵盖复杂物理交互与专业级运镜 [6] - 在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅其1/9 [7] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [9] 大模型M1 - 4560亿参数,原生支持100万token输入(DeepSeek R1的8倍)和8万token输出(超Gemini 2.5 Pro) [11] - 采用混合注意力机制(1/8自注意力+7/8线性注意力),实现长上下文窗口技术突破 [16] - CISPO算法使强化训练仅需3周+512块H800 GPU(成本53万美元),推理算力为DeepSeek R1的25% [17][19] 商业化与生态构建 Agent应用创新 - Hailuo Video Agent支持超百种视频模板,实现创意构思到成片的全链路生产,连续6个月全球视频生成AI榜首 [21][23] - 通用Agent可完成长程复杂任务(如网页搭建、PPT制作),内部使用率达50%,具备跨模态理解与生成能力 [24] - 基座模型与Agent形成技术闭环,性能优化与成本控制优势显著 [25] 公司发展路径 - 2022年初成立并提前布局MoE模型,2024年推出国内首个MoE大模型 [26] - 开源Lightning Attention技术,突破Transformer架构限制 [26] - 创新驱动战略使M1半年内登顶开源模型全球第二,通用Agent解决跨模态长距离任务难题 [27][28]
MiniMax进化论:一群「偏执者」的破浪前行
36氪· 2025-07-01 21:54
大模型行业特征 - 大模型技术发展速度极快,3年时间从默默无闻到改变世界,具备工业革命特质 [2] - 行业竞争激烈,头部玩家快速更迭,百亿资本投入可能迅速沉寂 [2] - 传统互联网的护城河、资金壁垒、规模效应失效,创业公司有机会站上世界舞台 [2] - 行业生存法则为创新至上,淘汰周期以季度为单位 [3][4] MiniMax的技术突破 - Hailuo 02模型参数较Hailuo 01增长3倍,视频分辨率提升至原生1080P,支持10秒高清内容生成 [9] - Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅1/9 [10][11] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [12] - M1模型支持100万token输入长度,是DeepSeek R1的8倍,输出token达8万个打破Gemini 2.5 Pro记录 [16] - M1在工具使用场景(TAU-bench)中领跑所有开源权重模型,30多轮长链路任务稳定性极高 [18] 创新架构与训练方法 - 早期探索MoE架构和混合注意力机制,1/8用自注意力,7/8用自创Lightning Attention [20] - CISPO算法替代传统PPO/GRPO,仅用3周时间、512块H800 GPU完成强化学习训练,成本53万美元 [21][23] - 生成10万token时推理算力仅需DeepSeek R1的25%,数学和编程任务效率更高 [23] Agent应用创新 - Hailuo Video Agent支持超百种视频模板,涵盖艺术片、广告片等体裁,打通完整视频生产链路 [28] - MiniMax Agent具备长期任务规划能力,内部使用60天,50%员工用于PPT制作、网页搭建等 [31] - Agent能生成复杂跳转逻辑网页,支持多模态理解与生成,完成动画、广告片等任务 [31] 公司发展历程 - 2022年初成立,早于ChatGPT引爆全球的时间 [33] - 2023年将80%算力投入MoE开发,2024年初推出国内首个MoE大模型 [34] - 2024年1月开源Lightning Attention技术,6月M1模型拿下开源模型全球第二 [34] - 持续探索更高智能水平,创新驱动发展 [35][36]
Kimi和Minimax,争夺“下一个DeepSeek”心智
36氪· 2025-07-01 16:41
行业格局演变 - 中国大模型行业格局从"六小龙"演变为"基模五强",DeepSeek的崛起显著改变竞争态势[1] - Kimi和Minimax近期分别推出Kimi-Dev编程模型/Minimax-M1推理模型,通过技术突破寻求差异化竞争[1][7][11] - 行业竞争焦点从早期用户争夺转向技术前沿突破,更适合以技术为核心的创业团队[6] Kimi战略与产品 - 聚焦Agent赛道推出Kimi-Researcher,专攻金融/学术等垂类场景,平均生成万字报告并引用26个可溯源信源[7][8] - 采用端到端自主强化学习技术,单任务平均进行23步推理,筛选前3.2%高质量信息,在低幻觉垂类赛道获积极反馈[7][8] - 技术路线与DeepSeek多次"撞车",包括注意力机制优化等基础研究,显示其技术实力仍处第一梯队[17][18] Minimax技术突破 - 推出4560亿参数推理模型M1,支持100万token输入/80k token输出,长上下文能力全球前二[11] - 采用MoE架构创新,训练成本性价比显著,性能超越多数开源模型及Claude 4 Opus,仅次于Gemini 2.5 Pro[11] - 2023年即押注MoE路线,早于行业转向,但市场影响力未达预期[20] 竞争策略差异 - Kimi选择垂直Agent路线,通过深度研究功能切割专业场景,避开大厂主战场[3][29] - Minimax坚持全栈布局,通过多模态技术(如AI语音合成)展示全场景渗透能力[13][29] - 两家公司均试图打破"参数比拼"的初级竞争模式,转向用户心智占领[27] 创始团队特质 - Kimi创始人杨植麟兼具顶尖学术背景(CMU/苹果AI导师)和企业级AI落地经验,融资能力突出[16] - Minimax创始人闫俊杰技术预判精准,早期All in MoE路线但商业化节奏滞后[20] - 投资方认为团队技术预判能力(如长文本/MoE布局)仍是核心竞争优势[22][29] 行业趋势观察 - AI应用加速渗透生活场景,从工具转向收益驱动的商业化阶段[25] - 通用Agent市场被大模型公司主导,创业公司需聚焦垂直领域构建壁垒[25] - 技术突破与市场定位的精准耦合成为重塑行业认知的关键,参考DeepSeek崛起路径[27][29]
Kimi“憋”出的深度研究,成色几何?
虎嗅· 2025-07-01 15:01
产品功能 - Kimi推出的深度研究功能在行业内可排名Top 3,其生成的报告深度超过ChatGPT [1][5] - 深度研究功能能充分理解问题并给出结构合理的框架,找到真正有价值的信源,围绕核心问题展开内容 [5][6][7] - 该功能支持全流程自主规划,包括关键词分析、全网资料搜集、信息筛选等,最终生成高质量分析报告 [17] - 目前存在生成速度较慢(约15分钟)和无法导出PDF等需完善之处 [8] 技术实现 - 深度研究功能本质上是具有Agent能力的模型,需解决真实环境下的复杂任务挑战 [9][12] - Agent需应对环境变化、工具调用差异、长链任务等实验室外的难题,对模型记忆力、上下文管理和推理连贯性要求极高 [13][14][15] - Kimi团队通过技术突破实现了Agent自主规划能力,而非简单功能堆砌 [16] - 深度研究功能同时运用了Coding能力,实现可视化网页生成等高级功能 [22][45] 用户体验 - 用户仅需输入简单问题,系统会自动细化需求并确认边界,支持生成不同风格内容 [26][27] - 研究过程使用中英文关键词组合,规划超过80组关键词,覆盖权威信源如南方周末、中国日报香港版等 [24][31][32][34] - 系统具备主动纠偏能力,发现关键词不精准时会调整检索逻辑 [36][37][38] - 最终交付双报告:可溯源的万字深度报告(9345字,30个信源)和交互式可视化网页 [40][42][43] 行业定位 - 深度研究是少数已验证PMF的Agent场景之一,与Coding Agent并列 [10] - 头部大模型公司如OpenAI、Anthropic等均在布局该领域,但通常集成在ChatBot中 [11] - 深度研究属于垂直Agent场景,通过高质量信息构建为AI提供关键Context [19][21] - 公司选择专注技术创新而非短期数据,走通用智能发展路径 [52] 商业策略 - 公司此前曾陷入投流竞争,现转向产品和技术创新为主导的发展模式 [48][49][50] - 与财新传媒等权威媒体合作,为深度研究功能获取优质信源 [35] - 团队资源充足且人才密度高,坚持长期主义发展路线 [52]
AI下半场,大模型要少说话,多做事
虎嗅· 2025-07-01 09:33
大模型性能与竞争格局 - DeepSeek模型性能快速提升 2024年4月排名靠后 8月进入TOP10 12月成为基础能力第一的开源模型[1] - 基础模型TOP10中中国占6个 美国占4个 包括通义千问 豆包 混元 文心等[3] - 模型排名轮动加速 GPT-4o曾保持200天第一 现在十几天就会变化[7] - 训练成本高企 每次至少几百万美元 保鲜期短导致玩家减少[8] 模型训练技术趋势 - 预训练与后训练并存 预训练提升基础能力 强化学习从实战中学习潜力大[14] - 下游企业减少参与训练 转向提示词工程 检索增强 工作流等工程化方法[9] - 智谱AI坚持预训练路线 技术团队实力和资源储备是关键[12] Agent发展与应用 - Agent成为运行在大模型上的软件 自主规划能力显著提升[21] - 提示词仍重要 精心设计的系统提示词可充分激发模型能力[22] - Agent可能不是单一产品 而是多功能集合 开发平台将成关键[29] - 未来或形成个位数基座模型+垂直行业应用平台的格局[30] 基准测试体系价值 - "方升"测试体系包含700万条数据 聚焦产业实战应用[1][44] - 测试方法标准化 题目非开源 每次抽取1-2万题后作废[47][48] - 基准测试是指挥棒 定义方向 中美差距缩小因目标一致[51] 技术路线与产业方向 - 谷歌DeepMind强化学习路线被低估 在生物 材料等领域价值巨大[34][37] - 当前模型缺乏世界模型能力 需突破空间关系 物理定律等[38] - AI下半场需减少信息过载 增强意图理解 任务规划等能力[52]