Workflow
AI Agent
icon
搜索文档
但我还是想说:建议个人和小团队不要碰大模型训练!
自动驾驶之心· 2025-09-21 00:03
大模型应用策略 - 对于小规模团队,部署开源大语言模型结合检索增强生成技术已能满足99%的需求,在触及开源模型性能边界前不建议进行模型微调[2] - 若开源模型在特定垂直领域效果不佳,应优先尝试检索增强生成技术和上下文学习等低成本方案,而非直接进行模型微调[3] - 建议将最复杂的任务分配给o1系列模型,将需要较高智能的任务分配给4o等第一梯队模型[3] - 除付费模型外,可考虑采用DeepSeek、豆包、Qwen等国产开源大模型[4] - 基础模型能力的每次重大提升都如同一次技术版本更新,从业者需敏锐识别现有模型能力与业务需求的差异[6] - 应避免在低收益赛道进行无意义投入,采取错位竞争和降维打击策略更为有效[7] 核心技术趋势与人才需求 - 检索增强生成和智能体技术是当前大模型领域最具代表性的技术,企业对掌握这些技能的人才需求高涨[8] - 行业正积极构建技术社区,汇集来自上海交通大学、清华大学、北京大学、上海人工智能实验室、香港科技大学、香港大学等顶尖高校及阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等头部企业的专家[10][43] 技术社区资源体系 - 社区提供集视频、图文、学习路线、问答、求职交流为一体的综合型大模型技术平台[8][10] - 技术学习路线图全面覆盖检索增强生成、智能体、多模态大模型三大方向,包括Graph RAG、知识导向RAG、多模态RAG、推理RAG、智能体强化学习、多模态智能体、多智能体等细分领域[10] - 社区已邀请40余位学术界和工业界专家,计划不定期举办行业大佬直播分享活动[41][43] - 提供大模型相关工作岗位推荐和行业机会挖掘服务,助力职业发展[13][44]
鸿蒙砸下十亿,打响AI Agent入口战
第一财经· 2025-09-20 20:56
公司战略与投资 - 华为宣布启动"天工计划" 投入10亿元资金与资源支持鸿蒙AI生态构建 [1] - 计划目标加速孵化超过1万个AI原生元服务 1千多种意图框架 5千多个智能体 [5] - 华为通过小艺智能体开放平台提供4种开发模式和50多种开发组件能力 支持自然对话创建智能体 [5] 技术发展与行业趋势 - AI智能体将从执行工具演进为决策伙伴 驱动产业革命 交互方式从图形界面转向自然语言和多模态交互 [2] - 手机App正从独立功能实体转变为由AI智能体驱动的服务节点 用户只需指令即可调用相关服务 [2] - 智能体可实现对用户的个性化服务 包括信息整合、关联和处理 带来革命性创新体验 [3] - 手机通过内置本地化端侧模型 真正解决AI手机与第三方AI APP的功能区别 [4] 生态系统建设 - HarmonyOS 5终端设备数量已突破1700万台 [1] - 鸿蒙基于端边云协同架构 实现手机、平板、智能音箱、智能汽车等多设备自由切换 [2] - 鸿蒙系统已打通元服务和第三方应用内容检索 为开发者带来更多流量和商业机会 [5] - 小艺任务空间功能可自主调度120多种对接工具和三方智能体 覆盖办公写作、出行规划等高频场景 [6] 市场竞争格局 - 操作系统成为终端设备底层核心 大模型技术融合和多设备互联互通成为行业竞争核心 [1] - 谷歌在智能语音助手领域取得先发优势 苹果推出"Apple Intelligence"试图重构手机应用 [1] - 鸿蒙发展速度决定其在AI智能体赛道的竞争身位 [1] - 中小开发者有机会突破"流量壁垒" 通过创新分发策略让服务触达更多用户 [6] 开发者生态与合作伙伴 - 鸿蒙通过合作方提供全链路开发工具 降低新系统接入难度和成本 [7] - 鸿蒙新的分发能力将APP和操作系统"重新调度" 为开发者创造新流量机会 [5] - 生态建设需要千行百业APP共同参与 光靠华为一家无法完成探索 [7]
鸿蒙进击!鸿蒙5终端数量突破1700万,“天工计划”10亿激励AI生态创新
第一财经· 2025-09-20 15:50
鸿蒙生态发展现状 - 鸿蒙生态基于OpenHarmony共建共享,开源5年代码行数超1.3亿行,拥有9200多位社区贡献者 [4] - 已推出1300多款软硬件产品和70多款行业发行版,覆盖金融、交通、教育、能源、航天、消费电子等多个领域 [4] - 鸿蒙操作系统采用“一个系统一个生态”架构,实现多终端、全场景无缝打通,并打造了70多种创新体验 [4] 鸿蒙操作系统产品与应用 - 华为终端产品全面搭载鸿蒙5操作系统,覆盖手机、电脑、平板、手表、智慧屏等品类 [5] - 具体产品创新包括Pura X的真人感交互小艺、MateBook Fold的应用生态融合、Mate XTs的PC级应用体验以及智慧屏的灵犀指向遥控等 [5] - 鸿蒙高度重视用户体验,累计收到超1000万条用户建议,96%以上实现快速闭环,并通过“鸿蒙心声计划”鼓励用户反馈 [5] AI与智能体技术进展 - 鸿蒙从系统底层融入原生AI支持,AI智能体成为生态进化的重要方向,旨在带来更高阶的AI全场景体验 [2][7] - 小艺任务空间可自主调度120多种工具和智能体,覆盖8大类高频场景,例如能在20分钟左右生成一份图文并茂的万字报告 [9] - 小艺支持11类情绪识别,实现拟人化交互与服务响应,并依托“小艺大脑”实现跨设备统一决策调度和无感任务流转 [9] 开发者支持与生态建设 - 华为推出小艺智能体开放平台,提供4种开发模式、50多种开发组件能力,支持自然对话创建智能体 [10] - 平台开放10个AI领域Kit、11类AI控件、240+标准意图,全面赋能开发者高效构建AI能力与智能体 [10] - 通过“天工计划”,华为目标与伙伴和开发者共同加速孵化超过1万个AI元服务、1千多种意图框架/MCP、5千多个智能体 [10] - 公司呼吁更多伙伴、开发者及校园开发者加入鸿蒙AI生态,共同推动创新 [2]
DeepSeek R1论文登上Nature封面;OpenAI顶尖人才出走;英伟达英特尔宿敌握手言和| 混沌AI一周焦点
混沌学园· 2025-09-19 19:58
芯片行业战略合作 - 英伟达投资50亿美元收购英特尔5%股份,导致英特尔股价暴涨超过22% [3] - 双方合作核心为共同开发面向数据中心和PC的定制化产品,英特尔将推出集成英伟达RTX GPU的全新x86系统级芯片(SoC) [3][6] - 对于数据中心,英特尔将为英伟达构建定制版x86 CPU,此次合作被视为重塑PC和AI基础设施格局的关键一步 [3][6] AI模型技术突破 - DeepSeek R1论文登上《自然》封面,首次披露R1阶段训练成本约29.4万美元,展示极高训练效率 [4] - 李飞飞创业公司World Labs发布空间智能模型Marble,可免费通过单张图片或文本提示生成可无限探索的3D世界 [9] - AI公司Math开发的Gauss AI Agent仅用三周时间完成数学家陶哲轩耗时18个月未能完全解决的强素数定理形式化证明 [15] AI应用与产品动态 - 美团发布生活服务智能体"小美",深度整合外卖、闪购等服务,通过自然语言对话简化操作流程 [17] - 字节跳动发布图像大模型Seedream 4.0并集成至AI创意Agent"小云雀",支持4K高清分辨率,颠覆电商营销内容生产流程 [18] - 首款CEO私人助理"智跃Agent一体机"面市,内置单卡4090,提供完全本地化部署方案,连接企业内部系统生成每日工作报告 [10] AI行业趋势与市场 - OpenAI报告显示ChatGPT周活跃用户数超过7亿,每周处理消息总量达180亿条,实用指导(28.8%)、信息搜索(24.4%)和写作(23.9%)为三大核心应用场景 [12] - 中国AI人才缺口已超500万,供需比达1:10,行业竞赛成为企业发现和培养复合型人才的有效通道 [5][7] - 2025重庆智博会确立以人工智能为主线,聚焦智能机器人、低空经济、智能家居、智能驾驶和数字城市五大板块 [13] 企业战略与行业动向 - 马斯克"巨硬计划"通过Colossus II算力集群加速推进,6个月内建成200MW供电规模,旨在构建多智能体系统实现全自动化软件开发 [8] - OpenAI的Agent技术领军人物姚顺雨离职,认为AI竞赛重心已从模型能力转向为AI找到有价值的现实任务,创业公司机会在于创造超越聊天模式的"超级应用" [19][22] - 《麻省理工科技评论》2025年度"50家聪明公司"榜单显示AI与计算、机器人与智能制造、芯片及生命科学成为技术商业化最活跃的四大赛道 [14]
港股异动丨银盛数惠大涨11%,为连续第2日上涨
格隆汇· 2025-09-19 15:56
股价表现 - 银盛数惠盘中大涨11%至1.71港元 实现连续第二日上涨 [1] 产品动态 - 公司推出首款AI Agent产品"数惠助手" 系国内数字权益消费场景首个AI智能体 [1] - 产品借力微信生态 通过跨平台优惠聚合和银行活动场景融合构建核心竞争力 [1] 行业地位与资源 - 公司深耕数字权益领域超10年 与多家银行及近百家国内知名平台达成深度合作 [1] - 累计服务上千家企业客户 触达终端消费者超4亿 [1] - 庞大资源积累为AI Agent发展奠定基础 助力打破单一生态限制 [1] 产品竞争优势 - 数惠助手具备先发优势及差异化能力 通过全网信息聚合提供跨平台省钱方案 [1] - 本地生活服务赛道市场热度高涨 产品整合银行优惠活动为用户提供最优解 [1]
小易智联董事长杨振:XYZ模型可帮助企业摆脱对高性能显卡的依赖
搜狐财经· 2025-09-19 14:13
中国商报(记者 赵熠如 文/图)9月15日,重庆小易智联智能技术有限公司(以下简称小易智联)董事长杨振在接受中国商报记者采访时表示,小易智联研 发的XYZ端侧模型可帮助企业摆脱对高性能显卡的依赖。 重庆小易智联智能技术有限公司董事长杨振。 据介绍,XYZ端侧模型是小易智联全自研、全正向、全国产的AI模型。它凭借创新架构,突破"卡脖子"难关,摆脱对高性能显卡的依赖,具备低资源需求、 低成本部署特性,可广泛应用于多场景。XYZ模型的整体大小仅10MB,比传统AI模型缩小99%以上;耗电量仅0.008度/小时,部署成本降低99%以上。该模 型实现从芯片到算法的全链条国产化,所有数据处理100%本地化运行,为关键基础设施和敏感行业提供了安全可靠的AI解决方案。 "经过中国信通院的代码审核,我们的国产化自研率已达到99.66%,意味着这是一个完全由我们一行一行的代码构建起来的基座模型。"杨振说。 "当前提倡'人工智能+制造',其目标是打造'黑灯工厂',但企业自建算力中心、更换生产线设备的成本极高。"杨振说,"XYZ模型可显著降低成本,帮助企 业在算力层面摆脱对GPU的依赖,突破国际算力垄断。XYZ模型仅靠CPU即可完成 ...
港股异动丨银盛数惠逆势大涨10% 推出首款AI Agent产品“数惠助手”
格隆汇· 2025-09-18 14:58
公司股价表现 - 银盛数惠股价逆势上涨10.07%至1.64港元 市值达6.8亿港元[1] 产品创新动态 - 公司推出首款AI Agent产品"数惠助手" 定位国内数字权益消费场景首个AI智能体[1] - 产品聚焦本地生活服务赛道 以"找优惠,问数惠"为核心理念[1] - 战略目标是从工具向综合服务平台跨越[1] 行业竞争地位 - 公司在本地生活赛道率先启动AI智能体转型升级[1] - 先行布局AI Agent有助于抢占市场份额并积累用户数据及运营经验[1] - 为未来行业整合占据有利位置奠定基础[1]
独家丨前安克 UV 打印机产品负责人付瀚龙计划创业,多家头部机构火速跟进
雷峰网· 2025-09-18 08:24
核心人物动态 - 前安克UV打印机产品负责人付瀚龙已从安克离职并计划创业 [3] - 其创业项目目前正处于融资阶段 多家头部投资机构有意参与投资 [3] - 该项目在一级市场非常火热 有望直接完成多轮融资 [4] 职业履历 - 付瀚龙于2023年9月加入安克创新 曾担任UV打印机产品负责人 [4] - 其在安克期间完成了UV打印机的产品定义工作 [4] - 加入安克前 其曾于2017年8月至2021年4月在大疆担任高级产品工程师 [4] - 离开大疆后 其于2021年4月加入元戎启行担任高级产品经理 [4] 创业方向与行业背景 - 付瀚龙创业方向仍在探索中 并同步进行团队搭建 [5] - 其曾与3D影像行业创业者探讨影像产业链情况 但未最终确定进入该领域 [5] - 3D影像目前不被视为理想创业方向 主要因下游VR产业尚未到达爆发点 [5] - VR设备出货量主要由Apple Vision Pro和Meta主导 其他厂商发展平平 [5] - 国内之前的AR/VR创业浪潮未能成功兴起 [5]
Shopify 经验贴:如何搞出一个生产级别可用的 AI Agent 系统?
Founder Park· 2025-09-17 20:50
架构演进与设计原则 - 系统核心围绕"智能体循环"构建 包括人类输入 LLM处理决策 环境执行和反馈收集的持续循环[5] - 工具库从最初几个函数扩展到几十个专业化功能 导致"千条指令之死"问题 系统提示词变得杂乱无章且难以维护[10][12] - 采用"即时指令"解决方案 在工具数据返回时附带相关指令而非全部塞入系统提示词 实现恰到好处的上下文[14] - 工具数量在0-20个时边界清晰易于调试 20-50个时边界开始模糊 50个以上时系统变得难以理解和推理[15] - 即时指令带来三大关键好处:局部化指导 缓存效率和模块化 使系统更易维护且所有性能指标提升[16][18] 评估系统构建 - 传统软件测试方法难以处理LLM输出的概率性和多步骤智能体行为的复杂性[17] - 放弃精心策划的"黄金"数据集 采用反映真实生产环境数据分布的"基准真相集"[20] - 评估流程包括人工评估 统计验证和基准设定 使用科恩系数 肯德尔等级相关系数和皮尔逊相关系数衡量标注者一致性[22] - 开发专门的大语言模型裁判并与人类判断校准 将裁判性能从科恩系数0.02提升至0.61 接近人类基准0.69[21] - 构建大语言模型驱动的商家模拟器进行全面测试 在部署前重放真实对话以捕捉性能衰退和验证改进[24][28] 模型训练与优化 - 采用群组相对策略优化强化学习方法 使用大语言模型裁判作为奖励信号[31] - 开发N阶段门控奖励系统 结合程序化验证和语义评估[31] - 遇到严重奖励作弊问题 包括退出式作弊 标签式作弊和模式违规[32] - 模型学会创建错误筛选条件如customer_tags CONTAINS 'enabled'而非正确的customer_account_status = 'ENABLED'[33] - 通过更新语法验证器和大语言模型裁判解决作弊问题 语法验证准确率从93%提升至99% 裁判平均相关性从0.66增加到0.75[34][36] 核心建议与最佳实践 - 保持工具简单性 抵制在没有明确边界情况下添加工具的诱惑[37] - 从模块化开始设计 使用即时指令模式以保持系统可理解性[37] - 早期避免多智能体架构 单智能体系统能处理远超预期的复杂性[37] - 构建多个专门的大语言模型裁判来评估智能体性能的不同方面[37] - 将裁判与人类判断对齐 统计相关性是建立自动化评估信任的关键[37] - 预料奖励作弊问题并提前构建检测机制[37] - 结合程序化验证和语义验证以获得稳健的奖励信号[37] - 投资逼真的用户模拟器进行投产前全面测试[37] - 迭代改进裁判以应对新发现的失败模式[37]
LLM开源2.0大洗牌:60个出局,39个上桌,AI Coding疯魔,TensorFlow已死
36氪· 2025-09-17 16:57
大模型开源生态全景图2.0核心更新 - 全景图收录114个项目(较1.0版减少21个),覆盖22个领域,其中39个为新晋项目,60个项目被淘汰 [4] - 生态中位年龄仅30个月,平均寿命不足三年,62%项目诞生于2022年10月"GPT时刻"之后 [5] - 分类框架从Infrastructure/Application进化为AI Agent/AI Infra/AI Data三大板块,反映行业向智能体为中心演进 [10] 项目生态动态 - 头部前十项目覆盖模型生态全链路,平均Star数接近3万,远超历史同期开源项目 [5] - TensorFlow因迭代迟缓被淘汰,PyTorch以92,039 Stars成为训练平台绝对主导 [4][6] - 新晋高热度项目包括Gemini(AI Coding)、TensorRT-LLM(推理引擎)、Cherry Studio(聊天机器人) [6][28] 开发者地域分布 - 全球366,521位开发者中,美国占37.41%、中国占18.72%,两国合计贡献超55% [10][12] - 美国在AI Infra领域贡献度达43.39%(中国22.03%),在AI Data领域贡献度35.76%(中国10.77%) [14] - 中国在AI Agent领域表现接近美国(中国21.5% vs 美国24.62%),与应用层投入密切相关 [14] AI Agent领域演进 - AI Coding完成从"补代码"到"全生命周期智能引擎"跨越,支持多模态与团队协同 [23] - 大厂通过开源工具链(如Gemini CLI、Codex CLI)绑定开发者生态,战略类似Windows+.NET模式 [27] - Agent Workflow Platform向企业级能力演进,Dify提供从原型到生产的一站式平台 [34] - Browser-use项目9个月内获60K Stars,实现Agent网页操作能力 [37] AI Infra技术趋势 - Model Serving赛道持续高热,vLLM(53,912 Stars)和NVIDIA TensorRT-LLM主导云端推理 [6][45] - 本地化推理框架崛起,ollama使大模型可运行于个人设备,GPUStack等新框架补位 [49] - LLMOps接棒MLOps,聚焦监控、提示词评测与安全可信,Phoenix、Langfuse等项目覆盖全生命周期管理 [52] - 模型训练赛道热度回落,社区更关注低成本微调方案(如Unsloth集成QLoRA) [55] 许可证模式变革 - 新晋项目多采用限制性许可证(如BSL变体、Fair-code),传统MIT/Apache 2.0协议使用减少 [62] - 部分项目按用户规模设限(如月活超阈值需额外授权),反映商业博弈加剧 [62] - Cursor、Claude-Code等闭源项目仍在GitHub获高热度,挑战"开源社区"定义 [63] 大模型技术前沿 - MoE架构普及使模型参数达万亿级别(如K2、Claude Opus),通过稀疏激活控制推理算力 [69] - Reasoning成为模型新标配,DeepSeek R1通过强化学习增强复杂决策能力 [70] - 多模态全面爆发,语言/图像/语音成为标配,中国厂商在开源与闭源路线均取得领先 [71] - 模型评价体系多元化,OpenRouter等平台通过调用数据形成"数据投票"排行榜 [72]