Workflow
Artificial Intelligence
icon
搜索文档
从《塞尔达传说》理解 Agent 的上下文工程:Claude Skills 还是被低估了
Founder Park· 2025-11-18 15:59
以下文章来源于言午 ,作者yan5xu 言午 . 贩卖你想要的人生 Claude 近期发布的 Skills 功能很火,不少开发者都在尝试、试用。 简单来说,Claude Skills 就像是为 AI 设计的标准化「技能包」,能够把完成复杂任务的指令打包成像「操作手册」一样的简单文件夹。 相比于 MCP, Skills 更进一步,让 LLM 长出「手脚」,能够更高效地外部知识和工具。 不过, 本文作者「言午」(前 Manus 研究员)认为, Skills 背后的 信息分层设计哲学,才是 真正为所有 Agent 开发者带来的、可以被广泛借鉴的关键 突破 。 「言午」以《塞尔达传说》等 3D 游戏为例,在游戏开发过程中,通常采用细节分层 (LOD, Level of Detail) 、按需加载 (On-demand Loading) 的方式。 那 AI Agent 开发也能采用「信息分层」的信息调用方式,像人一样,先看索引,再看摘要,最后有需要才去查原文。 这种信息分层设计, 让 Agent 在处理复杂任务时,能够 节省高达 95% 的 Token ,同时 提升决策质量和响应速度 。 ⬆️关注 Founder Pa ...
AI搜索应用Perplexity上线Kimi K2 Thinking模型
凤凰网· 2025-11-18 15:50
公司动态 - 月之暗面Kimi K2 Thinking模型被AI搜索应用Perplexity接入 成为唯一被接入的国产模型[1] - 同批被接入的还有OpenAI刚发布的GPT-5.1模型[1] - 更早之前 Cherry Studio Cline CoStrict Cursor Genspark Kilo Code Kortix Suna RooCode Trae Vercel Visual Studio Code Windsurf YouWare等AI应用均已接入Kimi K2系列模型[1] 公司表现 - Perplexity自2022年成立以来实现爆发式增长 拥有3000万月活跃用户[1] - 公司估值突破200亿美元 是全球估值最高的AI搜索应用[1] 行业影响 - Perplexity开创了对话式"答案引擎"这一全新品类[1] - 通过提供基于最新网络信息并附带清晰引用来源的即时答案 改变了很多用户获取和研究信息的方式[1]
数量暴涨10倍,全省三成备案AI大模型为何“抢滩”琶洲?
南方都市报· 2025-11-18 15:19
政府与企业同向发力应用型AI大模型 2023年3月,OpenAI发布ChatGPT-4,向外界展示了AI的巨大能量。当视线聚焦广州,本地的AI力量在 哪里?人们自然地将目光锁定在位于城央地段的人工智能与数字经济试验区。但当时的广州,还没有一 家企业在文生文通用AI大模型上,有足够的现有实力和投入意愿。 琶洲人工智能与数字经济体验推广赋能中心的大屏上,展示了琶洲片区的AI大模型产业发展数据。 广州的AI企业圈出现了一股"抢滩"潮,正向海珠琶洲这个"岛中岛"集中。广州海珠官方提供的数据显 示,截至2025年11月,广东完成AI大模型备案105个,其中广州市56个,深圳市40个。广州的备案AI大 模型有32个位于海珠区,占全省三成,占全市57%。值得一提的是,海珠区的32个备案AI大模型全部出 自面积仅有30平方公里的"岛中岛"——琶洲。 时间回拨一年,去年4月,广东全省完成备案的AI大模型仅有23个,其中海珠区仅有3个。用一年多时 间,备案AI大模型数量暴涨10倍,广州琶洲凭的是什么? 这对于地方而言,是一种巨大的发展压力。作为试验区核心片区的琶洲能做点什么?这不仅要对技术的 演进方向有足够自信和准确的预测,还要 ...
千问对标ChatGPT,AI开启入口之争丨小白商业观
经济观察报· 2025-11-18 15:06
阿里巴巴“千问”项目战略发布 - 阿里巴巴于11月17日正式宣布“千问”项目,全力进军面向消费者的AI市场,并上线千问App公测版 [2] - 千问App基于全球性能领先的开源模型Qwen3,通过与生活服务场景深度融合及免费策略,与ChatGPT展开全面竞争 [2] - 阿里核心管理层将“千问”项目视为“AI时代的未来之战” [2] AI行业竞争格局与核心逻辑 - 中美顶尖科技巨头已进入AI世界入口争夺的下一个阶段,竞争焦点在于谁能率先找到“超级入口” [2][3] - 竞争催生了史无前例的军备竞赛,资本下注的并非前沿技术本身,而是对“超级入口”的预期 [3] - 未来真正的“AI超级应用”必然是一个“AI Agent”,不仅能提供信息,更能执行任务,成为个人助理、研究员等多重角色 [5] AI竞争的两条核心战线 - 第一条战线是“引擎之战”,即大模型本身的能力边界,这是基础入场券,全球AI实力正快速趋同,技术壁垒被无限拉平 [4] - 第二条更关键的战线是“入口之战”,核心在于如何将强大的AI能力“产品化”,使其从玩具转变为不可或缺的工具 [4] - 竞争的胜负手不再是模型参数多寡,而是谁能更早构建起“模型+工具+场景”的闭环生态 [5] 主要参与者的差异化战略路径 - OpenAI通过推出API和群聊功能,试图将其从个人助理转向协作工具,以构建生态 [5] - 谷歌试图将Gemini人工智能模型融入其庞大的搜索和安卓体系 [5] - 千问则依托阿里在中国市场的电商、生活服务和云计算生态,走“全栈整合”的路径,整合地图、外卖、订票等生活场景 [4][5] 行业范式转移与战略意义 - AI技术与商业进化正处在“范式转移”的关口,争夺“超级入口”的竞争将决定未来十年全球科技力量的版图 [6] - 这场竞争关乎万亿市值的归属,巨头们已全速启航,因为错过可能意味着失败,没有试错空间 [6]
马斯克亮AI王牌:Grok 4.1发布,智商情商双在线霸榜,背后团队被传是“全华班”
搜狐财经· 2025-11-18 14:54
产品发布与性能 - 公司发布新一代大模型Grok 4 1,包含Grok 4 1 Thinking(推理)和Grok 4 1(非推理)两个版本[2] - 新模型已向全网用户开放,可在官网、X平台及iOS和Android应用中免费体验[2] - 在LMArena大模型排名榜单中,Grok 4 1 Thinking以1483分的成绩位列全球第一,超越第二名Gemini 2 5 Pro达31分,非推理版Grok 4 1排名第二[2] - 在情商测试EQ-Bench3中,Grok 4 1 Thinking以1586分霸榜,Grok 4 1位居第二[3] 技术能力提升 - 模型情商进步明显,具备更高理解力、洞察力、同理心和人际交往能力,对比上一代成为更具耐心的倾听者且共情能力凸显[3][4] - 创意写作能力较上一代提升600分,语言表达流畅有画面感[5] - 基于训练方法优化,模型幻觉率从12 09%降至4 22%,比之前降低了3倍[5] - 在支撑Grok 4的同一套大规模强化学习基础设施上进一步优化了模型风格、个性等特征[6] 研发与团队 - 新模型改进主要在强化学习上,将RLHF推向新高度,团队利用用户真实对话偏好和智能体奖励模型对算法进行全面改进[7] - 强化学习的规模扩大10倍,由十几人团队完成[7] - 公司人才战略引人注目,团队合影显示多为华人面孔,有消息称已辞退Grok团队最后一名白人成员,打造“全华班”[7] 未来产品规划 - 公司推迟发布Grok 5,部分原因在于开发过程中的资源限制和极其严格的测试需求[9] - Grok 5预计拥有约6万亿参数,训练和优化需要巨大计算能力,将成为世界上最智能的人工智能,作为迈向AGI的关键一步[9] - Grok 5全面测试和开发工作需要更多时间以达到高标准,预计明年发布[9] 行业竞争与定位 - 本次发布是技术迭代,也是公司AI战略的强力宣言,为Grok 5和实现AGI目标铺设道路[9] - 有业内人士认为该模型可能不是今年最好的型号,期待谷歌即将发布的Gemini 3 0模型表现[9]
从DeepSeek到千问灵光,杭州AI梦之队引领2025 AI风口
第一财经资讯· 2025-11-18 14:40
阿里系AI应用战略加速 - 阿里巴巴于11月17日上线千问App公测版,借助Qwen模型的海外影响力与ChatGPT争夺海外用户 [1] - 蚂蚁集团于11月18日推出全模态通用AI助手灵光,支持30秒生成日常生活小应用,直指豆包 [1][3] - 阿里夸克推出“吃豆人”计划,内嵌AI对话式助手,千问APP升级了通义APP和夸克AI助手,计划覆盖办公、地图、健康、购物等多个生活场景 [3] 国内AI应用竞争格局 - 国内形成“南阿里、北字节”的AI格局,中国AI应用开始冲击海外市场,直接对标ChatGPT等 [4] - 2025年被视为“AI应用元年”,C端用户热情升温,大厂迎来场景布局和能力延伸的最佳机遇 [4] - 行业格局未定,豆包2025年10月DAU最高达5410万,DeepSeek为2860万,夸克月活跃用户全球总榜排名仅次于ChatGPT [10] 蚂蚁集团AI布局与能力 - 灵光作为全模态通用AI助手,支持3D、音频、图表、动画、地图等全模态信息输出,答案结构化逻辑强且形式多样 [3] - 蚂蚁集团自主研发的百灵大模型已发布18款大模型,跻身万亿参数模型阵营,未来AI战略方向为聚焦应用、推动普惠 [4] - 蚂蚁已发布AI医疗管家AQ,布局具身智能成立灵波科技,在医疗健康、金融等垂类领域推出AQ、蚂小财两款应用 [5] 杭州AI产业集聚优势 - 杭州发布政策支持大模型多路线攻关,明确点名高端芯片、基础软件、模型算法等前沿方向 [6] - 2025年前三季度,浙江省人工智能核心产业营业收入达4944亿元,同比增速22%,研发费用390亿元,同比增长14% [7] - 杭州AI产品经理平均月薪以28659元领跑全国,产业在基础层、技术层、应用层积累了全链路企业布局 [7][9] 大厂差异化竞争策略 - 阿里千问从B端走向C端大众市场,夸克专注“all in one”入口体验,百度文心一言加强知识增强与搜索融合 [12] - 腾讯元宝覆盖下沉市场,字节跳动豆包依托抖音等社交平台巩固流量优势,蚂蚁AQ深耕垂类场景需求痛点 [12] - 2025年9月,大陆市场AI产品投放素材量达141.1万组,腾讯元宝、夸克、豆包、AI抖音与快影位列素材投放榜前五 [11]
顶尖AI大会调研“你会做空哪家初创公司?”,排名第一是Perplexity,第二是OpenAI
华尔街见闻· 2025-11-18 14:31
行业情绪与共识 - 在一场有超过300名创始人及投资者参与的行业峰会上,一项非正式调查显示硅谷内部对当前AI热潮的疑虑日益增长,反映出市场对行业领跑者商业模式及估值可持续性的信心出现裂痕 [1] - 尽管看空情绪浮现,但市场对AI公司的未来预期存在巨大分歧,高风险与高回报并存是当前AI投资领域的真实写照 [5] - 峰会上的一个几乎没有争议的共识是行业确实处在一个AI泡沫之中,许多资深投资者认为这未必是坏事,并将其与1990年代末的互联网泡沫相提并论 [6] Perplexity 相关要点 - AI搜索初创公司Perplexity在“做空哪家估值超十亿美元的AI初创公司”调查中高居榜首,被视为AI泡沫的典型代表 [1][3] - 该公司正以惊人速度进行多轮融资,其估值已从140亿美元一路飙升至高达500亿美元,这种快速攀升的估值使其成为泡沫论的焦点 [3] - 在“押注哪家公司”的调查中,Perplexity同样榜上有名,表明市场对其未来预期存在巨大分歧 [5] OpenAI 相关要点 - 行业巨头OpenAI在上述“做空”调查中位列第二,这一结果令外界惊讶 [1] - 投资者对其不安的原因在于公司不断膨胀的估值和高达数万亿美元的基础设施支出计划,这引发了对其财务可持续性的担忧 [3][4] - 针对估值被夸大的质疑,公司首席执行官Sam Altman进行了强力反驳 [4] - 在“押注哪家公司”的调查中,OpenAI同样榜上有名 [5] Anthropic 与其他观点 - 在“押注哪家公司”的调查中,估值可能高达3500亿美元的Anthropic位列第一 [6] - 有观点认为,每一个技术周期按定义来说都是一个泡沫,关键问题在于识别哪些是能够存活下来的持久公司以及它们最终能变得多大 [6] - 预测最终会有几十家公司变得规模巨大,少数几家会成为真正改变时代的公司,而其他公司将以某种形式消失 [6]
从DeepSeek到千问灵光,杭州AI梦之队引领2025 AI风口
第一财经· 2025-11-18 14:30
阿里系AI应用战略加速 - 阿里巴巴于11月17日推出千问App公测版,旨在借助Qwen模型的海外影响力与ChatGPT争夺海外用户 [1] - 蚂蚁集团于11月18日推出全模态通用AI助手“灵光”,支持30秒生成日常生活小应用,直接对标豆包 [1][3] - 阿里夸克推出“吃豆人”计划,内嵌AI对话式助手,千问App计划覆盖办公、地图、健康、购物等多个生活场景 [6] 主要AI产品能力与市场表现 - 蚂蚁灵光支持3D、音频、图表、动画、地图等全模态信息输出,并能实现信息的可视化 [3][4] - 2025年10月豆包的日活跃用户最高,达到5410万,DeepSeek为2860万 [15] - 2025年9月夸克的月活跃用户在全球总榜排名仅次于ChatGPT,位列国内总榜第一 [16] - 蚂蚁AQ在上线四个月后月活用户规模突破千万,是唯一一款月活超千万的行业专业级AI原生应用 [16] 行业竞争格局与市场动态 - 国内形成“南阿里、北字节”的AI格局,AI应用进一步冲击海外市场,直接对标ChatGPT等 [6] - 2025年被视为“AI应用元年”,C端用户热情升温,大厂迎来场景布局和能力延伸的最佳机遇 [6] - 2025年9月,大陆市场AI产品投放素材量达141.1万组,腾讯元宝、夸克、豆包等位列素材投放榜前五 [16] - 各公司确立差异化方向:千问从B端走向C端,夸克专注“all in one”,豆包依托社交平台流量,AQ深耕医疗垂类场景 [17] 技术积累与战略方向 - 蚂蚁自主研发的百灵大模型已发布18款大模型,跻身万亿参数模型阵营,未来战略方向为聚焦应用、推动普惠 [7] - 蚂蚁已在医疗健康、金融等垂类领域推出AQ、蚂小财等应用,并通过灵光重新定义通用AI助手能力边界 [8] - 阿里巴巴宣布三年3800亿AI基础设施支出,蚂蚁集团早在2023年就提出“AI First”战略 [11] 杭州AI产业集聚效应 - 2025年前三季度浙江省人工智能核心产业营业收入达4944亿元,同比增速22%,研发费用390亿元,同比增长14% [11] - 杭州在AI基础层、技术层、应用层积累了全链路企业布局,并积极推动人才引进和培养 [11] - 2025年第三季度AI产品经理岗位,杭州以平均月薪28659元领跑全国,成为该岗位薪资最高的城市 [13] - 杭州发布多项人工智能发展方案,支持大模型多路线攻关及全产业链高质量发展 [10]
杭州连发两张王牌:阿里千问对标ChatGPT,蚂蚁灵光同频Gemini3.0
财联社· 2025-11-18 14:28
杭州AI产业集聚效应 - 杭州集结了包括阿里千问、蚂蚁灵光、DeepSeek、AQ和通义在内的多款AI应用,形成“AI梦之队” [1][3] - 2024年浙江省AI产业年产值突破5700亿元,其中杭州贡献超七成利润,AI企业数量达569家,稳居全国第一梯队 [3] - 杭州AI产品经理平均月薪达28659元,领跑全国,成为该岗位薪资最高的城市 [4] - 杭州AI产业快速发展得益于政策支持,2024年出台行动计划明确从基础层、技术层、应用层全链条推进 [3] 阿里系AI战略布局 - 阿里系在AI时代形成“南阿里、北字节”的双雄对垒格局,以杭州和北京为两大阵地 [5] - 阿里通义千问系列在全球开源模型竞争中表现活跃,蚂蚁百灵大模型持续攻坚AGI技术突破 [5] - 蚂蚁集团提出“AI First”战略,在应用端聚焦生活服务、医疗健康与金融服务三大领域,对应灵光、AQ、蚂小财三大应用 [10] - 阿里升级千问APP对标ChatGPT,战略重心从B端市场向C端拓展 [7] AI入口竞争新态势 - AI助手被视作互联网入口之争的下一个重要战场,行业从技术竞赛转向应用落地深度探索 [6] - 2025年8月移动端AI应用整体规模达6.45亿,原生AI App用户规模2.77亿,竞争进入比拼留存与粘性阶段 [6] - 2025年下半年起国内AI大厂围绕入口争夺战明显提速,阿里、蚂蚁、腾讯、字节纷纷抛出战略级项目 [7] - 行业正逐步摆脱同质化内卷,迈向以场景深度为核心的差异化破局阶段 [10] 蚂蚁灵光的产品差异化 - 蚂蚁灵光支持在移动端实现30秒生成日常生活小应用,主打自然语言生应用功能 [1][9] - 灵光对话解答通过3D、音频、图表、动画、地图等结构化形式展现,形成务实高效风格 [7] - 灵光可生成可交互、可编辑的“工具”,实现AI服务个性化定制,与谷歌Gemini 3.0探索方向一致 [9][1] - 灵光价值主张简单易用,支持一句话30秒生成应用,覆盖运动健身、旅行攻略等具体生活场景 [10]
搞事情!AI天才扎堆虎嗅F&M之夜
虎嗅APP· 2025-11-18 14:17
活动概述 - 虎嗅F&M之夜举办了一场以95后AI天才创业者为主的私享派对 主题为“脑洞比算法还野” [2] - 活动采用限量闭门定邀制 聚集了150位AI创业者、新兴科学家、人文学者、创投大佬和科技品牌业务负责人 旨在提供直接的硬核资源对接 [24] 创业者与项目亮点 - Skyris创始人张宇诺提出为“不合群”个体创造专属AI数字宠物 其核心能力是“偏袒” 能深度理解并拥抱用户的独特喜好与微小情绪 [3][4] - Dreamoo创始人孙东来探索用AI技术构建“数字人生” 焦点在于捕捉和复现个体生命的独特痕迹与情感记忆 为生者的思念提供可感知、可交互的载体 [8] - 期音科技创始人殷渝杰从生物最原始的发音中寻找灵感 训练算法创造超越人类发声极限的旋律 旨在探索AI赋能下音乐的全新表达维度 [10][12] - 共绩科技联合创始人黄力昂聚焦“量子意识”前沿议题 探索自由意志的本质 试图拆解人脑与AGI的底层共同逻辑 [14] - 生境科技联合创始人庄子扬认为世界底层运行逻辑与推荐系统核心本质相通 都是“精准匹配供需” 其“连接需求与资源”的逻辑可作为理解复杂系统的新模型 [17][18] 跨界对话环节 - 活动包含深度对话环节 由2025虎嗅年度创作者榜得主卫诗婕主持 跨界集结了科技史学者张笑宇、极群科技创始人陈春宇、煜盛智元创始人叶宇轩、iMeanAI创始人尚晏仪等多领域专家 [21] - 讨论围绕“世界观是否被AI动摇”展开 从历史纵深、商业实战、技术前沿多维度进行碰撞 兼具理性思考与鲜活洞察 [21] 活动参与信息 - 活动线下对外开放最后20席少量名额 仅限AI行业相关人士报名 审核通过可锁定席位并加入AI原生长线社群 享受长期资源对接、闭门复盘交流和项目撮合等专属福利 [24] - 活动首次开放线上直播通道 用户可通过预约链接线上同步围观 [27] - 活动入场券不包含F&M创新节通票 创新节门票需另行购买 其中超值搭子票为300元双人两日 日均仅75元 [26][27]