Workflow
Fellou
icon
搜索文档
GPT5来了,OpenAI、谷歌、Anthropic纷纷更新,压力给到国产大模型;这40种工作最可能被AI取代|混沌AI一周焦点
混沌学园· 2025-08-09 12:08
本周核心趋势 - 开源策略驱动谷歌、Anthropic等巨头展开多维度竞争,加速AI在各行业的应用与适配,开源与闭源界限模糊可能催生新商业模式[2] - 浏览器、地图等应用从信息工具转变为具备行动能力的"智能伙伴",通过深度整合Agent重构交互维度,跨界整合有望实现用户粘性倍增[3] - AI对就业市场影响显著分化:信息处理型岗位(白领)面临自动化风险,体力型岗位相对稳定,将重构技能培训市场并催生"AI+X"跨界技能需求[4] - AI从单点智能向多智能体协同进化,360蜂群智能体展现接近L4级别自主效率,在工业、医疗等领域跨界应用预计释放数十倍效率潜力[5] GPT-5发布 - GPT-5模型将过往能力"合而为一"进化为全能个人助手,"幻觉"现象大幅减少80%,编程能力实现飞跃,前端开发等领域超越多数专业开发者[6][7] OpenAI开源模型 - 推出开源语言模型gpt-oss-120b和gpt-oss-20b,采用MoE架构,gpt-oss-120b可在高端笔记本运行,gpt-oss-20b支持手机运行,推理速度达3000 token/秒,性能比肩o4-mini[9] Genie 3世界模型 - 谷歌DeepMind发布Genie 3,仅需一句话指令即可实时生成720p动态世界,支持20-24FPS流畅交互+分钟级视觉记忆一致性,可模拟物理、自然、奇幻场景[10] Claude Opus 4.1发布 - Anthropic发布Claude Opus 4 1,在权威编程基准SWE-bench上取得74 5%成绩,超越前代Opus 4及竞品Gemini 2 5 Pro,深度强化Agent任务和跨文件代码重构能力显著提升[12] 松延动力商业化进展 - 半年斩获超2000台商业化订单,合同额破1亿,成为国内第二家迈入"千台俱乐部"的人形机器人企业,双足机器人实现全球首个开放场景连续空翻技术[13][15] AI浏览器测评 - Fellou:自动化Agent能力突出,复杂多步骤任务可简化为一键操作[17] - Comet:搜索质量与内容生成能力领跑,综合体验最佳[18] - 微软Edge:整合Copilot可生成长达9页深度报告,生态优势显著但各项能力尚待精进[19] - Dia:专注陪伴感与易用性,人性化交互设计突出[20][21] 高德地图更新 - 深度整合空间智能架构,推出AI领航、AR打卡等工具,打造个性化数字孪生世界,重新定义地图导航[23] AI对就业影响 - 翻译员、销售等职业AI覆盖率和成功率超80%,护理助理、卡车司机等体力劳动岗位受影响最小,AI适用性与薪资、学历关联较弱[24] 360蜂群智能体 - 纳米AI升级为"多智能体蜂群",实现L4级别智能体系统,从单兵作战到群体协同进化,推动各行业效率与创新能力提升[25][26]
Agent爆火,华人赢麻了
36氪· 2025-07-24 18:36
华人AI Agent创业热潮 - 2025年以华人为主角的AI Agent创业热潮席卷全球,Manus和Genspark成为代表性产品[3][7][8] - Genspark在45天内实现3600万美元年度经常性收入(ARR),10周上线8个产品[4][5] - Manus发布当月MAU达2300万,获Benchmark领投7500万美元融资,投后估值超5亿美元[9][10] 代表性公司及产品表现 - MainFunc的Genspark浏览器通用Agent发布45天ARR达3600万美元[5][24] - Monica团队的Manus通用Agent发布当月MAU达2300万[9] - Flowith的Neo无投放ARR达130万美元,6月Web访问量101万[15] - 360的纳米AI超级搜索智能体6月Web访问量达1.57亿[15] - 阿里夸克AI 6月Web访问量超8400万[15] 技术驱动因素 - Claude 3.7 Sonnet混合推理模型提升编程和开发性能[16] - MCP(模型上下文协议)实现AI自由调用外部工具[16] - Agent产品形态从简单聊天演进为能自主规划任务并交付结果的智能体[12] 行业趋势与挑战 - 通用Agent增长红利消退:Manus月访问量从3月2376万次降至6月1730万次,Genspark从4月888万次降至6月769次[19] - 地缘政治影响:Manus退出中国市场可能与美国财政部监察有关[20][21] - 大厂在通用Agent领域进展缓慢,初创公司凭借灵活高效占据优势[26][27][29] 产品发展策略 - 快速响应技术:Manus团队3个月完成产品开发,Lovart团队2个月完成研发[30][31] - 专注用户体验:Manus4次重构智能体框架提升运行速度[32] - 垂类Agent成为新方向:LiblibAI发布设计Agent Lovart,蔡浩宇推出AI游戏《Whispers from the Star》[37][39] 商业化表现 - Genspark仅用9天实现1000万美元ARR,远超AI Coding企业Cursor的21个月[25] - 垂类Agent表现突出:Lovart发布5天注册用户超10万,ListenHub首发当天DAU 5000+[39] - OpenAI的Agent"Deep Research"促使20%用户升级至200美元/月的Pro会员[36]
「Manus+景鲲」领衔主演,华人AI Agent全球狂欢
36氪· 2025-07-24 18:07
行业动态 - 2025年全球科技圈聚焦华人AI Agent,Genspark和Manus成为代表性产品[1][3][4] - Agent行业在2025年迎来"文艺复兴",技术跃升推动产品形态成熟,用户规模和收入显著增长[6][7] - Claude 3.7 Sonnet模型和MCP协议发布,为Agent生态发展提供关键技术支撑[9] - 垂直领域Agent开始崛起,LiblibAI、米哈游等公司在多模态、游戏等细分市场布局[29][31] 公司表现 - MainFunc旗下Genspark实现45天3600万美元ARR,10周上线8个产品的爆发式增长[1] - Monica团队开发的Manus发布当月MAU达2300万,获Benchmark领投7500万美元融资,投后估值超5亿美元[4] - 阿里夸克AI月访问量超8400万,高考志愿报告Agent累计生成1000万份报告[8] - 360纳米AI超级搜索智能体月访问量达1.57亿,美图RoboNeo登顶国内App Store分类榜[8] 产品特征 - 新一代Agent具备自主规划任务、调用外部工具的能力,突破传统聊天机器人局限[6] - Manus定义了显示思维链对话框+任务执行可视化面板的产品范式,被多家公司模仿[10][12] - 通用Agent面临PMF验证问题,Manus和Genspark月访问量分别从2376万/888万下滑至1730万/769万[13] - 垂直领域Agent在图像设计、视频编辑、编程等场景取得突破性进展[31] 市场趋势 - Agent实现高营收速度惊人,Genspark仅用9天达到1000万美元ARR,远超Cursor的21个月[17] - 初创公司在通用Agent领域表现激进,大厂受制于组织惯性和政策限制进展缓慢[18][22] - 地缘政治影响显现,Manus裁撤中国团队转向新加坡市场,面临海外融资压力[14][15] - 行业共识认为未来通用Agent将由模型厂商主导,创业公司需转向垂直领域发展[28][29] 技术发展 - 第三方模型性能提升和低代码工具降低开发门槛,推动Agent产品快速迭代[6][23] - Monica团队4次重构智能体框架,优化运行速度和可扩展性[25] - 产品开发周期大幅缩短,Manus和Lovart分别仅用3个月和2个月完成开发[24][25]
为什么AI浏览器可以聚集一切
虎嗅· 2025-07-01 10:31
互联网与AI时代浏览器演变 - 互联网时代发展路径为网页-浏览器-门户-搜索-社交网络,AI时代企业参照该路径在不同节点寻找AI化可能性 [1] - 浏览器是互联网首个全民级应用,微软30年前通过IE赢得首轮平台之争,Google后来用Chrome颠覆IE并强化搜索入口地位 [2] - AI浪潮中浏览器竞争白热化,参与者包括Fellou、Dia、Opera等原生AI浏览器,以及Chrome、QQ浏览器等植入AI功能的传统产品 [2] AI浏览器功能转型 - AI浏览器从搜索容器升级为AI能力躯体,从信息窗口变为代理执行伙伴,整合搜索、决策、执行功能 [4] - 产品形态包括豆包(AI助理)、夸克(AI搜索)、ima(知识库)等浏览器形态产品,以及扣子空间等基于浏览器的Web工具合集 [4] - 进化方向是成为AI时代操作系统,类似Google曾试图通过Chrome OS构建的云端生态 [5] 用户交互与硬件生态变革 - AI浏览器简化人机交互范式,硬件将分化为本地算力提供者(高配PC)和云端连接者(智能眼镜等轻量化设备) [6] - 全球数亿用户仍依赖浏览器处理复杂信息获取,共享文档和多维表格主要通过浏览器打开 [7] - AI浏览器产品如Fellou、Dia采用邀请制注册,出现"一码难求"现象 [7] AI浏览器三大类别 - **原生AI浏览器**:Dia侧重流畅浏览体验,Fellou强调代理式深度行动,60%用例涉及数据查询与爬取 [9][15] - **类AI浏览器**:豆包、夸克等以浏览器为功能载体,核心仍围绕AI助手/搜索优化 [10] - **AI化传统浏览器**:QQ浏览器集成QBot支持多模态搜索,Chrome嵌入Gemini,Edge上线Copilot Vision,采用渐进式改造策略 [10] 行业竞争逻辑 - **入口争夺**:云端营收增长、WebAssembly等技术推动浏览器成为AI搜索/生图/视频的核心入口,地址栏可能进化为"超级框" [12] - **操作员角色**:Perplexity等产品管理投资组合等完整工作流,Fellou用户通过自动填表功能成功求职案例显示行动力需求 [14][15] - **智能伙伴定位**:Dia定位聊天工具辅助工作,Fellou强调赋予用户自由时间,最终目标是打造具记忆力和执行力的AI伙伴 [17][18] 技术演进与生态构建 - Opera Neon通过DOM树分析网页内容,跳过传统浏览方式直接获取信息 [21] - OpenAI计划开发整合ChatGPT的AI浏览器,接入旅游/零售等服务商能力,可能通过Agent间交互实现 [23] - 浏览器向操作系统进化,Dia目标成为Agent指挥中心,Chrome OS的成功预示AI浏览器或匹配专属硬件(如Chromebook) [24][27][28]
如何定义智能体价值?容错性与自主性为核心考量指标
21世纪经济报道· 2025-07-01 08:41
智能体行业发展现状 - 2025年被称为"智能体元年",AI发展从对话生成跃迁到自动执行,智能体成为最重要的商业化锚点和下一代人机交互范式 [1] - OpenAI将AI发展分为L1-L5阶段,L3阶段的智能体具备对话能力、推理能力、长记忆和工具调用四项核心能力,其中工具调用是最关键区分要素 [2] - 智能体市场划分为通用型和垂直型,通用型跨领域提供基本认知能力,垂直型专注特定领域深度融合专业知识,目前垂直型更易形成可持续商业模式 [4] 智能体商业化进展 - 编程场景已诞生ARR突破5亿美元的产品Cursor,成为最短时间突破1亿美元ARR的软件产品 [6] - 垂直智能体在办公软件(WPS、钉钉、飞书)、金融(支付宝、微信风控)、法律(通义法睿、金山晓法)等领域开始落地 [4] - 2025年AI手机渗透率预计达34%,端侧模型精简和芯片算力升级推动AI手机向中端价位渗透 [12] 智能体产业链格局 - 产业链分为基础层(大模型与基础设施)、平台层(开发工具与平台)、应用层(应用与场景) [7] - 科技巨头以大模型为底座布局智能体平台和生态,创业团队在核心能力做颠覆性创新,终端厂商依靠设备入口差异化竞争 [8] - MCP协议通过提供统一通信标准推动智能体行业互联互通,降低集成门槛 [10] 智能体技术演进方向 - 多模态基础模型和强化学习训练方法已发展到相对成熟阶段,能理解视觉信息和训练Agent与环境交互 [9] - 智能体正从AI手机扩展到AI浏览器,将对话交互方式植入搜索页面实现实时唤起和多轮对话 [13] - 通用智能体挑战"上限"和"广度",垂直智能体夯实"下限"和"深度",两者发展方向各有价值 [4] 智能体评估框架 - 从"容错性"和"自主性"两个维度建立智能体价值生态评估模型,X轴容错性衡量错误后果严重程度,Y轴自主性衡量决策执行能力 [14] - 医疗等低容错性场景需要更准确信息捕捉和稳定执行,写作创意等高容错性场景错误后果轻微可控 [14] - 不同象限的智能体产品需适配对应的安全风险准则 [14]
深度拆解:为什么通用 Agent 的下一站是 Agentic Browser?
Founder Park· 2025-06-14 10:32
核心观点 - 行业正经历从通用Agent向Agentic Browser的范式转移,浏览器因其内容通用性、用户习惯和跨应用能力成为通用Agent的天然载体 [13][17][20] - Agentic Browser的核心是"代替用户行动",而不仅是"辅助用户浏览",其终极目标是成为全新的AI操作系统并催生定制化硬件生态 [13][31][41] - 未来AI之争的本质是对用户跨应用、全链路"上下文"控制权的争夺,浏览器凭借其深度与广度兼备的上下文获取能力成为关键战场 [21][25][28] 概念定义 - 通用Agent:具备自主理解、规划、执行能力的智能实体,强调自主性和通用性,代表产品包括ChatGPT、豆包等 [17] - AI搜索:利用AI技术改进搜索结果相关性和呈现方式,代表产品包括Perplexity、秘塔搜索等 [17] - AI浏览器:传统浏览器集成AI功能如侧边栏助手、内容总结等,代表产品包括QQ浏览器、夸克等 [17] - Agentic Browser:以浏览器为载体使Agent具备深度上下文感知和跨应用操作能力,代表产品包括Comet、Fellou等 [17][18] 行业驱动力 - 操作系统厂商通过生态霸权限制第三方AI创新,如谷歌阻止摩托罗拉预装Perplexity,微软深度绑定Copilot [9] - 传统浏览器同源策略形成数据孤岛,使通用Agent无法获取用户真实行为数据执行跨网站任务 [10] - 反垄断诉讼为突破生态封锁创造机会,如美国司法部强制谷歌剥离Chrome的提案促使Perplexity开发Comet浏览器 [11] 技术载体优势 - 上下文控制:浏览器可获取用户全维度数据包括浏览时长、交易信息、跨站点行为等,远超单一APP的数据维度 [25][27] - 本地OS控制:通过混合影子空间技术实现本地即时响应、虚拟化执行和云端协同,具备操作系统级资源调度能力 [30][34] - 跨应用连接:支持跨网站工作流自动化如自动关注Twitter博主、电商比价加入购物车等复杂操作 [35][36] 未来演进路径 - 短期:通过Agent Store构建开放生态,如Fellou的VIEP技术和Eko框架实现任务动态规划 [27][35] - 中期:发展为AI优先操作系统,重构资源调度和交互设计围绕任务执行为核心 [31][43] - 长期:催生定制化硬件如AgentBook,在芯片层面集成AI计算单元和先进传感器 [41][43]
2025,AI Agent赛道还有哪些机会?
虎嗅· 2025-05-26 16:16
AI Agent行业动态 - OpenAI以30亿美元收购编程工具Windsurf [1] - 编程工具Cursor母公司Anysphere获9亿美元融资 估值达90亿美元 [1] - 中国通用AI Agent项目Manus获Benchmark领投7500万美元融资 [1] - OpenAI推出具备浏览器能力的Operator和复杂任务处理产品Deep Research [1] 技术演进 - 2025年AI Agent技术实现跃迁 结合强化学习与推理模型能力 [8] - RFT(强化学习微调)技术推动Agent具备自主学习能力 [8] - 大语言模型达到"AlphaGo时刻" 能自主探索解题路径 [15] - 环境理解成为关键 Devin构建包含四个子界面的综合开发环境 [21] 产品分析 - Cursor从编程工具向通用平台转型 积极接入MCP接口 [31][55] - Windsurf内置context engine 环境理解能力突出 [19] - Devin创新性加入笔记系统 支持长期开发过程管理 [21] - Manus依赖Claude Sonnet 3.7模型 面临API稳定性挑战 [33] 创业机会 - 通用Agent领域被大厂占据 创业者机会集中在垂直场景 [23] - 服务型Agent面临被整合风险 如Operator覆盖上百个场景 [22] - 个人化Agent可能成为新方向 类似自媒体网红模式 [24] - 评估机制(Evaluation)成为构建竞争力Agent的关键 [40][43] 技术路线 - RFT相比SFT性能提升25% 但成本高出数倍 [47] - Manus采用SFT技术调优外围执行模块而非核心模型 [48] - MCP协议发展缓慢 行业采纳面临商业化障碍 [72] - 代码层成为数字世界操作的关键中间层 [28] 垂直领域案例 - Vantel为保险经纪人节省80%重复工作时间 [58] - Sweet Spot服务中小企业申请政府资助 用户体验优异 [59] - Gamma革新PPT制作流程 模块化设计获长期用户认可 [61][62] - Replit和Fellou在人机交互设计上表现突出 [49][52] 行业趋势 - 产品开发节奏加快 执行优先于计划 [65] - 环境侧建设滞后 MCP生态渗透需以年计 [68] - 编程Agent可能发展为通用型平台 [31][56] - 用户需求理解仍是待解难题 [69]
AI不只有大模型?Agent凭什么成为2025年度风口|对话刘志毅
36氪· 2025-05-14 20:45
互联网产品格局变化 - 过去十年国内诞生上千万款互联网产品,目前仅44款月活过亿,其中9款诞生于近十年,字节跳动占一半以上,腾讯占两款 [1] - DeepSeek成为历史上首款未花营销费用、上线一个月下载量破亿的应用软件,打破字节在To C产品的统治地位 [2] - 深度求索公司打破持续十年的大厂垄断局面,为行业带来新竞争格局 [2] AI Agent市场发展 - DeepSeek推动大模型推理能力进步,促进AI Agent发展,Manus发布2天预约超120万,后续增长至260万 [4] - Manus验证市场对Agent的热情,百度心响、Genspark、Fellou、Coze空间等竞品涌现 [4] - Manus完成7500万美元融资,估值暴涨五倍,行业巨头OpenAI和微软均看好Agent未来 [5] AI Agent技术特性 - Agent具备自主规划、工具调用和多模态能力,推动AI从被动响应升级为主动执行 [9] - Agent依赖基础模型进步,推理能力提升是关键,但存在响应速度慢、易出幻觉等不足 [5][11] - 智能体发展需突破跨组织协同、物理世界交互能力及开源生态成熟三大技术节点 [14] AI Agent应用场景 - 当前成熟场景包括智能客服、金融投顾、医疗辅助诊疗等垂直领域 [12] - 深圳福田区部署70个基于DeepSeek的"AI数智员工",覆盖240个场景,一次解答精准率近90% [17] - 文旅和房产管理是潜力行业,涉及多模态交互和招商管理等场景 [18][19] 行业竞争格局 - 基础模型领域已形成巨头垄断,难容纳新创业公司 [3] - Agent公司分为技术框架、垂直应用和开放协议三类流派 [13] - 国内市场可能超越SaaS规模,因发展空间大且共识未形成 [22] 职场影响与人才需求 - Agent将催生"超级个体"与智能体集群模式,出现AI训练师等新职业 [16] - 企业用人标准转向AI协同能力,需具备二次改造智能体的技能 [20] - 管理者角色转变为"认知架构师",需掌握人机协同思维 [16][21] 技术发展趋势 - DeepSeek推出R1模型开源成果,标志开源生态发展 [14] - 智能体需解决动态检索和模态关联问题,减少执行幻觉 [11] - 物理仿真平台和世界模型生成技术是未来突破方向 [14]
来自flomo、沉浸式翻译、Cubox、Podwise、Fellou、Manus的劳动节礼物
Founder Park· 2025-04-30 17:14
AI产品市集计划概述 - 公司推出「AI产品市集」计划,首期推荐10款创新AI产品 [2] - 计划发布24小时内飞书群突破1000人,持续增长中 [3] - 社群每日推荐AI产品并分享真实使用反馈 [3] 社群福利活动 - 五一期间推出6天进群福利,包括51个flomo会员、41个沉浸式翻译会员等 [5] 计划背景与目标 - 观察到DeepSeek崛起、Manus爆火等信号,预示AI产品春天来临 [7] - 计划旨在记录开发者成果,帮助创新AI产品获得行业关注 [7] 计划服务内容 - 提供早期市场验证服务,通过社区反馈优化产品 [8] - 为优秀产品提供展示推广服务,利用公众号及社群扩大声量 [9] 参与产品标准 - 涵盖早期产品(用户量未达10万)及多样化形态(移动端、Web端等) [10][11] - 无严格限制,鼓励提交产品demo申请助推 [12] 相关行业动态 - 提及Qwen 3发布、Perplexity浏览器竞争等AI行业热点 [13]
AI 活动公告板:5 月假期,来充电!
Founder Park· 2025-04-29 20:33
AI行业活动概览 - 阿里开源Qwen3系列模型并推出Fellou、扣子空间、心响等AI Agent产品,行业创新速度加快 [2] - 参与高质量行业活动是快速跟进AI趋势的重要途径 [2] 重点活动详情 湾区闭门深度交流局 - 主办方为极客公园Global ready,5月17日-19日在湾区举办,与Figma大会、SaaStr 2025、Google I/O同期 [4][5] - 目标人群为企业家、AI创业者及关键业务负责人,需通过微信联系报名 [4][6] 亚马逊云科技AI开发大赛 - 线上活动,4月10日-6月19日举行,提供10万启动金、拉斯维加斯技术之旅及禅意机械键盘等奖励 [6] - 面向AI创业者及开发者,强调代码全民化与创新边界突破 [6] NVIDIA创业企业展示-上海站 - 5月15日线下举办,聚焦AI智能体、合成数据、物理仿真,提供技术指导、资金支持及产业对接 [6] - 目标人群为AI创业者、开发者及技术专家 [6] Hugging Face AI Agents课程 - 长期线上课程,教授Agents底层原理及smolagents、LlamaIndex等工具库的应用 [7] - 适合AI工程师、创业者及产品经理 [7] 复星杯AI+创业创新大赛 - 6月1日截止报名,依托复星200+产业场景,提供千万级投资、出海资源及亚马逊补贴 [7][8] - 面向AI创业者及开发者,优胜者可获现金奖及复星直通录用机会 [7][8] 延伸阅读 - 文章推荐Perplexity浏览器战略、Arc创始人访谈及OpenAI Agent产品化分析等话题 [9]