Workflow
Gemini系列模型
icon
搜索文档
90%被大模型吃掉,AI Agent的困局
投中网· 2025-07-25 16:33
通用Agent行业现状 - 通用Agent面临尴尬境地,90%的市场份额可能被大模型吞噬[3][4][8] - Manus等头部公司出现收入下滑和用户活跃度下降,Manus 6月访问量1781万次,较3月峰值2376万次下降25%[5][22] - Genspark发布45天即达3600万美元ARR,但6月MRR环比下跌13.58%至295万美元[20][22] 商业化与竞争格局 - 头部产品商业化表现分化:Manus 5月ARR达936万美元,但6月MRR环比暴跌51.79%至167万美元[20][21] - 国内大厂主导市场,百度、字节等通过免费策略挤压创业公司空间[26][27][29] - 收费模式对比:Manus Pro会员199美元/月限积分制(约10次/天),Claude Opus 4同价但支持不限量使用[9][11] 技术瓶颈与场景困境 - 大模型能力溢出直接冲击Agent价值,用户更倾向使用基础模型API[9][12] - 垂类Agent在企业端优势显著,可对接内部知识库实现精准输出[15][16] - 当前通用Agent核心场景局限在PPT生成、深度研究等办公功能,但存在信息错漏和低价值输出问题[24][32][34] 技术演进方向 - MiniMax采用线性注意力机制支持100万上下文输入,强化法律文书处理能力[35] - 强化学习(RL)成为突破关键,月之暗面Agent模型在HLE测试得分从8.6%提升至26.9%[36][38] - OpenAI最新Agent产品ChatGPT Agent在HLE测试创41.6%的SOTA成绩[38] 市场趋势 - 行业呈现"模型即Agent"趋势,大模型公司直接切入Agent赛道[28][29] - 开发者生态成竞争焦点,阿里、字节等通过平台推广和比赛吸引开发者[26] - 深度研究功能因成本较低成为主流方向,多模态能力成为标配[30][32]
90%被大模型吃掉,AI Agent的困局
36氪· 2025-07-18 18:48
通用Agent市场现状 - 通用Agent面临增长放缓困境,Manus访问量从3月2376万次下跌至6月1781万次(跌幅25%),Genspark访问量下降8% [10] - 商业化表现波动明显:Manus 5月ARR达936万美元但6月MRR环比下跌超50%至254万美元,Genspark同期ARR 3600万美元但MRR下跌13.58%至295万美元 [9][11] - 核心问题在于缺乏杀手级应用场景,当前功能集中于PPT生成、多模态处理等办公场景,用户付费持续性不足 [2][11] 竞争格局变化 - 基础模型能力溢出侵蚀市场:Claude Opus 4等模型提供不限量服务(200美元/月),相较Manus Pro会员199美元/月但限制每日约10次任务更具性价比 [4][6] - 垂类Agent在企业端形成优势:Head AI等垂类产品能对接内部知识库,准确度显著高于通用Agent [7] - 大厂主导国内市场:百度、字节等通过免费策略挤压创业公司空间,MiniMax等采用积分制但难敌大厂资源 [12][13] 技术演进方向 - 强化学习(RL)成为突破重点:月之暗面Kimi-Researcher通过RL将HLE测试得分从8.6%提升至26.9%,OpenAI ChatGPT Agent最新达41.6% [18][20] - 长文本处理能力升级:MiniMax M1模型支持100万token上下文,优于Gemini 2.5 Pro的200K上限 [17][18] - 多模态集成趋势明显:MiniMax融入视频生成能力,百度心响整合原有对话系统 [15] 商业模式挑战 - 成本转嫁矛盾突出:Manus采用积分制导致高频用户成本高企,对比基础模型API无使用次数限制 [6] - B端落地障碍:企业需求与通用Agent"黑盒"特性存在冲突,需深度集成内部系统 [7] - 大厂生态战略:阿里、字节等侧重开发者平台建设,通过比赛推广而非直接产品竞争 [11]
腾讯研究院AI速递 20250710
腾讯研究院· 2025-07-09 22:49
一、AI视频生成技术升级 - 谷歌Veo 3升级支持仅用一张图片生成音频和视频,角色在多镜头下保持高度一致性[1] - 新功能通过Flow平台的"Frames to Video"选项实现,加入丰富运镜功能[1] - 用户实测显示人物表情自然、表演到位,适用于广告、动画等多领域[1] - Vidu Q1多参考生视频功能可上传最多7张参考图像,实现角色一致性强、多元素同框和零分镜视频生成[4] - 清晰度升级至1080P,支持主体库存储角色素材,单条视频成本不到9毛钱[5] 二、开源大模型进展 - Hugging Face开源3B参数模型SmolLM3,性能超越Llama-3.2-3B和Qwen2.5-3B,支持128K上下文窗口及6种语言[2] - 模型采用双模式系统,用户可在深度思考和非思考模式间灵活切换[2] - 昆仑万维开源Skywork-R1V 3.0多模态模型,高考数学得142分,MMMU评测达76分,超越部分闭源模型[3] - 模型通过强化学习策略GRPO和关键熵驱动机制,仅用1.2万条监督样本和1.3万条强化学习样本实现高性能[3] 三、端侧与多模态模型 - vivo发布端侧多模态模型BlueLM-2.5-3B,支持GUI界面理解,在20余项评测中表现优异[6] - 模型支持长短思考模式自由切换,引入思考预算控制机制[6] - 采用精巧结构(ViT+Adapter+LLM)和四阶段预训练策略,缓解多模态模型文本能力遗忘问题[6] 四、AI系统突破 - X-Masters系统在"人类最后的考试"(HLE)上首次突破30分,达到32.1分,超越OpenAI和谷歌[7] - 系统基于DeepSeek-R1模型构建了工具增强推理智能体X-Master,能在内部推理和外部工具使用间流畅切换[7] - 采用分散-堆叠式多智能体工作流,通过求解器、批评者、重写器和选择器多角色协作[7] 五、行业并购与市场格局 - 智元机器人以21亿元收购科创板上市公司上纬新材控制权,预计收购63.62%-66.99%股份[8] - 2025年上半年Gemini系列模型占据大模型API市场近一半份额,谷歌以43.1%位居第一[9] - DeepSeek V3自发布以来用户留存率极高,位列使用量前五[9] - 细分领域呈现差异化竞争格局:Claude-Sonnet-4在编程领域领先(44.5%),GPT-4o在营销领域领先(32.5%)[9] 六、AI应用趋势 - 全球已有18亿AI用户,但付费率仅3%,学生使用率高达85%,家长群体成为AI重度用户[10] - AI主要应用于邮件撰写(19%)、研究兴趣主题(18%)和管理待办事项(18%)等日常场景[10] - 未来18-24个月AI将迎来六大趋势:垂直领域工具崛起、完整流程自动化、语音AI爆发等[10]
120页深度报告,搞懂今年大模型和应用的现状与未来
Founder Park· 2025-07-03 19:07
模型篇 - 基础模型训练成本五年内增长近两个数量级 从2020年GPT-3的450万美元增至2025年Llama 4的3亿美元[3][6] - 模型生命周期急剧缩短 闭源前沿模型的领先地位可能在6-12个月内被颠覆 如GPT-4在一年后被成本低10倍的开源模型DeepSeek-VL超越[6] - 开源模型性能快速收敛闭源模型 新模型在排行榜前五保持领先的中位数时间仅3周[8] - 行业从追求参数规模转向计算效率 新一代顶尖模型如Claude 3.5 Sonnet参数规模反而下降[12] - 推理计算成为新前沿 30亿参数模型通过深度思考可超越700亿参数大模型的数学能力[16] - 混合专家模型(MoE)架构普及 通过部分参数激活降低单次推理成本[22] 技术突破 - 自监督学习突破数据规模化瓶颈 允许模型从海量未标注数据学习[24] - 注意力架构(Transformer)实现计算效率革命 完美契合GPU并行计算特性[25] - 模型规模达到临界点后出现"涌现"能力 性能从随机猜测跃升至高度准确[26] - 参数量三年增长15,500倍 远超摩尔定律的两年翻一番[27] - 上下文窗口扩展100-500倍 从数千token增至百万级[28][34] - 多模态能力持续进步 但全能模型(Omni-modal)仍处早期阶段[28] 应用篇 - AI代码生成工具形成20亿美元市场 Cursor创SaaS最快增长记录 年收入近10亿美元[42] - YC创业公司中25%的代码库95%由LLM生成 标志"氛围编程"时代到来[44] - 软件工程全生命周期被重塑 从代码审查到测试QA各环节都出现AI工具[45] - 专业Copilot矩阵快速扩张 覆盖硬件/创意/工程/金融等领域[47][48] - AI个人生活整合加速 核心用例从"生成想法"转向"治疗/陪伴"和"生活管理"[52] 市场动态 - 2024年全球风险投资10.5%流向基础模型公司 总额330亿美元[112] - OpenAI收入结构分化 73%来自ChatGPT订阅 Anthropic 85%来自API[119] - AI原生应用ARR超12亿美元 Midjourney/Cursor/ElevenLabs等突破1亿美元[130][133] - 物理世界AI公司获巨额融资 Figure AI获6.75亿美元 OpenAI/微软等参投[127][128] - GPU生态系统重塑 英伟达AI推理token生成量一年增长十倍[139] 未来趋势 - 软件开发范式迁移 CI/CD/Git等传统流程面临AI适配挑战[152] - 数据即服务(DaaS)复兴 LLM使数据收集/结构化成本降低1000倍[156] - 创意工具护城河转向网络效应/运行环境/工作流特异性[158] - AI与科学结合催生"生成+验证"闭环系统 如AI科学家[161] - 智能体基础设施需求爆发 需专用浏览器/支付系统/身份认证[161]
亚马逊云现场一手
小熊跑的快· 2025-06-20 16:13
大模型竞争格局 - Claude 3.7和4系列模型性能已与OpenAI O1系列分庭抗礼 单日token处理量接近持平 [1] - 云计算厂商模型阵营分化明显 AWS不主推OpenAI GPT和Gemini系列 Google云部署Claude而非GPT 微软云亦未主推Claude [2] 芯片技术进展 - Trainium2当前支持6万卡集群部署 在推理需求推动下加速推广 Inferentia芯片迭代停滞 预计年底推出Trainium3 [3] 云计算基础设施 - 亚马逊基于CPU的计算基础云规模居行业首位 持续获得市场认可并通过降本优化竞争力 [4] - 应用开发架构分为三层:基于GPU的Sagemaker 基础模型API一体化平台Bedrock 面向高阶用户的Q平台 [5]
投资大家谈 | 景顺长城科技军团6月观点
点拾投资· 2025-06-13 19:51
核心观点 - 中国科技产业崛起成为全球资本市场焦点,AI领域突破性进展提振市场信心 [2] - 政策制定者的战略决心和方向锚定是当前最重要的关注点 [2] - A股估值处于历史相对低位,看好股票市场结构性机会,配置新质生产力板块和顺周期板块 [3] - AI发展进入新阶段,看好算力基础设施和应用端投资机会 [4][6][8][9] - 医药板块长期受益于人口老龄化和创新药出海,估值消化充分具备配置价值 [5][11][12] - 新能源产业链是中国高端制造重要名片,看好汽车和新能源领域投资机会 [14][15] - 市场波动放大带来布局机会,看好AI行业中期叙事继续加强 [9][10] - 优质出口企业是中期相对确定之路 [7] - 港股核心资产及优势产业配置优势凸显 [13] 行业观点 科技行业 - AI行业持续稳步发展,英伟达FY26Q1营收440.6亿美元,Q2指引450亿美元 [4] - Gemini系列模型大幅升级,AI overview功能月活跃用户达15亿 [4] - 2025年国产算力开始扬帆起航,看好推理和AI端侧硬件尤其是AI手机 [8] - AI行业从训练投入驱动转向推理需求为主,应用繁荣渐行渐近 [9][10] - 中国科技巨头对全年展望保持乐观,AI发展进入Agent新阶段 [13] 医药行业 - 创新药出海授权项目纷纷落地,中国药企研发效率和成本优势明显 [3][11] - 医药行情刚开始,可期待龙头公司和权重股估值重估 [12] - 创新药授权交易首付款价值已反应,中期看2-3年后商业化分成兑现 [12] - AI医疗、商保、创新支持政策是行业底部资金流入重要催化剂 [11] 新能源行业 - 中国汽车全方位崛起:自主品牌国内市占率从2015年38%升至2024年61% [14] - 乘用车出口量从2015年43万辆激增至2024年494万辆 [14] - 华为系、理想等车企加速冲击中高端市场,小米SU7 Ultra热销 [14] - 光伏行业2024年10月发起"反内卷"行动,2025年政府工作报告明确整治 [15] - 新能源产业基金聚焦三类企业:成本优势龙头、技术创新者、新产品开拓者 [15] 其他行业 - 军工、医药创新领域经历长周期调整,优选政策风险出清环节 [13] - 汽车零部件、电子、电新等行业存在较强阿尔法公司 [18] - 有色、轻工、建材等行业存在质地较好、稳健增长潜力公司 [18] - 油运、航空、覆铜板等行业存在顺周期复苏机会 [18]
科创板人工智能ETF(588930)盘中溢价,芯原股份涨超4%,机构:2025年有望迎来“中国AI”的投资机会
21世纪经济报道· 2025-05-27 09:46
市场表现 - A股三大指数集体低开 科创AI指数跌0.1% [1] - 科创板人工智能ETF(588930)跌0.27% 溢折率0.05% 盘中现溢价交易 [1] - 成分股中芯原股份涨超4% 中邮科技涨超3% 乐鑫科技涨超2% [1] - 上证科创板人工智能指数(950180.CSI)选取30只市值较大且业务涉及AI基础资源、技术及应用的科创板上市公司证券 [1] AI行业动态 - 谷歌I/O开发者大会发布多款AI模型、应用及Agent产品 Gemini系列模型全面升级 [2] - Gemini模型将逐步登陆手机、手表、汽车、电视等多平台 持续赋能终端产品 [2] - OpenAI宣布Responses API支持MCP A2A协议和MCP生态完善将提升AI Agent开发效率及交互能力 [2] 机构观点 - 天风证券指出AI正融入消费级设备 推动人机交互范式变革 建议关注中国头部AI科技企业模型迭代及DeepSeek新模型发布预期 [2] - 华西证券看好AI加速发展 模型能力提升+AI提升企业ROI+AI优化报表等因素将催化前瞻布局AI的企业业绩增长 [2] - 市场空间有望从IT预算进入企业人力预算 带来AI应用企业估值重构 [2]
AI加速落地,算力产业链确定性高
每日经济新闻· 2025-05-27 08:50
通信与半导体行业表现 - 通信ETF(515880)5月26日收涨0.83% [1] - 半导体设备ETF(159516)5月26日收涨1.1% [1] AI大厂动态与模型升级 - 谷歌在I/O开发者大会发布多款AI模型、应用及AI Agent产品,Gemini系列模型全面升级 [3] - Gemini模型将逐步登陆手机、手表、汽车、电视等多平台 [3] - OpenAI宣布Responses API支持MCP,A2A协议和MCP生态完善将提升AI Agent开发效率和交互能力 [3] 海外巨头资本开支情况 - Meta 25Q1 CAPEX为137亿美元(同比+104%,环比-8%),全年指引上调至640~720亿美元(同比+63~84%) [3] - 亚马逊25Q1 CAPEX为263亿美元(同比+74%,环比-7%) [3] - 谷歌25Q1 CAPEX为172亿美元(同比+43%,环比+20%) [3] 国内大厂资本开支加速 - 阿里25Q1 CAPEX为246亿元(同比+120.6%,环比-22.6%),云业务单季度收入301亿元 [4] - 腾讯25Q1 CAPEX为275亿元(同比+91%,环比-25%) [4] 行业趋势与投资机会 - AI大厂持续发布新模型,AI Agent逐步完善,国内外大厂加码资本开支推进IDC建设 [4] - 国产AIDC算力产业链确定性高,通信ETF(515880)和半导体设备ETF(159516)具备长期投资机会 [4]
谁能成为中国版的AI Google?
36氪· 2025-05-26 08:30
谷歌I/O发布会战略方向 - 核心战略是让AI像空气一样无处不在,渗透到搜索、语音助手、办公套件、安卓系统及终端设备中[2] - AI必须成为企业整体业务链条的核心部分,从底层架构开始用AI思维重新设计产品逻辑[2][3] - 展示Gemini系列模型在多模态(文本/图像/音频/视频)下的理解与生成能力,预示未来通用智能需具备"会看、会听、会说"特性[4][5] - 提出Agentic AI(智能体)理念,要求AI能主动理解意图、规划任务并完成复杂操作[7][8] 对中国企业的启示与挑战 - 技术能力需足够强,内部协作机制需灵活以打破部门壁垒,贯穿AI思维至研发全环节[4] - 多模态大模型训练需大量资源、高质量数据及顶尖团队,中国在数据合规与伦理治理方面仍有差距[6][10] - 需构建具备智能体能力的系统,涉及模型推理、记忆、工具调用及安全决策机制[9] - 生态布局方面需建立开放协作的开发者生态系统,提升工具链水平与技术社区活力[11] 软硬件结合与商业化路径 - AI与硬件结合进入爆发期,华为、小米等拥有完整硬件生态的企业可激活智能终端创新场景[12] - 商业化需通过工具平台(如Google Cloud的Vertex AI)和产品体验升级双轮驱动[14][16] - 中国企业应聚焦生态建设与场景深耕,提供行业完整解决方案而非单纯技术输出[17][19] 中国企业的差异化竞争策略 - 避免盲目追求通用模型,转向行业大模型与轻量化解决方案,专注"专而精"和"特而强"[32][33] - 采用高效利旧+国产替代策略,利用国产芯片(华为昇腾/寒武纪)构建自主可控技术体系[27] - 聚焦高质量垂直行业数据(医疗/工业/城市管理),形成数据闭环与模型优化壁垒[31][32] 战略能力构建 - 需建立从芯片、数据、算法到研发投入的完整技术堆栈,而非单一模型追赶[23][24] - 定义自身突围方式,综合实力与战略执行力比复制谷歌模式更重要[34]
离Agent更进一步
国盛证券· 2025-05-25 15:48
报告行业投资评级 - 行业投资评级为增持(维持) [5] 报告的核心观点 - 谷歌I/O大会和Anthropic推出Claude 4模型给AI领域带来变革,推动Agent产业发展,且Agent产业发展对算力需求巨大 [3][42] 根据相关目录分别进行总结 谷歌I/O大会召开,AI生态全面升级 - Gemini系列模型升级:Gemini 2.5 Pro在学术基准测试、编码及多模态推理等方面表现卓越,新增Deep Think增强推理模式;2.5 Flash侧重速度与成本优化;还推出新实验模型Gemini Diffusion和更新设备端模型Gemma 3n [1][11][15] - 多模态模型更新和AI电影工具:推出Veo 3视频生成模型可生成带音频视频,Imagen 4图像生成模型质量高且支持多宽高比和打印演示,以及新电影制作工具Flow [20] - 搜索功能更新:推出AI模式和Search Live功能,用户可通过与Gemini AI对话获取信息,Search Live允许用户根据手机摄像头实时捕捉内容提问 [21] - AI硬件创新:发布Android XR智能眼镜和3D视频通信平台Google Beam,为Agent提供更多元载体和交互方式 [24][25] - 办公应用方面:将AI引入Workspace,包括Gmail、Meet、Vids和Docs中,可帮助用户更快响应和简化日程安排等 [1][27] Claude 4发布,最强编码模型能力突破 - Claude 4包括Claude Opus 4和Claude Sonnet 4,两款均为混合模型,提供即时响应和扩展思维两种模式,适用于不同场景 [2] - Claude Opus 4在复杂任务和Agent工作流程中性能卓越,是领先的编码模型,记忆能力显著提升,减少模型使用捷径行为 [2][32] - Claude Sonnet 4在功能与实用性间取得平衡,编码效率和性能大幅提升 [2] - Anthropic推出Claude Code代码工具,将Claude的强大功能带入开发工作流程,支持主流IDE [2] Agent产业发展加速,算力是Agent落地基石 - 基础模型提升助力Agent能力跨越,开放与集成促进Agent生态繁荣,软硬件协同发展推动Agent普及 [42][43] - Agent对算力需求巨大的原因包括处理长上下文和接入外部数据、执行任务验证、多模态发展、算力瓶颈影响用户体验以及模型训练阶段对算力要求高 [43][48][50] 建议关注 - 算力相关公司:寒武纪、海光信息等多家公司 [4][52] - Agent相关公司:金山办公、泛微网络等多家公司 [7][52] - 军工AI相关公司:品高股份、普天科技等 [8][53]