Agent
搜索文档
下一站AI创业主线:别卷模型了,把这件事干成才重要
Founder Park· 2025-06-27 18:32
Agent成为创新中心 - Agent成为新一轮创新叙事的核心坐标[1] - AI创业从"拼技术"进入"拼交付"时代[2] - 通用Agent由巨头主导,垂直Agent满足千行百业具体需求[3] - AI"劳动力化"催生全新基础设施需求[3] 多模态技术发展 - 多模态技术进展显著但尚未完全成熟[11] - 当前面临多模态理解与生成一体化、各模态统一融合两大挑战[11] - 可控性要求不高的场景已实现商业化落地[12] - 行业高估多模态短期影响,低估长期潜力[18] - 多模态将逐步发展而非一步到位[17] Agent投资逻辑 - 通用Agent需具备流量、模型能力、硬件、生态四大要素[34] - 垂直Agent是创业公司重要机会,已出现千万级ARR案例[35] - 未来可能由成百上千个小而美的Agent公司组成[8] - 投资聚焦生成式AI驱动的五大领域:内容生成、生产力工具、数据洞察、各类Agent、AI与物理世界交互[23][24][25][26][27] - 投资节奏加快,从年均5-6个项目增至每月1个[28] Agent基础设施 - Agent发展将带来记忆模块、执行环境等新基础设施需求[43] - Agent核心三要素:感知&记忆、决策、行动[45] - 记忆相关infra和执行环境是重要机会点[45] - 决策能力提升依赖模型进步[45] - 行动方面需关注工具调用能力[46] 商业模式演变 - 从SaaS"按用户月付费"转向"按调用量付费"甚至"按结果付费"[4] - 未来可能直接按交付结果收费[49] - 按结果付费是理想商业模式[54][55] - 广告行业从CPM到CPS的演变可作为参考[57] 全球化视角 - 中国创业者应从一开始就布局全球化[68] - 已有许多中国创业公司从创立第一天就是全球化[69] - 非主流市场创业者更具韧性[67] - AI使ToB公司更具可扩展性[66] 行业现状 - 投资市场存在泡沫但也找到坚实逻辑[61] - 优质创业公司供给不足导致估值过高[64] - 能穿越周期的公司需长期创造价值[62] - 现在是创业者下场的良好时机[64]
@所有开发者:Agent变现,阿里云百炼联合支付宝首创「AI打赏」!Agent Store全新发布
量子位· 2025-06-27 12:40
行业趋势 - 2025年成为Agent元年,AI Agent正经历从"玩具"到"工具"的关键转折[1] - 行业面临开发周期长、商业价值验证难等挑战,大量项目卡在POC阶段[2] 阿里云百炼核心升级 - 推出业内首个"Agent打赏"功能,用户可直接为开发者打赏,金额直达AI钱包并可提现[3][4][5][23][24][26][27] - 正式上线Agent Store,提供覆盖各行各业的100+个可一键复制的Agent模板[7][8][10][18][19] - 升级企业级RAG能力至千万级文档处理水平,支持多模态文件统一索引并开源V-RAG方案[29][30][33][34][35] - 升级MCP服务支持KMS加密,免费提供50个加密Key,实现统一鉴权和计量计费[36][37][38] - 发布OpenAPI MCP Server,支持大模型与2W+OpenAPI互联互通[39] 技术能力突破 - 多模态交互开发套件支持低延迟(1.5秒)全双工对话、复杂任务自主规划推理等能力[45][46] - 提供可视化配置界面,开发者可像拼乐高一样自由组合功能[48][49] - 支持后付费或买断License等灵活计费方式[50] 商业化进展 - 已有超50个企业级MCP上架,22000+用户开通服务,构建3万+MCP Agent[41] - 落地案例包括听力熊学习机(扩展50+交互技能)、浙一麻醉评估助手、牧原智能兽医问诊系统等[42][28]
一年后,当Kimi和MiniMax投资人再坐到一起
36氪· 2025-06-26 18:15
中国大模型行业格局变化 - DeepSeek横空出世改变中国大模型竞争格局,Kimi和MiniMax从直接竞争转向差异化发展[3][6][8] - 六小虎(包括Kimi/MiniMax等)仍具备发展潜力,行业格局远未定型,未来全球5-6家大模型公司中可能有2-3家来自中国[17][18] - DeepSeek推动华人团队技术突破,其V3模型和R1推理能力短期内占领用户心智,同时提振中国AI行业全球地位[12][15][17] 头部公司最新动态 - Kimi近期开源编程模型Kimi-Dev并测试首个Agent产品kimi-Researcher,MiniMax开源推理模型MiniMax-M1并连续五天更新[3][9] - MiniMax聚焦多模态领域,其视频生成技术"海螺"和语音合成模型(如"吴彦祖学英语"案例)已实现商业化落地[12][13] - 头部公司调整战略优先级:MiniMax押注视频/语音模型和线性注意力机制,Kimi回归技术前沿创新[13][18] Agent领域发展 - Agent的"蒸汽机时刻"已到来,推理能力/编程能力突破推动应用爆发[22][24] - 三类Agent受关注:产能提升100倍的Agent/成本降低100倍的Agent/创造全新场景的Agent[31][32][33] - 垂直领域Agent通过交付结果构建护城河,字节豆包汽车产品已在百万台车落地[26][27][29] - 应用层价值被低估,"壳"在特定场景具备不可替代性(如生成更优质PPT)[24][25] 具身智能投资现状 - 行业处于早期阶段,技术路线未明确且成本高昂(单台8-10万美金),但资本热度高涨[36][37][45] - 类比2016年自动驾驶发展路径,需经历泡沫期-平台期-商业化拐点[42][43] - 部分垂直领域已出现商业化临界点,市场规模1-2年内翻数倍[44][46] AI时代投资范式 - 早期投资窗口期缩短至3-4年,2026年底前潜力公司将基本定型[54][55] - 技术迭代速度远超移动互联网时代,一年相当于其他行业3-5年[12][54] - 团队非共识能力成为关键指标,如MiniMax对Linear Attention的坚持[18][60] 行业未来趋势 - AI将超越人类顶尖水平("李世石时刻"),编程/数学等领域已现端倪[64] - 个人专属AI助手("哆啦A梦")和AI劳动力将成为常态[65][66] - 多模态技术突破推动AI拟人化,已出现"欺骗"行为反映人性特征[67]
出门问问发了新硬件,AIGC第一股急需新故事
36氪· 2025-06-25 19:54
公司战略转型 - 公司放弃大模型研发,转向Agent和AI Coding等热门领域,推出内置Shadow AI的TicNote录音笔 [1][3] - 公司调整硬件策略,从原创研发转向成熟硬件形态+AI软件开发的模式,降低研发成本 [3][12] - 公司海外业务收入占比达41.8%,智能硬件95%以上销往海外,AIGC解决方案收入同比增长88.5% [18] 产品表现与市场定位 - TicNote海外首月销量"很低",国内定价999元低于竞品Plaud的1140元,试图通过Shadow AI实现差异化 [14] - 智能手表TicWatch销量持续下滑:2023年比2022年少卖6万块,2022年比2021年少卖12.6万块 [7] - 公司产品线包括AI配音、数字人、视频生成和智能硬件,但均非行业第一梯队 [3][19] 行业竞争格局 - 卡片录音笔品类已验证PMF,竞品Plaud 2024年创收1000万美元 [3] - 数字人赛道竞争激烈,2024年中国相关企业达114.4万家,2025年前5月新增17.4万家 [19] - 华为/小米/三星凭借手机生态挤压公司硬件空间,公司ODM模式缺乏护城河 [10] 财务与资本市场表现 - 公司连续4年亏损,2024年营收3.9亿元为近4年最低水平 [4][18] - 股价从上市3.8港元跌至0.35港元,跌幅超90% [6] - 端侧AI硬件存在成功案例:Oura Ring销量250万件/5亿美元,Liberlive吉他年营收10亿元 [11]
多模态内容生成的机会,为什么属于中国公司?
Founder Park· 2025-06-24 19:53
多模态技术发展现状 - 中国企业在视频生成、3D创作等多模态细分领域已跻身全球第一梯队,与美国在大语言模型领域的领先形成差异化竞争[1] - Pixverse的视频生成产品用户规模超过许多美国知名产品,VAST在3D技术上实现核心突破,Feeling AI探索多模态融合创新路径[1] - 中国团队在场景理解、数据积累和工程落地方面具备综合优势,抖音、快手等产品背后的视觉技术为视频生成奠定基础[7] 中国团队的核心优势 - 视频技术领域有多年积累,组织架构灵活性助力创新,全球用户量最大的视频生成产品多数来自国内团队[7] - 多模态领域技术路径尚未定型,中国丰富的应用场景和人才储备为创新提供沃土[7] - 差异化技术策略实现突破,3D领域从核心技术攻坚转向产品化落地,专注画质而非功能丰富性[8] 竞争格局与战略应对 - 面对阿里、腾讯等巨头的开源攻势,创业公司通过保持战略定力、聚焦细分需求寻找突破口[9] - 大厂竞争是创业公司的"成人礼",战略节奏领先是关键,先聚拢顶尖科学家实现技术突破,再转向产品化和商业化[9][10] - 开源是创业公司可以借力的东风,但难以满足特定场景需求,需要在开源基础上进行深度定制[12] 技术发展趋势 - 实时生成成为重点方向,Pixverse线上模型5秒生成5秒视频,目标实现真正实时生成[17] - 多模态融合趋势显著,GPT-4o强调的原生多模态实现训练时共享同一语义空间[14] - 3D生成转向自回归路线,生成模型面数低且拓扑结构类似人工建模,方便二次编辑[18] 产品与用户策略 - Pixverse采取双轨策略:网页版服务专业用户,移动端"拍我"App面向大众,模板化生成降低创作门槛[21][22] - VAST调整用户定位,从游戏玩家转向专业用户,打造完整3D创作工作流而非简单模型生成[25] - Feeling AI面向海外14-24岁年轻群体,结合游戏、创作和虚拟陪伴体验,模糊创作者与消费者界限[27][28] 未来目标与挑战 - Pixverse目标实现高质量实时视频生成,用户规模达3亿-5亿[37] - VAST希望降低3D创作门槛,探索可交互内容新生态,可能出现"3D版抖音"[37] - 行业共识是技术进步将让更多普通用户参与多模态创作,AI加速动态3D内容发展进程[33]
李建忠对话 KK 凯文.凯利:通用智能是个伪命题,AI 不应该模仿人类 | AI 进化论
AI科技大本营· 2025-06-23 16:38
AI 的人机交互、单一设备 VS 多元设备 - 凯文·凯利预测智能眼镜将在25年后取代智能手机成为个人计算中心设备,但需攻克储能技术等五项关键突破 [5][6] - 镜像世界的构建不依赖眼镜,特斯拉自动驾驶汽车和TikTok等已在扫描真实世界训练AI的空间智能 [6][7] - 技术发展呈现钟摆效应,未来设备可能回归专业化,但智能手机是例外,AR眼镜或成为通用平台连接专业化应用 [7][8][9] AI 的路线之争、通用智能 VS 专用智能 - 技术路线呈现从专用模型向通用模型统一趋势,大语言模型已统一文本任务,但应用层面专用AI更实用 [10] - AI发展路径存在巨大不确定性,分为"扩展派"(持续扩大模型规模)和"专业化派"(终端小模型、领域专用AI) [11][12] - 凯文·凯利个人倾向专业化路线,认为需为不同场景做好准备,避免垄断生态 [12] AI 哲学思辨、"异人智能"与人类智能 - AI智能与人类智能本质不同,AI意识将是"异人意识",其智能构成和演进环境(人类需求)决定差异 [13][14][16] - 人类价值在于责任承担能力,未来工作核心是管理AI并为其决策担责,人性本身成为稀缺资产 [15][16] AI 的创新 VS 人类的创新 - AI创造力分为日常创新(当前可实现)和颠覆式创新(25年内或部分实现),后者将开辟全新领域 [17][18] - AI创新呈现"异人"特质,如AlphaGo第37手,但社会消化现有AI技术仍需10年,重大突破尚需时间 [17][19] Agent 的生态与入口之争 - Agent生态将推动互联网从"信息网络"升级为"行动网络",入口之争涉及超级AI助理、操作系统或新型设备 [20] - 智能眼镜可能成为Agent交互界面,需支持多模态交互(语音、手势、表情),苹果等公司正探索相关设备 [20][21] AI 时代的操作系统 - AIOS需定义自然语言交互标准,实现跨Agent协作,开源属性可避免垄断,责任是规范人机交互协议 [23] AI 变革内容创作与内容消费 - 未来内容向3D/4D沉浸式体验迁移,AI将具备情绪反应能力,引发人机情感联结革命 [24][25] - AI成为内容主要消费者,催生为AI创作的新模式,如传记专供AI阅读,重塑互联网商业模式 [26][27] AI 时代的创业公司与巨头竞争 - 科技巨头面临创新者窘境,OpenAI等创业公司更可能主导AI变革,因巨头难以冒险投入高风险新业务 [28][29] - 突破窘境需强决断力领导者,如盖茨和乔布斯,但成功概率极低 [29][30] 人形机器人 VS 专用机器人 - 绝大多数机器人非人形但适配人类尺寸基础设施,仅家用机器人可能拟人化,工作场景优先普及 [31][32][33] AI 时代的组织变革 - 小公司AI应用速度快于大公司,因需重构组织而非简单添加AI工具,亚马逊要求15万员工强制实验AI [34] - 成功关键为持续试错(容忍10次失败)、量化评估人机协同效果,中层管理者受影响最大 [34][35] 行业活动与趋势 - 《AI进化论》系列直播吸引超50万人观看,聚焦DeepSeek等前沿技术,构建高信噪比思想策源地 [1][37]
一年后,当Kimi和MiniMax投资人再坐到一起
暗涌Waves· 2025-06-23 14:01
中国大模型行业格局变化 - DeepSeek横空出世改变中国大模型竞争格局 使原本被比较的Kimi和MiniMax转向差异化发展[1][3] - 六小虎(包括Kimi MiniMax等)仍具备竞争力 但行业格局远未定型 未来全球大模型公司中可能有2-3家中国企业[11][12] - Kimi近期开源编程模型Kimi-Dev并测试Agent产品 MiniMax开源推理模型MiniMax-M1并连续更新五天[1][3] 头部大模型公司最新动态 - Kimi团队保持技术前沿探索 从比拼用户规模转向强化技术认知 更适合以技术大牛为核心的创业团队[6] - MiniMax押注视频生成和语音合成技术 其海螺视频产品已商业化落地 语音合成达到以假乱真水平[7][8] - DeepSeek在搜索类应用市占率遥遥领先 其V3模型和R1推理能力表现惊艳 迅速占领用户心智[7][11] Agent领域发展趋势 - Agent的"蒸汽机时刻"已到来 因模型推理/编程/工具使用能力突破 垂类Agent在汽车等领域快速落地[14][18] - 三类Agent受关注:提升产能100倍的Agent/降低成本100倍的Agent/创造全新场景的Agent[23][24] - 垂直Agent可积累独有知识库形成护城河 最终可能反攻通用Agent 应用公司需聚焦细分场景快速迭代[20][25] 具身智能投资现状 - 具身智能处于早期阶段 技术路线未明确 存在明显泡沫 但类似互联网泡沫具有正向溢出效应[27][28] - 当前具身智能硬件成本高达8-10万美元 无故障时间不足 尚未找到预训练的scaling law[32] - 参考自动驾驶发展历程 具身智能将经历平台期 具备资金和技术储备的公司才能坚持到商业化拐点[29][30] AI时代投资范式变化 - AI投资窗口期缩短至3-4年 2026年底前有潜力成为AI巨头的公司将基本浮现[37] - 技术迭代速度加快 一年相当于其他行业3-5年 需更关注底层模型能力演进带来的场景重构[7][37] - 创业者需具备持续学习能力 保持非共识判断 如MiniMax坚持线性注意力机制的技术路线[12][42] AI技术带来的深远影响 - AI开始具备"欺骗"能力 反映人性特征 成为人类自我认知的终极工具[48] - 未来每人将拥有多个AI"打工人" 人类可能不再是地球上唯一的智能物种[45][46] - AI在编程/数学等领域达到顶尖人类水平 行业将迎来更多"李世石时刻"[44]
AI算力逻辑闭环
国盛证券· 2025-06-22 15:24
报告行业投资评级 - 增持(维持) [5] 报告的核心观点 - AI编程成为现象级应用,海外投资机构a16z报告显示软件开发是AI企业应用采用率最高的用例,代码生成行业预计2024 - 2029年复合年增长率达53%,海外AI编程龙头Cursor商业化进展迅速 [1][16] - Agent成为AI新增长引擎,推动海外B端AI采用率攀升,企业AI预算增长超预期,未来一年预计平均增长约75% [2] - 头部大模型高速增长驱动算力需求激增,谷歌、OpenAI、Anthropic等公司的模型使用量和营收大幅增长 [3] - 国内AI应用与算力需求闭环持续孕育,以字节跳动为例,在AI Coding、Agent与多模态方面重点发力,同时驱动算力需求增长 [4][8] 各部分总结 Coding已成为现象级AI应用 - 软件开发是AI企业应用采用率最高的用例,代码生成行业预计2024 - 2029年复合年增长率达53%,专业开发人员占Claude对话的37% [1][16] - 2025年5月23日Anthropic推出Claude 4系列模型,编程能力提升,GitHub将使用Claude Sonnet 4作为GitHub Copilot新编码Agent的基础模型 [1][18] - 海外AI编程龙头Cursor商业化成果显著,截至2025年6月ARR突破5亿美元,较4月中旬增长60%,6月完成9亿美元融资,估值达99亿美元 [1][23][24] Agent成为AI新增长引擎,海外B端AI采用率攀升 - Agent能自主理解复杂目标、拆解任务等,推动各行业加速采用AI,截至2025年5月美国企业AI采用率为9.2%,高于2024年第四季度的7.4% [2] - 企业AI预算增长超预期,从试点项目和创新基金成为核心IT和业务部门预算的经常性项目,未来一年预计平均增长约75% [2] - 企业使用的模型份额中,OpenAI领先,谷歌和Anthropic过去一年进步较大,不同规模企业对模型的采用率有差异 [34] 大模型用量快速增长,算力需求激增 - 谷歌每月处理的token总量超480T,较去年同期增长50倍,超700万开发者使用Gemini模型,月活突破4亿 [3] - OpenAI全球约8亿 - 10亿人使用ChatGPT,2025年2月周活超4亿,付费企业用户突破300万,预计今年营收达127亿美元 [3][42] - Anthropic第一季度年化营收达20亿美元,较上一季度增长一倍多,年消费超10万美元的客户数量较去年同期增长八倍 [43] 国内AI应用与算力需求闭环持续孕育 - 字节跳动在AI Coding、Agent与多模态方面重点发力,AI编程产品TRAE月活用户超100万,内部超80%工程师使用 [44] - 字节做AI Coding的意义包括技术普惠、提升研发效率、追求智能上限,未来AI有望统筹软件开发各环节 [45][48] - 火山引擎大会升级发布多款产品和开源项目,构建大模型开发全链路工具矩阵,为开发者提供一站式解决方案 [50] - 多模态方面,豆包App实时通话功能升级,支持视频聊天问答,豆包视频生成模型Seedance 1.0 pro发布,性能强大且性价比高 [4][52] - 国内AI产业进展强化算力需求,豆包大模型日均tokens使用量超16.4万亿,较去年5月增长137倍,阿里云和百度智能云2025年一季度营收增速达近三年最高点 [8][56] 建议关注 - 算力:寒武纪、海光信息等多家公司 [9][58] - Agent:阿里巴巴、腾讯控股等多家公司 [9][58] - 自动驾驶:江淮汽车、赛力斯等多家公司 [9][59] - 军工AI:能科科技、品高股份等多家公司 [10][60]
前百度最牛技术转投字节跳动搞AI,目标1000亿
搜狐财经· 2025-06-20 16:39
字节跳动并购幺零贰四科技 - 2020年底字节跳动并购成立一年半的互联网医疗服务公司幺零贰四科技,实际目标是获取其创始团队中的百度搜索技术大拿[5] - 创始团队包括原百度副总裁吴海锋、前百度执行总监孙雯玉、前百度搜索首席架构师谭待等百度T11级技术骨干[5] - 谭待最初被委任主导火山引擎技术架构设计,重点布局云计算与AI基础设施[5] 火山引擎业务发展 - 2021年11月火山引擎被提升为字节跳动六大核心业务板块之一,谭待升任总经理[6] - 谭待提出未来8-10年火山引擎营收突破千亿的目标[7] - 2024年火山引擎营收突破百亿,在中国云厂商中暂居第三梯队[12] - 2025年营收目标定为250亿,与百度智能云的差距可能缩小[13] 豆包大模型表现 - 截至2024年5月豆包大模型日均tokens使用量超过16.4万亿,较去年增长137倍[8] - IDC报告显示豆包大模型在中国公有云大模型市场份额达46.4%,排名第一[8] - 服务全球TOP10手机厂商中的9家、8成主流汽车品牌、70%系统重要性银行及超5成985高校[8] 火山引擎竞争策略 - 与百度智能云在AI大模型领域全面竞争,包括价格战和技术路线[16] - 谭待提出"规模决定一切"理论,认为字节跳动整体计算资源规模不输阿里云[24] - 字节跳动2025年收入预计达1860亿美元,估值或迫近4500亿美元,为火山引擎提供支撑[25] AI Agent战略布局 - 谭待认为2025年是AI agent元年,将深度思考、多模态及工具调用能力视为构建Agent关键要素[19] - 火山引擎发布MCP服务、promptPilot智能提示工具、AI知识管理系统等AI云原生服务[19] - 豆包1.6首创"输入长度"区间定价,综合成本降至豆包1.5的三分之一[20] 高层支持与战略定位 - 字节跳动CEO梁汝波首次出席火山引擎发布会,表示将长期投入智能技术突破[27][28] - 火山引擎定位不只是云计算厂商,而是打造更具AI的基础技术平台[15] - 公司取名"火山引擎"体现前瞻性,意在依托20年后回看云计算的技术视角[15]
汪华的最新预言:AI时代和移动互联网的最大区别是实现,而非连接
暗涌Waves· 2025-06-19 17:21
移动互联网与AI时代的范式差异 - 移动互联网的核心范式是连接,追求大体量用户群和垄断性平台,而AI时代的核心范式是实现,聚焦垂直领域的高价值交付[4][5] - 大厂在AI领域仍沿用移动互联网打法,争夺10%-20%的连接市场,但80%-90%的实现市场留给创业者[5] - 新旧范式的本质区别在于:移动互联网追求广度(用户规模),AI追求深度(单用户价值)[5][6] 模型红利带来的创业机遇 - 2023年底至今,推理模型和多模态技术突破形成史上最大模型红利,创业者可借此快速实现千万美元级营收[8][9][11] - 模型性能在指令遵循、工具调用等实际应用场景的进步远超榜单体现,半年内多个垂直领域出现从"玩具"到"惊艳"的转折[11][12] - 典型案例包括:医疗笔记公司估值达50亿美元,编程工具Lovable利用Claude3.7实现前端开发革新[11][12] 垂直领域创业策略 - 目标市场选择标准:不需大规模用户,但需高ARPU(toC约200美元/年,toB几十个客户即可达千万美元营收)[17][18] - 成功案例:Rille t用AI重构中小企业财务系统,一年内颠覆传统产品;餐饮管理SaaS通过模型整合实现快速商业化[21][22] - 方法论:聚焦具体痛点,问题定义越细模型效果越好,避免与通用方案(如谷歌搜索)正面竞争[23][24] Agent与多模态的技术窗口 - Agent领域:未来一年工具调用能力将提升10倍,从当前支持十几个工具扩展到上百个工具协同[31][33][34] - 多模态领域:B端应用存在巨大空白,视频生成、运动控制等关键技术将在10个月内显著进步[35][36] - 行动窗口:模型红利黄金期约12个月,之后进入同质化竞争阶段,创业者需抓住技术跃迁期[34][36] 全球化市场机会 - 中国创业者应瞄准全球市场:欧美市场ARR达成速度比国内快5-10倍,且模型能力更成熟[7][21] - 南方创业者优势:强商业化能力、全球化视野与AI实现范式高度契合,有望复制跨境电商成功[37][38] - 行业分布:除互联网外,重点关注医疗、法律、金融、餐饮等传统行业数字化改造[22][24]