Agent
搜索文档
对话火山引擎谭待:马拉松才跑 500 米,要做中国 AI 云第一
晚点LatePost· 2025-06-12 17:57
火山引擎发展现状与战略 - 火山引擎国内云端大模型调用量占比达46.4%,超二三名总和[3] - 豆包大模型日均Token处理量半年内翻两番至16.4万亿[3][49] - 公司2021年定下1000亿元年收入目标,去年收入100亿,今年目标200亿[22] 技术优势与产品布局 - 推出MCP服务、Prompt Pilot等Agent定制开发套件,思考模型定价为同行1/3[4] - 深度思考模型context长度达256K国内第一,TPM达500万领先行业[39][45] - 强化学习框架veRL和集成式Coding Agent Trae构成技术壁垒[46][47] 商业模式与竞争策略 - MaaS业务实现盈利,毛利率优于传统PaaS服务[33] - 采用"技术优化+规模效应"降本模式,而非价格战[34][41] - C端产品豆包App成为B端获客重要渠道,形成协同效应[37][40] 行业趋势判断 - 预测AI云服务市场将扩大100倍,GPU业务占比超50%[23][42] - Agent将突破App时代天花板,创造更大经济价值[48] - 多模态模型带动AI搜索、AI Coding需求增长10倍[52][53] 运营管理特点 - 坚持"内外技术同源"原则,复用字节基础设施[12][61] - 通过规模效应摊薄成本,1万台服务器优化收益放大100倍[41] - 建立垂直优化团队深度参与模型研发[61][62]
离谱!裁员裁出新高度了。。。
程序员的那些事· 2025-06-12 10:32
行业趋势与人才需求 - AI技术人才严重稀缺,大厂加紧落地AI应用,导致相关岗位需求激增 [1] - 常规开发岗竞争激烈(投递70-80份无反馈),而AI相关岗位HR响应迅速且薪资高达70-100W年薪 [1] - RAG、Agent、微调、Function Call等AI应用开发技术成为市场抢手技能,智能客服、AI助手等应用开发需求旺盛 [1][15] - 现有"连接、封装、服务"能力是大模型接入业务的核心刚需,无需深奥算法即可开发爆款应用 [1] 职业转型与课程价值 - 技术人需快速补齐AI大模型底层原理、应用技术和项目实操经验以应对职业瓶颈或业务转型 [3] - 「大模型应用开发实战课程」覆盖前端、后端、算法、测试等所有技术岗位,助力职业转型与高薪机会 [4] - 课程包含5小时直播,限前100名免费预约,内容涵盖AI技术原理、实战应用与职业发展 [5][18] - 课程由AI大模型领域专家研发,结合商业化项目案例,提升技术+原理+实战能力 [7] 课程内容与实战资源 - 课程拆解金融行业"支小助"、知乎直答等热门产品的技术架构,提供全流程项目复现机会 [12] - 2节直播课详解RAG、Fine-tuning技术原理与应用场景,解析大模型底层架构 [14] - 涵盖GPT及开源模型,展示个人开发者如何完成AI原生应用全栈开发 [15] - Agent技术成为企业级智能客服首选方案,Function Call增强大模型复杂任务处理能力 [15] 就业支持与学员成果 - 课程提供大厂内推机会,简历直达面试官,已有学员实现职业跃迁 [9][11] - 完课赠送大模型应用案例集、AI商业落地白皮书及热门项目拆解资源 [12][18] - 课程已开班58期,服务20000+学员,口碑爆棚且多人获得高薪offer [17] - 学习路径包括大模型原理掌握→AI工具应用→产品开发→前沿信息链接→实战演练五步法 [12]
火山引擎推出大模型“区间定价”策略 Agent规模化应用进一步提速
证券日报网· 2025-06-11 20:52
产品发布与升级 - 字节跳动旗下火山引擎发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务 [1] - 豆包1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题 [1] - Seedance 1.0 pro支持文字与图片输入,可生成多镜头无缝切换的1080P高品质视频 [1] - 豆包大模型已涵盖多模态、视频、图像、语音、音乐等模型品类,全方位推进智能提升和应用落地 [1] 市场表现与数据 - 豆包大模型日均tokens使用量超过16.4万亿,较去年5月份首次发布时增长137倍 [1] - 豆包大模型在中国公有云大模型市场份额占比高达46.4% [1] - 在字节跳动内部,超过80%的工程师在使用TRAE辅助开发,TRAE的整体月活用户已经超过100万 [3] 定价策略与成本优化 - 豆包1.6首创按"输入长度"区间定价,深度思考、多模态能力与基础语言模型统一价格 [2] - 在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出为8元/百万tokens,综合成本只有豆包1.5深度思考模型的三分之一 [2] - Seedance 1.0 pro模型每千tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低 [2] 技术发展与创新 - 深度思考、多模态和工具调用等模型能力提升,是构建Agent的关键要素 [2] - 火山引擎AI云原生全栈服务进一步升级,发布了火山引擎MCP服务、PromptPilot智能提示工具、AI知识管理系统、veRL强化学习框架等产品 [3] - 推出多模态数据湖、AICC私密计算、大模型应用防火墙,以及一系列AI Infra套件 [3] 行业影响与未来展望 - 低价策略可以加速技术普及,降低企业AI转型门槛,促进生态繁荣 [2] - 随着模型能力的持续进步,AI有机会成为调度者,通过调用不同的Agent和工具,让软件开发"all in one" [3] - AI时代会推动开发范式与技术架构全面升级,Agent能够自主感知、规划和反思,完成复杂任务 [4]
Agent浪潮席卷前,火山引擎再降价
第一财经· 2025-06-11 18:16
大模型价格下调 - OpenAI宣布将o3价格下调80% [3] - 火山引擎视频生成模型Seedance 1.0 pro每千Tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元 [3] - 火山引擎豆包1.6模型在0-32K输入区间的综合成本仅为豆包1.5深度思考模型或DeepSeek R1的三分之一 [4] 降价驱动因素 - OpenAI降价主要基于推理服务架构的全面优化 [3] - 火山引擎降价原因包括工程优化和AI云原生服务中的ServingKit方案 [4] - Tokens调用规模快速增长,五个月内火山引擎Tokens消耗增长4.4倍,其中AI搜索增长10倍,AI编程增长8.4倍 [5] 云平台与算力优化 - OpenAI寻求与谷歌云合作以缓解算力压力 [3] - 云平台可通过混合调度打平推理的波峰波谷区间,降低成本 [3] - 火山引擎强调云业务是大模型发展的数字底座 [3] AI编程Agent发展 - 字节跳动AI编程Agent产品Trae月活用户数已超过100万 [7] - 字节跳动内部超过80%工程师使用类Trae产品进行辅助开发 [7] - 2025年可能成为中国Agent落地的元年 [7] Agent技术趋势 - 深度思考、多模态理解和工具自主调用是模型进化关键方向 [7] - Agent能够自主感知、规划和反思,完成复杂任务 [7] - 大模型和Agent开发平台是AI时代的关键要素 [7] Agent协议发展 - 火山引擎演示了MCP和GUI两种模型调用方式 [8] - MCP存在场景适用性局限,与GUI融合可提高调用效率 [8] - 火山引擎正在自研下一代MCP或类A2A协议 [8]
字节跳动,大消息!
中国基金报· 2025-06-11 15:23
豆包大模型1.6系列发布 - 火山引擎正式发布豆包大模型1.6系列,进一步优化模型能力和服务成本 [2] - 豆包1.6系列由三个模型组成:全功能综合模型doubao-seed-1.6、强化深度推理的doubao-seed-1.6-thinking、适用于实时交互的极速版本doubao-seed-1.6-flash [4] - 豆包1.6系列支持多模态理解和图形界面操作,相比1.5版本进一步具备“行动力”,能自动操作浏览器、识别购物小票并整理成Excel表格 [4] - 在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包1.6-thinking的表现已跻身全球前列 [4] 视频生成模型Seedance 1.0 pro - 火山引擎发布最新的豆包视频生成模型Seedance 1.0 pro,支持无缝多镜头叙事、丝滑运镜 [4] - 该模型应用于电商广告、影视分镜、游戏剧情生成 [4] - 根据第三方权威榜单,豆包视频生成模型在文生视频、图生视频两个维度都超越了业界诸多主流模型 [5] 模型定价与成本优势 - 通过技术和商业创新,豆包1.6创新“区间定价”,深度思考、多模态能力与基础语言模型统一价格 [6] - 在企业使用量最大的0~32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens [6] - 豆包1.6的综合成本只有豆包1.5深度思考模型或DeepSeek-R1的三分之一 [7] - Seedance 1.0 pro模型每千tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低 [7] 市场表现与行业应用 - 豆包大模型日均tokens调用量从2024年12月的4万亿飙升至2025年5月的16.4万亿,年增长率超300% [7] - 豆包大模型稳居中国公有云大模型服务调用量第一,占据46.4%的市场份额 [7] - 企业级应用场景快速扩展,AI搜索、编程、视觉理解等场景tokens消耗5个月增长4.4倍 [8] - 其中,K12在线教育增长12倍,智能巡检、视频检索等新场景突破日均百亿tokens [8] 公司战略与行业展望 - 字节跳动CEO梁汝波表示,AI发展还处于早期,只是马拉松的前500米 [2] - 在AI大模型带来的技术变革时代,字节跳动致力于成为优秀的创新科技公司,探索和发明新技术 [2][8] - 公司技术高管认为,AI时代的主体是Agent,其能够自主感知、规划和反思,完成复杂任务 [7] - 随着模型能力进步,AI有机会成为调度者,通过调用不同的Agent和工具,让软件开发“all in one”,降低开发门槛,提升开发效率 [7]
字节跳动推出豆包大模型1.6和视频模型Seedance 1.0,后者首次登顶全球视频生成竞技榜
新浪科技· 2025-06-11 12:33
豆包大模型发布与升级 - 公司发布豆包大模型1.6、视频生成模型Seedance 1.0 pro及升级AI云原生服务[1] - 豆包1.6在复杂推理、竞赛级数学、多轮对话和指令遵循测试中跻身全球前列[1] - 豆包1.6支持多模态理解和图形界面操作,能自动完成酒店预定、购物小票整理等任务[1] 视频生成模型表现 - Seedance 1.0 pro支持文字与图片输入,可生成1080P高品质视频[2] - 该模型在Artificial Analysis评测中文生视频、图生视频两项任务排名首位[2] - 每生成一条5秒1080P视频成本仅3.67元,为行业最低[3] 市场份额与应用情况 - 豆包大模型服务全球TOP10手机厂商中的9家、80%主流汽车品牌、70%系统重要性银行及超50%985高校[2] - 日均tokens使用量达16.4万亿,较去年5月增长137倍[2] - 在中国公有云大模型市场份额占比46.4%,排名第一[2] 定价策略与成本优化 - 首创按输入长度区间定价,0-32K区间输入0.8元/百万tokens、输出8元/百万tokens[3] - 综合成本仅为豆包1.5深度思考模型或DeepSeek R1的三分之一[3] - Seedance 1.0 pro每千tokens仅0.015元[3] AI云原生服务升级 - 发布火山引擎MCP服务、PromptPilot智能提示工具、AI知识管理系统等新产品[3] - 推出多模态数据湖、AICC私密计算、大模型应用防火墙等AI Infra套件[3] - 超过80%字节工程师使用AI编程产品TRAE,月活用户超100万[4] 技术发展方向 - AI将发展为调度者,通过调用Agent和工具实现"all in one"开发[3] - 豆包1.6编程能力显著提升,已接入TRAE内测[3] - AI时代开发范式将从Web、APP转向Agent主导[4]
华泰证券今日早参-20250611
华泰证券· 2025-06-11 09:23
通信行业 - 博通CPO取得积极进展,5月推出单通道200G的CPO产品系列,6月交付支持CPO版本的Tomahawk 6交换芯片,预计科技巨头将推动CPO技术落地和产业链生态成熟 [2] - 看好CPO产业发展前景,推荐太辰光、天孚通信,建议关注中际旭创、新易盛、华工科技 [2] 多元金融行业 - 5月ETF市场总资产规模环比增长1.6%,股票ETF规模环比提升0.9%,债券型基金资产净值达2841亿元、环比增长15%,规模占比环比提升0.8pct至6.9%,龙头集中度环比小幅下滑,前3名地位稳固,5月新发产品较为分散、规模环比下滑 [3] - 《推动公募基金高质量发展行动方案》落地,股票ETF有望迎来快速发展机遇 [3] 银行/证券行业 - 2025年5月全市场发行理财产品5400份,环比-9.8%;公募基金新发份额环比减少,5月发行641亿份,月环比-31%;ETF资产净值持续提升,基准做市信用债ETF贡献核心增量 [3] - 推荐零售及财富管理标杆招行(AH)、财富管理战略地位提升的宁波银行,券商推荐大财富管理产业链具备较强优势的广发证券、东方证券 [3] 电子行业 - 运动相机和全景相机正从极限运动玩家的小众影像设备“破圈”成为大众创意生产力工具,行业处在快速增长阶段,影石创新(待上市)、GoPro、大疆是三大核心玩家 [4] - “全能型”个人影像设备或是发展方向,行业竞争核心正从硬件参数向AI、软件生态、差异化创新能力等多维度转变 [4] 金融工程行业 - 基于开源大模型Qwen3 - 8b增强BERT - FADT策略,构建LLM - FADT策略,增强后策略效果显著优于增强前 [6] - LLM - FADT Top25沪深300指增组合年化超额收益率为12.16%,LLM - FADT医药行业增强组合年化超额收益率为18.53%(回测区间均为20170126 - 20250530) [6] - 行业配置高度稳定、长期稳定在大盘价值风格的基金跑赢基准的平均概率较高,细分行业差异较大的医药主题基金跑赢基准的平均概率更高,消费和TMT主题基金跑赢基准的平均概率更低 [8] 固定收益行业 - 下半年利率或延续震荡市格局,信用债供需关系略好,中短端需求好于长端,供给以央国企产业、国股行二永债为主,关注科创债扩容、城投转型等机会 [9] - 化债下信用风险可控,信用利差仍有下行机会但空间或不大且波动较多,建议以震荡思路应对,票息策略+波段操作>品种选择>信用拉久期>杠杆,关注城投、二永、地产板块,高等级二永债尝试波段增厚收益 [9] 科技/计算机行业 - 2025年中期策略会显示AI算力保持积极向上趋势,推理端与训练端共同推进算力需求;国内外Agent进展提速,业绩有望加速释放;Agent产品有望在特定场景率先落地 [10] 交通运输行业 - 5月客货两旺,6月看多航空,短期暑运旺季催化、油汇利好,中长期供给增速放缓推动供需改善;配置高股息港股公路,Hibor走低支撑红利估值,公路板块业绩稳健;关税缓和推升集运运价,但市场预期或已充分,板块波动率加大 [11] - 推荐中国国航AH/中国东航AH/华夏航空/中远海能H/皖通高速AH/浙江沪杭甬/粤高速A/港铁公司/顺丰控股AH [11] 评级变动 - 极米科技(688696)目标价150元,评级调整为买入(首次),2025 - 2027年EPS分别为5元、5.77元、6.39元 [15]
环球问策|智源研究院王仲远:当前正是AI产品爆发的“前夕”
环球网· 2025-06-10 12:42
大模型技术发展 - 多模态大模型技术成为主流,从单纯文本训练转向多模态能力,GPT-o3和GPT-4o为代表[1] - Scaling Law依然成立,未来可能通过人工智能合成数据实现自我学习和进步[3] - 大模型与硬件结合,通过具身智能解决实际生产生活问题成为可能[3] Agent产品化趋势 - 2025年被行业视为"Agent元年",基础大模型达到可用状态后,Agent成为产业界发力重点[1][3] - Agent领域可能出现"杀手级"应用,创业公司需聚焦专业领域而非通用领域[3] - 一人或少数人组成的创业公司有机会在特定领域创造独特的大模型产品[4] 智源研究院最新成果 - 推出"悟界"系列大模型,包含Emu3、Brainμ、RoboBrain 2.0和OpenComplex2四个模型[4] - RoboBrain 2.0任务规划准确率较1.0提升74%,空间智能性能提升17%并新增空间推理能力[4] - 已开源核心资源,与20多家具身智能企业共建协同生态[4] 产业发展环境 - 人工智能进入产业爆发期"拐点",需辩证看待技术快速发展阶段的落地现实[5] - 政府应创造良好创新创业环境,支持大中小企业及科研机构协同发展[5]
AI展望:NewScaling,NewParadigm,NewTAM
华泰证券· 2025-06-10 09:43
报告核心观点 - 全球AI发展呈现模型端新架构探索、算力端需求上行与硬件设计进入新范式、应用端商业模式变革的趋势,持续看好AI产业投资主线,全球AI应用将进入业绩收获期 [1] 模型:预训练Scaling Law有望开启新起点 - 大模型技术路线从预训练到后训练发展,2018 - 2024年9月为预训练阶段,2024年9月后进入后训练阶段 [13][15] - 腾讯混元Turbo - S通过创新架构实现性能与效率平衡,Google Gemini Diffusion在文本生成上有突破,大厂在预训练参数量和数据量扩大上有尝试,大规模算力集群支持预训练探索,模型架构改进或使预训练Scaling Law开启新起点 [23][24][25] 算力:训练推理两条主线共同推动算力需求持续上行 训练端 - 后训练阶段Scaling Law成大厂共识,新Scaling路径不断涌现,新架构探索有望重启预训练阶段算力需求叙事 [33][34] - 以“星际之门”为代表的大规模算力集群进展顺利,中东版“星际之门”落地,主权AI逐步落地,台积电新产能规划预示算力需求乐观 [38][41][42] 推理端 - Agent需求增长或使推理算力提升几十至上百倍,大量工具调用和信息交互使tokens消耗量大幅提升,产品用户数量增长带动算力需求提升 [43][46][52] 算力硬件新范式 - 大模型对系统综合能力要求提高,NVLink Fusion强化英伟达硬件生态优势,国产算力加速迭代,华为云推出新服务器,高密度机架方案为性能追赶提供路径 [57][58][60] 应用:Agent进展提速,看好AI应用进入业绩收获期 Agent发展情况 - Agent可能是AI应用终极形态,目前雏形初具,但完成复杂长期任务能力有限,“任务长度”是关键衡量指标且提升速度快 [68][73][74] - MCP统一了Agent工具调用生态,促进其快速构建和发展 [79] 海外AI应用 - AI Coding是重要垂类赛道,细分垂类商业化效果好,25Q1业绩大部分超预期,头部2B软件AI产品存量客户渗透率接近10%,全年收入有望加速增长 [82][84][85] 国内AI应用 - 加速从简单环节到复杂环节产品升级,25Q1利润指标率先改善,AI商业化24年初步验证,25年有望加速复制推广,MCP有望加速产业节奏 [88][90][94] 落地节奏展望:商业模式变革有望成为共识,看好细分领域率先放量 商业模式变革 - Agent应用从交付工具转变为交付结果,按效果付费新范式有望成行业共识 [99] 细分场景放量 - 数据复杂度低、幻觉容忍度高的场景率先实现规模化商业落地,2C场景商业化进展领先,2B应用分场景和行业来看,数据复杂度和预算影响落地节奏 [103][104][110] AI + 营销/销售 - 数据丰富、可量化ROI和流程标准化驱动AI快速商业化,企业需求从单一工具向全链路智能中枢升级,市场格局分散,AI有望重塑格局 [113][114][119] 重点公司推荐 - 推荐金山办公、福昕软件、泛微网络等多家公司,均给予“买入”评级 [7]
张津剑:投资中的频率与频谱 | 42章经
42章经· 2025-06-08 16:11
注意力机制与人类信息处理 - Transformer架构首次赋予机器注意力机制 推动AI技术飞跃 并促使人类重新审视自身信息感知方式 [1] - 人类感知-处理-行动系统存在巨大鸿沟:视网膜每秒接收10^9比特信息 大脑处理仅10^6比特 输出带宽仅10^1比特 [6][7] - 注意力机制作为主动过滤器 帮助人类在信息洪流中聚焦关键信号 但当前普遍面临机制崩溃导致独立判断能力丧失 [8][10] 社会分化与注意力失控 - 注意力失控导致世界分化加剧 体现为地缘政治冲突 贫富差距扩大及微观人际关系割裂 [1][3] - "拉尔森效应"普遍存在:信息输入输出端口过近导致信号循环啸叫 引发赛道投资极端化(过热或过冷) [12][13][14] - 创始人案例显示 专注冷门领域7年最终获得全球仅4张的国家牌照 验证注意力博弈价值 [19][20] AI与人类能力对比 - AI通过注意力机制实现能力飞跃 未来将具备全频谱感知能力(包括X光 伽马射线等人类不可感知频段) [34][35] - 人类局限性体现为:感知频谱仅占已知电磁波频谱1/10^9 依赖核磁共振等工具间接获取信息 [33] - 未来AI系统将是"传感器+Agent+具身智能"三位一体 需以AI为中心重构工作流而非简单赋能人类 [35][37][38] 人类在AI时代的核心价值 - 创造需求成为关键价值 需明确自身要解决的问题 而非依赖市场反馈贴标签 [40][42] - 审美作为超越多模态的处理结果 是人类独有的核心能力 能预判技术路径或感知潜在风险 [41][42][43] - 心力取代智力成为核心竞争力 优秀创始人特质体现为逆境坚持与克制 [44] 创业与投资启示 - 冷门领域存在未被充分估值的机会 需通过专注发现根本性变化(如2023年具身智能案例) [15][16][17] - 传感器技术将迎来爆发 创业者应探索人类未利用的数据频段(如α波 伽马射线) [34][35] - 区块链或成为Agent互联网的基础设施 当前多数项目仍错误围绕人类需求设计 [35][36]