Workflow
智能体
icon
搜索文档
腾讯大模型战略首次全景亮相!智能体平台重磅上线,从“落地可用”到“智能协同”
量子位· 2025-05-22 22:29
腾讯云智能体开发平台发布 - 腾讯云在AI产业应用峰会上正式上线智能体开发平台,实现零代码配置多智能体协同构建,显著降低开发门槛[1] - 平台前身为"大模型知识引擎",具备RAG能力、工作流能力、多Agent协作机制及To B实战场景支持等差异化优势[5] - 平台支持文档自动生成问答对并进行溯源校验,降低运营成本,同时实现新旧文档比对与高效决策,显著减少token消耗[8] - 平台首次推出具备全局视野的Agent,支持灵活的节点回退和全局意图洞察,智能控制节点跳转[10] - 平台支持零代码配置多Agent协同转交,灵活满足不同Multi-Agent协同方式搭建需求[13] - 平台整合腾讯内部优质能力(如腾讯地图、腾讯医典)、RAG组件及第三方插件,实现全面开放与能力融合[15] 混元大模型升级 - 混元系列大模型迎来重磅更新,包括新模型发布和既有模型升级[3] - 深度思考模型T1采用多阶段强化学习训练,竞赛级数学能力提升8%[22] - 快思考模型Turbo S在全球arena榜单中上升到全球第八[22] - 视觉深度模型、端到端语音通话模型、生图模型imageV2.0、3D生成模型3D V2.5以及混元游戏模型等也同步更新[22] 行业应用与案例 - 在智能客服场景,与一汽丰田合作提升独立解决率从37%至84%,大幅优化客户体验和服务效率[25] - 在医药零售领域,与大参林合作构建专属AI知识库,打造"AI小参"问答助手,服务5万名员工,查询响应时间缩短超80%[25] - 在医疗行业文书撰写场景,与迈瑞合作推出"启元重症"智能体,病历书写效率提升近一倍[26] - 已构建覆盖金融、教育、零售、出行、消费电子等30多个行业的解决方案[36] 技术演进路径 - 从最初的RAG知识库问答,到流程编排的工作流,再逐步引入Agent能力,演进为多智能体协同的Multi-Agent架构[29] - 未来将通过模型能力升级、平台工具完善、场景解决方案打磨等措施进一步提升产品能力[36] - 更高效与自动化的训练技术、分布式推理技术、主流模型内核优化、主流芯片的推理加速能力将是主要演进方向[36] 战略定位 - 围绕企业真实需求逐步演进,从场景出发解决实际问题,推动能力从"落地可用"迈向"智能协同"[3] - 坚持"构建离产业最近的AI平台"的核心主张,深度理解产业痛点并实现价值闭环[32][33] - 以用户需求为本,持续迭代产品和技术,更好地构建距离产业更近的AI[37]
百度Q1营收325亿元超预期,智能云增长42%
凤凰网财经· 2025-05-22 17:05
国际格局与AI投资趋势 - 21世纪国际格局正被算力和算法重塑 AI成为资本最热门赌注 各大公司加码投入争夺商业制高点[1] - 韦德布什证券从全球选出30家科技公司 涵盖半导体 硬件 机器人等领域 苹果 英伟达等入选[1] 百度AI战略与市场表现 - 百度成为唯二入选韦德布什报告的中国公司 股票上行潜力达25%[2] - Q1总营收325亿元 智能云增长42% 萝卜快跑累计提供1100万次全球出行服务[3] - 桥水基金持仓季度内增10倍 反映资本市场对百度AI增长潜力的认可[3] 智能云业务突破 - 百度智能云Q1收入增长42% 核心营收255亿元同比增长7% 超市场预期[4] - 千帆平台囊括100+主流模型 调用成本业内最低 工具链升级降低训练成本[4] - 文心4.5 Turbo价格下降80%至0.8元/百万token输入 X1 Turbo价格降50%至1元/百万token[5] 自动驾驶业务进展 - 萝卜快跑Q1全球出行服务量140万次 同比增长75% 累计服务量超1100万次[7] - 出海迪拜 阿布扎比 计划进入土耳其 瑞士 香港测试区扩大[7] - 第六代无人车价格20.46万元 为Waymo的1/7 出险率仅为人类司机1/14[8][9] - Apollo获ASIL D安全认证 测试里程超1.3亿公里 与神州合作推自动驾驶租赁[8][9] AI应用生态构建 - 文心智能体平台合作企业达30万家 生产2100万数字人视频 开发者变现数量季度增15倍[11] - 百度APP月活7.24亿 文库AI MAU 9700万 网盘AI MAU超8000万[10][11] - 采用"AI改造现有业务造血-利润反哺研发"路径 5年培养630万AI人才 计划再培养1000万[12] 技术迭代与成本优势 - 连发4款大模型 包括多模态文心4.5和推理模型X1 性能提升同时价格大幅下降[5] - 三万卡集群点亮 端到端全栈能力持续提升训练效率 综合成本降低[4] - 智能体成为AI应用代名词 代码智能体Coding Agent成最火赛道[4]
腾讯混元上新:多模态和智能体,两手都要抓 | 最前线
36氪· 2025-05-22 16:01
腾讯大模型战略升级 - 腾讯混元大模型迎来全面升级 包括旗舰快思考模型混元TurboS和深度思考模型混元T1的新迭代版本 [1] - 基于TurboS基座推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice [1] - 同步上新混元图像2.0 混元3D v2.5及混元游戏视觉生成等一系列多模态模型 [1] 混元TurboS模型性能 - 混元TurboS在Chatbot Arena排名全球前八 国内仅次于DeepSeek [2] - 代码和数学等理科能力进入全球前十 [2] - 采用大规模混合Mamba-MoE模型 理科推理提升超10% 代码能力提升24% 竞赛数学成绩提升39% [2] 混元T1模型进展 - 深度思考模型混元T1持续快速迭代 在元宝App上线后实现多项能力提升 [6] - 竞赛数学效果提升8% 常识问答提升8% 复杂任务的Agent能力提升13% [6] 多模态模型突破 - 混元视觉深度推理模型T1-Vision支持多图输入 具备原生长思维链 [8] - 整体效果提升5.3% 理解速度提升50% [8] - 混元Voice语音模型响应速度提升超30% 降至1.6秒 [8] - 混元图像2.0在主观画面质量和美学层面被认为"AI味"最少 [8] 智能体平台战略 - 将大模型知识引擎升级为"腾讯云智能体开发平台" [12] - 整合RAG技术和全面Agent能力 帮助企业激活私域知识和构建专属智能体 [13] - 大模型显著提升语义理解 上下文建模 内容切分等能力 [14] - 多模态模型发展使视觉+文本协同任务成为可能 [14] 开源与业务应用 - 混元3D模型在Hugging Face下载量超过160万 [16] - 计划推出多尺寸混合推理模型 适配企业与端侧不同需求 [16] - 混元已深度融入微信 QQ 腾讯元宝 腾讯会议 腾讯文档等核心产品 [17]
智能体大爆发,腾讯要怎么做?
虎嗅· 2025-05-22 15:25
出品|虎嗅科技组 作者|宋思杭 编辑|苗正卿 头图|视觉中国 5月21日,在北京一家五星级酒店的宴会厅里,腾讯云AI产业应用峰会正在举行。会场入口处,一排混 元大模型和智能体的互动展示吸引了络绎不绝的参观者。腾讯集团高级执行副总裁、云与智慧产业事业 群CEO汤道生身着深灰色西装、浅蓝色衬衫出现在会场中央的演讲台上。他保持了一贯的沉稳风格,平 静而有力地阐述着腾讯对AI的全面战略布局。 "AI持续落地,每个企业正在成为AI公司,每个人也将成为AI加持的'超级个体'。"汤道生开门见山地表 示。而在加大AI投入力度方面,腾讯的做法可以说是相当激进,其打通了各业务条线与AI之间的壁 垒,极大权限地对各业务开放了AI能力。 而"全面拥抱AI",既是本场峰会的主题,同时也贯穿了腾讯2025年的全年战略重要。它正在影响着这家 科技大厂的方方面面。在演讲中,汤道生还提出了大模型、智能体、知识库和基础设施"四个加速"的战 略。其中,智能体则是极为重要的一种呈现形式。它所代表的是当大模型在国内走过三年时间,应用范 式的迭代。 然而,究竟什么是智能体?这个定义在行业里似乎还不够清晰。 在大部分人的眼中,智能体是这样的——当你想打开 ...
天选打工人--天工智能体测评
小熊跑的快· 2025-05-22 15:09
天工agent技术能力 - 成功实现从图片识别到论文下载、算法理解的完整流程,包括OCR识别、网络搜索、资源获取等复杂步骤 [1][3] - 准确复现论文中的交易共现分析算法,包含五种交易类型分类(孤立交易/同股共现/跨股共现/混合共现/全部交易)及条件订单不平衡(COI)计算 [2] - 提供Python代码实现交易信号生成功能,支持参数调整(如共现时间阈值δ默认为1毫秒) [2] - 集成MCP工具实现多工具协同,包括网页浏览、PDF解析、代码生成等 [2][3] 产品功能亮点 - 支持通用模式、Office三件套(文档/PPT/表格)、网页三种模式,解决垂直领域适配问题 [3] - 网页智能体可快速搭建结构化交互网页,播客智能体支持脚本生成音频,未来扩展多语言 [3] - 集成图像/视频/音乐生成的通用智能体,实现文字到多媒体内容转化 [3] - 获GAIA榜单第一名,用户体验流畅,支持任务过程实时确认与用户接管 [3] 技术局限性 - 未实际执行生成的Python代码,无法验证代码准确性,结论依赖网络参考 [3] - 文档撰写过度依赖搜索工具,存在分析深度不足的问题 [3] - 复杂任务链(如OCR+搜索+代码执行)的综合自动化仍具挑战性 [3] 行业应用潜力 - 算法复现能力可服务于量化交易领域,尤其高频交易中的市场微观结构分析 [2] - 多工具集成模式为创意产业(如自动化PPT/音视频制作)提供效率解决方案 [3] - 交易流分解技术(如COI计算)对金融研究机构具有方法论参考价值 [2]
腾讯AI投入再加码 打造“好用的AI”
环球网资讯· 2025-05-22 11:41
行业趋势 - AI已成为产业界高度关注的核心话题,企业普遍将AI作为重要发展方向 [1] - 生成式AI技术实现从"量变"到"质变"的突破,推动行业应用落地 [3] - 智能体行业处于高速增长阶段,但技术仍处于发展初期 [3] 公司战略 - 腾讯将持续加大AI投入力度,推动各项业务全面拥抱AI [3] - 腾讯通过大模型、智能体、知识库、基础设施"四个加速"战略打造"好用的AI" [3] - 腾讯云升级"智能体开发平台",支持企业快速构建智能体应用 [3] 技术发展 - 智能体技术面临执行复杂任务的挑战,需依赖底层模型技术的持续进步 [3] - 知识库、插件工具、Multi-Agent框架等技术正在驱动智能体升级 [3] - 未来智能体将具备企业知识理解、工具调用和自主执行复杂任务的能力 [3] 应用案例 - QQ浏览器、腾讯健康、腾讯云代码助手CodeBuddy、腾讯企点营销云等应用已集成智能体能力 [3]
全球智能体榜单新SOTA!中国公司登顶,Office三件套一键生成,全程可控可溯源,打工人直接拿来用
量子位· 2025-05-22 10:01
公司表现 - 昆仑万维推出的天工超级智能体(Skywork Super Agents)上线即登顶GAIA榜单,超越Manus和OpenAI的Deep Research [1][2] - 在GAIA基准测试中,该产品在Level 1和Level 2以显著优势领先,Level 3与Manus持平 [2][18] - 同时获得SimpleQA评分第一和Product Hunt日榜第一 [19] 技术能力 - 支持五种模态一站式生成,包括Office三件套(Word/PPT/Excel)、网站、网页、播客 [8] - 首创表格生成功能,可自动生成数据表格和图表 [21] - 集成十余种MCP工具,实现多模态内容联动生成(如MV/宣传片/有声书) [51][52] 产品设计 - 采用场景化入口设计,覆盖20+高频工作场景(商业报告/简历/合同等),降低用户提示词门槛 [22][23] - 全链路可控设计:需求确认→大纲审核→内容溯源,关键节点支持人工干预 [36][56] - 生成内容可溯源、可编辑,并支持NotebookLM式私人知识库功能 [9][51] 行业影响 - GAIA基准包含450个真实世界问题,人类得分率92% vs GPT-4插件版仅15%,凸显技术突破难度 [17] - 产品从"技术秀场"转向"生产力工具",解决AI工具半成品烂尾痛点 [55][56] - 开源DeepResearch Agent框架,提供三件套生成能力接口供开发者调用 [53][54] 市场定位 - 海外版和国内版同步上线,界面设计优于同类竞品 [20][61] - 差异化聚焦"打工人友好"特性,填补市场空白(传统Agent不支持文件溯源/格式有限) [10][12] - 通过Office三件套深度优化建立职场场景壁垒 [31][56]
稳坐亚洲AIGC赛道头把交椅,出门问问研发总监孙鹏飞: “先声夺人”,叩问人工智能未来
南京日报· 2025-05-22 06:58
公司发展历程 - 出门问问成立于2012年,先后开发语音助手、智能硬件、多模态大模型及多款AIGC产品 [2] - 2020年推出配音工具"魔音工坊",成为AIGC技术在中国首个商业应用 [3] - 2024年4月登陆港交所,成为"AIGC第一股" [5] - 已构建AI配音助理、AI数字分身、AI数字员工平台和AI短视频生成平台的AIGC产品矩阵 [6] 核心产品与技术 - "魔音工坊"在国内短视频平台覆盖超过70%的AI配音作品 [3] - 产品实现16种语言转换能力,支持数字分身批量制作多语言带货视频 [5] - 技术能精准提取语音参数,实现嘴型与声音完美同步,处理多人同框复杂场景 [6] - 全球首款AI智能体硬件TicNote具备智能录音、即时聊天、深度思考等功能 [7] 市场表现与用户数据 - AIGC产品累计服务用户超过1500万,注册用户超1000万,付费用户超百万 [6] - 智能硬件产品95%以上面向海外市场销售 [7] - "魔音工坊"用户社群推动产品从单一配音工具进化为AI创作平台 [4] 行业趋势与战略 - AI智能体被视为行业下一个风口,出门问问已发布全球首款相关硬件 [7] - 通过技术创新精准对接用户需求,验证AI技术商业化落地潜力 [4] - 持续迭代升级建立技术壁垒,快速响应市场需求打造爆款应用 [6] 典型案例 - "小帅""小美"虚拟角色推动"魔音工坊"破圈,形成短视频解说领域固定叙事符号 [3][4] - 赋能义乌2万家商户数字分身,实现跨时区全球贸易 [5] - 助力义乌老板娘登上纽约时代广场,展示"中国制造"数字化能力 [5]
腾讯首次晒出大模型战略:加速智能体落地,加码知识库赛道
南方都市报· 2025-05-21 22:56
腾讯AI战略与产品升级 - 公司提出"每个企业正在成为AI公司,每个人也将成为AI加持的'超级个体'"的核心理念,强调生成式AI已跨过"可用性"门槛,未来需向"好用"和"人人能用"发展 [2] - 公司首次全面公布大模型战略,涵盖自研混元大模型、AI云基础设施、智能体开发工具、知识库及场景应用的全矩阵产品升级 [2] - 混元TurboS在全球权威评测平台Chatbot Arena排名全球前八(国内第二),代码与数学能力进入全球前十 [3] - 混元图像2.0实现"毫秒级"生图,3D v2.5采用稀疏3D原生架构实现代际飞跃,开源社区下载量超160万 [3] - 混元已实现图像/视频/3D/文本全模态开源,将推出0.5B-32B的dense模型及13B MoE模型适配企业需求 [4] 技术迭代与客户驱动 - 混元产品迭代速度明显加快,推出视觉深度推理模型T1 Vision和端到端语音模型混元Voice,即将推出实时视频通话AI [3] - 技术节奏加快源于客户需求驱动,公司通过整合视觉/多模态/文本/智能体技术形成系统性解决方案 [4] - 公司强调技术堆栈优化并非孤立演进,而是基于多年能力积累借助大模型/Agent等新范式重新激活 [4] 智能体平台创新 - 2025年被定位为Agent智能体元年,公司认为智能体将降低AI应用门槛成为企业创新利器 [5] - 腾讯云智能体开发平台整合RAG技术/Agent能力,支持零代码多Agent协同与工作流模式,实现任务自主拆解与工具调用 [5] - 平台创新性地在工作流中引入"全局视野"智能体节点,兼顾流程确定性与智能体灵活性 [6] - 当前智能体落地面临技术层面自主规划准确性不足与客户认知鸿沟的双重挑战 [6] 知识库战略布局 - 公司认定"大模型+知识库"为当前AI落地最佳路径,升级腾讯乐享和ima知识库产品 [7] - ima面向个人用户支持课程作业/论文写作等场景,乐享服务企业客户已累计覆盖30万包括比亚迪/清华大学等行业代表 [7] - 知识库产品在知识整合/更新/权限管理/AI问答等层面提升流转效率,适配政务/法律/教育等知识驱动领域 [7] 云计算基础设施 - 智能时代云计算正从"资源供给"转向"智能服务",公司推出智算系列产品在效能/可靠性/易用性三大方向升级 [8] - 基础设施升级旨在应对AI应用和模型爆发对算力性能提出的全新挑战 [8]
腾讯云吴运声:加速AI原生应用落地,让技术创新转化为实际生产力
搜狐财经· 2025-05-21 20:57
AI应用趋势 - 大语言模型和多模态模型进一步融合,交互形式从文字演化到语音、视频,提升AI应用渗透率 [5] - 训练和推理效率持续提升,通过算力管理调度和推理加速优化降低成本,推动更多场景落地 [5] - 智能体加速落地,能够自主规划执行路径、灵活调用工具,降低企业构建AI应用门槛 [5] 腾讯云语音PaaS解决方案 - 将ASR大模型、TTS大模型与TRTC实时通信能力深度融合,构建"语音输入→智能处理→自然输出→实时交互"全链路闭环 [2][7] - ASR大模型在复杂场景下字错率明显下降,支持方言识别和动态适应不同口音、语速 [6] - TTS大模型拟人度和韵律自然度提升,发音接近真人自然对话感 [6] - TRTC确保音视频传输端到端延迟低于300ms,对话延迟保持在1000ms以下 [6] 腾讯云TI平台升级 - 升级精调工具链,支持蒸馏精调和强化学习等训练方式,提供自动驾驶模型训练能力 [2][8] - 资源调度支持训推一体、潮汐调度,提升资源利用率 [2][8] - Angel加速套件实现行业领先的推理加速性能,在3.5K输入、1K输出场景下2机16卡QPM超过100 [9][10] - 某消费电子企业使用TI平台后AI研发整体提效50%以上,GPU资源利用率提升80%以上 [9] 腾讯云智能体开发平台 - 将大模型知识引擎升级为智能体开发平台,提供行业领先的RAG技术和全面的Agent能力 [2][10] - RAG能力支持从复杂Excel表精准提取答案、自然语言查询数据库、文档自动生成问答对、文档间比对等 [12] - 提供全面的Agent能力支持,包括全局视野Agent、零代码配置多Agent协同转交、MCP插件生态等 [13] - 支持多层权限体系配置、意图达成方式配置、全链路运营支持等企业级功能 [14][15][16] - QQ浏览器基于该平台推出智能体Qbot,帮助用户执行下载、应用更新等任务 [3][16]