智能体

搜索文档
腾讯云吴运声:加速AI原生应用落地,让技术创新转化为实际生产力
搜狐财经· 2025-05-21 20:57
AI应用趋势 - 大语言模型和多模态模型进一步融合,交互形式从文字演化到语音、视频,提升AI应用渗透率 [5] - 训练和推理效率持续提升,通过算力管理调度和推理加速优化降低成本,推动更多场景落地 [5] - 智能体加速落地,能够自主规划执行路径、灵活调用工具,降低企业构建AI应用门槛 [5] 腾讯云语音PaaS解决方案 - 将ASR大模型、TTS大模型与TRTC实时通信能力深度融合,构建"语音输入→智能处理→自然输出→实时交互"全链路闭环 [2][7] - ASR大模型在复杂场景下字错率明显下降,支持方言识别和动态适应不同口音、语速 [6] - TTS大模型拟人度和韵律自然度提升,发音接近真人自然对话感 [6] - TRTC确保音视频传输端到端延迟低于300ms,对话延迟保持在1000ms以下 [6] 腾讯云TI平台升级 - 升级精调工具链,支持蒸馏精调和强化学习等训练方式,提供自动驾驶模型训练能力 [2][8] - 资源调度支持训推一体、潮汐调度,提升资源利用率 [2][8] - Angel加速套件实现行业领先的推理加速性能,在3.5K输入、1K输出场景下2机16卡QPM超过100 [9][10] - 某消费电子企业使用TI平台后AI研发整体提效50%以上,GPU资源利用率提升80%以上 [9] 腾讯云智能体开发平台 - 将大模型知识引擎升级为智能体开发平台,提供行业领先的RAG技术和全面的Agent能力 [2][10] - RAG能力支持从复杂Excel表精准提取答案、自然语言查询数据库、文档自动生成问答对、文档间比对等 [12] - 提供全面的Agent能力支持,包括全局视野Agent、零代码配置多Agent协同转交、MCP插件生态等 [13] - 支持多层权限体系配置、意图达成方式配置、全链路运营支持等企业级功能 [14][15][16] - QQ浏览器基于该平台推出智能体Qbot,帮助用户执行下载、应用更新等任务 [3][16]
腾讯汤道生:每个企业都将成为AI公司,每个人都将是“超级个体”
腾讯研究院· 2025-05-21 15:51
腾讯AI战略与产业应用 - 生成式AI已从"量变"到"质变",公司提出"四个加速"战略(大模型创新、智能体应用、知识库建设、基础设施升级)推动AI普及[1][6] - 混元大模型TurboS进入全球Chatbot Arena前8,中国排名第二,多模态能力覆盖视觉理解、语音交互、3D建模等[2][7] - 混元开源模型GitHub Star超3万,覆盖文本/图像/视频/3D生成,应用于30+行业如医疗(近1万家医疗机构使用AI导辅诊)[8] 大模型技术进展 - 混元T1-Vision实现多模态深度推理,混元Voice支持低延时情感化语音交互,混元Image 2.0实现商用级实时生图[7] - 3D模型达到超高清几何建模精度,视觉理解/语音交互能力获行业认可[2] - 开源计划包含多尺寸多场景模型,与50家生态伙伴开展场景共创[8] 智能体平台发展 - 智能体开发平台支持零代码多Agent协同,提供工作流模式与全局Agent节点回退功能[9] - QQ浏览器QBot实现搜索/下载/分析全流程自动化,AI高考通可生成志愿填报方案[10] - 代码助手CodeBuddy使85%开发者编码时间缩短40%,企点营销云智能体提升绝味食品活动点击率40%/转化率25%[11] 知识库与行业应用 - 企业AI知识库支持多人在线编辑与权限管控,科沃斯应用后实现人效两位数提升/年省数百万成本[11][12] - ima知识号积累1000万+专业内容,健康管理智能体可自动解读体检报告并制定健康计划[10] - AI驱动广告业务双位数增长,游戏匹配优化提升用户粘性,视频/音乐制作效率显著提升[4] 基础设施优化 - 推理成本优化成为核心,训练infra综合性能提升30%,星脉网络实现三带宽(显存/存储/互联)升级[13][14] - 潮汐调度实现集群白天推理/夜间训练,荣耀手机合作案例显示推理吞吐最高提升54%[14]
腾讯首次完整披露大模型战略,各业务全面拥抱AI
21世纪经济报道· 2025-05-21 14:40
腾讯大模型战略发布 - 腾讯首次完整披露大模型战略 在2025腾讯云AI产业应用峰会上全面升级大模型矩阵产品 包括自研混元大模型 AI云基础设施 智能体开发工具 知识库及场景应用等 [1] - 公司高管表示AI持续落地将使每家企业成为AI公司 每个人成为AI加持的超级个体 过去一年腾讯各项业务已全面拥抱AI 并观察到产业对大模型的庞大需求 [1] - 未来将加大AI投入力度 重点加速大模型创新 智能体应用 知识库建设 基础设施升级 目标打造"好用的AI" [1] 混元大模型技术进展 - 混元T1自年初上线元宝App后持续迭代 基于TurboS基座新推出视觉深度推理模型T1 Vision和端到端语音通话模型混元Voice 近期将推出实时视频通话AI体验 [2] - 混元已实现图像 视频 3D 文本等全模态开源 未来计划推出多尺寸混合推理模型 包括0.5B到32B的dense模型和激活13B的MoE模型 [2] - 将持续开源多模态基础模型及配套插件模型 包括图像 视频 3D等方向 [2] AI产业发展趋势 - 生成式AI已跨过"可用性"门槛 正从"可用"向"好用"转变 从"部分人用"向"人人能用"发展 [1] - 产业对大模型API调用量和算力需求快速增长 需在交互体验 执行能力 内容准确性 落地成本等方面持续升级 [1] - 优化模型可提升性能与交互体验 智能体赋予独立执行能力 知识库减少模型幻觉 基础设施优化降低训推成本 [1]
2025 全球产品经理大会正式官宣,聚焦 AI 产品实战,全景呈现未来产品图谱!
AI科技大本营· 2025-05-21 14:10
大会核心主题 - 聚焦AI时代产品设计理念,强调"用户体验至上"的乔布斯式原则,探讨如何将技术转化为可感知的用户价值[1] - 提出AI重塑的不仅是技术栈,更是产品构建方法论,需重构体验流与用户心智[36][14] 大会专题架构 - 12大专题覆盖AI产品全生命周期,包括: - **技术实现层**:生成式AI全链路构建(1-5专题)[4][6] - **行业应用层**:金融/教育/制造等垂类场景落地(4专题)[6] - **全球化维度**:中国企业出海策略与挑战(6专题)[7] - **商业闭环**:可持续商业模式设计(11专题)[10][15] 嘉宾阵容亮点 - **技术专家**: - 李建忠提出"范式转换立方体"理论,专注大语言模型软件应用[16] - 胡腾宇拥有12年全栈产品架构经验,主导AWE智能引擎获奖项目[28] - **产品实践者**: - 王保平(玉伯)曾打造语雀/Ant Design等亿级产品,现专注AI创作应用[20] - 杨一溪实现快手DAU增长117PP,美团B端半年拓客500万[21][22] - **跨界创新者**: - 芦良超整合游戏与AI产品经验,主导腾讯gameloop产品[29][30] - 隋哲深耕人机交互领域,拥有游戏/O2O电商多赛道经验[31][32] 内容价值定位 - 强调实战方法论:要求嘉宾分享从0到1及1到N的真实路径[37][40] - 覆盖关键增长环节:包括冷启动策略(9专题)、规模化运营(10专题)、用户价值发现机制(12专题)[9][15] - 突出数据驱动:如支付宝体验度量体系(31)、合成数据算法应用(34)[31][34] 行业趋势洞察 - 技术融合方向:具身智能硬件强调感知-动作闭环部署能力(5专题)[6] - 企业级需求:工具型/平台型AI构建路径受重点关注(3专题)[6] - 生态协作模式:开放品牌合作与内容共创机制[39][40]
腾讯大模型战略首次全景亮相:自研混元大模型、知识库、智能体开发、工具箱一应俱全
新浪科技· 2025-05-21 13:30
腾讯AI战略升级 - 公司全面升级大模型矩阵产品,包括混元大模型、AI云基础设施、智能体开发工具、知识库及场景应用,致力于打造"好用的 AI" [1] - 公司高层提出"每个企业都将成为AI公司"、"每个人将是AI加持的超级个体"的愿景 [1] - 业务已全面拥抱AI,未来将加速大模型创新、智能体应用、知识库建设和基础设施升级 [3] 混元大模型技术进展 - 混元TurboS在Chatbot Arena排名全球前八(国内第二),代码/数学能力进入全球前十 [3] - 推出视觉深度推理模型混元T1 Vision和端到端语音通话模型混元Voice,即将推出实时视频通话AI [3] - 混元图像2.0实现"毫秒级"生图,混元3D v2.5采用稀疏3D原生架构实现代际飞跃,Hugging Face下载量超160万 [3] - 实现全模态开源(图像/视频/3D/文本),计划推出0.5B-32B dense模型和13B MoE模型 [4] 智能体平台发展 - 大模型知识引擎升级为"腾讯云智能体开发平台",整合RAG技术和Agent能力 [4] - 平台支持零代码多Agent协同、工作流模式拖拉拽,降低智能体搭建门槛 [5] - 智能体具备自主任务拆解、工具调用能力,成为企业执行复杂任务的助手 [5] 知识库产品布局 - 升级知识库系列产品(腾讯乐享和ima),服务企业/组织/个人用户 [5] - 乐享知识库累计服务超30万客户,覆盖比亚迪、友邦保险、清华大学等行业标杆 [5] - 提供知识整合、AI问答等功能,提升企业知识流转效率 [5] 行业应用落地 - 代码助手CodeBuddy升级为Craft软件开发智能体,支持自然语言需求到代码全流程生成 [6] - 企点营销云发布"营销云智能体",实现从人群洞察到效果追踪的全链路智能决策 [6] - 办公协同产品全面AI化:腾讯文档支持AI生成内容、腾讯会议接入DeepSeek双模型、电子签实现AI合同管理 [6]
2025 全球产品经理大会来袭,聚焦 AI 产品实战,全景呈现未来产品图谱
钛媒体APP· 2025-05-21 12:20
大会核心内容 - 2025全球产品经理大会将于8月15-16日在北京威斯汀酒店举办 聚焦生成式AI与智能体产品设计、商业落地与用户体验创新等12大专题方向 [1] - 大会主题为"产品与AI如何共创未来" 旨在探索技术转化为用户价值的路径 强调"智能可感、体验可用"的产品理念 [1] 专题板块 - 12大核心专题包括:生成式人工智能产品(GenAI Products)、企业级AI产品与应用(Enterprise AI Products)、Agent智能体产品设计(AI Agents)等 [1][2] - 专题覆盖全产业链:从AI+行业应用落地实践(金融/教育/制造)到具身智能硬件产品 从全球化出海实践到商业模式设计 [2][3][21] - 特别关注产品全链路构建:包括用户研究、交互体验设计、产品战略创新及运营增长方法论 [2][8][21] 演讲嘉宾阵容 - 汇集互联网头部平台与AI创业公司专家:包括CSDN高级副总裁李建忠(大语言模型应用专家)、久痕科技CEO汪源(前网易副总裁)、YouMind创始人王保平(前字节跳动产品副总裁) [4][5][18] - 实战派代表:WPS高级产品总监赵九州(腾讯P12专家)、火星电波CEO冯雷(MiniMax前产品负责人)、索云AI联合创始人胡腾宇(前昆仑万维AI首席架构师) [6][19] - 增长运营专家:快手前增长负责人(主导DAU增长117PP)、美团前高级产品经理(半年实现B端商家钱包用户从0到500万) [5] 大会亮点 - 深度解析生成式AI与智能体产品的设计方法 分享从模型能力到交互体验的全链路构建 [16] - 揭秘中国企业出海策略与AI行业应用最佳实践 包含金融、教育、制造等垂类场景案例 [2][16] - 探讨AI驱动的运营增长方法论 覆盖冷启动到规模化阶段 强调数据驱动与用户价值重构 [8][17] 其他信息 - 大会开放演讲议题征集 截止时间为2025年6月15日 要求分享者具备AI产品从0到1的实战经验 [10][11][15] - 参会者可领取产品人专属礼包 官网提供最新嘉宾与议题动态更新 [13][16]
一文读懂Google I/O 2025 开发者大会:“降低门槛、加速创造”,谷歌开启 “模型即平台” 的 AI 生态新时代
硬AI· 2025-05-21 11:29
Google I/O 2025核心发布 - Gemini 2 5 Pro被定位为公司最强大的通用AI模型 在LLM Arena所有类别排行榜名列前茅[22][24] - Gemini系列模型每月处理token数量从9 7万亿激增至480万亿 增长近50倍 每月活跃用户超4亿[24] - 公司推出Gemini 2 5 Flash轻量版模型 效率提升22% 支持"思考预算"机制控制输出质量与响应速度[6][39][40] 跨平台AI引擎整合 - Android平台深度整合Gemini Nano 提供summarize等轻量功能 同时推出Androidify应用生成机器人形象[17][19] - 新UI系统Material 3 Expressive增强界面趣味性 Android 16引入live updates等性能优化工具[20] - 智能眼镜Moohan支持沉浸式地图和交互式Gemini AI 合作伙伴包括Gentle Monster和Warby Parker[63][64][65] AI开发工具升级 - AI Studio新增原生语音模型支持24种语言 增强函数调用与搜索推理功能[9][11] - Stitch实验项目实现文本提示自动生成App UI设计 可导出至Figma或IDE继续开发[7][8] - Cloud Run支持一键部署应用到线上 集成至VS Code等IDE[16] 多模态与创作突破 - Imagine 4图像模型细节捕捉能力提升 支持中英文复杂字体识别 生成速度快10倍[56] - Veo 3视频模型实现角色一致性控制 可自动合成环境音与对白 口型同步[56][57] - Lyria音频模型结合Music AI Sandbox可生成专业音乐 Flow平台支持AI视频全流程制作[61] 搜索与智能体革新 - 搜索新增AI模式标签页 支持数百字复杂查询 采用Deep Research模型提供结构化答案[46][47][51] - 智能体模式可同时管理10个任务 实验版将向Gemini订阅用户开放[27][29][30] - AI概览功能月活达15亿 推动部分查询量增长10%[46] 订阅与商业化 - Google AI Ultra套餐月费249 99美元 包含Gemini模型最高使用权限及30TB存储空间[69][70][71] - Google Beam视频通信平台采用六摄像头阵列实现毫米级精度3D渲染 将与惠普合作商业化[37]
直击谷歌I/O 2025:谷歌AI眼镜剑指主流市场,未来拍电影全靠“打字”?
钛媒体APP· 2025-05-21 08:35
文 | 大模型之家 AI能生成分镜,"拍"电影还会远吗? 北京时间5月21日凌晨,在2025年Google I/O开发者大会的主题演讲中,谷歌CEO桑达尔·皮查伊以一句 轻松的"双子座季节"开场白,揭开了这场科技盛宴的序幕。他直言,在谷歌的"Gemini时代",技术突破 不再受传统发布周期束缚,谷歌正以史无前例的速度将最前沿的AI模型推向全球用户。 皮查伊强调:"我们打破了'性能与价格不可兼得'的行业魔咒。"Gemini 2.5 Pro在性能飙升的同时,实现 了成本的大幅优化。数据显示,Gemini模型每秒生成输出令牌数已跻身全球前三,而单位计算成本较前 代下降40%。这一突破得益于谷歌第七代TPU芯片的赋能——这款专为大规模推理设计的芯片,性能较 前代提升10倍,单计算仓算力达42.5 ExaFLOPS,成为支撑谷歌AI基础设施的"超级引擎"。 技术突破正转化为触手可及的产品体验。皮查伊公布了一组数据:过去一年间,谷歌每月通过产品和 API处理的AI Token数量从9.7万亿激增至480万亿,增幅超50倍;开发者生态同样迎来爆发式增长,超 过700万开发者通过Gemini API、Google AI St ...
腾讯研究院AI速递 20250521
腾讯研究院· 2025-05-21 00:01
微软智能体生态布局 - Coding Agent将GitHub Copilot升级为自主编程助手,实现bug修复、代码维护全流程自动化 [1] - NLWeb开源项目支持自然语言交互网站,Agent Factory平台可构建Grok等智能体应用 [1] - Copilot Tuning允许企业用自有数据微调智能体,适配独特语言风格 [1] - Microsoft Discovery具备生成科研想法、模拟结果和自主学习能力 [1] 谷歌AI编程助手动态 - 发布基于Gemini 2.5 Pro的Jules编程助手,每日提供5次免费额度并直连GitHub仓库 [2] - Jules可自主完成代码编写、Bug修复及测试运行,支持生成详细计划并在云虚拟机验证代码 [2] - 即将推出Codecast功能生成代码库音频摘要 [2] 腾讯AIGC游戏引擎突破 - 发布工业级AIGC游戏内容生产引擎"混元游戏",基于百万级游戏动漫数据集训练 [3] - 提供AI美术管线、实时画布、2D美术生成和角色多视图生成功能,后者耗时从12小时缩短至30分钟 [3] - 包含四大图像模型和五大视频模型,首创游戏特效生成模型并支持多种风格实时交互 [3] AI音频工具创新 - ListenHub支持链接/文档转2-3分钟对话式播客,生成速度优于谷歌NotebookLM且中文语音更自然 [4][5] - 产品已开放公测,支持网页/App/浏览器插件,但存在内容长度不可调等限制 [5] 智源向量模型技术领先 - BGE-Code-v1支持14种编程语言,在CoIR和CodeRAG-Bench基准超越商业/开源模型 [6] - BGE-VL-v1.5针对多模态检索优化,BGE-VL-Screenshot在MVRB基准达60.61分SOTA成绩 [6] 谷歌知识管理工具升级 - NotebookLM推出iOS/安卓APP,支持离线听书、实时互动提问和跨平台分享 [7] - 当前支持网页/PDF/视频链接转播客,但仅限海外用户使用 [7] AI科研平台突破 - Microsoft Discovery无需编程即可用超算能力,200小时内发现新型环保冷却剂 [8] - 平台结合基础/专业模型构建AI博士后团队,支持医药/芯片设计等领域研发 [8] 开源机器人进展 - UC伯克利BHL机器人总成本低于5000美元,采用3D打印模块化设计且机械效率达90% [9] - 配备英特尔N95迷你PC和手机级IMU,实现双足行走和遥操作功能 [9] AI编程行业预测 - Anthropic CEO预测AI将在3-6个月内编写90%代码,谷歌已有25%代码由AI生成 [10] - 未来程序员角色或转向AI系统架构师和训练师,人类专注创造性工作 [10] 腾讯知识管理战略 - ima产品定位为AI驱动的"搜读写"工作台,已积累近1000万篇内容 [11] - 通过知识库/知识号/知识库广场三层架构实现从个人管理到生态共建的演进 [11]
京东云总裁曹鹏:大模型正在企业级市场加速爆发
中国金融信息网· 2025-05-20 21:53
大模型应用发展现状 - 大模型应用迎来临界点,基础模型持续升级,深度应用正在开启,企业级市场加速爆发 [1] - 数字员工上岗率将成为衡量未来企业先进性的标准,人工智能完成的工作量决定企业未来发展速度 [1][3] - 行业正加速迈向深度应用阶段,大模型及智能体技术持续升级,渗透到需要大量人力重复劳动的场景 [3][4] 京东云产品发布与成果 - 京东云发布AI算力平台、大模型开发计算平台、JoyAgent智能体2.0等九大产品,以及医疗、工业、金融三大垂直行业一体机 [1][3] - 过去三个月京东云大模型一体机全国规模化落地突破500台,采用"开箱即用"模式助力企业快速部署 [3] - 近三个月京东大模型服务调用量环比增长200%,超1.4万个智能体在内部运行,覆盖零售、物流、医疗等场景,服务超50万商家和38万快递小哥 [4] 智能体技术进展 - 智能体是人工智能深度应用最具代表性的方向,从被动响应需求进化为主动聚焦问题、精准运算、智能决策和执行 [4] - 京东云智能体平台在企业应用场景方面相比通用智能体更具优势 [4] 基础设施挑战与解决方案 - 大模型应用对基础设施提出新要求,需从CPU为中心转向GPU为中心架构,并应对激增的推理计算资源需求 [5] - 京东云提供多场景、多形态、多规格的解决方案,支持企业大模型应用部署需求 [5] - 公司基于内部场景深度应用经验,打造高性价比技术与产品,助力企业重塑AI生产能力 [5]