Workflow
智能体
icon
搜索文档
一文读懂Google I/O 2025 开发者大会:“降低门槛、加速创造”,谷歌开启 “模型即平台” 的 AI 生态新时代
硬AI· 2025-05-21 11:29
Google I/O 2025核心发布 - Gemini 2 5 Pro被定位为公司最强大的通用AI模型 在LLM Arena所有类别排行榜名列前茅[22][24] - Gemini系列模型每月处理token数量从9 7万亿激增至480万亿 增长近50倍 每月活跃用户超4亿[24] - 公司推出Gemini 2 5 Flash轻量版模型 效率提升22% 支持"思考预算"机制控制输出质量与响应速度[6][39][40] 跨平台AI引擎整合 - Android平台深度整合Gemini Nano 提供summarize等轻量功能 同时推出Androidify应用生成机器人形象[17][19] - 新UI系统Material 3 Expressive增强界面趣味性 Android 16引入live updates等性能优化工具[20] - 智能眼镜Moohan支持沉浸式地图和交互式Gemini AI 合作伙伴包括Gentle Monster和Warby Parker[63][64][65] AI开发工具升级 - AI Studio新增原生语音模型支持24种语言 增强函数调用与搜索推理功能[9][11] - Stitch实验项目实现文本提示自动生成App UI设计 可导出至Figma或IDE继续开发[7][8] - Cloud Run支持一键部署应用到线上 集成至VS Code等IDE[16] 多模态与创作突破 - Imagine 4图像模型细节捕捉能力提升 支持中英文复杂字体识别 生成速度快10倍[56] - Veo 3视频模型实现角色一致性控制 可自动合成环境音与对白 口型同步[56][57] - Lyria音频模型结合Music AI Sandbox可生成专业音乐 Flow平台支持AI视频全流程制作[61] 搜索与智能体革新 - 搜索新增AI模式标签页 支持数百字复杂查询 采用Deep Research模型提供结构化答案[46][47][51] - 智能体模式可同时管理10个任务 实验版将向Gemini订阅用户开放[27][29][30] - AI概览功能月活达15亿 推动部分查询量增长10%[46] 订阅与商业化 - Google AI Ultra套餐月费249 99美元 包含Gemini模型最高使用权限及30TB存储空间[69][70][71] - Google Beam视频通信平台采用六摄像头阵列实现毫米级精度3D渲染 将与惠普合作商业化[37]
直击谷歌I/O 2025:谷歌AI眼镜剑指主流市场,未来拍电影全靠“打字”?
钛媒体APP· 2025-05-21 08:35
Gemini模型技术突破 - Gemini 2.5 Pro性能飙升且单位计算成本较前代下降40% [3] - 第七代TPU芯片性能较前代提升10倍,单计算仓算力达42.5 ExaFLOPS [3] - 轻量化模型Gemini 2.5 Flash推理速度提升22%,计划6月开放开发者接入 [9] - 原生多模态能力落地,支持文本、图像、音视频联合推理 [9][15] - 引入"深度思考"能力,实现复杂任务下的延时思考 [12][15] 开发者与用户增长 - 每月处理的AI Token数量从9.7万亿激增至480万亿,增幅超50倍 [3] - 超过700万开发者通过Gemini API等平台构建应用,较去年增长5倍 [3] - Vertex AI平台上的Gemini使用量飙升40倍 [3] - Gemini应用月活用户突破4亿,2.5 Pro版本使用量增长45% [4] - AI概览功能每月覆盖15亿用户,成为最大生成式AI应用场景 [4] 智能体生态与项目 - Project Starlight落地为Google Beam平台,支持3D视频通讯 [8] - Project Astra实现实时语音翻译,支持英语与西班牙语互译 [8] - Project Marina具备多任务处理和教学-重复学习能力,可同时管理10项任务 [8] - 智能体互联计划推动不同智能体共享数据与工具 [9] - AI编程代理"Rose"支持全流程自动化开发 [11] 搜索与交互革新 - AI模式通过Query Decomposition技术实现查询拆解与结构化报告生成 [23] - 推出"个人情境"功能,结合用户偏好数据提供个性化推荐 [25] - Google Lens月活跃用户超15亿,引入实时视觉交互功能 [25] - 搜索引擎从"信息检索工具"升级为"思考伙伴" [20] 生成式内容与创意工具 - Imagen 4强化图文混排与细节表现,可生成高质量海报 [25] - Veo 3实现原声音频生成,画面与背景音效同步生成 [25][27] - 发布AI视频制作工具Flow,集成Veo、Imagen和Gemini [31][33] - Flow支持从灵感萌芽到成片输出的完整内容生产 [33] - SynthID水印技术覆盖超100亿条生成内容,新增多模态检测器 [29] XR与硬件生态 - 发布Android XR平台,支持沉浸式头显与智能眼镜 [36] - 首款搭载Android XR的设备为三星Project Moohan头戴装置 [36] - 新款智能眼镜支持全语音交互与"所见即搜索"能力 [38][39] - 与Gentle Monster等合作推出消费级智能眼镜 [39] 行业影响与趋势 - 技术突破正转化为触手可及的产品体验 [3] - AI从被动工具进化为能自主规划、串联任务的"数字伙伴" [19] - 生成式AI正在重塑影视制作的整个流程 [27] - 人工智能与物理世界的深度融合进程加速 [40]
腾讯研究院AI速递 20250521
腾讯研究院· 2025-05-21 00:01
微软智能体生态布局 - Coding Agent将GitHub Copilot升级为自主编程助手,实现bug修复、代码维护全流程自动化 [1] - NLWeb开源项目支持自然语言交互网站,Agent Factory平台可构建Grok等智能体应用 [1] - Copilot Tuning允许企业用自有数据微调智能体,适配独特语言风格 [1] - Microsoft Discovery具备生成科研想法、模拟结果和自主学习能力 [1] 谷歌AI编程助手动态 - 发布基于Gemini 2.5 Pro的Jules编程助手,每日提供5次免费额度并直连GitHub仓库 [2] - Jules可自主完成代码编写、Bug修复及测试运行,支持生成详细计划并在云虚拟机验证代码 [2] - 即将推出Codecast功能生成代码库音频摘要 [2] 腾讯AIGC游戏引擎突破 - 发布工业级AIGC游戏内容生产引擎"混元游戏",基于百万级游戏动漫数据集训练 [3] - 提供AI美术管线、实时画布、2D美术生成和角色多视图生成功能,后者耗时从12小时缩短至30分钟 [3] - 包含四大图像模型和五大视频模型,首创游戏特效生成模型并支持多种风格实时交互 [3] AI音频工具创新 - ListenHub支持链接/文档转2-3分钟对话式播客,生成速度优于谷歌NotebookLM且中文语音更自然 [4][5] - 产品已开放公测,支持网页/App/浏览器插件,但存在内容长度不可调等限制 [5] 智源向量模型技术领先 - BGE-Code-v1支持14种编程语言,在CoIR和CodeRAG-Bench基准超越商业/开源模型 [6] - BGE-VL-v1.5针对多模态检索优化,BGE-VL-Screenshot在MVRB基准达60.61分SOTA成绩 [6] 谷歌知识管理工具升级 - NotebookLM推出iOS/安卓APP,支持离线听书、实时互动提问和跨平台分享 [7] - 当前支持网页/PDF/视频链接转播客,但仅限海外用户使用 [7] AI科研平台突破 - Microsoft Discovery无需编程即可用超算能力,200小时内发现新型环保冷却剂 [8] - 平台结合基础/专业模型构建AI博士后团队,支持医药/芯片设计等领域研发 [8] 开源机器人进展 - UC伯克利BHL机器人总成本低于5000美元,采用3D打印模块化设计且机械效率达90% [9] - 配备英特尔N95迷你PC和手机级IMU,实现双足行走和遥操作功能 [9] AI编程行业预测 - Anthropic CEO预测AI将在3-6个月内编写90%代码,谷歌已有25%代码由AI生成 [10] - 未来程序员角色或转向AI系统架构师和训练师,人类专注创造性工作 [10] 腾讯知识管理战略 - ima产品定位为AI驱动的"搜读写"工作台,已积累近1000万篇内容 [11] - 通过知识库/知识号/知识库广场三层架构实现从个人管理到生态共建的演进 [11]
京东云总裁曹鹏:大模型正在企业级市场加速爆发
中国金融信息网· 2025-05-20 21:53
大模型应用发展现状 - 大模型应用迎来临界点,基础模型持续升级,深度应用正在开启,企业级市场加速爆发 [1] - 数字员工上岗率将成为衡量未来企业先进性的标准,人工智能完成的工作量决定企业未来发展速度 [1][3] - 行业正加速迈向深度应用阶段,大模型及智能体技术持续升级,渗透到需要大量人力重复劳动的场景 [3][4] 京东云产品发布与成果 - 京东云发布AI算力平台、大模型开发计算平台、JoyAgent智能体2.0等九大产品,以及医疗、工业、金融三大垂直行业一体机 [1][3] - 过去三个月京东云大模型一体机全国规模化落地突破500台,采用"开箱即用"模式助力企业快速部署 [3] - 近三个月京东大模型服务调用量环比增长200%,超1.4万个智能体在内部运行,覆盖零售、物流、医疗等场景,服务超50万商家和38万快递小哥 [4] 智能体技术进展 - 智能体是人工智能深度应用最具代表性的方向,从被动响应需求进化为主动聚焦问题、精准运算、智能决策和执行 [4] - 京东云智能体平台在企业应用场景方面相比通用智能体更具优势 [4] 基础设施挑战与解决方案 - 大模型应用对基础设施提出新要求,需从CPU为中心转向GPU为中心架构,并应对激增的推理计算资源需求 [5] - 京东云提供多场景、多形态、多规格的解决方案,支持企业大模型应用部署需求 [5] - 公司基于内部场景深度应用经验,打造高性价比技术与产品,助力企业重塑AI生产能力 [5]
微软Build大会宣告进入AI智能体时代 Microsoft 365 Copilot、GitHub编码升级,马斯克xAI模型纳入微软云
华尔街见闻· 2025-05-20 07:18
微软Build 2025开发者大会核心发布 - 公司宣布将Windows转变为AI智能体核心平台 原生支持Model Context Protocol协议并推出Windows AI Foundry [2] - 公司展示如何将"AI助理"升级为"AI开发伙伴" 推动AI应用开发与企业运营进入"代理时代" [2] - 公司推出多项AI开发者平台包括Copilot Studio Windows AI Studio等 [4] GitHub Copilot升级 - GitHub Copilot从代码编辑器助手进化为具备Agentic能力的AI智慧伙伴 新增异步代码代理功能 [2] - GitHub Models新增提示管理 轻量级评估机制与企业级控管功能 [2] - 公司开源GitHub Copilot Chat in VS Code 覆盖1.5亿开发者 [3] Microsoft 365 Copilot增强 - 引入Copilot Tuning能力 允许企业用自有数据训练模型 [5] - 新增multi-agent orchestration功能 支持多智能体协同处理复杂任务 [5][7] - 智能体可在Microsoft 365服务内安全执行领域专业任务 [5] Azure AI Foundry更新 - 新增xAI的Grok 3和Grok 3 mini模型 由微软直接托管和计费 [6] - 平台提供超过1900种AI模型 包括OpenAI Meta和DeepSeek的模型 [6] - 推出Model Leaderboard和Model Router工具 自动选择最佳AI模型 [9] Windows AI Foundry平台 - 重新品牌化Windows Copilot Runtime服务 成为本地AI开发统一平台 [10] - 自动检测硬件并获取必要软件组件 保持组件最新状态 [10] - 支持完整AI开发者生命周期 可管理开源LLM或导入专有模型 [10] Edge浏览器AI能力 - 推出新API允许开发者整合AI功能到Web应用 使用内置模型 [10] - 提供Phi 4 mini模型访问 该模型拥有38亿参数且在数学表现优异 [11] - 新增PDF翻译工具支持70多种语言 下月全面可用 [11] NLWeb项目 - 简化构建AI聊天机器人过程 通过几行代码实现对话界面 [13] - 允许网站选择AI模型和自有数据创建语义化交互体验 [15] - 支持MCP协议 使内容可被AI平台发现和访问 [15] MCP协议整合 - 将Anthropic的MCP协议整合到Windows系统 实现AI应用深度交互 [16] - MCP服务器可访问文件系统 窗口管理等功能 [16] - 目标使智能体成为操作系统工作负载的一部分 [16] 开源举措 - 开源命令行文本编辑器Edit 今夏通过Windows Insider计划安装 [18] - 开源GitHub Copilot in VS Code和Windows Linux子系统 [19] - 允许开发者访问源代码并根据用例进行修改 [19]
Jeff Dean:一年内 AI 将取代初级工程师,网友:“Altman只会画饼,Jeff说的话才致命”
新浪财经· 2025-05-19 06:46
AI技术发展预测 - 谷歌首席科学家Jeff Dean预测一年内将出现具备"初级工程师"能力的24/7全天候AI系统[1][13] - AI工程师不仅能够编写代码,还具备人类工程师难以比拟的持续性与规模化潜力[4] - 多模态成为重要趋势,AI输入输出可涵盖音频、视频、图像、文本或代码等多种形式[6] AI行业格局 - 构建最先进AI模型需要大量投资,最终市场可能仅保留少数几个主流模型[8] - 知识蒸馏技术可将强大模型压缩成轻量级模型,适配更多应用场景[9] - 谷歌通过Pathways系统实现单一Python进程控制上万设备,显著提升开发者体验[19][20] 硬件发展趋势 - 专用机器学习硬件如TPU对AI发展至关重要,谷歌已推出多代TPU产品[16] - 模拟计算在功耗效率方面具有优势,可能成为未来推理硬件发展方向[18] - AI计算需求变化推动硬件创新,需要针对训练和推理不同负载优化设计[22] 技术突破方向 - 稀疏模型和混合专家架构可带来10-100倍的效率提升[24] - 动态扩展模型结构比固定模型更具潜力,可优化资源分配[25] - AI正在改变科研方式,神经网络可加速科学模拟达30万倍[17] 产品应用前景 - AI助手可观察用户操作并协助完成任务,如浏览器标签管理[11] - 教育领域可能成为AI杀手级应用场景,可自动生成互动教学内容[10] - 物理机器人智能体在未来几年可能完成数十种实际工作任务[7]
全球首个 L4 级智能体母体系统亮相 MasterAgent 开启 AI 新纪元
智通财经网· 2025-05-18 21:20
技术突破 - 全球首个L4级智能体母体系统MasterAgent发布,标志中国AI应用从"工具化"迈向"全自主化"新纪元 [1] - MasterAgent达到L4级别,拥有自主学习和泛化能力,能跨领域应用知识,接近人类认知能力 [3] - 自主研发Master Builder和Agent Group两大核心架构,实现从"中心化控制"向"多智能体自治协作"的范式转变 [4] 核心架构优势 - 协作模式升级:支持数百个智能体并行协作,突破单一语言模型局限性,形成"集体智慧" [4] - 开发效率跃升:用户通过自然语言指令数分钟即可定制化部署"智能体助手集群",效率提升数十倍 [4] - 主动智能服务:系统基于历史数据预测用户需求,提前规划任务流程,变"被动响应"为"主动服务" [4] 应用场景 - 金融领域:多智能体同步完成数据挖掘、风险评估与投资建议,预判股价波动区间 [7] - 医疗场景:根据患者症状自动匹配诊疗方案,预判重症患者病情发展趋势 [7] - 系统通过内置进化机制优化算法,自动完成流程,在复杂场景中展现超越人类经验的实时决策能力 [4] 公司背景 - 由深圳深元人工智能科技有限公司自主开发,核心技术团队2018年组建 [7] - 2025年深圳市重点招商引资项目,科研力量依托中国科学技术大学专家团队 [7] - 国家级高新技术企业,多次参与国家级及国际性重要展会如香港创科展 [7]
微软老员工48岁生日被裁,妻子发帖怒斥算法裁人!全球大血洗6000人
猿大侠· 2025-05-17 11:44
微软裁员事件核心观点 - 微软近期在全球范围内裁员6000人,占员工总数的3%,这是继2023年裁员1万人后最大规模的裁员行动[43][44][45] - 裁员涉及多个层级和团队,包括技术核心岗位如TypeScript主力开发、AI总监等关键人才[4][27][33] - 公司官方声明称裁员与绩效无关,目的是简化管理层级并提高程序员比例[46][50] 被裁员工典型案例 - 一位拥有25年资历的微软老员工在48岁生日当天被算法随机选中裁员,该员工曾修复价值数百万美元的漏洞并获奖[2][3][7][8][15] - TypeScript开源项目核心开发者Ron Buckton被裁,正值项目进行10倍性能升级的关键阶段[27][28][29] - 微软AI初创生态系统总监Gabriela de Queiroz被裁,其团队负责Azure AI与OpenAI服务的初创企业支持[33][37][41] 裁员背景与公司战略 - 微软股价创年内新高(449 26美元),季度净收入达258亿美元超预期,同时给出不低于30%的同比增长预测[52][53][54] - 公司正推动管理层扁平化改革,因现有管理体系存在工程师转管理岗效率低下等问题[48][49][50] - 2024年1月已基于绩效裁减2000名低效员工,并启动新绩效改进计划[56][57] AI对行业的影响 - 微软365 Copilot等AI工具升级可能替代部分岗位,网络安全公司CrowdStrike将5%裁员归因于AI[58][59][60] - OpenAI、DeepMind等企业加速开发"博士级研究智能体",行业预测AI智能体赛道可能诞生3000亿美元估值公司[62][63] - 2025年美国科技行业已累计裁员超5 9万人,AI自动化被视为重要驱动因素[63]
引入导航智能体,智能眼镜或成下一个“入口级”终端
北京日报客户端· 2025-05-16 20:34
合作动态 - 高德地图与智能眼镜厂商Rokid合作推出基于全场景智能眼镜的导航智能体应用NaviAgent [1] - 合作将骑行导航功能整合到Rokid Glasses智能眼镜中 实现"手不离车"的动态场景导航体验 [1] - 导航功能包括红绿灯信息提示 后方来车监测 语音添加途径点 路线推荐等多样化服务 [1] - 双方计划将生活服务 文旅景区等内容融入智能眼镜 如周边商家优惠 景区导览等功能 [2] 技术发展 - 新一代智能眼镜融合语音 图像识别 翻译 拍摄等多模态能力 从功能演示走向实用场景 [3] - 智能眼镜通过语音 手势 头动等交互方式 在双手被占用时展现出成为下一代智能终端的潜力 [3] - 产品发展方向从基础硬件叠加逐步转向智能辅助与智能助理 未来可能成为智能协同与计算终端 [3] 市场趋势 - 智能眼镜行业经历低迷期后正进入发展上升期 受技术革新和市场需求驱动 [3] - Rokid旗下带显示功能的AI眼镜过去三个月全球已交定金订单超25万台 [3] - 华为计划发布集成AR导航 健康监测等功能的智能眼镜新品 苹果智能眼镜发布时间或提前至2026年末 [3] 战略布局 - 高德地图CEO表示导航智能体标志着出行服务从软件功能驱动向空间智能驱动的结构性跃迁 [2] - 公司将逐步构建环绕出行和位置服务的空间智能生态体系 [2]
京东首季营收增速15.78%创三年新高 研发开支46亿超1.4万个智能体运行
长江商报· 2025-05-15 07:47
财务表现 - 公司一季度实现营业收入3010 82亿元 创历史同期新高 同比增长15 78% 增速为近三年最高 [2][4] - 归母净利润108 90亿元 同比增长52 73% 实现高速增长 [2][4] - 综合毛利率15 89% 同比上升0 6个百分点 [12] 核心业务 - 零售收入2638 45亿元 同比增长16 32% 高于整体营收增速 其中带电品类增长17 1% 日百品类增长14 9% [4][5] - 物流收入469 69亿元 同比增长10 63% [5] - 新业务收入57 53亿元 同比增长18 13% 包括2月推出的外卖业务 [5][6] 战略合作 - 与科大讯飞达成三年100亿元全渠道销售目标 [8] - 与学而思签订三年50亿元销售协议 目标覆盖超100万用户 [8] - 与小米深化合作 目标2025年智能穿戴设备成交600万台 三年达成100亿元成交额 [8] 研发与技术 - 一季度研发支出46亿元 同比增长14 6% [3][10] - 2017年以来累计研发投入达1456亿元 [10] - 内部运行智能体超1 4万个 通过京东云JoyAgent平台输出AI生产力 [3][10] - 物流AI解决方案入选工信部新型工业化典型案例 健康领域推出"京医千询"大模型 [11] 国际化布局 - 物流波兰华沙2号仓投入运营 欧洲管理超40个基础设施项目 [10] - 全球售业务扩展至9国 包括新开通的柬埔寨 澳大利亚站点 [10] - 伦敦试运营Joybuy全品类零售 提供当日 次日达服务 [10] 运营开支 - 履约开支197亿元 同比增长17 4% [9] - 营销开支105亿元 同比增长13 9% [9] - 一般行政开支24亿元 同比增长22 2% [9]