Workflow
Android XR智能眼镜
icon
搜索文档
计算机行业周报:离Agent更进一步
国盛证券· 2025-05-25 15:30
算力:寒武纪、海光信息、阿里巴巴、奥飞数据、协创数据、海南华铁、 潍柴重机、科华数据、大位科技、新易盛、中际旭创、胜宏股份、玉柴国 际、亿田智能、宏景科技、云赛智联、圣阳股份、润建股份、弘信电子、 有方科技、深信服神州数码、深桑达、品高股份、金山云、南都电源、云 天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、 杭钢股份、数据港、南兴股份、华策影视、顺网科技、恒为科技、网宿科 技、杰创智能、朗科科技等。 证券研究报告 | 行业周报 gszqdatemark 2025 05 25 年 月 日 计算机 离 Agent 更进一步 谷歌 I/O 大会召开,AI 生态全面升级。5 月 20 日在 2025 年度谷歌 I/O 大会上,谷歌展示了 AI 领域从基础模型到应用的全面升级。1)Gemini 系 列模型更新:Gemini 2.5 Pro 在学术基准测试、编码及多模态推理等方面 表现卓越,新增 Deep Think 增强推理模式;2.5 Flash 则侧重速度与成本 优化。推出新的实验模型:Gemini Diffusion,是一种文本扩散模型;更新 设备端模型 Gemma 3n。2)多模态方面 V ...
税收收入增速年内首次转正,日本意外陷入贸易逆差 | 财经日日评
吴晓波频道· 2025-05-21 22:50
点击上图 ▲立即加入 4月税收收入增速年内首次转正 5月21日消息,财政部近日公布数据显示,1—4月,全国一般公共预算收入80616亿元,同比下降0.4%,这一降幅较一季度(-1.1%)有所缩 窄。今年前4个月,全国税收收入65556亿元,同比下降2.1%,降幅比一季度收窄1.4个百分点。从单月数据来看,4月份,全国税收收入同比增 长1.9%,增速实现年内首次转正。此外,1—4月,印花税1614亿元,同比增长18.9%。其中,证券交易印花税535亿元,同比增长57.8%。 1—4月,全国一般公共预算支出93581亿元,同比增长4.6%。这一支出增速明显高于收入增速,并略高于今年全年支出增速预算数(4.4%), 且前4个月支出完成预算的31.5%,支出进度为2020年以来同期最快。(综合第一财经) |点评| 整体而言,前4个月财政收入的降幅略有收窄,财政收支间的分化趋势有所弥合,经济表现出较强韧性。4月税收收入增速转正,主要 由个人所得税较快增长带动。外部经济环境不确定性增加,前4个月企业所得税收入处于下滑区间,也与PPI处于较低水平相吻合,企业利润端 仍待修复。同时,受到关税政策扰动,4月进口环节增值税、关税 ...
一文读懂Google I/O 2025 开发者大会:开启 “模型即平台” 的 AI 生态新时代
华尔街见闻· 2025-05-21 18:38
谷歌AI战略升级 - 公司全面拥抱AI智能体技术,将Gemini模型深度整合至搜索、Gemini助手等核心业务,推出全新AI模式搜索[1][2][27] - 强调Gemini 2.5 Pro为当前最强通用AI模型,在LLM Arena测评中所有类别排名第一,App月活用户超4亿[19][20][23][24] - 智能体模式(Agent Mode)支持多任务管理(如同时处理10个任务),实验版将向Gemini订阅用户开放[29][30] Gemini模型技术突破 - Gemini 2.5 Pro与Flash双模型协同:Pro侧重高性能,Flash速度更快、成本降低22%,支持"思考预算"机制[3][39] - 多模态能力升级:支持原生音频输出(2种声音)、实时翻译(Google Meet已上线英西互译)、草图转3D动画编码[34][38][41] - 实时语音助手Gemini Live支持45种语言,具备环境音分离、多任务处理(如找房订票)及跨App操作能力[32][35] 开发者工具与平台创新 - AI Studio新增URL Context功能(支持20个链接提取)、原生语音模型及增强函数调用,加速语音助手/游戏开发[6][7][8] - 实验项目Stitch实现文本提示生成App UI设计并一键导出至Figma/IDE,Canvas功能可将文档转为互动网页[4][5][33] - 编码智能体Jules开放公测,支持异步函数调用;Gemini Diffusion文本生成速度提升5倍,处于实验阶段[40][41] 搜索与用户体验革新 - AI模式搜索支持数百字复杂查询,结构化答案整合地图/评论/视频,美国用户已可体验"深度搜索"功能[47][48][49] - AI概览(AI Overviews)月活15亿用户,推动部分查询量增长10%,未来将逐步融入核心搜索[47][50] - Android XR生态推出智能眼镜(物体识别/语音控制)与Moohan头显(沉浸式地图),联合Gentle Monster等厂商[58][59][60] 内容创作与多模态技术 - Imagine 4图像模型细节提升10倍,支持中英复杂字体;Veo 3视频模型实现角色一致性/口型同步/镜头控制[52][53] - Flow平台联合电影人开发,支持AI生成剧本/镜头/配乐;Lyria音频模型可创作专业音乐并与视频协同[54][56][57] - Google Beam视频通信平台采用6摄像头阵列+AI渲染,实现毫米级头部追踪与60fps 3D画面[37] 商业化与订阅服务 - 推出Google AI Ultra订阅套餐(249.99美元/月),包含Gemini高级模型、30TB存储及YouTube Premium等权益[62][63][64] - 惠普将商业化Google Beam设备,Gemini 2.5 Flash模型6月面世,Deep Think模型限测试人员开放[37][39]
四点速读2025谷歌开发者大会
第一财经· 2025-05-21 11:22
谷歌推出的Veo 3视频生成模型支持原生音频生成,不仅能够生成高清视频,还可为视频添加背景音乐、 音效甚至对白,解决了以往AI视频生成中"有影无声"的问题,极大提升了AI视频的质量和真实感。 2025.05. 21 本文字数:977,阅读时长大约2分钟 作者 | 一财科技 北京时间5月21日,谷歌开发者大会(Google I/O)上公布了在AI技术上的最新进展,从基础模型升级到 生成式内容工具推出,再到硬件更新,标志着谷歌将AI技术融入其生态系统的进程又迈出重要一步。 一、Gemini模型升级,多模态能力显著提升 核心亮点仍是Gemini模型。Gemini 2.5 Pro 和 Flash 模型全面支持视听输入和原生音频输出对话,开发 者可通过Live API 预览版构建和微调对话体验的音调、口音和说话风格等。Gemini还可作为Chatbot登 录Chrome浏览器,帮助用户快速理解页面上下文并完成任务。其中,Deep Think模式引入增强型推理机 制,在处理数学、编程和多模态任务时,能够在回答前充分考虑多种可能性,显著提升了模型的推理能 力。 二、生成式内容工具 再升级 针对各项AI升级功能,谷歌推出了每 ...
四点速读2025谷歌开发者大会
第一财经· 2025-05-21 11:06
核心亮点仍是Gemini模型。Gemini 2.5 Pro 和 Flash 模型全面支持视听输入和原生音频输出对话,开发 者可通过Live API 预览版构建和微调对话体验的音调、口音和说话风格等。Gemini还可作为Chatbot登 录Chrome浏览器,帮助用户快速理解页面上下文并完成任务。其中,Deep Think模式引入增强型推理机 制,在处理数学、编程和多模态任务时,能够在回答前充分考虑多种可能性,显著提升了模型的推理能 力。 谷歌在开发者大会上展示了升级的多模态Gemini模型、增强的生成式内容工具以及集成AI功能的智能 硬件。 北京时间5月21日,谷歌开发者大会(Google I/O)上公布了在AI技术上的最新进展,从基础模型升级 到生成式内容工具推出,再到硬件更新,标志着谷歌将AI技术融入其生态系统的进程又迈出重要一 步。 一、Gemini模型升级,多模态能力显著提升 四、XR智能眼镜亮相 二、生成式内容工具再升级 谷歌与Xreal、Samsung等品牌合作,推出了集成AI助手功能的Android XR智能眼镜。这款眼镜支持实时 翻译、导航和信息提示等功能,是谷歌在可穿戴设备领域的新尝试,为用 ...