Workflow
Gemini APP
icon
搜索文档
3毛钱生成刷屏3D手办图片,API调用成AI应用厂商落地“快车道”
第一财经· 2025-09-05 18:54
谷歌NanoBanana模型发布 - 谷歌DeepMind实验室推出图像生成与编辑模型NanoBanana(内部代号,正式名称为Gemini 2.5 Flash Image),核心能力包括角色一致性、多图融合和自然语言交互 [3] - 模型通过Gemini APP、API等方式访问,API定价为每百万输出token 30美元,生成单张图片消耗约1290个输出token,成本约0.039美元(约0.277元人民币) [3] - 在LM Arena图像编辑榜单中以1362 Elo分排名第一,华福证券认为其优势包括跨图一致性、多图融合、精细编辑及基于Gemini世界知识的语义理解能力 [4] 模型性价比与行业定位 - NanoBanana定价处于行业中档水平,较GPT-Image-1中档价格略低,较Midjourney便宜约50%,但高于Stability AI与快手可灵AI的超低价档位 [4] - 凭借高质量生成能力形成高性价比优势,但存在生成失败率偏高、细节失真、图像细腻度不足等问题 [7] - 模型本质为高度逼真的二维图像生成工具,不支持直接生成3D打印格式文件(如.stl、.obj) [7] 下游应用与商业合作 - 爱诗科技旗下拍我AI平台国内首批接入NanoBanana,以Agent产品形态和API形式提供6天限时免费服务,后续付费模式未披露 [3][7] - 合作属于模型供应商-应用方关系,未涉及联合研发、品牌合作或资源互换 [7] - Adobe、Figma、Lovart、Genspark等企业均已接入模型,企业客户可通过Google AI Studio、Gemini API和Vertex AI快速集成功能 [8] 行业商业化趋势 - 券商机构将"应用厂商直接调用大模型API"视为AI赛道确定性商业主线,调用量大增、成本下降及场景颗粒化推动API经济闭环形成 [8] - 电商、金融、客服等场景已出现可量化案例,浙商证券认为产品矩阵闭环构建者及垂直场景企业服务商更具竞争优势 [8] - 企业客户可通过API调用模型功能,应用于广告、产品展示及教育等场景 [1][8]
Nano Banana 邪修之王最强科研成果!教你自定义生图比例!
歸藏的AI工具箱· 2025-09-02 12:59
核心观点 - 通过特定提示词和垫图方法可有效控制Nano Banana生成图像的比例 解决原模型输出比例不可控的生产应用难题 [2][4][12] 技术原理 - 多图输入时输出比例会随机匹配其中一张图的特性 通过垫图方式实现比例控制 [4] - 需准备两张图片:待修改原图(首位)和比例模板图(次位) 顺序不可颠倒 [6][8][16] - 使用GLif启发的方法但扩展至图生图场景 支持对已生成图片进行二次比例调整 [4] 操作流程 - 提示词需明确指令:"Redraw the content of Figure 1 onto Figure 2, add content to Figure 1 to fit the aspect ratio of Figure 2, completely clear the content of Figure 2, and only retain the aspect ratio of Figure 2" [13][15] - 在AI Studio或Gemini APP(推荐Gemini2.5 Pro模型)中操作 后者效果更优 [15] - 若出现蓝色背景异常 通过多次抽卡可解决 [15] 资源支持 - 提供覆盖常见比例的模板图集 支持自定义比例(需通过Figma制作) [8] - 模板图集可通过网盘下载(链接:https://pan.quark.cn/s/163037f38e88 提取码:7tJV) [18]
顶级邪修倾囊相授!藏师傅教你速通Nano Banana
歸藏的AI工具箱· 2025-08-27 15:26
大家好,这里是歸藏(guizang),今天教大家如何最大程度发掘最强图片编辑模型 Nano Banana 的潜力。 昨晚我们期盼了很久的图像编辑模型终于上线了,大家不再需要从竞技场吭哧瘪肚抽卡,可以爽 玩,而且谷歌一如既往的发挥了财大气粗的优势,可以让你疯狂白嫖。 在做了一晚上的通宵测试之后,发现这玩意真的很离谱。直接把 Adobe 和一众修图软件整麻了。 以往复杂的修图操作现在都可以一句话搞定,而且人脸的相似度相对于 FLUX Kontext 高了一截。 不多逼逼,先来总结一下这期教学内容: 如何使用 Nano Banana 首先来看一下如何使用 Nano Banana ,优先推荐在谷歌的 AI Studio ( https://aistudio.google. com/ )上使用,因为免费而且不会掺水。 进入页面后,我们在页面最右侧将模型切换到 Gemini 2.5 Flash Image Preview 这个模型,没错 这就是 Nano Banana的官方名称。 用 Nano Banana 帮你修图:祛痘、瘦身、瘦脸、都不在话下 烂片拯救者,用 Nano Banana 一键让你的普通照片变大片 用简洁高 ...
通信|应用爆发前夕,持续看好算力
2025-07-28 09:42
纪要涉及的行业和公司 - **行业**:通信行业、光芯片行业 - **公司**:旭创、新易盛、剑桥科技、仕佳光子、长信博创、太辰光、联杰科技、长华鑫、东山精密、联科科技、华工科技、光迅科技、元杰、长光、世家、太辰光、罗博特科、天孚通信、中际旭创、锐捷网络、字节、西凤、OpenAI、甲骨文、Meta、谷歌 纪要提到的核心观点和论据 - **通信行业高景气持续**:6月起算力板块表现出色,7月部分公司发布超预期业绩报告,如兴业证券预期终值约23.8亿元,同比增超300%,环比增50%;西凤二季度预告利润终值约24亿元,同环比增超50% ,预计2026年行业仍维持高景气 [1][2][3] - **海外市场驱动增长**:海外电商上修800G/1.6T需求,份额向龙头集中并外溢,促进相关公司订单和收入利润增长,如东山精密等 [1][5] - **AI应用推动算力投入**:AI应用成果涌现,如谷歌财报及世界人工智能大会展示,促进算力投入大幅增长,国内企业也加速跟进 [1][6][7] - **OpenAI发展迅猛**:计划8月初发布GPT - 5并切入AI浏览器领域;2024年收入近40亿美元,2025年一季度和6月年化增长达100亿美元,目标2029年收入1250亿美元;ChatGPT周活用户数增至4.5亿,年底目标10亿 [1][8][9] - **谷歌投入加大**:过去两月增加资本开支,用户数据亮眼,如搜索总结页月活从15亿增至20亿等;宣布资本开支上限100亿美元解决供应链瓶颈 [13][15] - **国内差距缩小**:国内领先互联网厂商如字节与谷歌TOKEN数差距仅约两个月,国内应用也在爆发 [14] - **关注投资机会**:关注应用端爆发验证闭环逻辑,关注能看到2027年的个股或细分方向,如光芯片行业、CPO新技术相关个股;当前是布局算力链投资的重要时间点 [2][16][24] 其他重要但可能被忽略的内容 - **光芯片行业供需紧张**:光芯片行业(元杰、长光、世家等)供需紧张,CPO新技术提高投入效率或降低单位算力成本,头部厂商要求供应链做好产能准备 [2][17] - **星际之门和Meta投入**:星际之门和Meta投入各约5000万美元,合计约1万亿美元,预计释放超1亿支800G光模块 [2][20] - **基本面变化**:部件厂商开始看到2027年预测,光芯片等增长快,上游光芯片出货量八九月份以来环比增速超50%,TEC及硅光部分加速上量,总体增速可能超50% [22]
电子行业周报:谷歌资本支出超预期,算力需求强劲增长-20250727
湘财证券· 2025-07-27 20:13
报告行业投资评级 - 维持电子行业“增持”评级 [2][8][22] 报告的核心观点 - 2025年以来消费电子延续复苏态势,折叠屏手机新品不断发布,人工智能技术进步推动AI基建需求维持高景气,AI技术在终端落地推动端侧硬件升级,带动端侧SOC、散热材料等零部件赛道景气度提升,看好AI基建、端侧SOC、折叠屏手机供应链的投资机会 [8][22] 根据相关目录分别进行总结 市场回顾 - 上周(2025.07.21 - 2025.07.25)电子行业指数上涨2.85%,跑赢沪深300 1.16pct;2025年以来电子指数上涨9.52%,跑赢沪深300 4.64pct [3][10] - 各细分板块表现为半导体报收5132.81点,上涨4.65%;消费电子报收7000.39点,上涨1.85%;元件报收9223.95点,下跌0.85%;光学光电子报收1516.60点,上涨2.36% [3] - 上周表现居前的公司有统联精密、苏州天脉、阿石创、芯导科技、茂莱光学;表现靠后的公司有*ST恒久、东田微、中电港、*ST华微、*ST东晶 [3] - 截至7月25日,电子PE(TTM,剔除负值)为48.38X,位于近10年以来30.00%分位数,环比上升1.55X;PB(LF)约3.83X,位于近10年以来38.05%分位数,环比上升0.10X [4][10] - 电子在申万31个一级行业中从低到高估值倍数排第29,低于计算机、国防军工,整体处于10年历史偏低位置,各细分行业估值均处于10年历史偏低位置 [13] - 近一周涨幅靠前的公司为统联精密(39.97%)、苏州天脉(33.58%)、阿石创(21.34%)、芯导科技(21.28%)、茂莱光学(19.82%);2025年以来涨幅靠前的公司为*ST宇顺(443.26%)、胜宏科技(271.02%)、迅捷兴(115.77%)、景旺电子(114.57%)、慧为智能(110.18%) [19] 行业动态点评 - 7月23日盘后谷歌母公司Alphabet公布2025年二季度财报,当季营收同比增长14%至964亿美元,谷歌云服务收入达136亿美元,净利润增长19%至281.96亿美元,谷歌服务收入增长12%至825亿美元;谷歌调高全年资本支出预期,预计2025年达约850亿美元,2026年还会继续增加 [5] - 谷歌搜索查询量和商业查询量持续增长,token用量翻倍,Gemini APP月活超4.5亿人,日请求量较一季度增长超50%,6月超5000万人使用AI会议记录功能,5月以来用户用AI视频生成大模型Veo 3生成超7000万个视频,表明AI应用已渗透入谷歌主要服务,需求强劲,算力需求有望持续增长 [6] 投资建议 - 维持电子行业“增持”评级,AI基建板块建议关注寒武纪、芯原股份、翱捷科技;端侧SOC板块建议关注瑞芯微、恒玄科技、乐鑫科技、中科蓝讯 [8][22]
AI与机器人盘前速递丨谷歌母公司Alphabet第二季度营收同比增长14%;大疆首款扫拖一体机器人“ROMO”即将发布!
每日经济新闻· 2025-07-24 09:32
市场表现 - 科创人工智能ETF华夏(589010)收涨0.77%,盘中最大涨幅达1.55%,持仓股优刻得领涨3.20%,星环科技、合合信息涨幅超2% [1] - 机器人ETF(562500)收跌0.68%,持仓股江苏雷利领跌5.26%,中大力德、中信重工等跌幅逾3%,近10个交易日资金净流入7.68亿元 [1] - 机器人ETF当日交易总额9.48亿元,换手率6.01%,量能稳定 [1] 公司动态 - Alphabet第二季度营收964.3亿美元,同比增长14%,AI Premium计划推动订阅收入,Gemini APP月活用户超4.5亿,"AI模式"在美印用户达1亿 [2] - 大疆首款扫地机器人"ROMO"8月6日发布,研发历时四年,主打扫拖一体,依托视觉避障和路径规划技术拓展家用场景 [2] - 阿里云上线AI编程大模型Qwen3-Coder API,每百万Tokens输入/输出价格分别为4元和16元,均价为Claude 4的1/3 [2] 行业分析 - 人形机器人核心机械零部件(关节模组、减速器等)决定运动性能,国产零部件成本较国外低60%-70%,性价比优势显著 [2]
微软Build&谷歌IO大会:海外大厂AI进阶方向
2025-05-21 23:14
纪要涉及的行业和公司 行业:人工智能、科技硬件、软件开发、互联网服务 公司:谷歌、微软、OpenAI 纪要提到的核心观点和论据 谷歌 - **核心观点**:谷歌在 AI 领域持续创新,致力于打造全面强大的 C 端入口,推动代理技术、端侧进展及优化 Gemini 模型,有望保持竞争优势并获商业收益 [12][13] - **论据** - 推出 Gemini APP 对标 ChatGPT,含实时视频交互等功能,逐步接入多种应用 [1][3] - 搜索分为四层,新 AI 模式类似 ChatGPT 聊天框,有商业化潜力,已在美国上线 [1][11][12] - 发布 Project Marina、CodeAgent 等智能代理和编程代理,支持 MCP [2][3] - 推出虚拟穿衣、文生视频应用、实时翻译功能及新订阅服务,与惠普合作推显示器,智能眼镜更新 [12] - Gemini 模型迭代快,性能优越成本低,4 月处理 480 亿次请求,数据量达万亿级别 [12] 微软 - **核心观点**:微软通过构建代理互联网夯实基础设施,持续推动技术创新和生态建设,对行业生态有深远影响 [14] - **论据** - Build 大会 2025 核心亮点是 agent - centric Web,促进生态系统发展 [14] - 推进 DeepSeek 项目,新增 teach and repeat 功能,展示 CodeX 云端编程智能代理,强调对 MCP 支持 [1][4] - M365 Copilot APP 新设计整合应用,优化体验,形成超级应用 [2][20] - 推出全新 M365 Copilot 产品,含聊天、搜索等五大功能,代理产品可与第三方应用协同 [21][22] - 在 AI 开发平台多方面更新,解决企业 AI 落地问题,应对数据安全和主权要求 [23][25] - 提升产品可靠性和可观测性,升级 Windows 端侧开发场景 [27][28] 其他重要但可能被忽略的内容 - **Gemini 模型进展**:Gemini 3.0 未发布,2.5 版本 Flash 2.5 6 月上线,有实时语音交互功能,后续将上线成本控制功能,处于邀请测试阶段;Gemini 2.5 Pro 集成到 AI IDE 环境 [5][6] - **扩散模型进展**:谷歌用扩散模型训练文本生成模型,可一次性生成完整内容,未发布具体技术细节 [7] - **图像和视频模型更新**:Imagen Four 文生图模型速度和效果提高,View 3 文生视频第三代效果显著提升,能直接生成音频 [8] - **GPU 产品**:第七代 GPU XAAR 4 月发布,今年晚些时候通过 GCP 向用户提供 [9] - **智能眼镜产品**:谷歌与 Nreal 合作推智能眼镜原型,年底将发布与三星、XREF 合作产品,向开发者开放,上市时间未确定 [10] - **GitHub Copilot 发展**:2021 年上线初代,2025 年初有代码智能体雏形,开发者大会发布 GitHub agent 产品 [18] - **企业级大模型重要性**:企业级大模型学习企业行为习惯可模拟专家思路和行为,提高业务效率 [24]