Workflow
NanoBanana
icon
搜索文档
3D领域的NanoBanana也来了,万物皆可用嘴操控。
数字生命卡兹克· 2026-01-26 10:31
核心观点 - AI驱动的3D内容创作与编辑正经历范式转变,从传统的专业软件手动建模转向通过自然语言提示进行“局部、可控、可回滚的增量修改”,这极大降低了3D创作门槛并提升了专业工作流程的效率 [7][8][12][42] 产品功能与技术亮点 - **产品定位**:Hyper3D的Rodin Gen-2被认为是第一个也是唯一一个能够通过自然语言提示编辑任意3D模型的AI产品 [8] - **核心功能**: - 支持上传任意第三方3D模型文件(如obj, fbx)并进行AI编辑 [9][15] - 支持通过图片生成3D模型 [13] - 提供“局部编辑”功能,用户可通过框选模型特定区域,并使用“添加、移除、修改”等指令进行精准编辑 [4][29][31] - **操作流程**:用户上传模型后,通过悬浮操作触发修改界面,以“水波纹”视觉反馈确认选择区域,随后输入文本指令即可完成修改 [24][26][28][29] - **生成速度**:从图片生成3D模型仅需几十秒 [20] 行业应用与价值主张 - **解决行业痛点**:传统3D模型修改流程复杂,涉及拓扑、UV、材质、骨骼绑定等多重属性,局部修改需求(如调整鼻梁高度、更换Logo)若推倒重来将导致大量关联工作失效,成本极高 [17][38][40][44][45] - **核心价值**:AI 3D编辑的核心价值在于对现有3D资产进行“局部、可控、可回滚的增量修改”,而非重新生成,这确保了模型底层结构(如骨骼绑定、动画)的完整性,符合专业生产管线要求 [40][42][44] - **应用场景**: - **游戏与影视**:角色模型需反复迭代,导演要求局部修改(如铠甲厚度、肩甲外扩)时,AI编辑可仅调整局部网格与材质,保持骨骼与动画可用 [44] - **电商与产品设计**:精确修改产品模型的特定细节(如杯子Logo、鞋带颜色),要求其他属性(厚度、圆角、比例)严格保持不变 [45] - **创意与原型制作**:支持模型融合(Remix),例如将“戴珍珠耳环的少女”与“墨镜”模型结合,并可通过3D打印快速实现实体化 [54][55] 市场趋势与生态 - **多模态AI发展**:图片领域有Nano Banana,视频领域有可灵o1,3D领域则由Hyper3D等产品跟进,标志着“用语言驱动一切”成为明确的行业趋势 [7][57] - **创作民主化**:AI 3D工具与消费级3D打印(如拓竹H2C)结合,使得从数字创作到实体物件的链条更加便捷,激发了更广泛的创作与个性化制造需求 [50][52][54] - **技术挑战**:跨模态转换(如图片转3D)存在信息漏损问题,当前生成的模型可能存在缺陷(如部件缺失、部件悬空),但可通过后续的AI编辑进行修补 [22][41]
未知机构:弘则研究科技国内外AI应用冰火两重天模型和应用的矛盾加剧发布于2026年-20260120
未知机构· 2026-01-20 10:40
行业与公司 * 行业:全球人工智能产业,涵盖上游算力、中游模型与下游应用[1] * 公司:涉及海内外多家科技公司,包括Anthropic、OpenAI、Google、字节跳动、腾讯、阿里巴巴、美图等[1][3][5][6][7] 宏观趋势与市场分化 * 中美AI应用市场呈现“冰火两重天”格局[1] * 美股软件股自2026年1月以来大幅下跌,主要原因是Anthropic发布具备全自动工作流能力的Agent产品,引发市场对软件开发成本和功能价值被颠覆的担忧[1] * 中国AI应用生态更偏向“闭环整合”,头部厂商依托自有流量与生态快速落地Agent功能[2] * 自2025年8月起,上游算力(芯片、设备、存储)持续走强,下游应用侧(互联网、软件公司)表现疲软[2] * 市场对短期算力资本开支确定性高,但担忧中长期需求可持续性[3] 技术演进与模型格局 * 基础模型进入线性增长阶段,未出现突破性跃迁,整体能力稳步提升[3][4] * 第一梯队模型包括Anthropic、OpenAI、Gemini[3] * 第二梯队模型包括Grok、智谱、Kimi[3] * 国内通义千问版本滞后,Deepseek V4有望冲击第一梯队[3] * 多模态成为关键突破点,例如Google的NanoBanana等图像编辑模型具备视觉交互能力,显著提升Agent在浏览器自动化、GUI操作、机器人、医疗影像等场景的连续任务执行能力[4] * 垂直模型转向“后训练+强化学习”模式,不再依赖RAG外挂检索,而是将专家思维链内化至模型,实现类人推理[4] * 医疗、金融、编程等领域需大量专家标注数据支撑[5] 国内外AI应用落地对比 * **国内(闭环生态驱动)**: * 字节跳动:豆包手机采用“OS+APP”模式,通过读屏理解操作APP,但效率偏低[5] * 腾讯:开放小程序生态,将小程序转化为Agent(“超级应用+Agent”)[5] * 阿里巴巴:通义千问新版本深度整合阿里生态(飞猪、饿了么等),实现无需跳转的闭环服务,被视为首个真正落地的C端Agent,显著提升其AI叙事确定性[5] * **海外(平台+第三方生态)**: * Anthropic:聚焦编程工作流,实现“仅需产品设计即可自动生成完整产品”,颠覆传统软件开发逻辑[5] * OpenAI /JIMI:仍以Chatbot为主,侧重一次性输出,缺乏任务规划能力[5] * Google:拥有自有模型,推出Sketch(对标Figma)、Opa Notebook等工具,但偏C端,专业场景影响有限[5] 投资逻辑与标的推荐 * **上游(受益明确)**:存储(DRAM/HBM/SSD)、半导体设备、电力设备——受益于AI推理需求迁移与台积电扩产(2026年CAPEX预计增长30%-40%)[5] * **平台型公司(生态+模型+流量)**: * 海外:Google[6] * 国内:阿里巴巴(已验证闭环)、腾讯(待观察)、快手[6][7] * **终端场景类(AI赋能而非替代)**:推荐美图、Roblox、Reddit[7] * **ToB工具类(存在错杀机会)**:Adobe、Figma等正与大模型公司合作转型,需观察2026年Q1产品落地与业绩兑现[7] 核心判断与展望 * 2026年是“第三个Agent元年”,但成败未定,市场给予极高溢价[7] * Agent的核心竞争力从“通用对话”转向“自动化工作流执行”,尤其在编程、医疗等垂直领域[7] * 国内AI应用因生态闭环+快速迭代,在C端落地速度领先;海外则在B端工作流自动化上更具颠覆性[7] * 存储需求正从训练侧向推理侧迁移,SSD作为“个人记忆体”将成为下一代Agent基础设施[7] * 总结:AI产业正经历从“模型竞赛”到“应用落地”的关键转折,中美路径分化明显,技术突破(多模态、强化学习)与生态整合能力成为胜负手[7]
从谷歌AI体系看应用叙事
2025-12-29 09:04
涉及的行业与公司 * **公司**:谷歌(Alphabet)、OpenAI、Anthropic、阿里、百度、字节跳动、Deepseek、三星、Perplexity * **行业**:人工智能(AI)、大模型、云计算、搜索引擎、消费电子、企业服务、互联网 核心观点与论据 谷歌AI模型的技术优势与进展 * **Gemini 3.0 Pro在多模态与长上下文领先**:支持文本、图片、音频、视频及PDF,上下文窗口达100万token,超越GPT 5.1的40万token和Claude 4.5的20万token,通过动态调整计算资源实现更拟人的慢思考效果[1][2][3] * **视频生成模型VO系列实现音画同步与精确调控**:VO 3.0是首个实现声音和画面原生同步直出的头部模型,VO 3.1新增对已生成视频的精确调控功能,单价为每秒0.4美元,与Sora R接近,分辨率达720P-1,080P[1][4] * **图像生成模型NanoBanana具备实时知识与精细操控**:基于Gemini开发,调用谷歌搜索接入真实世界知识,通过思维链机制理解提示词,具备高分辨率、文字渲染准确、图片精细操控等优势[1][7] * **用户使用时长反超ChatGPT**:截至2025年10月,Gemini APP和网页端单用户单次使用时长达到7.2分钟,超越ChatGPT的6分钟,下载量从年中每月1,500万次增至10月份6,600万次[1][5] 谷歌AI驱动的业务增长与市场布局 * **AI成为核心业务增长新动力**:2025年第三季度谷歌总营收1,023亿美元,其中搜索收入565亿美元,AI overview和AI mode提升了广告变现效率,云业务新增客户数同比增长34%[2][11] * **C端应用场景示范效应显著**:Google Search的AI模式日活人数超过7,500万,内置的AI Overview功能月活用户数超过20亿,大幅提升整体搜索收入[14] * **B端企业服务与硬件生态全面布局**:通过Vertex AI平台提供企业级解决方案,合同金额达1,550亿美元,付费企业用户数突破100万,在安卓生态(如安卓16)和C端硬件(手机、手表)中深度集成AI功能[10][12][14][16][18][23] * **深入垂直行业与合作伙伴**:将客户分为11个主要行业,吸引头部客户,例如三星Galaxy手机部署了Gemini和Imagen模型,三星家庭伴侣机器人也接入了谷歌AI[19][20] 全球及中国AI市场动态 * **AI搜索市场快速增长**:2025年,AI浏览器Perplexity访问量近乎翻倍,国内AI搜索用户量约5亿,日查询需求约20亿次,由阿里夸克、百度AI搜索等主导[2][15] * **国内大模型企业市场爆发**:2025年上半年,国内大模型企业市场总Token使用量日均达10.2万亿,同比增长超三倍,阿里通义、字节豆包及Deepseek调用最多,主要来自互联网和金融行业[2][21] * **国产大模型紧跟迭代,应用场景深化**:国产模型在思考深度、多模态处理及编程性能方面不断迭代,企业应用场景从智能问答(32%)转向价值更高的内容创作与客户服务等领域[22] * **操作系统层面AI化改造成为趋势**:谷歌在安卓16中内置大量Gemini AI功能,字节跳动的豆包手机也在操作系统层面进行了大量AI化改造[16][17] 其他重要内容 * **谷歌AI体系架构**:分为云计算、大模型及原生AI应用三大部分,核心研发部门是DeepMind人工实验室[10][12] * **模型收费与成本**:NanoBanana Pro按Token收费,每百万Token定价120美元,高于Gemini 3.0 Pro文本输出价格,每张图片平均消耗1,200至2000个Token[9] * **技术路径差异**:NanoBanana Pro采用多模态架构和思维链机制模拟物理世界,而GPT-4O基于统计相关性拼接像素图片[8] * **投资方向启示**:基于谷歌示范,创意领域多模态模型、C端硬件AI化、B端企业强付费意愿的AI应用被视为具有较大发展机会的方向[24]
Bank of America Securities Reiterates a Buy on ​Alphabet Inc. (GOOGL)
Yahoo Finance· 2025-11-24 21:58
公司评级与目标价 - 美国银行证券分析师Justin Post重申买入评级 目标价335美元 [1] - Evercore ISI分析师Mark Mahaney重申买入评级 目标价325美元 [1] 新产品发布与市场反应 - 公司发布名为NanoBanana的最新图像生成和编辑工具 [2] - 新产品基于最新发布的Gemini 3 Pro构建 推动公司股价在11月18日上涨5% [2] - 该工具现已可在Gemini应用程序中使用 其潜力超越8月发布的初始版本 [2] 技术模型与行业评价 - 华尔街分析师对最新Gemini 3模型表达积极看法 [3] - 美国银行认为新模型可能缩小与市场其他领先模型的性能差距 [3] - D A Davidson分析师基于AI基准测试称Gemini 3为真正强大的模型 [3] 公司业务结构 - 公司为主要持股公司 主要业务部门包括谷歌服务、谷歌云和其他赌注 [4]
“表现极其惊艳”,谷歌大模型罕见发布前“造势”,Gemini 3.0本周登场?
硬AI· 2025-11-17 10:32
Gemini 3 0发布预期与市场影响 - 预测市场押注Gemini 3 0将于下周发布,首席执行官Sundar Pichai在社交平台的微妙举动被解读为对发布时间的确认[2][3] - 内部人士形容新模型"极其惊艳",预计将在编码和多媒体内容生成方面实现重大改进,可能让公司有机会在OpenAI的ChatGPT-5未能立即产生重大影响后夺得领先地位[2][3][4] - 公司员工在社交媒体上流露对发布的兴奋之情,这种现象在公司以往的模型发布前并不多见,表明此次发布前热度罕见[3][6] 模型性能突破性进展 - 专业测试显示新模型在识别18世纪手写文稿方面接近完美,字符错误率仅为0 56%,词错误率为1 22%,相比前代Gemini 2 5 Pro提升50%-70%,达到专家级人类水平[3][8] - 模型展现出超越视觉识别的推理能力,例如能自发进行逐步符号推理,将"145"推断为"14磅5盎司",表明其对生成记录的经济和文化系统有理解[9] - 前代模型Gemini 2 5 Pro在复杂文档上的字符错误率约为4%,新模型将错误率显著降低至0 56%[8] 公司AI战略转折点 - 自2022年底ChatGPT发布后公司一度陷入"红色警报",Gemini 3 0被视为重塑市场地位的关键一步[4][11] - 新模型预计对公司热门图像工具NanoBanana进行重大升级,该名称源于员工创建的占位符名称,在开放AI评估平台测试后意外走红并被正式采用[6][11] - 如果新模型的推理能力被证明可靠,AI可能从复杂的"随机鹦鹉"过渡为具有真正理解能力的系统,能够自动化人类专家专属领域的复杂认知任务[11]
“表现及其惊艳”,谷歌大模型罕见发布前“造势”,Gemini 3.0本周登场?
华尔街见闻· 2025-11-17 08:29
发布信息与市场预期 - 谷歌Gemini 3.0人工智能模型预测将于下周发布,首席执行官Sundar Pichai在社交媒体上的回应几乎确认了这一时间表 [1] - 此次发布前公司进行了大规模的内外部造势活动,这种现象在谷歌以往的模型发布前并不多见 [1] - 接触过该模型的内部人士评价其能力“极其惊艳”,预计将在编码和多媒体内容生成方面实现重大改进 [1][3] 模型性能表现 - 在专业测试中,新模型在识别18世纪手写文稿方面接近完美,字符错误率仅为0.56%,词错误率为1.22% [1][4] - 相比前代Gemini 2.5 Pro,新模型的错误率提升了50%-70%,达到专家级人类水平 [1][4] - 模型展现出超越视觉识别的推理能力,例如能自发进行逐步符号推理,理解生成历史记录的经济和文化系统 [4][6] 战略意义与行业影响 - 自2022年底ChatGPT发布后,谷歌一度陷入“红色警报”,Gemini 3.0被视为公司重塑AI市场地位的关键一步 [2][5] - 此次发布具有战略意义,可能让谷歌在OpenAI的ChatGPT-5未能立即产生重大影响后夺得领先地位 [5] - 如果新模型的能力得到验证,AI可能正从“随机鹦鹉”过渡为具有真正理解能力的系统,能够自动化此前被认为是人类专家专属领域的复杂认知任务 [6]
全新创作平台SkyReels来了!一张画布+一个对话框包办AI视频创作全流程
量子位· 2025-11-04 09:56
产品核心定位与优势 - 产品是昆仑万维旗下的全新AI视频创作工具SkyReels,旨在通过一体化画布简化多模态内容创作流程[1] - 核心优势在于将图像生成、音频配乐、视频剪辑等多个独立功能整合进一张可无限延展的画布,用户无需在不同工具和网站间切换,避免了频繁导入导出文件的操作[3][4][5] - 该设计让创作者能更专注于内容创意本身,而非技术实现流程,提升了创作效率[44][45][46] 多模态模型集成与功能 - 平台内置了众多海内外主流大模型,包括近期热门的Sora2、Veo3.1、NanoBanana等,用户可根据需求灵活选用[7] - 支持图生视频功能,用户只需将图片拖入视频功能区并输入提示词,即可让静态图片动态化,例如将黏土风拍立得照片转化为动态视频[9][11][13] - 具备音乐生视频能力,可先让AI生成一段特定风格的音乐,再根据音乐氛围自动生成匹配剧情的视频,展示了其理解情绪和自导自演的能力[15][16][17] - 支持风格迁移功能,能够用一张图的风格去影响另一张图,例如将肯德基老爷爷与上海外滩场景结合生成新图片[17][19] 智能代理系统 - 平台设有一个Super Agent作为总协作者,可随时响应用户需求,进行聊天、补全脚本、生成分镜等操作[21][22] - 提供28个Expert Agent专家代理,覆盖广告大片、故事书绘本、高质量海报等专业领域,能为特定需求提供深度且可直接使用的解决方案[24][26] - 专家代理能生成具有商业大片质感的内容,例如耳机产品广告图、毛毡风动画片段、咖啡店品牌视觉设计等[26][28][29] 模板化创作与数字人技术 - 平台内置近10个大类、150多种创作模板,涵盖AI数字人口播、产品功能演示、高阶创意广告等场景,用户选择模板即可快速生成内容[31][32] - 数字人技术是业内首个支持单镜头多人多轮对话的模型,能实现最长4分钟的连续嘴型同步,并支持32种运镜与Prompt控制,使多角色互动自然流畅[36] - 数字人示例展示了其精准的嘴型同步和细节处理能力,如双人对话场景和角色语速节奏控制[36] 视频后期处理能力 - 支持视频延长功能,可将短视频延长并智能补充新镜头,例如将2秒的猫咪打哈欠视频延长至6秒并添加俯视远景镜头,画面过渡顺滑[36][38] - 具备视频风格化处理功能,可对长达30秒的视频进行风格转换,在保留原动作的基础上套用剪纸、辛普森、像素风、梵高画风等多种视觉风格[40][42]
大行评级|高盛:上调阿里巴巴H股目标价至174港元 看好AI云端驱动增长潜力
格隆汇· 2025-09-17 11:29
中国AI基础设施发展 - 中国AI基础设施层面出现更新叙事 支持行业复合增长潜力[1] - 中国云端超大规模企业采用多芯片策略 推动AI云端行业增长[1] 中国AI模型创新 - 阿里巴巴推出Qwen3-Next模型 百度推出X1.1模型 腾讯推出HYWorld-Voyager 3D模型[1] - 多家企业推出多模态模型 近期焦点围绕字节跳动Seedream 4.0与NanoBanana的图像编辑和生产力功能比较[1] AI应用层进展 - 交易平台推出AI助理功能 包括阿里巴巴的Amap 2025和美团的Xiao Mei[1] 阿里巴巴估值调整 - 高盛将阿里巴巴云端估值从每ADS 36美元上调至43美元[1] - 基于2026财年第二至第四季度云端增长假设上调至年增30%至32% 原假设为28%至30%[1] - 阿里巴巴SOTP 12个月目标价从163美元上调至179美元 港股目标价从158港元上调至174港元 维持买入评级[1] 云端行业资本支出预测 - 预测中国云端服务提供商2025年第三季度资本支出将年增39%[1] - 资本支出增长可能促进AI云端收入持续增长[1]
在赌场门口卖茶叶蛋——A股一周走势研判及事件提醒
Datayes· 2025-08-31 22:44
市场行情与资金动向 - 本周两个交易日成交额超过三万亿,量能出现转折点 [1] - TMT行业集中度高达38.98%,逼近2024年10月历史峰值,阶段性风险大于收益 [1] - 创业板和科创板ETF净赎回金额扩大,高估值成长性题材承压 [2] - 机构资金自8月初进入净流出状态,本周趋势加剧 [2] - 当周A股主力资金净卖出1778.93亿元,创4周最大规模,医药生物/计算机/非银金融净卖出居前 [32] - 北向资金当周成交19382.05亿元,连续第3周增加 [33] - 电子/有色金属/通信行业资金净流入领先,分别达154.53亿元/114.48亿元/75.05亿元 [34] 券商策略观点汇总 - 兴业证券建议重视港股互联网、半导体设备等五大方向轮动扩散 [6] - 财通证券认为短期量能高位收缩后市场可能震荡,调整空间有限 [6] - 银河证券指出成长板块上半年景气度高,关注光伏设备/电池等领域 [6] - 开源证券看好科技成长/自主可控/军工方向,以及出海结构性机会 [6] - 西部证券将9月A股视为"看涨期权",下行风险有限而上行潜力大 [6] - 中泰证券预期大盘以震荡和结构性轮动为主,非全面普涨 [6] 宏观经济数据 - 8月制造业PMI为49.4%,较上月提升0.1个百分点,连续五个月处于收缩区间 [6] - 医药、计算机通信电子设备等行业产需指数明显高于制造业总体 [7] - 产成品库存指数下降0.6pct至46.8%,原材料库存上涨0.3pct至48% [9] - 非制造业PMI为50.3%,服务业商务活动指数上升0.5pct至50.5%,创年内高点 [12] - 商务部将出台扩大服务消费政策,服务业景气度或进一步上升 [12] 细分行业动态 - 阿里巴巴开发新款AI推理芯片,阿里云FY2026Q1营收333.98亿元,同比增长26% [14] - 阿里未来三年将投入超3800亿元建设云和AI基础设施 [14] - 锂电产业链9月预排产环比增长,电池排产124.8GWh(+7.4%),正极/负极/隔膜/电解液均增超6% [16] - 上汽名爵半固态电池车型售价10.28万元,39分37秒大定突破10000台 [16] - 华域汽车拟受让上汽清陶49%股权 [17] - 中石油研究以稳定币进行跨境结算的可行性 [18] - NanoBanana图像生成模型以1362分位列全球图像编辑榜单第一 [19] - 俄罗斯与中国结算几乎完全转向本币 [21] - 成都国星宇航递交港股上市申请,冲刺"商业航天第一股" [22] 政策与产业要闻 - 美国商务部调整三星/SK海力士在华工厂设备许可制度 [23] - 六大行中期分红比例30%,合计金额2046.57亿元 [23] - 国家电网特高压招标金额13亿元,1000kV电抗器/变压器/组合电器为主 [23] - 安徽省发行456亿元专项债,其中18.6亿元投向低空经济基础设施 [24] - 上合组织峰会在天津举行 [25] - 钢铁行业稳增长方案目标2025-2026年增加值年均增长4% [25] - 国务院研究要素市场化配置综合改革试点 [26] 行业景气与估值 - 纺织服装/公用事业/休闲服务行业位于衰退象限,非银金融/通信/计算机处于扩张象限 [36] - 国防军工行业由扩张进入放缓象限 [36] - 医药生物/房地产/电气设备景气度提升居前,建筑材料/国防军工/建筑装饰景气度回落居前 [36] - 农林牧渔/有色金属/建筑材料行业位于"高景气、低估值"象限 [37] - 化工/计算机/电子行业估值水平偏高(PE历史百分位>0.7),食品饮料/家用电器/农林牧渔估值偏低(PE历史百分位<0.3) [37]