Workflow
Imagine
icon
搜索文档
Nano Banana 拉爆谷歌营收创纪录,劈柴哥开心坏了,幕后团队曝内部“绝对优先事项清单”
36氪· 2025-11-03 13:02
"看到 Gemini 应用的月活跃用户居然已经达到 6.5 亿,真是有点意外,大概要多谢 Nano Banana 吧。"Hyperbolic Labs 联创兼 CTO Yuchen Ji 在看到在看到谷歌"战报"后说道。 前两天,谷歌 CEO Sundar Pichai 开心地发推称:"我们首次实现单季度营收突破 1000 亿美元,这是公 司历史上的第一次,并且我们在业务的每个主要板块都实现了两位数增长。(五年前,我们的季度营收 还只有 500 亿美元)" 最近,谷歌 DeepMind 首席科学家 Oliver Wang、产品经理 Nicole Brichtova 做客 a16z 播客节目,与 a16z 合伙人 Justine Moore、专注人工智能和基础设施投资的 Guido Appenzeller 和 Yoko 一起讨了 Nano Banana 是如何诞生的、为什么它会病毒式传播以及图像和视频编辑的未来。我们翻译了该内容,并在 不改变原意基础上进行了删减和整理,以飨读者。 Nano Banana 的缘起 Yoko:能不能先聊聊 Nano Banana 模型背后的故事?它是怎么诞生的? Oliver Wa ...
蚂蚁集团发布万亿参数旗舰模型 Ling-1T,恒生科技指数ETF(159742)涨超1.2%,冲击3连涨
搜狐财经· 2025-10-09 11:05
恒生科技指数及ETF表现 - 截至2025年10月9日10:22,恒生科技指数上涨0.52%,成分股ASMPT上涨10.54%,华虹半导体上涨6.32%,联想集团上涨3.84%,比亚迪电子上涨2.94%,蔚来-SW上涨2.41% [3] - 恒生科技指数ETF上涨1.24%,最新价报0.9元,冲击3连涨;截至2025年9月30日,该ETF近2周累计上涨2.79%,涨幅在可比基金中排名第1/11 [3] - 恒生科技指数ETF盘中换手率达9.49%,成交4.62亿元;截至9月30日,近1周日均成交额为7.59亿元 [3] - 恒生科技指数ETF最新规模达45.95亿元,最新份额达52.34亿份,均创近1年新高 [4] - 恒生科技指数ETF最新资金净流入4969.98万元,近4个交易日内合计资金净流入1.77亿元 [4] - 恒生科技指数代表经筛选后最大30间与科技主题高度相关的香港上市公司,其前十大权重股合计占比69.87% [4][5] AI大模型技术进展 - 蚂蚁集团于10月9日凌晨发布万亿参数的通用语言模型Ling-1T,该模型是蚂蚁百灵大模型Ling 2.0系列的首款旗舰模型,也是其团队迄今推出的规模最大、能力最强的非思考大模型 [3] - OpenAI发布Sora2,标志着AI视频生成技术迈入新阶段,该模型已从实验性产品升级为面向大众的社交应用,支持多镜头连续性、角色一致性及音视频同步 [3] - Sora2通过引入物理引擎和多样化风格选项,推动AI生成内容向更高质量演进,并有望重塑创意产业生态,带动数字营销、影视创作等领域效率提升 [4] - Sora 2 App上线三天即登顶美区App Store榜首,支持用户"客串"生成内容,显示出强劲的用户参与意愿 [4] AI行业趋势与影响 - xAI推出视觉生成模块Imagine,Anthropic强化AI Agent能力,表明多模态理解与生成技术已跨越商业化临界点 [4] - AI正从工具演变为内容交互的基础平台,推动Tokens消耗增长与算力需求上升 [4] - Sora2打包为消费级社交产品的模式为行业提供了商业化落地的新范式 [4]
AI需求侧核心逻辑正式向多模态大模型延展-国产算力认知强化!Tokens消耗 | 投研报告
中国能源网· 2025-10-08 10:01
海外多模态大模型进展 - OpenAI于10月1日上线Sora2/Pro App,支持最长15秒文生视频,物理运动更精准并支持用户客串生成内容,发布三天后登上美区App Store第一名 [1][1] - OpenAI在10月7日开发者大会上宣布ChatGPT可直接调用第三方应用,并推出GPT-5Pro、Sora2 API等开发者工具,标志其从单一对话工具向AI应用及社交平台转型 [1] - xAI于10月6日推出视觉生成模块Imagine,可从文字生成高质量图像与视频,Grok由问答助手升级为多模态创作AI,构建社交+搜索+创作一体化平台 [1] - Anthropic于9月30日发布Claude Sonnet 4.5编程模型,强调构建生产就绪级AI Agent能力,推动智能体从原型验证迈向实际部署 [1] - 多模态理解与生成技术已突破具备商业化价值临界点,AI生成视频动作可控性与内容观赏度显著提升,用户主动创作与付费意愿大幅提升 [1] 国内多模态能力发展 - 快手可灵2.5 Turbo于10月2日在全球视频生成模型榜单中登顶图生视频与文生视频双榜首,体现其视频生成与内容质量的国际领先水平 [2] - 字节跳动于10月2日与UCLA推出Self-Forcing++视频生成技术,可生成4分15秒高清视频,视觉稳定性提升至2.6倍 [2] - 字节跳动旗下豆包1.6-Vision模型于9月30日更新,通过工具调用将图像融入思维链,提升视觉理解精度 [2] - 腾讯于9月28日推出并开源混元图像3.0,作为业界首个开源工业级原生多模态生成模型,快速登顶Hugging Face热榜并保持领先 [2] - AI应用落地竞争核心从单一语言智能转向多模态生成与理解能力,国内头部厂商正快速补齐该关键环节并在国际基准测试中崭露头角 [2] 国产算力投资逻辑演变 - DeepSeek于9月30日发布DeepSeek-V3.2-Exp,DSA架构使得推理成本更低且支持更长上下文,模型支持国产开发生态tilelang语言,并实现与寒武纪、海光、昇腾等芯片的首日适配 [3] - 智谱于9月30日开源GLM-4.6,在Agentic Coding等关键能力上显著提升,代码生成性能已对齐Claude Sonnet 4,并完成与国产GPU的联合优化 [3] - 阿里巴巴于10月4日发布并开源Qwen3-VL系列多模态模型,实现昇腾芯片的0Day适配,加速国产硬件生态落地 [3] - 投资逻辑从因H20限售驱动的供给侧替代逻辑,演进为多模态能力突破带来的需求侧拉动,AI应用自身增长牵引形成国产算力原生成长路径 [3] - 随着多模态生成与实时推理场景不断丰富,国产算力有望进入内生驱动的新一轮成长周期 [3]
AI需求侧核心逻辑正式向多模态大模型延展:国产算力认知强化!Tokens消耗
东吴证券· 2025-10-08 09:27
行业投资评级 - 电子行业评级为增持(维持)[1] 核心观点 - 国产算力投资逻辑从供给侧向需求侧延展,AI应用需求成为国产算力新引擎[1] - 多模态能力突破带动C端付费意愿提升,AI正从生产力工具加速演进为内容与交互的基础平台[5] - 国内头部厂商快速补齐多模态生成与理解关键环节并在国际基准测试中崭露头角[5] - 随着多模态生成与实时推理场景丰富,国产算力有望进入内生驱动的新一轮成长周期[1] 国产算力投资逻辑演进 - 国产算力崛起标志是适配工作渗透到AI大模型研发更早期阶段[1] - DeepSeek于9月30日发布DeepSeek-V3.2-Exp,DSA架构使推理成本更低,支持更长上下文,并实现与寒武纪、海光、昇腾等芯片的首日适配[1] - 智谱于9月30日开源GLM-4.6,代码生成性能已对齐Claude Sonnet 4,并完成与国产GPU联合优化[1] - 阿里巴巴于10月4日发布开源的Qwen3-VL系列多模态模型实现昇腾芯片0Day适配[1] - 投资逻辑从H20限售驱动的供给侧替代演进为多模态能力突破带来的需求侧拉动[1] 海外多模态进展 - OpenAI于10月1日上线Sora 2/Pro App,支持最长15秒文生视频,发布三天后登上美区App Store第一名[5] - OpenAI于10月7日开发者大会宣布ChatGPT可直接调用第三方应用,推出GPT-5 Pro、Sora 2 API等工具,标志从单一对话工具向AI应用及社交平台转型[5] - xAI于10月6日推出视觉生成模块Imagine,Grok由问答助手升级为多模态创作AI,构建社交+搜索+创作一体化平台[5] - Anthropic于9月30日发布Claude Sonnet 4.5编程模型,强调构建生产就绪级AI Agent能力[5] 国内多模态进展 - 快手可灵2.5 Turbo于10月2日在全球视频生成模型榜单中登顶图生视频与文生视频双榜首[5] - 字节跳动与UCLA推出Self-Forcing++视频生成技术,可生成4分15秒高清视频,视觉稳定性提升至2.6倍[5] - 字节跳动豆包1.6-Vision模型于9月30日更新,通过工具调用将图像融入思维链提升视觉理解精度[5] - 腾讯于9月28日推出并开源混元图像3.0,作为业界首个开源工业级原生多模态生成模型,快速登顶Hugging Face热榜[5] 投资建议 - 云端算力:推荐寒武纪、海光信息、芯原股份、盛科通信、兆易创新,建议关注翱捷科技、裕太微等[2] - 端侧算力:推荐晶晨股份、瑞芯微、恒玄科技,建议关注乐鑫科技等[2] 重点公司估值 - 寒武纪-U总市值5,543.14亿元,2025年预测EPS为4.07元/股,预测PE为325.55倍[7] - 海光信息总市值5,871.28亿元,2025年预测EPS为1.23元/股,预测PE为205.37倍[7] - 芯原股份总市值962.06亿元,2025年预测EPS为-0.19元/股[7] - 兆易创新总市值1,423.30亿元,2025年预测EPS为2.48元/股,预测PE为86.01倍[7] - 晶晨股份总市值468.18亿元,2025年预测EPS为2.52元/股,预测PE为44.12倍[7] - 瑞芯微总市值948.95亿元,2025年预测EPS为2.53元/股,预测PE为89.15倍[7] - 恒玄科技总市值500.89亿元,2025年预测EPS为5.14元/股,预测PE为57.88倍[7]
Meta plans to sell targeted ads based on data in your AI chats
TechCrunch· 2025-10-01 21:00
核心观点 - Meta宣布将利用用户与其AI产品互动的数据来销售其社交媒体平台上的定向广告,这标志着其核心广告业务的重大扩展 [1][2] 隐私政策更新 - 公司将于12月16日更新其全球隐私政策以反映此项变更,并将在近日通知用户 [1] - 新政策不适用于韩国、英国和欧盟的用户,因当地隐私法律禁止此类数据收集 [1] - 用户无法选择退出此项数据使用 [7] 数据来源与应用 - 数据来源包括与Meta AI聊天机器人的对话,每月有超过10亿人与Meta AI聊天 [2][3] - 其他AI产品数据也将被利用,包括Ray-Ban Meta智能眼镜中的语音记录、图片和视频,以及AI视频动态Vibes和AI图像生成产品Imagine [5] - 只有当用户在不同产品上使用同一账户登录时,与Meta AI的对话才会影响其在Facebook和Instagram上看到的广告 [5] - 围绕敏感话题的对话数据不会被用于广告投放,包括宗教观点、性取向、政治观点、健康、种族或民族出身、哲学信仰或工会成员身份 [8][9] 对广告业务的影响 - 此举为公司提供了丰富的新信息流,以增强其有价值的广告产品,因为用户通常会与AI聊天机器人进行长时间、详细的对话 [3] - 例如,若用户与Meta AI讨论徒步旅行,公司可能会向其展示徒步装备广告 [4] - 公司目前仍在构建利用AI互动来改进广告产品的系统 [8] 行业趋势 - 科技公司正开始测试AI产品的货币化方式,目前大多数AI产品是免费的 [9] - OpenAI推出了在ChatGPT内购买产品的方式,公司将从应用内完成的交易中抽取分成;谷歌也公布了在其AI驱动的搜索产品AI Mode中引入广告的计划 [9] - Meta表示目前“没有即将实施的计划”在其AI产品中放置广告,但首席执行官马克·扎克伯格暗示未来可能会出现 [10]
Llama拉垮,Meta开始寻求“第三方AI产品”合作
华尔街见闻· 2025-08-23 14:18
核心战略转变 - Meta调整长期坚持的内部AI开发战略 转而与外部AI公司Midjourney进行技术合作 授权使用其美学技术 旨在为数十亿人带来美感 [1] - 公司采取全方位策略 与行业中最优秀的参与者合作 标志着从封闭自研向开放合作的重大战略转变 [1] - 由于对自研Llama系列模型信心减弱 Meta已开始在内部编码等任务中使用第三方模型 [2] 产品竞争态势 - 尽管2024年推出图像生成工具Imagine 并计划2025年将视频生成模型Movie Gen整合到Instagram 但产品被认为已落后于竞争对手 [2] - Meta产品与谷歌Veo 3和OpenAI Sora等已向消费者发布的模型相比显得过时 [2] - 公司已放弃公开发布旗舰大语言模型Behemoth的计划 转而集中精力开发新模型 [2] 资源投入与组织架构 - 近几个月积极从竞争对手处招揽顶尖AI研究员 加倍投资AI基础设施 收购AI语音公司Play AI 入股数据标注公司Scale AI [3] - AI部门Meta Superintelligence Lab在过去六个月经历四次重组 反映公司在确立有效组织结构方面遇到困难 [3] - 巨额投入未立即转化为稳定组织架构和领先产品 这种投入产出反差可能是寻求外部合作的原因 [3] 合作方价值分析 - Midjourney是2021年成立的AI图像生成公司 坚持不接受风险投资 自筹资金发展 成为最受欢迎的图像生成工具之一 [4] - 其核心价值在于成熟的美学技术 对社交媒体应用的视觉吸引力至关重要 [4] - 通过授权合作 Meta可快速提升AI生成内容质量 在用户体验上追赶竞争对手 [4]
速递|Meta联手Midjourney,或即将迎来Midjourney加持的AI图像、视频功能
Z Potentials· 2025-08-23 13:22
战略合作 - Meta与Midjourney达成技术授权合作 将整合AI图像和视频生成技术至未来产品线 [2] - 合作旨在开发能与OpenAI Sora、Black Forest Lab Flux及Google Veo竞争的产品 [2] - Meta自研工具Imagine已整合至Facebook、Instagram和Messenger AI视频工具Movie Gen支持文字生成视频 [2] 资源投入 - Meta为部分AI研究人员提供价值超1亿美元薪酬方案 大举招募人才 [3] - 公司向Scale AI投资140亿美元 并收购AI语音初创公司Play AI [3] - 曾与多家AI实验室洽谈收购 包括讨论参与970亿美元OpenAI竞标(未实际报价) [3] 合作方背景 - Midjourney为未接受外部融资的独立AI开发商 年收入预计达2亿美元(2023年) [4] - 提供月费10美元至120美元订阅服务 2024年6月发布首款AI视频模型V1 [4] - 面临迪士尼和环球影业版权诉讼 被指控使用受版权作品训练模型 [4] 行业动态 - 多家AI模型开发商(包括Meta)面临类似版权指控 近期法庭判决倾向科技公司 [4] - AI图像生成领域竞争加剧 主要参与者包括OpenAI、Google及Black Forest Lab等企业 [2]
计算机行业周报:政策助力AI发展,行业创新加速-20250804
国元证券· 2025-08-04 12:41
行业投资评级 - 推荐|维持 [5] 市场回顾 - 本周(2025 7 28-2025 8 1)计算机(申万)指数下跌0 20%,表现优于上证指数(-0 94%)、深证成指(-1 58%)和创业板指(-0 74%) [1][10] - 细分板块中软件开发(+0 68%)表现最佳,计算机设备(-0 98%)和IT服务Ⅱ(-0 75%)表现较弱 [1][12] - 个股方面,淳中科技(+32 16%)、卓易信息(+26 91%)、当虹科技(+24 30%)涨幅居前三 [12][14] 重大行业事件 - GPT-5预计最快下周发布,将整合多模态能力并支持100万tokens上下文窗口,其mini版"lobster"强化编程能力 [15] - DeepSeek与北大联合研发的"原生稀疏注意力"技术获ACL最佳论文奖,实现长文本处理速度提升11倍 [15] - OpenAI推出"学习模式"新功能,采用苏格拉底式引导帮助用户理解复杂概念 [15] - xAI即将为Grok推出视频生成功能"Imagine",支持带音频的多风格视频生成 [15] - 国务院常务会议审议通过《关于深入实施"人工智能+"行动的意见》,强调推动AI与各领域深度融合 [3][19] 重点公司动态 - 海康威视2025年上半年营收418 18亿元(同比+1 48%),净利润56 57亿元(同比+11 71%),经营性现金流53 43亿元(占净利润94%) [2][17] - 汉仪股份转型文化消费生态平台,"博物汉字"IP已积累300万粉丝,并与不凡玩品展开合作开发传统文化衍生品 [2][18] - 龙软科技表示煤矿智能化验收以中级为主,受行业周期影响煤炭企业智能化投入节奏放缓 [2][17] - 阶跃星辰发布Step 3基础大模型(总参数321B),在国产芯片上推理效率达DeepSeek-R1的300% [17] - 智谱发布开源模型GLM-4 5,支持100tokens/秒处理速度,输入成本低至0 8元/百万tokens [17] 核心投资观点 - 人工智能行业处于快速发展阶段,政策支持力度加大,《人工智能+行动意见》将推动技术在各领域规模化应用 [3][19] - 看好具备核心技术、明确应用场景和成功商业化案例的上市公司,AI赋能千行百业趋势明确 [3][19] - 软件板块表现相对强势,细分领域技术创新持续突破(如GPT-5、原生稀疏注意力等)带来结构性机会 [1][15]
AI进化速递丨小红书推出首个社交大模型
第一财经· 2025-08-01 20:50
小米浏览器接入豆包大模型 - 小米浏览器宣布接入豆包大模型以增强功能 [1] 小红书推出社交大模型 - 小红书宣布推出首个社交大模型"RedOne" [1][3] OpenAI启动挪威项目 - OpenAI即将启动"星际之门"挪威项目 [1][4] 马斯克推出Grok新功能 - 马斯克宣布将向Grok Heavy订阅用户推出Imagine和Valentine测试版 [1][4]
马斯克偷偷憋了个大招,Grok秒出《阿凡达》画质,好莱坞瑟瑟发抖?
36氪· 2025-07-30 11:49
马斯克又放大招!这次不是火箭,不是Grok智商升级,而是一个几乎能拍电影的AI视频生成器「Imagine」。它不但能加音效、配画面,还支持 多风格生成。网友实测效果太炸裂! 马斯克的Grok也能生成视频了! Grok即将推出了「Imagine」视频功能,直接挑战谷歌的Veo 3。 马斯克表示正在修复相关的bug,并且附上了机器人修复机器鸟的视频。 源自古代天空的奇想:Archytas的飞行鸽 —— 可能是世界上最早的「机器人」? 视频效果之炫目,让Michael Hyacinth怀疑这段视频来自某部电影中的情节。 这是人类历史上首个具备自我推进能力的飞行装置。虽然它在今天看来并不算真正意义上的飞行,但这项发明在理解鸟类飞行机制与空气动力学方面,迈出 了具有划时代意义的一步。 视频中,机器人修复的金光闪烁的「机器之鸽」,让网友联想起古希腊数学家、哲学家、数学力学先驱Archytas的机械飞鸟传说。 得到试用机会的网友,用Grok制作了赛博朋克风格的视频。 代码在血色的暗室里跳动,机械手在键盘上掀起金属风暴。 这个瞳孔泛着危险红光的Robot,正用二进制语言撕咬人类文明的防火墙。六块曲面屏同时倾泻数据瀑布,0与1 ...