硬AI
搜索文档
字节与快手助推,漫剧迅速起量,引领AI变现
硬AI· 2025-11-25 20:07
行业趋势:AI驱动漫剧成为内容市场新赛道 - 一种由AI技术驱动的新内容形态“漫剧”正在迅速崛起,结合了动漫形式与短剧节奏 [2] - 在真人短剧成本攀升、付费投流模式增长见顶的背景下,漫剧凭借低成本、高效率优势承接溢出产能和资本 [2][9] - 字节跳动和快手等科技巨头正以模型、流量与补贴构建商业闭环,推动漫剧走向工业化与精品化 [2][4] 市场规模与用户增长 - 微短剧市场规模预计在2025年将达到634.3亿元,其中免费短剧赛道表现最为景气 [5] - 红果短剧APP在2025年10月的月活跃用户已达2.45亿,成为行业头部 [5] - 从2024年中开始,漫剧玩家数量迅速增加,今年暑期投流高峰时商业化投流在8月达到400万/天,流水规模翻了12倍,头部作品累计收益近800万元 [11] AI技术对生产效率的提升 - AI将漫剧制作周期从传统方式的50至60天缩短至一个月内,制作效率提升超过100% [3][12] - 一部沙雕漫的成本仅约3至4万元,远低于真人短剧的七八十万元 [9][12] - AI技术能够赋能从剧本改编、分镜设计、图像生成、动态制作到配音的全流程,动漫题材成为当前AI生成内容最合适的应用场景 [12] 平台战略与生态构建 - 字节跳动旗下平台迅速布局,红果短剧APP内部设立独立漫剧频道,并在11月推出“红果免费漫剧”独立应用 [2] - 平台通过为创作者提供AI生产工具、开放IP版权库、并予以流量和现金补贴激励创作,例如抖音调整分成系数对AI参与度高的品类给予更高激励 [15] - 这种“AI技术+内容生态”闭环让AI技术从面向C端的“兴趣工具”转变为面向B端创作者可直接产生商业回报的“生产工具” [3][15] 内容供给与IP开发 - 阅文、番茄小说等IP持有方正开放大量网文版权用于漫剧改编,各大网络文学平台已开放数以万计的IP版权 [4][21] - 当前漫剧题材多集中于男频内容,用户以男性为主,而整个短剧市场男女用户比例基本持平,女频内容将是下一阶段扩充用户群体的重点 [19] - 中文在线依托自研AI漫剧平台制作的《仙尊归来:只手镇人间》上线后迅速登顶抖音动态漫热榜,显示工业化生产方式降低入行门槛 [12] 代表性作品与技术应用 - 《隐世魔尊,开局天降女帝》剧中有95%以上的画面为AI技术生成 [13] - 《玄幻:从拉二胡开始》使用聚力维度自研的多模态3D视频大模型,AI演员生成技术等全方位赋能 [13] - 《35岁社畜默示求》由2人团队在40天内完成拍摄和后期,使用Kimi、GPT、Midjourney等多种AI工具 [13]
生成式AI,阿里云凭什么是亚太唯一领导者?
硬AI· 2025-11-24 17:45
Gartner报告核心发现 - 阿里云是唯一在Gartner《生成式AI技术创新指南》报告全部四个维度(云基础设施、模型工程、模型提供商、AI应用)均被列入领导者象限的亚太公司[2] - 阿里云与谷歌、OpenAI并列于全球前列,成为全球双核心玩家之一[2][17] 全栈能力具体表现 - **基础设施维度**:阿里云是唯一入选的亚太云厂商,与谷歌、微软、AWS同列领导者象限,其AI数据中心全面升级,HPN8.0实现十万卡级高稳定互联[3] - **模型工程维度**:阿里云在纵轴产品特征和横轴未来潜力上均领先三大国际云厂商,PAI平台与通义协同后,训练端到端加速比提升三倍,推理效率同步提升[3] - **模型本体维度**:阿里云位于领导者象限,指标领先AWS与微软,仅次于谷歌和OpenAI,通义模型覆盖从轻量到全尺寸并保持多模态迭代[4] - **知识管理与应用维度**:阿里云是唯一来自中国的领导者象限厂商,百炼平台过去一年模型调用量提升十五倍,使大模型在企业内部可视化落地[4] 市场地位与采用率 - 沙利文报告显示通义是中国企业采用最多的大模型[4] - Omdia指出财富中国500强企业中七成已部署GenAI,阿里云渗透率过半[4] - 在AI云市场,阿里云2025上半年份额达35.8%,超过第二到第四名总和[8] 全栈优势的竞争壁垒 - **协同优化复利效应**:通过“云+AI”全栈协同,Qwen3-Next推出后推理成本下降90%[7] - **紧耦合落地确定性**:企业需要稳定、便宜且能快速落地的全栈服务,而非单一模型[8] - **跨层能力强化**:阿里云已建立跨层互相强化的能力结构,整个技术栈没有明显短板[9] 全球竞争格局与路线 - 全球GenAI竞争形成两种路线:以模型为核心(如OpenAI)和以云为核心进行垂直整合[11] - 能够真正做到“云+模型+芯片”垂直整合的厂商全球仅剩谷歌与阿里两家[11][13] - 谷歌依托自研TPU和Gemini模型家族,阿里则以通义模型、自研芯片和百炼平台构建类似的三段式结构[11][13] - AWS和微软有云和芯片但缺少顶级自研模型,OpenAI只有模型而在成本控制上受制于云服务商[15]
钉钉用一张录音卡补齐阿里AI战略版图
硬AI· 2025-11-21 11:03
产品表现与市场定位 - 钉钉A1是一款银行卡大小、厚度仅3.8毫米的AI录音硬件,在双十一期间于电商平台长期霸榜,并成为天猫平台录音笔品类成交量TOP1,力压科大讯飞等老牌选手 [2] - 产品定价具备竞争力,旗舰版799元、青春版499元,将传统AI录音硬件动辄数千元的门槛拉平,上市备货规模超十万台,使其迅速进入市场第一梯队 [13][14] - 产品的热度不仅来自消费市场,其更大的增量来自更为深水的企业市场 [2] 产品核心价值与差异化 - A1定位为钉钉协同体系中的第一个硬件入口,其核心价值不在于单纯的录音功能,而在于实现从内容到协作的闭环 [11][12] - 与Plaud、TicNote等个人记录工具不同,A1能将语音在钉钉体系中直接转化为可执行的业务动作,如会议纪要自动同步到待办、日历、AI表格,并沉淀进企业知识库 [12] - 产品按企业级标准设计,具备统一设备管理、端到端加密、企业独立空间和IT管理员可控的数据流向等生态能力,是个人消费类设备无法比拟的 [12] - A1的价值是补上钉钉生态中高质量的实时数据入口,将高频但未被结构化的语音数据变为可搜索、可分析、可回溯的组织资产 [23] 钉钉的生态与硬件基因 - 钉钉是阿里巴巴集团内最具硬件基因的团队之一,自2017年即通过智能考勤机、视频会议终端探索软硬一体,奠定了用硬件延展协同能力的基本路线 [4][26] - 钉钉拥有中国最大的协同平台基础,覆盖2600万企业组织和7亿用户,这意味着任何入口级产品接入其生态后能迅速形成规模效应 [6][26] - A1是钉钉第一款同时面向C端与B端开放的设备,标志着其生态正从传统企业端延伸至更广泛的个体专业人士 [26] 在阿里巴巴AI战略中的角色 - A1承载着阿里巴巴AI战略的重要一环,旨在通过专用硬件将通义大模型等AI能力触达千行百业的个人与组织,契合阿里“AI普惠”的大战略布局 [7][30] - 产品让阿里的AI能力从云端真正抵达企业日常工作的“一线场景”,使语音这类最难沉淀的生产资料变成可检索、可执行的数字资产 [30][31] - A1验证了“云—端一体化”的AI生态范式,是钉钉形成覆盖人、事、流程的全链路智能系统的起点,预示着AI将在更多物理场景中成为企业智能化的基础设施 [33][34]
谷歌又来炸场!大热生图模型升级,Nano Banana Pro提供“摄影棚级别”精度和控制
硬AI· 2025-11-21 11:03
产品核心功能与性能提升 - 新模型Nano Banana Pro支持生成最高4K分辨率的图像,并在多语言环境下实现精确文本渲染 [2][3] - 模型提供专业级控制能力,用户可调整拍摄角度、景深、色彩、光照等参数,并能将场景从白天转换为夜晚 [2][12][13] - 在素材一致性方面,模型可保持最多五个角色和十四个物体的一致性 [2][3][18] - 模型支持1K、2K和4K三种分辨率的精准放大,并能随意切换纵横比 [16] 技术突破与专业应用 - 新模型攻克了AI图像生成中长期存在的文本渲染准确性难题,能更好地规划文本位置、字体特征及其空间关系 [6][7] - 该技术可将菜谱文本转换为图解流程图,或可视化天气、体育等实时信息,适用于制作信息图表、幻灯片设计 [7][3] - 模型能将草图转化为物体,将手绘笔记转为图表,将创意变成3D渲染建筑,并创建具有真实细节的逼真图像 [19] 商业化策略与市场推广 - 谷歌将新模型集成至Canva、Figma、Adobe Firefly和Photoshop等主流设计工具,以扩大其应用范围 [5] - Gemini App免费用户可在配额限制内使用新模型,付费AI计划订阅用户(如AI Plus、Pro和Ultra)则拥有更高使用额度 [5][21] - 公司同步推出AI内容溯源功能,用户可上传图像查询是否由谷歌AI生成,该功能未来将扩展至音频和视频 [5][22] 用户增长与市场竞争 - Gemini App目前每月活跃用户超过6.5亿,由Gemini驱动的AI Overviews每月用户达20亿 [24] - 相比之下,OpenAI的ChatGPT每周活跃用户达8亿,目前在苹果App Store免费应用榜单中排名第一,Gemini位居第二 [24] - 产品需求持续增长,许多用户注册Gemini订阅计划以获得高级模型的更高限额 [24]
鸿海与OpenAI合作,将共同设计数据中心的硬件
硬AI· 2025-11-21 11:03
合作公告 - 鸿海与OpenAI于11月21日宣布达成AI基础设施硬件合作伙伴关系,双方将共同设计、开发AI数据中心机架[2][3] - 鸿海计划在美国为AI数据中心设施生产布线、电源系统和其他关键设备,并致力于确保这些机架能够在美国各地生产[2][3] - 合作协议不含具体的采购承诺,为合作的最终规模留下不确定性[2][4] - OpenAI首席执行官表示此次合作旨在确保人工智能时代的核心技术在美国本土构建,以加强美国领导地位[3] OpenAI的基建投资计划 - OpenAI正与甲骨文公司和软银集团合作,计划在未来几年内向美国数据中心和AI基础设施投资5000亿美元[6] - 近几个月,OpenAI已与英伟达、超威半导体等芯片制造商及云计算提供商达成多项价值数十亿美元的交易,以扩大其数据中心规模[6] - OpenAI承诺在AI基础设施上投入1.4万亿美元,该巨额支出引发市场对其商业模式能否支撑庞大资本开支的疑问[8] 供应链控制战略 - OpenAI的系列举措显示其试图加强对AI供应链控制的战略意图,今年10月已宣布与博通公司达成协议采购定制芯片和网络组件[8] - 与鸿海在服务器硬件上的合作,进一步将这种控制力延伸到了基础设施层面[8] - 持续的巨额支出加剧了市场对人工智能领域泡沫风险的担忧[4][8]
谷歌Gemini 3模型获市场认可,Alphabet股价一度大涨超6%创新高
硬AI· 2025-11-20 09:53
Gemini 3 AI模型发布 - 谷歌正式发布最新AI模型Gemini 3,并在发布首日立即于谷歌搜索、Gemini应用程序App及多个开发者平台同步上线,在多个盈利产品中投入使用 [3] - Gemini 3是谷歌在约八个月前发布Gemini 2.5后推出的升级版本,能够为更复杂的问题提供更优质的答案,且无需过多提示即可判断用户请求背后的上下文和意图 [3] 模型性能与竞争力 - D.A. Davidson分析师称Gemini 3是真正强大的AI模型,在初步测试和AI基准评分中表现出色,足以与OpenAI和Anthropic发布的竞品展开竞争 [2][3] - 基于初步测试和基准评分,该模型实质性地推动了前沿技术的发展,在某些领域的能力远超通常对这一代前沿模型的预期 [4] - 美国银行证券分析师指出,Gemini 3代表谷歌在缩小与AI竞争对手之间"感知中的大语言模型性能差距"方面迈出的又一积极步伐 [2][7] 市场反应与股价表现 - Alphabet股价周三飙升5%,一度涨超6.6%创新高,随后涨幅收窄,截至发稿股价回落至293.76美元,涨幅逾3% [3][5] - 今年以来,Alphabet股价累计涨幅已超过55%,市场对其AI产品线的持续优化和竞争力提升反应积极 [10] 业务影响与采用情况 - AI Overviews和Gemini的健康采用指标表明,尽管竞争加剧,谷歌仍成功将用户引导至其AI界面,这有助于缓解对搜索业务可能受到冲击的担忧 [9] - 自OpenAI于2022年推出ChatGPT并引发生成式AI热潮以来,谷歌一直面临追赶压力 [8]
AMD、思科与沙特AI公司Humain建立合资企业,拟5年内建成1吉瓦数据中心
硬AI· 2025-11-20 09:53
合资公司成立与核心规划 - AMD、思科与沙特AI初创企业Humain周三宣布成立合资公司,计划2030年前在中东建设最高1吉瓦AI数据中心 [2][3] - 项目首期100兆瓦AI基础设施预计2026年动工,将包含Humain的现代数据中心能力、AMD Instinct™ MI450系列GPU以及思科的关键基础设施 [3][7] - 在合资公司中,AMD和思科均为少数股东,共享项目盈亏,Humain将作为主导方 [4] 客户签约与市场定位 - 合资公司已获得首位客户,生成式视频初创公司Luma AI已签署合同,将包下首期100兆瓦数据中心的全部算力容量 [2][3] - 合资公司瞄准的市场范围覆盖亚洲、欧洲、印度、中东和非洲,总人口规模约45亿 [6] - 思科将利用其销售团队和25年的激励机制设计经验,帮助销售这些尚未建成的数据中心的算力 [8] 技术合作与战略意义 - AMD将提供其Instinct™ MI450系列AI芯片,作为数据中心的核心计算能力 [3][7] - 合作被视为美国总统特朗普5月访问沙特后的一系列合作成果之一,并获得沙特主权财富基金的支持 [4] - AMD计划在沙特阿拉伯设立卓越中心,以加速本地的技术整合和创新 [5] - 项目将完全使用可再生能源,思科负责提供网络设备和其他关键基础设施 [7][9] 财务与合作协议背景 - 今年5月,AMD已与Humain达成一项价值100亿美元的合作,涉及购买AMD的先进AI芯片 [4] - 几家公司未披露合资项目的更多财务细节 [5] - 沙特因其拥有大量可用土地和低廉电力,正支持在全国建设大型数据中心的计划 [4]
英伟达上季营收加速增长62%,本季指引再超预期,黄仁勋称“Blackwell销量远超预期”
硬AI· 2025-11-20 09:53
核心财务表现 - 第三财季总营收达5701亿美元,同比增长62%,为两年来首次同比增速加快,超出分析师预期及公司指引[6][11] - 第三财季非GAAP调整后每股收益为130美元,同比增长60%,增速为本财年内最高[7][13] - 第三财季调整后毛利率为736%,略低于分析师预期的740%,但环比提升09个百分点[7][16] - 第四财季营收指引中值为6500亿美元,同比增长逾65%,超出分析师预期中值[10][14] - 第四财季毛利率指引中值为750%,预计为六个季度以来首次实现同比增长[10][16] 数据中心业务 - 第三财季数据中心营收达51215亿美元,创单季新高,同比增长66%,环比大增246%[8][12] - 数据中心营收占总营收比例近九成,其同比增速较前一季度提升10个百分点[8][11][12] - 公司CEO表示云端GPU已售罄,训练和推理的计算需求均呈指数级增长[2] 其他业务板块 - 游戏和AI PC业务第三财季营收43亿美元,同比增长30%,略低于分析师预期[8] - 专业可视化业务第三财季营收76亿美元,同比增长56%,超出分析师预期[8] - 汽车和机器人业务第三财季营收592亿美元,同比增长32%,略低于分析师预期[8] 管理层评论与前景 - CEO称公司已进入AI的良性循环,并反驳AI泡沫论[2] - CFO重申新一代芯片未来几个季度预计将带来5000亿美元收入,并称数据中心基础设施存在数万亿美元机遇[2][18][19] - CFO透露六年前发货的A100 GPU目前仍满负荷工作,新一代GB300芯片对营收贡献已超过前代产品GB200[2][21] - 针对中国市场的定制AI芯片H20第三财季销售额仅为05亿美元,公司正寻求出口更具竞争力产品的方法[21]
谷歌最强大AI模型来了!Gemini 3发布首日即投入搜索、App和开发者平台同步上线
硬AI· 2025-11-19 09:37
产品发布与战略意义 - 谷歌于美东时间18日正式发布其迄今最强大人工智能模型Gemini 3,并在发布首日立即整合至谷歌搜索、Gemini应用程序App及多个开发者平台,这是公司首次在新模型发布当天就将其应用于搜索产品,显示出加快AI技术商业化的决心 [1] - 此次发布正值微软Ignite大会召开之际,距离OpenAI发布GPT 5.1仅一周,距离Anthropic发布Sonnet 4.5仅两个月,凸显出前沿AI模型开发的激烈竞争态势 [3] - 谷歌CEO Sundar Pichai宣布正式开启Gemini时代,并计划很快发布Gemini 3系列的更多模型,以继续推动智能、智能体和个性化的前沿 [17] 模型性能与基准测试表现 - Gemini 3在全球AI模型LMArena排行榜上以1501分的历史最高分登顶,并在衡量通用推理能力的Humanity's Last Exam基准测试中获得37.5%的最高分,超越了GPT-5 Pro保持的31.64%纪录 [1] - 在多项学术基准测试中,Gemini 3展现出博士水平表现,具体包括:GPQA Diamond测试91.9%、MathArena Apex基准测试23.4%、SimpleQA Verified测试72.1%、MMMU-Pro测试81%、Video-MMMU测试87.6% [6][7] - 增强推理模式Gemini 3 Deep Think在Humanity's Last Exam测试中达到41.0%,在GPQA Diamond测试中获得93.8%,在ARC-AGI-2测试中创下45.1%的成绩 [7] 开发者工具与平台升级 - 谷歌推出以智能体为先的全新开发平台Google Antigravity,该平台利用Gemini 3的高级推理、工具使用和智能体编码能力,并集成Gemini 2.5 Computer Use模型和图像编辑模型Nano Banana [2][10][11] - 在代码生成领域,Gemini 3在WebDev Arena排行榜上以1487分登顶,在Terminal-Bench 2.0测试中获得54.2%的分数,在SWE-bench Verified基准测试中达到76.2% [10] - 开发者可通过Google AI Studio、Vertex AI、Gemini CLI以及Cursor、GitHub、JetBrains等第三方平台访问Gemini 3 [10] 多模态理解与智能体能力 - Gemini 3能够无缝处理文本、图像、视频、音频和代码等多种模态信息,并配备100万token的上下文窗口,被公司称为"世界上最好的多模态理解模型" [2][3][13] - 在智能体能力方面,Gemini 3在测试长期规划能力的Vending-Bench 2排行榜上位居榜首,在模拟运营中实现平均净收益$5,478.16,远超其他对比模型 [7][13] - 该模型能够结合更深入的推理与改进的工具使用,代表用户导航复杂的多步骤工作流程,如破译翻译手写食谱、分析运动视频生成训练计划等 [13] 产品整合与用户基础 - Gemini应用程序App的每月活跃用户已超过6.5亿,AI Overview功能每月服务20亿用户,超过70%的谷歌云客户正在使用其AI产品,1300万开发者已基于谷歌生成式模型进行开发 [4] - 在搜索方面,AI Mode现在使用Gemini 3实现新的生成式用户界面体验,包括沉浸式视觉布局和交互式工具 [16] - 对于企业用户,Gemini 3已在Vertex AI和Gemini Enterprise中推出,Google AI Ultra订阅用户可率先在Gemini App中体验智能体功能 [14][16][17]
Gemini 3的意义:AI已超越“幻觉阶段”,逼近人类,“人机协作”将从“人对AI纠错”走向“人指导AI工作”
硬AI· 2025-11-19 09:37
Gemini 3 模型发布与行业意义 - 谷歌正式发布其迄今最强大人工智能模型Gemini 3,并于发布首日立即在谷歌搜索、Gemini应用程序App及多个开发者平台同步上线,在多个盈利产品中投入使用 [1] - 谷歌高管强调,在衡量人工智能模型性能的几个热门行业排行榜上,Gemini 3处于领先地位,被称为"世界上最好的多模态理解模型"和公司迄今最强大的智能体和代码生成模型 [1] AI能力的范式转变:从聊天到代理 - 与三年前的GPT-3模型相比,AI能力发生了从"描述"到"行动"的飞跃,不再仅仅是生成文本,而是能够编写代码、构建可交互的应用、执行多步骤任务 [3][6] - 行业正从"聊天机器人时代"迈向"数字同事时代",AI正从一个对话伙伴演变为一个可以接入计算机并完成实际工作的通用工具 [3][28] - 三年前AI只能描述引擎,2025年AI能把引擎写出来、把界面画出来,并制作可交互的迷你游戏,展示了能力的巨大进步 [5][6][8] 代码能力作为通用工具的核心 - Gemini 3极擅长写代码,其本质不仅是"当程序员",而是"能完成任何在电脑上才能完成的活儿",包括建仪表盘、扒网站、做PPT、读文件等 [9] - 伴随Gemini 3发布的Antigravity工具将"会写代码的智能体"产品化,允许用户通过英语指令派发任务,智能体用代码代为完成,并会在需要时请求批准或帮助 [8][9][11] 高级认知与判断力的展现 - Gemini 3展现了真正的"判断力",能够自主处理复杂的研究任务,例如恢复损坏的STATA数据文件,并执行从选题、提出假设、跑统计、出图表到排版成文的完整学术论文写作流程 [16][17][18] - 模型甚至能够自创研究指标,例如用NLP技术衡量"众筹创意独特性",并自行编写代码验证结果 [21] - 其错误类型已从无中生有的"幻觉"转变为更接近人类在判断或意图理解上的偏差,更像"人类同事会有的判断偏差或误解" [14][25] 人机协作模式的进化 - 人机协作正从"人类修复AI的错误"进化为"人类指导AI的工作",人类角色转变为提供高阶的战略指引和方向 [2][29] - 与AI的互动感觉更像是管理一位队友,因为AI会定期检查并确认其工作,操作过程清晰可见,人类能够掌控其决策 [14] - 这种"人在回路"从"人替AI擦屁股"到"人指导AI干活"的演变,被认为是自ChatGPT发布以来AI领域最大的范式迁移 [29]