Artificial Intelligence
搜索文档
谷歌发布最强AI大模型Gemini 3!硬刚OpenAI和马斯克的XAI,商业化底牌藏不住了?
搜狐财经· 2025-11-19 12:39
文章核心观点 - 谷歌发布最强AI大模型Gemini 3,标志着AI行业竞争从技术跑分进入商业化落地阶段,谷歌凭借其全栈布局、生态协同和盈利验证优势,在竞争中占据有利位置 [1][11] Gemini 3 模型性能与功能 - Gemini 3在LMArena排行榜获得1501分,位列全球第一 [3] - 在GPQA钻石级测试中深度思考模式得分达93.8%,能独立解决41%的复杂难题,性能比前代提升10倍 [3] - 生成式UI功能强大,可依据指令生成可交互的3D分子模型等工具 [3] - 新推出的Antigravity平台可实现从代码到设计的APP开发一键搞定 [3] - Gemini APP月活跃用户达到6.5亿,开发者数量突破1300万 [3] AI行业竞争格局 - 行业形成谷歌、OpenAI(微软扶持)、马斯克XAI的“三国杀”格局 [5] - 谷歌定位全能型选手,注重企业服务与生态协同,谷歌云积压订单达1550亿美元 [5] - OpenAI为流量王者,ChatGPT月活超8亿但付费率仅5%,依靠与AWS的380亿美元合作补充算力,急于推动产品变现 [5] - 马斯克XAI定位技术极客,专注于前沿研究,商业化进程相对缓慢 [5] 谷歌的商业化优势 - 具备全栈布局能力,从自研TPU芯片、自建云服务器到开发AI应用全流程覆盖,谷歌云利润率已达23.7% [7] - 生态协同效应显著,Gemini为搜索、广告业务赋能,AI驱动的搜索广告AI Max解锁单季度数十亿新查询,YouTube的AI广告功能使转化价值提升40% [8] - 盈利已获验证,2025年第三季度谷歌营收突破千亿美元,净利润大幅增长33%,AI成为核心增长引擎 [9] 行业未来趋势 - 未来1-2年,大模型将深度绑定医疗、零售等具体行业 [11] - 算力与生态的重要性将愈发凸显,小型公司弯道超车难度加大 [11] - 行业竞争核心将从技术跑分转向商业化落地和盈利能力 [11]
Musk’s xAI in advanced talks to raise $15 billion at $230 billion valuation, WSJ reports
Yahoo Finance· 2025-11-19 12:17
(Reuters) -Elon Musk’s artificial-intelligence startup xAI (XAAI.PVT) is in advanced talks to raise $15 billion in fresh equity at a valuation of $230 billion, the Wall Street Journal reported on Tuesday. The fundraising terms were outlined to investors by Musk’s wealth manager, Jared Birchall, on Tuesday night, the report said. It was not clear whether the valuation figure Birchall shared was pre- or post-money, the paper added. Reuters could not immediately verify the report. Jared Birchall could n ...
谷歌发布 Gemini 3 并上线Antigravity平台,与 OpenAI 的竞争愈演愈烈
环球网资讯· 2025-11-19 11:54
新产品发布 - 谷歌正式发布新一代大模型Gemini 3以及面向开发者的新平台Google Antigravity [1] - Gemini 3在理解复杂语境、代码生成、图像交互及企业级任务处理能力上全面强化 [2] - Google Antigravity平台主打高阶任务导向编程体验,支持开发者用自然语言快速生成多步骤应用 [2] 产品性能与优势 - 用户可“用更少提示获得更精准答案”,在回答复杂问题时显著降低提示门槛 [2] - 模型被描述为能洞察场景、理解深层含义 [2] - Google Antigravity被谷歌实验室副总裁称作“迄今为止最好的Vibe编码模型” [2] 产品部署与覆盖 - Gemini 3即日起向订阅用户分批推送,数周内覆盖Gemini应用、AI Mode搜索、AI Overviews以及Vertex AI等全线产品 [2] - 未来几周将通过Vertex AI向企业客户全面开放Gemini 3 API [3] - Gemini应用月活已达6.5亿,AI Overviews月活高达20亿,为新模型提供即时流量入口 [2] 企业级应用场景 - 在企业场景中,Gemini 3可自动构建交互式贷款计算器、物理模拟器、员工入职培训等多模态界面 [2] - 模型强化对工厂视频与图像的精准分析,以加速采购、质检等流程落地 [2] 行业竞争与公司战略 - Gemini 3的推出距离上一代Gemini 2.5仅8个月,迭代节奏明显加快 [3] - 谷歌坐拥自研芯片、搜索入口与数十亿终端用户,为其对抗已发布GPT-5的OpenAI提供差异化竞争筹码 [3] - 公司将持续扩容算力,以应对年底购物季和云端业务增长带来的推理高峰 [3]
叫停50州“各自为战”,特朗普急推这一标准:怕中国赶超
观察者网· 2025-11-19 11:28
【文/观察者网 张菁娟】全球人工智能正进入竞速与规制并行的关键阶段,面对美国各州层出不穷的AI 新规,美国总统特朗普急了。 当地时间11月18日,特朗普在其自创的社交平台"Truth Social"(真实社交)发文呼吁制定AI监管的联邦 标准,称若不尽快行动,中国将"轻松赶超"。 他表示,美国必须有一个监管人工智能的联邦标准。如果美国每个州都提出自己的标准,这项技术就有 可能被过度监管。 "各州的过度监管正威胁着这一增长引擎。部分州甚至试图将'多样性、公平性和包容性'(DEI)意识形 态嵌入人工智能模型,催生出所谓'觉醒AI'。(还记得'黑人乔治・华盛顿'吗?)"特朗普写道。 去年,谷歌聊天机器人Gemini生成的一张图片中,美国"国父"乔治·华盛顿变成了黑人形象,带着白色 假发,身着陆军制服。包括马斯克在内的一些用户认为其图像生成功能被"觉醒病毒"污染了。 特朗普强调,"我们必须有一个联邦标准,而不是由50个州的监管制度拼凑而成。"他声称,"如果我们 不这样做,中国将轻松在人工智能竞赛中赶超我们"。 美国全国州议会会议(NCSL)2025年中期报告显示,全美50个州及领地共提出逾260项AI相关法案, 其中 ...
Google DeepMind to open new AI research lab in Singapore
Reuters· 2025-11-19 10:50
Google DeepMind said on Wednesday it is opening a new artificial intelligence research lab in Singapore that will focus on collaboration with governments, businesses, and academic institutions across ... ...
“AI闭环”扩大:英伟达、微软联手150亿美元投资Anthropic,“OpenAI对手”的估值已达3500亿美元
华尔街见闻· 2025-11-19 10:28
这笔交易使Anthropic估值飙升至3500亿美元,或也标志着AI领域"闭环"投资的进一步扩大。在这个闭环中,芯片巨头(英伟达)和云服务商(微软)投资模型 开发商(Anthropic),模型开发商则用获得的资金购买前两者的芯片和算力,资本在系统内循环。 英伟达首次深度合作Anthropic 这是英伟达与Anthropic首次建立深度技术合作伙伴关系 ,旨在支持Anthropic的未来发展。 英伟达表示,双方将在设计和工程方面展开合作,目标是优化Anthropic的现有产品,以实现最佳性能、效率和总体拥有成本 (TCO),并优化未来英伟达架构以 适应Anthropic的工作负载。 Anthropic初期将获得高达1吉瓦的算力,采用 NVIDIA Grace Blackwell 和 Vera Rubin 系统。 根据详细的协议,Anthropic承诺从微软购买价值300亿美元的Azure计算能力,这些算力将完全基于英伟达的AI系统,包括其当前最先进的Grace Blackwell架 构和将于明年发布的Vera Rubin架构。 周二,科技巨头微软、英伟达与人工智能初创公司Anthropic宣布建立一项新的战略合 ...
Gemini 3的意义:AI已超越“幻觉阶段”,逼近人类,“人机协作”将从“人对AI纠错”走向“人指导AI工作”
华尔街见闻· 2025-11-19 10:28
产品发布与定位 - 谷歌正式发布迄今最强大人工智能模型Gemini 3,并于发布首日立即在谷歌搜索、Gemini应用程序App及多个开发者平台同步上线,在多个盈利产品中投入使用[1] - 公司高管强调,在衡量人工智能模型性能的几个热门行业排行榜上,Gemini 3处于领先地位[2] - 谷歌AI研究实验室DeepMind的CEO表示,Gemini 3是"世界上最好的多模态理解模型",也是公司迄今最强大的智能体和代码生成模型[3] 性能突破与能力演进 - 与三年前的GPT-3模型相比,AI不再仅仅是生成文本,而是能够编写代码、构建可交互的应用、执行多步骤任务,展示了从"描述"到"行动"的飞跃[3][4] - 模型能够根据简单指令创建一个可交互的"糖果动力超光速飞船模拟器"迷你游戏,体现了从只能描述引擎到能把引擎写出来、把界面画出来的进步[6][7][8] - 模型所犯的错误已不再是无中生有的"幻觉",而更接近人类在判断或意图理解上的偏差,表明行业已越过"幻觉"阶段,进入更微妙、更"人类"的缺陷区[4][25] 智能体工具与产品化 - 伴随Gemini 3,谷歌发布了Antigravity工具,其本质是"会写代码的智能体",能获得电脑权限,在指导下自主写程序,将"能完成任何在电脑上才能完成的活儿"这一理念产品化[11] - 工具允许用户用自然语言(如英语)分派任务,智能体用代码替用户干活,擅长做计划,知道该干什么、何时请示,用户感觉更像管理一位队友[11][12][17] - 智能体能够执行复杂任务,例如读完所有文件、跑代码、搜索网页、建站、接管浏览器验效果,再把成品打包,并可根据用户意见进行迭代修改[12][14] 高级认知与判断力 - 模型展现了真正的"判断力",能够自主处理复杂研究任务,例如恢复损坏的STATA格式数据文件,并摸透复杂数据结构[18] - 在接到"写一篇原创论文"的典型博士级任务时,模型能够自己选题、提假设、跑统计、出图表、排版成文,并自创指标(如用NLP衡量"众筹创意独特性"),最终生成14页论文[19][21][22][23] - 其表现类似于一个合格的研究生,统计方法虽有瑕疵、理论跳跃过大,但可通过开放建议(如"再多补文献以确立方法")显著提升[25] 行业范式迁移 - 行业正从"聊天机器人时代"迈向"数字同事时代",AI正从一个对话伙伴演变为一个可以接入计算机并完成实际工作的通用工具[4][28] - "人在回路"的模式正从"人替AI擦屁股"演变为"人指导AI干活",人类所做的将不再是修正AI的低级错误,而是为其提供高阶的战略指引和方向,这被认为是自ChatGPT发布以来AI领域发生的最大变革[4][28] - 三年前,行业为"机器能写水獭诗"而惊叹,不到1000天后,用户已在跟一个自建研究环境的智能体辩论统计方法,表明AI演进速度并未放缓[27]
AI初创公司Anthropic CEO警告:AI将“消灭”半数白领初阶职务,失业率恐飙至20%!点名三大高风险职业
搜狐财经· 2025-11-19 10:24
格隆汇11月19日|AI初创公司Anthropic首席执行官Dario Amodei再次警告,生成式AI的快速进展可能在 未来五年内"消灭"一半的白领初阶职务,使失业率飙升至10%-20%。他点名三大高风险职业──初阶顾 问、实习律师、新进金融分析师。AI系统已经能接手这些新进通常负责的核心工作,包括撰写文件与 进行分析。Amodei谈到,他的担忧源自于观察到Claude已具备处理复杂的端到端工作能力,包含进阶 客服、撰写技术内容、分析医学论文,甚至撰写Anthropic内部近90%的源代码。 【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不 对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担 全部责任。邮箱:news_center@staff.hexun.com ...
谷歌发布Gemini 3,微软、英伟达与Anthropic建立战略合作伙伴关系,人工智能ETF(159819)备受关注
新浪财经· 2025-11-19 10:16
行业核心事件 - 谷歌推出Gemini 3模型,在几乎所有评测指标上取得领先,多模态、推理增强及编程领先优势显著,部分指标较GPT-5.1和Sonnet4.5等模型大幅领先 [1] - 微软、英伟达与Anthropic建立战略合作,Anthropic承诺购买300亿美元Azure计算容量,微软将投资50亿美元并持续在Copilot中接入Claude模型,英伟达则投资100亿美元并与Anthropic建立深度技术合作 [1] 行业影响与催化 - 谷歌Gemini 3模型复杂度提升可能推高AI训练和推理的算力需求,强化海外算力基础设施的扩容预期 [2] - 微软和英伟达对Anthropic的投资及大规模算力采购,可能进一步放大全球高端算力的需求缺口 [2] - A股市场布局海外算力配套的标的或有望承接订单弹性,享受行业需求景气上行带来的发展红利,具备业绩释放潜力 [2] 相关投资产品 - 人工智能ETF(159819)及其联接基金(012733/012734)跟踪中证人工智能主题指数 [3] - 中证人工智能主题指数选取50只为人工智能提供基础资源、技术及应用支持的上市公司证券,其第一、第二大权重股为典型的海外算力相关标的 [3] - 截至11月19日,人工智能ETF(159819)规模达到230.19亿元,具备充足流动性 [3]
ConsistEdit来了:无需训练,实现高精度、高一致性的视觉编辑新范式
机器之心· 2025-11-19 10:09
研究背景与核心痛点 - 无需额外训练即可适配预训练生成模型的编辑方法已成为研究热点,其通过操控Attention机制实现文本引导编辑,但存在两大核心痛点[5] - 痛点一:编辑强度与源图一致性难以兼顾,增强编辑强度易破坏源图特征结构(如改衣服颜色时丢失褶皱细节),且非编辑区域会出现意外变化,此问题在多轮编辑或视频编辑场景中会累积放大[5] - 痛点二:编辑强度缺乏细粒度控制能力,多数方法对编辑强度的控制局限于全局一致性,无法实现“保结构改纹理”或“保纹理改结构”的精准调节[5] - 生成模型架构正从U-Net向Multi-Modal Diffusion Transformer升级,MM-DiT通过统一的Self-Attention同时处理文本与视觉信息,为解决上述困境提供了新可能[7] 核心技术创新与发现 - 针对MM-DiT架构的Attention计算提炼出三个核心发现:仅编辑“视觉Token”是关键,若修改“文本Token”会导致结果失真[9] - 发现MM-DiT所有层的Q/K/V Token都保留完整的结构与纹理信息,意味着编辑可覆盖所有Attention层,而非仅作用于最后几层[11] - 发现Q/K Token主导结构一致性,单独对Q/K的视觉Token进行控制可精准保留源图像结构,而V的视觉Token则主要影响内容纹理,为结构与纹理的解耦控制提供了技术依据[15] ConsistEdit方法设计 - 提出视觉仅注意力控制,仅对所有Attention层的视觉Token进行编辑,文本Token保持不变,以实现强一致性的稳定生成[19] - 采用掩码引导的Attention融合,在Attention计算前通过文字和视觉Token的Attention Map值生成编辑掩码,精确分离编辑区与非编辑区[20] - 实现Q/K/V差异化操控,提出“一致性强度”以控制结构一致性,通过动态调整Q/K融合比例,实现从“完全保结构”到“自由改结构”的平滑过渡[21] 实验验证与应用前景 - 在PIE-Bench数据集上的对比实验显示,该方法在图像和视频编辑任务中均优于UniEdit-Flow、DiTCtrl、FireFlow等5种主流方法[22] - 方法支持真实图片的多轮编辑和多区域精准编辑,得益于精确的Attention控制与强大的预训练模型支撑[26][27] - ConsistEdit具有高度泛化性,不仅支持Stable Diffusion 3,还可无缝适配FLUX.1-dev、CogVideoX-2B等MM-DiT类模型[31][33] - 高一致性和细粒度控制特性使其可广泛应用于从静态图片到动态视频的全场景视觉创作,为交互式创作提供了更多可能性[34]