Workflow
氛围编程
icon
搜索文档
谷歌Gemini 3来了
财联社· 2025-11-19 08:44
以下文章来源于科创板日报 ,作者牛占林 专注科创板和科技创新,上海报业集团主管主办,界面财联社出品。 当地时间周二,Alphabet旗下的谷歌宣布发布其最新的人工智能(AI)模型Gemini 3,在与OpenAI等公司的竞赛中加快追赶步伐。受此消息 影响,谷歌A盘中股价爆拉3%。 Alphabet首席执行官桑达尔·皮查伊当天表示,新AI模型将针对更复杂的问题提供更优答案。"用户只需更少的提示,即可获得所需结 果。"此外,新模型在编程、应用开发与图像生成方面的能力也大幅增强。 Gemini 3将被整合进Gemini应用、谷歌的AI搜索产品AI Mode和AI Overviews,以及其企业级产品。该模型将自周二起向部分订阅用户开 放,并将在未来几周更大范围上线。 此次发布距离谷歌推出Gemini 2.5仅八个月,距离Gemini 2.0上线也仅11个月。引爆生成式AI热潮的OpenAI已于今年8月份发布GPT-5。 皮查伊写道:"令人惊叹的是,仅仅两年时间,AI已从单纯处理文本和图像,发展到能够读懂场景。从今天起,Gemini将在谷歌全系产品中 全面铺开。" 据谷歌披露数据显示,Gemini应用目前月活跃用户已 ...
Gemini 3.0发布:从“工具辅助”到“主动代理”,谷歌做了这几点
钛媒体APP· 2025-11-19 08:32
据悉,Gemini 3将被整合进Gemini应用、谷歌的AI搜索产品AI Mode和AI Overviews,以及其企业级产 品。该模型将自周二起向部分订阅用户开放,并将在未来几周更大范围上线。 在2025年11月的财报电话会议上,谷歌CEO桑达尔・皮查伊就已确认Gemini 3的发布计划,他当时强 调:"前沿模型的进一步发展需要更多时间,我们既要追求迭代速度,更要确保显著的能力突破"。这 种"慢工出细活"的策略,在Gemini 3的产品形态中得到充分体现——它不是对2.5 Pro的简单微调,而是 从架构、能力到生态的全面重构。 推理是AI解决复杂问题的核心,Gemini 3在这一领域实现了双重突破:基础性能的全面提升与推理模式 的产品化创新。在基础推理能力上,Gemini 3 Pro在多个权威基准测试中创下新高:GPQA Diamond (研究生级推理)测试准确率达91.9%,Humanity's Last Exam(多步逻辑推理)无工具状态下得分 37.5%,SimpleQA Verified(事实准确性)以72.1%的分数领跑业界。 这些数据意味着模型在科学研究、专业咨询等需要深度思考的场景中,可靠性达 ...
谷歌Gemini 3夜袭全球,暴击GPT-5.1,奥特曼罕见祝贺
36氪· 2025-11-19 08:07
产品发布核心 - 谷歌正式发布新一代旗舰人工智能模型Gemini 3 Pro,该模型被定位为“史上最强推理+多模态+氛围编程”三合一的AI模型 [1] - 此次发布标志着公司在通往AGI的道路上迈出重要一步,被视为开启了AI的下一个时代 [3][9] - 发布获得了行业高度关注,包括OpenAI CEO在内的业界人士表达了祝贺 [1] 核心性能优势 - 在多项关键基准测试中,Gemini 3 Pro性能相较于前代Gemini 2.5 Pro实现全方位跃升,并在多项测试中超越竞争对手包括GPT-5.1和Claude Sonnet 4.5 [3][4][18] - 模型在LMArena排行榜上以1501 Elo分数名列榜首,在WebDev Arena排行榜上以1487 Elo分数登顶,展示了顶尖的推理和编码能力 [5][6][31] - 其核心优势体现在博士级推理能力,在Humanity‘s Last Exam测试中取得37.5%(无工具)和45.8%(使用搜索和代码执行)的成绩,在GPQA Diamond测试中取得91.9%的成绩 [4][17] 多模态与复杂任务处理能力 - 模型具备世界领先的多模态理解力,能处理文本、图像、视频、音频、代码等多种信息形态,在MMMU-Pro测试中获81.0%高分,在Video-MMMU测试中获87.6%高分 [4][19][28] - 在长程规划和智能体任务方面表现卓越,在Vending-Bench 2测试中以平均净值$5,478.16的成绩大幅领先于其他模型,展示了出色的长期规划能力 [4][38][40] - 模型具备100万token的上下文长度,能够帮助用户以个性化方式进行学习,例如破译手写食谱、分析教学视频并生成训练计划等 [28][30] 编程与开发能力 - Gemini 3在“氛围编程”和智能体编码方面实现突破,能够根据简单提示生成美观灵动的应用和复杂的Web UI [14][31][34] - 在编码基准测试中表现强劲,在LiveCodeBench Pro测试中获得2,439 Elo评分,在SWE-Bench Verified测试中取得76.2%的成绩 [4][32] - 公司同步推出革命性智能体开发平台Google Antigravity,该平台与Gemini 3紧密集成,允许开发者以任务为维度与智能体协同,实现端到端的软件任务开发 [42][45][47] 市场应用与生态整合 - 即日起,Gemini 3 Pro预览版全面上线,而更高级的Deep Think模式将稍后向Google AI Ultra订阅用户开放 [11][41] - 模型的API定价针对不同上下文长度设定,对于不超过20万token的请求,输入价格为每百万tokens $2.00,输出价格为每百万tokens $12.00 [24] - 模型已接入Google AI Studio、Vertex AI等多个开发平台,并与Cursor、GitHub、JetBrains等第三方平台集成,供全球开发者使用 [36] 技术实现与行业影响 - Gemini 3完全在谷歌自研的TPU上完成训练,这被视为公司重要的技术护城河 [54] - 早期实测演示显示模型能力强大,可一次性生成复杂的3D乐高编辑器、重现经典iOS游戏甚至构建Game Boy模拟器,展示了其在游戏开发和复杂应用构建上的潜力 [48][49][52] - 模型的发布在行业内引发广泛关注和讨论,一系列实测Demo展示了其在实际应用中的卓越表现 [48][52]
00后MIT辍学生,两年干出2000亿神话,英伟达谷歌抢投
36氪· 2025-11-14 15:14
公司融资与估值 - 完成23亿美元D轮融资,由Accel和Coatue共同领投,英伟达、谷歌、Thrive Capital、DST Global加码[1] - 公司估值达到239亿美元,是今年1月估值的12倍[2] - 2025年至今已完成三轮融资[2] 财务业绩与增长 - 公司年度经常性收入(ARR)已超过10亿美元,是有史以来达到10亿美元ARR速度最快的公司[3] - 年度经常性收入在12个月内从100万美元飙升至1亿美元[21] 产品与技术 - Cursor是基于Visual Studio Code编辑器打造的AI编程助手,可主动提供代码建议并作为代码问答助手[15] - 产品支持自家模型以及OpenAI、Anthropic、谷歌、xAI等全球顶尖大模型[15] - Cursor内部生成的代码量几乎超过全球所有其他大型语言模型(LLM)的总和[17] - 发布Cursor 2.0重大版本更新,带来首个编码模型Composer,可在30秒内完成一个任务[7][10] 市场采用与影响力 - 全球有5万个团队的开发者使用Cursor,客户包括OpenAI、英伟达、Spotify、Uber及美国职业棒球大联盟(MLB)等[13] - 英伟达CEO表示公司每一位工程师都在使用Cursor,生产力大幅提升[13] - 芝加哥大学研究表明,采用Cursor后,企业每周合并的拉取请求(PR)数量提升约40%[11] 创始团队与股权 - 四名联合创始人(Michael Truell, Aman Sanger, Sualeh Asif, Arvid Lunnemark)均为二十多岁的MIT本科辍学生[5][19] - 四位创始人各持有公司4.5%股份,每人股份价值至少13亿美元[21] - 团队规模从最初几人扩展至300多人[5] 公司历史与发展 - Cursor孵化于应用研究实验室Anysphere,成立于2022年[8] - 公司从硅谷知名风险投资公司累计融资3.38亿美元[21] - OpenAI曾一度想要收购Cursor但未成功[18]
综述连arXiv都不给发了?最严新规出台:被会议、期刊接收才行,workshop都不行
机器之心· 2025-11-02 11:10
新规核心内容 - arXiv计算机科学分类下所有综述性文章和立场论文投稿必须先被正式期刊或会议接受并完成同行评审[1] - 作者投稿时需提供文章已被接收并完成同行评审的证据如期刊参考文献和DOI元数据否则文章可能被拒绝发布[3] - 接收条件必须是期刊或会议workshop的评审因通常达不到传统同行评审的严谨标准而不被认可[5] - 科学技术对社会影响的科学论文如csCY或physicssocph分类下的文章不受此新规限制[5] 新规出台背景 - 新规实施是由于arXiv计算机科学领域收到的综述文章和立场论文数量过多难以管理[3] - 过去此类文章量少质高审核员裁量后大多接收但对科学界很有吸引力[3] - 目前很多人使用AI生成论文试图发布到arXiv上导致此类论文数量激增每月有几百篇且大多质量较差在计算机科学领域尤其明显[3] - AI生成论文的泛滥牵制了志愿者版主团队的大量精力[3] 社区反应与潜在影响 - 新规在社区内引发热议很多人担心这会削弱arXiv在即时发布方面的作用[5] - 计算机科学尤其是人工智能领域发展迅速等待通过同行评审后一篇综述或立场论文可能已失去阅读价值[5] - 以氛围编程为例6个月前还不存在的方向需等待36个月走期刊会议流程才能挂arXiv这会卡死最前沿最时效的综述[6] - 研究者普遍认为新规过于严格希望保留看到各种综述的渠道无论是单独开辟板块还是探索新审核方法[7] 相关讨论与替代方案 - 有研究者认为任何有鉴别力的研究者不会照单全收内容拥有自己的筛选方法新规扼杀了看到内容的可能性[9] - 从源头分析AI论文泛滥原因在于奖励机制鼓励写更多论文导致所有人朝此方向发力低质论文自然增多不能归咎于AI[10] - 有人提议建立信任系统任何人都能给文章背书读者自行挑选信得过的背书人但该方法可行性仍有待讨论[12]
“氛围工作”时代来临:从微软到OpenAI,白领职场掀起感觉革命
36氪· 2025-10-22 12:10
文章核心观点 - 生成式AI驱动的“氛围工作”理念正在全球职场办公领域引发变革,重新定义白领工作方式,其核心是利用AI处理重复耗时环节,追求流动、即兴的工作状态 [1][3] - 该变革从编程领域(氛围编程)兴起,并迅速向营销、内容创作、文档处理等更广泛的商业领域蔓延,科技巨头是主要推动者 [2] - 尽管理念受追捧,但“氛围工作”并未改变劳动本质,对员工的专业知识、战略思考及企业的系统培训提出了更高要求,同时潜藏弱化专业技能价值、导致工作流程混乱的风险 [5][6][7] 行业趋势与变革 - 生成式AI的编码能力颠覆传统软件开发,催生“氛围编程”新概念,企业争相招募掌握此项能力的人才 [2] - 科技巨头高管积极为新模式站台:谷歌CEO演示氛围编程制作网页,Meta CEO预言AI将接管中级工程任务,Klarna CEO借助其转型为业余程序员 [2] - 变革从技术领域向整个商业世界蔓延,先锋企业设置“氛围增长经理”等新职位,运用AI快速构建验证营销方案 [2] - 微软推出“氛围工作”解决方案,将智能工具嵌入Office套件,使员工通过自然对话生成复杂报表和专业文档 [2] - 更广泛的“氛围化”生态正在形成,基于AI生成与简单编辑的全新内容经济兴起,如AI视频应用Mea的“氛围”内容流和OpenAI Sora平台催生的“氛围创作者” [2] 工作理念与组织实践 - “氛围工作”理念将许多白领岗位职责重新定义为“营造工作氛围”,本质是利用AI处理重复耗时环节,传递流动、即兴、轻松的新型工作哲学 [3] - “氛围”一词源自Z世代对北欧“hygge”生活理念的现代化诠释,已渗透进企业管理词汇体系 [3] - 具体组织实践包括经理定期进行“氛围检查”评估团队状态,企业试水“首席氛围官”岗位,如Smirnoff邀请明星担任,Atlassian推行轮值制度 [3] - 企业试图以更温和的“氛围”理念重塑职场形象,打造更宽松的工作环境,应对员工与企业文化日渐疏离的现状 [5][6] 挑战与潜在风险 - 与AI高效协作需要持续实验精神和扎实专业知识,工作本质未变,认为依靠“氛围”就能轻松工作无需投入的想法有失偏颇 [5][6] - 若管理层仅为标榜“拥抱AI”或追逐潮流,模糊表述与盲目试验可能带来团队认知与工作流程混乱 [6] - 将工作简单定义为“营造氛围”可能弱化专业知识价值,若企业低估与AI协作的价值而依赖员工专业技能,矛盾可能演变为新型职场剥削 [6] - 过度依赖AI已显现弊端,员工不经深入思考滥用生成式AI会产生大量“工作糟粕”,如外表精美内容空泛的报告或结构严谨缺乏洞见的方案 [7] - “氛围工作”概念具有开放性,难以对这些新兴工作模式的产出进行标准化评估 [7] 人才需求与培训现状 - 掌握AI技能已成为职场新门槛,企业迫切渴求具备AI应用能力的人才,以实现成本优化和生产力提升 [7] - 微软2024年度工作报告揭示,71%的企业领导者更倾向录用经验尚浅但熟悉AI的求职者,而非经验丰富却不了解AI的人 [7] - 三分之二的雇主明确表示不会考虑聘用缺乏AI知识的应聘者 [7] - 企业AI人才需求与实际培训投入存在显著断层,“就业未来”组织调研显示,仅不足三分之一的在职人员接受过公司提供的AI技能培训 [7] - AI技能学习呈现由下而上的自发趋势,员工通过非正式渠道探索实践,而非依赖企业自上而下的系统培训 [7]
2026AI Agent六大趋势,编程热潮后谁是下一个风口?
36氪· 2025-10-22 08:02
AI Agent行业发展势头 - AI Agent在短短2年内已从实验品转变为企业的优先事项,财报电话会议提及Agent的次数自2023年以来增加10倍[4] - 2025年按投融资交易数量排名前10的科技细分赛道中,有5个与AI Agent直接相关,占最火爆投融资热点的一半[4] - 每5家新晋独角兽公司中就有1家将Agent技术作为核心产品[4] AI Agent技术演进路径 - 2025年AI Agent在受限环境中运行,利用结构化工作流和"护栏"完成特定目标[5] - 2026年后AI Agent将发展为完全自主代理,在没有人为干预的情况下运行,具有更复杂的决策和任务执行能力[6] - 技术演进从聊天机器人(2025年前)逐步发展为助手/Copilot(2025年)、带护栏的智能体(2025年)和完全自主智能体(2026年后)[7] 2026年AI Agent六大趋势预测 - 语音AI加速崛起,企业正布局通过对话而非文本界面与AI互动的未来[10] - AI并购潮席卷智能体领域,2025年第一季度AI智能体解决方案引领顶级AI退出交易,目前已发生35笔以上收购[11] - 利润压力蔓延,推理模型将输出Token数量增加约20倍,导致计算成本显著增加[12] - 智能体式商业模式基础巩固,Stripe在2025年9月宣布推出代理式支付API,与OpenAI共同推出代理式商业协议[13] - 数据护城河之战重塑企业软件,Salesforce为Slack API设置新速率限制,Snowflake发起联盟制定标准化数据格式[14] - 智能体监控工具成为必需品,2025年AI智能体可观测性、评估和治理市场发生7笔早期交易,总融资额3090万美元[15] AI Agent企业营收表现 - 2025年收入最高的20家Agent初创公司中,有一半3年前都不存在,包括Cursor(收入5亿美元,2022年成立)、Lovable和Mercor(收入均达1亿美元,2023年成立)[4] - 编程AI智能体在商业化中领先,6个软件开发智能体进入收入榜单前列,Cursor年经常性收入达5亿美元,Replit达1.5亿美元[16] - 软件开发智能体是资本效率最高的类别,平均每名员工创造140万美元收入,而所有顶级智能体类别的平均水平为每名员工59.4万美元[16] - 客户服务AI智能体获得最高估值溢价,平均收入倍数高达219倍,所有顶级创收AI智能体的平均值为80倍[16] AI Agent在企业工作流程中的应用进展 - 软件开发Agent正从代码助手进化到风险护栏,超过一半公司专注于通过基于浏览器的测试智能体和自动化审查系统降低风险[20] - 网络浏览Agent从通用走向专业化,Y Combinator孵化现有网络浏览智能体市场50%以上的公司,初创公司通过有针对性的应用进行差异化竞争[21] - 垂直Agent瞄准高度监管行业,医疗保健和金融服务占智能体AI公司的19%,其中32%的垂直化智能体已在积极部署解决方案[22]
Meta公司28岁亿万富豪:下一个比尔·盖茨将在这类少年中产生
财富FORTUNE· 2025-10-16 21:06
公司战略与雄心 - 公司目标直指超级智能,其商业模式足以支撑构建耗资数千亿美元的计算系统 [1][6] - 团队规模控制在百余人,力求比其他实验室更精简且人才密度更高,其他实验室规模可能大十余倍 [1][6] - 实验室分为三大支柱:研究部门构建最终实现超级智能的模型,产品部门确保模型推广给数十亿用户,基础设施部门专注于建设全球最大数据中心 [6] - 公司将新推出的智能眼镜视为超级智能的天然交付机制,这些设备将使数字感知与认知相融合 [6][7] 行业趋势与变革 - 当前是真正意义上的颠覆性时刻,与PC革命爆发前夕相提并论 [4] - 工程师正在编写的代码都将在五年内过时,所有已编写的代码都将被人工智能模型生成的代码取代 [1][2] - 氛围编程正风靡硅谷高管层,谷歌公司30%以上的新代码已由AI生成,这被视为25年来软件开发领域的最大飞跃 [8] - 氛围编程不仅是一种生产力工具,更是一种面向未来的文化使命,工程师的角色定位已截然不同 [9] 人才与竞争优势 - 青少年与成年人相比拥有明显优势,拥有足够的时间与自由去深入探索新技术,投入最多时间的人将在未来经济中占据先机 [4][5] - 当下最重要的不是语法或学习特定语言,而是投入时间实验和驾驭AI工具,若花费一万小时钻研这些工具将获得巨大优势 [2][4] - 氛围编程的核心价值在于通过不断挑战AI工具的极限所积累的大量直觉经验 [9]
速递|​​Emergent获Lightspeed领投2300万美元A轮融资,面向非技术用户,助力百万用户创建150万应用
Z Potentials· 2025-09-25 11:05
公司概况 - 公司Emergent由双胞胎兄弟Mukund和Madhav Jha创立,旨在成为面向普通消费者的应用开发平台,允许非技术人员通过提示词创建应用程序[1] - 公司从零构建了支撑应用开发的基础设施架构,并开发了AI Agent来检测并修复应用中的错误[6] - 公司明确表示不愿与Claude Code、Cursor等面向开发者的工具竞争,而是希望为非技术用户简化软件开发生命周期[4] 融资情况 - 公司宣布获得2300万美元A轮融资,由Lightspeed领投,Y Combinator、Together以及多位知名天使投资人跟投[1] - 公司迄今融资总额达3000万美元[2] 技术优势与产品特点 - 平台利用AI实现了部署、共享、错误修复和支持等开发后全生命周期管理[12] - 公司为应用构建了自动化测试流程,用户测试显示构建初版应用耗时不足半小时[6] - 公司采用通用API密钥与共享使用机制,使用户无需为不同服务或模型提供商创建多个账户[7] - 公司为新用户打造了头脑风暴模式,帮助有创意但不确定应用最终形态的用户顺利度过构思阶段[8] 市场表现与用户数据 - 自去年工具推出以来,已有超过100万人构建了150多万个应用程序[7] - 平台不仅让用户构建应用,还负责部署和后端基础设施,使应用程序维护更为容易[7] 竞争环境 - 公司在该领域面临激烈竞争,竞争对手包括Canva、Figma等初创公司以及Perplexity、Comet和Opera Neon等浏览器[12] - 多家初创企业正致力于开发面向非技术用户的氛围编程解决方案,包括获得Seven Seven Six投资的Vibecode和刚完成1500万美元A轮融资的Rocket[12] 未来发展 - 公司计划推出自己的移动应用程序以原生构建应用,目前使用Expo作为移动客户端[7] - 未来公司计划让应用发现与变现都更加便捷,开发者目前可以集成Stripe等支付选项但需自行提供API密钥[8]
2025科技圈最新职位:“Vibe Coding擦屁股工程师”,专治老板们的决策性Bug
AI前线· 2025-09-15 16:08
AI驱动的裁员趋势 - 科技职位招聘数量较2020年下降36% [3] - IBM因AI替代裁员8000人 其中人力资源岗位数百人 [3] - 多邻国停止雇佣可由AI完成的承包商工作 [3] - 克拉纳公司因AI投资裁员40% [3] - Workday将AI需求增长列为裁员原因 [3] - 塔塔咨询裁员12000人并部署AI [4] 氛围编程的缺陷与风险 - AI生成代码常无法满足预期目标且存在安全隐患 [7][11] - 典型问题包括数据暴露(如Firebase未设置规则)、敏感信息置于前端、缺乏版本控制和测试 [9] - 可能导致严重安全漏洞 例如任意用户通过修改UID访问数据 [9] - 在应用开发后期 新增功能易破坏原有功能 使AI使用成本飙升 [18] 新兴修复服务市场崛起 - 自由开发者通过平台如Fiverr提供"氛围编程审查与修复"服务 [12] - 服务内容包括解决UI不一致、代码优化、性能问题及功能体验调整 [12] - VibeCodeFixers.com聚集近300名开发者 已完成30-40个项目匹配 [15] - Ulam Labs等公司专门提供AI生成代码的清理与夯实服务 [13] - 修复需求源自企业不愿放弃已开发项目 而非从头创建 [18] 行业影响与人力角色演变 - 氛围编程概念由Andrej Karpathy于2025年2月提出 [17] - 人类开发者职能范围收缩 但AI编程仍需人类参与督导 [19][20] - 非技术人员开发应用时 最后10%-20%阶段易因新增功能导致崩溃 [18] - 开发者需对AI输出进行抛光、修正、调试和重构 [22]