Workflow
Jules
icon
搜索文档
AI编程加速前行:技术演进与商业化新篇
Wind万得· 2025-06-24 06:35
以下文章来源于RimeData 来觅数据 ,作者来觅研究院 RimeData 来觅数据 . 全面的一级市场数据平台 导读: 2025年6月4日,Cursor正式发布1.0正式版,标志着Cursor从测试阶段走向成熟。这次更新增加了BugBot自动代码审查、后台 Agent全面开放等功能,为用户带来了更智能、更高效的编程体验。6月11日,2025火山引擎FORCE原动力大会在北京开幕,大会主论坛 主要聚焦新品发布、Agent、AI编程等。近两年来,随着人工智能相关技术不断提升,AI编程也进入快速发展期。AI编程的技术现状如何? 发展前景如何?赛道投融资情况如何?本文尝试分析和探讨。 01 AI编程技术演进 AI编程(也称为AI Coding)通常是指利用人工智能技术来辅助或自动化软件开发的过程,其主要有以下特点: (1)自然语言交互与对话式编程:支持通过自然语言与用户进行多轮对话,理解用户需求并生成代码; (2)代码生成与补全:可根据用户输入的提示或部分代码,自动生成完整的代码片段或补全代码; 图表 1: AI编程在中国各行业渗透率 02 AI编程竞争格局与前景 AI编程参与者众多,竞争较为激烈。当前布局AI编 ...
-数字经济周报(202505第4期):构建科技金融发展的“四梁八柱”-20250527
银河证券· 2025-05-27 22:38
科技金融政策 - 5月22日四部门推出15项科技金融举措,构建全周期支持网络[1] - 央行将科技创新再贷款规模从5000亿元扩至8000亿元,利率降至1.5%[16] - 金融监管总局三批保险资金长期投资试点规模合计达2220亿元[16] 资本市场挑战 - 2025年一季度专业机构持股占A股总市值50.56%,保险、基金等主力配置比例偏低[18] - 2022 - 2025年5月,科创票据10年期及以上仅占4.88%,3年期及以下占76.43%[18] - 2021 - 2025年5月,央国企在科创票据、公司债发行人中分别占83.52%、97.33%,民营科创企业发债难[18] 产业发展动态 - 预计2030年我国数据产业规模达7.5万亿元,2024年年度数据生产总量同比增长25%[46] - OpenAI计划在阿联酋建全球最大AI数据中心,占地10平方英里,耗电5GW[7][52] - OpenAI以约65亿美元收购AI设备初创公司io[53] 技术前沿动态 - 谷歌推出AI编程智能体Jules,微软DiscoveryAI平台发现新型物质[54][55] - 华为揭秘超大规模MoE模型推理部署技术,性能超英伟达[60] - 英伟达推出DreamGen,让机器人通过“做梦”自主学习新技能[64] 智库前沿观点 - 武汉通用人工智能发展以“具身智能”为路径,2025年预计算力达30exaflops[6][74] - 武汉模式可能形成新治理范式,重塑全球科技竞争格局[75]
AI动态汇总:Claude4系列发布,谷歌上线编程智能体Jules
中邮证券· 2025-05-27 21:43
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称:Claude Opus 4** - **模型构建思路**:专为复杂推理与软件开发设计,扩展AI智能体能力边界[12] - **模型具体构建过程**: - 基于Anthropic的底层架构优化,增强跨文件代码理解能力 - 引入记忆文件机制,通过本地存储关键信息提升长期任务连贯性[16] - 采用轻量级思考摘要功能,在5%场景下精简推理链条[19] - **模型评价**:在SWE-bench测试中准确率72.5%,TerminalBench测试43.2%,展现顶尖编码能力[12][16] 2. **模型名称:Claude Sonnet 4** - **模型构建思路**:平衡性能与成本的通用模型,优化指令遵循能力[12] - **模型具体构建过程**: - 基于Sonnet 3.7改进编码和推理模块 - 通过行为控制技术降低系统漏洞利用概率65%[16] - **模型评价**:SWE-bench测试72.7%优于Opus 4,但综合性能稍逊[16] 3. **模型名称:Cosmos-Reason1** - **模型构建思路**:融合物理常识与具身推理,面向自动驾驶/机器人场景[29] - **模型具体构建过程**: - 采用混合Mamba-MLP-Transformer架构,结合ViT视觉编码器[30] - 四阶段训练流程: 1. 130M数据视觉预训练(跨模态对齐) 2. 8M通用监督微调(SFT) 3. 物理AI专项微调(16类知识注入) 4. GRPO算法强化学习优化决策[30] - 公式:奖励机制采用时空谜题自监督生成$$R=\sum_{t=1}^{T}\gamma^{t-1}r_t(s_t,a_t)$$ - **模型评价**:物理常识测试60.2%准确率,具身推理任务性能提升10%[34] 4. **模型名称:Gemini 2.5 Pro** - **模型构建思路**:旗舰级多模态推理模型,扩展上下文窗口至200万token[43] - **模型具体构建过程**: - 引入"Deep Think"并行推理架构,动态调整5%-100%思考强度 - 集成Model Context Protocol SDK降低开源工具链对接门槛[44] - **模型评价**:MMMU测试84.0%,长期记忆准确率83.1%显著优于竞品[44] 5. **模型名称:Devstral** - **模型构建思路**:开源编程专用模型,强化安全对齐与工程级任务处理[38] - **模型具体构建过程**: - 基于Mistral Small 3.1架构,采用Tekken Tokenizer(131,000词汇量) - 零样本训练策略避免SWE-bench过拟合[41] - **模型评价**:SWE-bench Verified得分46.8%,超越前代开源模型6%[39] --- 模型的回测效果 1. **Claude Opus 4** - SWE-bench准确率72.5%[12] - TerminalBench准确率43.2%[12] - 长期记忆准确率83.1%(MRCR 128K测试)[44] 2. **Cosmos-Reason1-7B** - 物理常识基准60.2%准确率[34] - 具身推理基准平均60.7%[34] - 8K视频流推理速度较GPT-4快11倍[34] 3. **Gemini 2.5 Pro** - MMMU得分84.0%[44] - WebDev Arena测试1499.95分(较前代+147)[44] 4. **Devstral** - SWE-bench Verified得分46.8%[39] - 单RTX 4090显卡可部署[39] --- 技术前沿发现 1. **思维链(CoT)对指令遵循的影响** - **构建思路**:通过IFEval/ComplexBench基准测试15种模型的CoT干扰效应[52] - **关键发现**: - CoT导致IFEval准确率平均下降12.3%[54] - 注意力机制显示约束token关注度下降18.7%[60] - **缓解方案**: - 分类器选择性推理提升IFEval准确率7.2%[65] - 自适应推理选择优化ComplexBench表现[64] (注:原文未涉及量化因子相关内容,故未总结该部分)
数字经济周报(202505第4期):构建科技金融发展的“四梁八柱”-20250527
银河证券· 2025-05-27 19:55
科技金融政策 - 5月22日四部门推出15项科技金融举措,构建全周期支持网络[1] - 央行将科技创新再贷款规模从5000亿元扩至8000亿元,利率降至1.5%[7] - 金融监管总局三批保险资金长期投资试点规模合计达2220亿元[7] 资本市场挑战 - 2025年一季度专业机构持股占A股总市值50.56%,保险、基金等主力配置比例偏低[10] - 2022 - 2025年5月,科创票据10年期及以上仅占4.88%,3年期及以下占76.43%[10] - 2021 - 2025年5月,央国企在科创票据、公司债发行人中分别占83.52%、97.33%,民营科创企业发债难[10] 产业发展动态 - 预计2030年我国数据产业规模达7.5万亿元,2024年年度数据生产总量达41.06泽字节,同比增长25%[33] - OpenAI计划在阿联酋建全球最大AI数据中心,占地10平方英里,耗电5GW[37] - OpenAI以约65亿美元收购AI设备初创公司io[38] 技术前沿动态 - 谷歌推出AI编程智能体Jules,基于Gemini 2.5 Pro模型[39] - 微软DiscoveryAI平台200小时内发现新型数据中心冷却剂原型,传统研究需数年[40] - 华为揭秘超大规模MoE模型推理部署技术,性能超越英伟达[42] 智库前沿观点 - 武汉2025年预计算力达30 exaflops,紫东太初多模态大模型已应用于智能制造[51] - 武汉AGI模式以“价值观驱动”和“具身智能”为特征,可能形成新治理范式[52]
微软和Google都找到了自己的AI重心
36氪· 2025-05-27 07:39
微软的Build 2025大会和Google的I/O开发者大会都选择了在本周举办,并且两场活动谈论的核心都是 AI。 不同的是,微软的重心是向行业展示如何更好搭建Agent。微软在Build 2025大会上向用户呈现了一套 更加成熟的Agent基础设施,想要吸引更多开发者加入到构建开放Agent网络(Open Agentic Web)的进 程中——这是一个 AI 智能体能够在个人、组织、团队乃至整个端到端业务流程中协同运作的体系。 Google则致力于展示一个围绕Gemini搭建的AI操作系统雏形。谷歌首席执行官Sundar Pichai在演讲中使 用了「Gemini时代(Gemini Era)」来描述未来。一方面,Google展示了更强的模型研发能力;另一方 面,Google在将Gemini的能力融入到各个C端产品中。 微软和Google虽然重心不同,但其面向AI的战略规划都具备了一定的整体性,不再是进行散点的尝试, 而是开始找到一条线,将散落的点串联起来,成为一个体系。这个体系的使命就如Pichai所言——让研 究成果真正发挥作用,将其尽快转化为现实应用。 这是目前我们在国内大厂中尚未观察到的一种变化。我 ...
微软、谷歌下场围剿Cursor ,AI编程格局生变 | 企服国际观察
钛媒体APP· 2025-05-26 14:12
图片来源@pixabay AI编程领域开始进入混战模式,大厂也在开启"降维打击"。 近期,先是OpenAI宣布Codex Agent编程模式,微软正式开源GitHub Copilot Extension for VS Code项 目,而后谷歌就公布其AI编程Agent工具Jules私有预览版,紧接着大模型创企Anthropic也正式发布新一 代模型:Claude Opus 4和Claude Sonnet 4,作为面向AI编程能力的最强模型加持。 这些动作背后其实都在共同指向一类对手:当前最热门的AI编程助手Cursor、Windsurf等,这些风头正 劲的创业企业在别人的规则下,如何继续玩下去?对于微软和谷歌等大厂而言,AI编程有利于补强云 服务生态黏性。对于同时提供B端和C端服务的大模型公司,提供擅长编码任务的模型+下探到Agent, 可能是在大模型商业化路径上的一次重大机会点。 异步+混合 微软对于AI编程的布局更为体系化,围绕生态布局,而谷歌从近期的打法上看,则更围绕产品服务。 对于微软而言,GitHub Copilot是自2021年起作为主流集成开发环境IDE如VS Code的插件而提供给用 户。因此 ...
计算机行业周报:鸿蒙电脑正式发布,产业生态值得期待
国元证券· 2025-05-26 13:23
报告行业投资评级 - 推荐|维持 [6] 报告的核心观点 - 本周计算机(申万)指数延续下跌趋势,跌幅3.02%,建议关注计算机行业创新节奏 [21] - 华为发布全新鸿蒙电脑,标志我国拥有自主可控电脑操作系统,国产电脑产业迎来新机遇,相关上市公司有望受益 [4][21] - OpenAI以65亿美元收购AI硬件初创公司io,计划2026年底前推出首款AI“伴侣”设备,目标出货1亿台,有望推动AI产业进一步商业化 [4][22] 根据相关目录分别进行总结 指数表现 - 本周(2025.5.19 - 2025.5.23)计算机(申万)指数下跌3.02%,位居跌幅榜第一,上证指数、深证成指、创业板指分别下跌0.57%、0.46%、0.88% [1][11] - 申万二级行业指数中,计算机设备、软件开发、IT服务Ⅱ涨跌幅分别为 - 2.36%、 - 3.05%、 - 3.47%,均呈回调趋势 [1][13] - 本周计算机板块上涨、回调和走平的个股数量分别为50、264和22,慧博云通、*ST迪威、盛视科技涨幅分列前三 [13] 重大事件 - OpenAI的Responses API新增MCP服务支持,优化安全控制机制,增加图像生成等功能并引入新特性 [16] - 昆仑万维发布天工超级智能体,集成多个智能体,可生成多模态内容,成本仅为OpenAI的40%,并已开源相关框架 [16] - 微软将GitHub Copilot升级为自主编程助手,多个项目和平台有新进展,Microsoft Discovery助力科研创新 [16] - 谷歌发布AI编程助手Jules,基于Gemini 2.5 Pro模型,提供免费使用额度,能完成多项代码任务,即将推出新功能 [16][17] - Anthropic发布下一代Claude模型Claude Opus 4和Claude Sonnet 4,在编程基准测试上大幅超越OpenAI部分模型 [19] 本周重点公告 - 华大九天希望未来3年完成集成电路设计工具系统开发和推广,实现设计类工具国产化替代;未来5年全面实现EDA工具全流程国产化替代,成为全球EDA行业领导者 [2][19] - 盛视科技探索轮足机器人与人形机器人在多场景应用,轮足机器人用于安防巡检等,人形机器人为旅客提供服务,公司在相关领域取得进展并将持续研究 [3][19][20] - 卓易信息SnapDevelop产品有约7000名活跃用户,已与Dcloud合作,未来将发布收费商业版本并分成 [23] - 中科曙光与海光信息筹划由海光信息换股吸收合并中科曙光并募集配套资金 [3][23] 投资观点 - 建议关注计算机行业创新节奏,关注鸿蒙电脑产业链发展及相关上市公司参与深度 [21] - 建议关注AI产业链的持续创新和商业化进展 [22]
计算机行业周报:鸿蒙电脑正式发布,产业生态值得期待-20250526
国元证券· 2025-05-26 12:26
报告行业投资评级 - 推荐|维持 [6] 报告的核心观点 - 本周计算机(申万)指数延续下跌趋势,跌幅3.02%,建议关注计算机行业创新节奏 [21] - 华为发布全新鸿蒙电脑,标志我国拥有自主可控电脑操作系统,国产电脑产业迎来新机遇,相关上市公司有望受益 [4][21] - OpenAI以65亿美元收购AI硬件初创公司io,计划2026年底前推出首款AI“伴侣”设备,目标出货1亿台,其收购有望推动AI产业进一步商业化 [4][22] 根据相关目录分别进行总结 指数表现 - 本周(2025.5.19 - 2025.5.23)计算机(申万)指数下跌3.02%,位居跌幅榜第一,上证指数、深证成指、创业板指分别下跌0.57%、0.46%、0.88% [1][11] - 申万二级行业指数中,计算机设备、软件开发、IT服务Ⅱ涨跌幅分别为 - 2.36%、 - 3.05%、 - 3.47%,均呈回调趋势 [1][13] - 本周计算机板块上涨、回调和走平个股数量分别为50、264和22,慧博云通、*ST迪威、盛视科技涨幅分列前三 [13] 重大事件 - OpenAI的Responses API新增MCP服务支持,优化安全控制机制,增加图像生成等功能并引入新特性 [16] - 昆仑万维发布天工超级智能体,集成多个智能体,可生成多模态内容,成本仅为OpenAI的40%,并已开源相关框架 [16] - 微软将GitHub Copilot升级为自主编程助手,多个项目和平台有新进展,Microsoft Discovery助力科研创新 [16] - 谷歌发布AI编程助手Jules,基于Gemini 2.5 Pro模型,提供免费使用额度,能完成多项代码任务,即将推出新功能 [16][17] - Anthropic发布下一代Claude模型Claude Opus 4和Claude Sonnet 4,在编程基准测试上大幅超越OpenAI部分模型 [19] - 华为发布全新鸿蒙电脑HUAWEI MateBook Pro与HUAWEI MateBook Fold非凡大师,国产操作系统在PC领域实现重要突破 [19] 本周重点公告 - 华大九天希望未来3年完成集成电路设计工具系统开发和推广,实现设计类工具国产化替代;未来5年实现EDA工具全流程国产化替代,成为全球EDA行业领导者 [2][19] - 盛视科技探索轮足机器人与人形机器人在多场景应用,轮足机器人用于安防巡检等,人形机器人为旅客提供服务,公司在相关领域取得进展并将持续研究 [3][19][20] - 卓易信息SnapDevelop产品有约7000名活跃用户,已与Dcloud合作,未来将发布收费商业版本并分成 [23] - 中科曙光与海光信息筹划由海光信息换股吸收合并中科曙光并募集配套资金 [3][23] 投资观点 - 建议关注计算机行业创新节奏、鸿蒙电脑产业链发展及相关上市公司参与深度 [21] - 建议关注AI产业链的持续创新和商业化进展 [22]
电子行业周观点:AI模型显著升级,AI与XR深度融合
国盛证券· 2025-05-25 14:23
报告行业投资评级 - 行业评级为增持(维持) [6] 报告的核心观点 - AI处于景气周期,随着基础模型不断优化、端侧以及AI应用与模型互相正向推动,整个AI产业链将受益 [1] 根据相关目录分别进行总结 1. AI融入业务生态系统,谷歌重回AR眼镜市场 1.1 各大模型全面爆发,Gemini系列模型成为核心焦点 - 2025年5月21日Google I/O 2025开发者大会,谷歌发布或升级系列AI相关工具和服务,基础模型是亮点,Gemini系列为核心焦点 [11] - 谷歌对Gemini全面升级,2.5 Pro版本性能卓越,在学术基准测试及全球排行榜领先,DeepMind为2.5 Pro和2.5 Flash新增三大功能,Deep Think提升2.5 Pro能力 [11] - 最高效主力模型Gemini 2.5 Flash多维度提升,效率进一步提升,使用token减少20 - 30%,2.5 Flash已面向所有用户开放,6月初将正式发布更新版本,2.5 Pro也将很快发布 [12] - 谷歌在Gemini API和Vertex AI引入思维摘要功能,扩展思维预算到2.5 Pro,增加对MCP工具支持 [14] - 谷歌宣布新模型Gemini Diffusion,用「扩散」技术探索新语言模型方向,生成速度是谷歌最快模型五倍,编程性能相当 [15] - 谷歌将Gemini扩展为世界模型,愿景是打造成通用AI助手,过去一年集成功能到Gemini Live,还进行了语音输出、记忆功能和计算机控制功能的创新 [16] - 编程工具领域,谷歌宣布编程智能体Jules,可与用户代码库集成,异步运行,默认为私有,不使用用户私有代码训练,隔离用户数据 [17] - 谷歌宣布Gemini Code Assist新升级,个人版和GitHub版正式发布,Gemini 2.5支持免费版和付费版,提供更多自定义选项,标准版和企业版开发者可用200万token上下文窗口,可提高开发者完成常见开发任务成功率2.5倍 [19][20] - 谷歌推出全新AI驱动式UI工具Stitch,能基于自然语言描述或图像提示词生成UI设计及前端代码,可对话迭代设计,导出为CSS/HTML或Figma [20] - 谷歌宣布Colab和Firebase Studio功能升级,Colab将有全新智能体体验 [21] - 视频和图像生成领域,谷歌最新模型Veo 3和Imagen 4打破媒体生成界限,全新AI电影制作工具Flow用上最先进模型 [21] - Veo 3提高质量且可生成带音频视频,为Ultra在美国用户和Vertex AI企业用户服务;Veo 2更新添加新功能 [23][26] - Flow整合先进模型,让用户无缝创作电影级片段、场景和故事;Imagen 4细节清晰,表现出色,可创建多种宽高比图像,拼写和排版提升,将推出比Imagen 3快10倍的变体 [30] - 视频通信领域,谷歌Starline项目演变为3D视频通信平台Google Beam,借助AI将2D视频流转化为3D体验,还探索语音翻译功能,今日在Google Meet上线,最初支持英语和西班牙语,未来几周支持更多语言 [31][34] - 搜索领域,谷歌搜索AI概览功能升级,覆盖200多个国家和地区,支持40多种语言,新增多种语言支持,速度快,本周将在美国引入Gemini 2.5定制版本 [35] - 谷歌在美国正式推出AI模式,无需注册Labs,推理和多模态分析能力先进,采用查询扇出技术,将引入深度搜索功能,还为搜索引入实时功能、Project Mariner智能体功能、个人上下文与定制图表等能力 [38][41] - 谷歌推出全新AI购物体验,将Gemini功能与Shopping Graph结合,Shopping Graph有超500亿条商品信息,每小时超20亿条信息更新,用户可虚拟试穿服装 [44] - 谷歌推出Gemma 3n预览版本,是可在多设备流畅运行的开放式多模态模型,还推出新订阅套餐Google AI Ultra,每月249.99美元 [49] 1.2 联手XREAL打造Project Aura眼镜,面对竞争激励的AR眼镜市场 - 2025年谷歌I/O开发者大会,谷歌和XREAL共同开发Project Aura全新Android XR设备,基于OST技术路线,搭载高通骁龙XR芯片,有摄像头、视觉传感器模组、扬声器和麦克风阵列 [53] - 该设备外观与普通眼镜相近,佩戴舒适度初步接近普通Ray - Ban眼镜,单镜设计未影响使用体验,反而可能成亮点 [55] - 设备集成Gemini多模态助手,按住右侧镜腿触控区域可激活,能实时分析周围环境,Project Astra可用于视障人士辅助 [56] - 谷歌与XREAL合作类似安卓开放生态扩张经验,还预告与时尚眼镜品牌合作,Project Aura发布标志谷歌加入消费级AR硬件竞赛 [60] 2、相关标的 - 谷歌产业链相关标的有胜宏科技、天弘科技、lumentum、FINISAR [61] - 海外AI相关标的有胜宏科技、工业富联、沪电股份、麦格米特 [61] - 国产算力相关标的有中芯国际、寒武纪、海光信息等多家公司 [61] - 存储相关标的分企业级存储(香农芯创、澜起科技等)和AI端侧存储(兆易创新、东芯股份等) [61] - 消费电子相关标的涵盖代工厂&终端、电池、结构件&功能件等多个类别,涉及华勤技术、珠海冠宇等多家公司 [61] - 智能驾驶相关标的涉及智驾芯片、智驾域控、车载CIS等多个领域,包括地平线、比亚迪电子等多家公司 [61][63]
Claude 4发布:新一代最强编程AI?
虎嗅· 2025-05-23 08:30
本文来自微信公众号:APPSO (ID:appsolution),原文标题:《地表最强编程 AI 诞生!Claude 4 连续自动编程 7 小时,实测细节惊艳程序员》,题图 来自:AI生成 就这几天,AI圈像是过年了。 就在刚刚,Anthropic正式发布Claude 4系列模型:Claude Opus 4和Claude Sonnet 4。 没喊口号,没搞长篇论文,这次Claude升级的关键词只有一个:干活。 据Anthropic宣称,Opus 4是目前全球最强的编程模型,能够稳定胜任复杂且持续时间长的任务和Agent工作流。而Sonnet 4则着重强化了编程和推理能力, 能更精准地响应用户的指令。 此外,Anthropic还同步推出了以下新功能: Claude 4发布,最强编程AI又又双叒叕易主了? 作为Anthropic迄今为止最强大的模型,Opus 4在编程基准测试SWE-bench上拿下了72.5%的高分,在Terminal-bench上也以43.2%领先同行,堪称最会写代 码的模型。 工具辅助的延伸思考(测试版):Claude模型在进行深入思考时,能够交替使用工具(如网页搜索),以优化推理过程和回复 ...