Aardvark
搜索文档
【产业互联网周报】 “十五五”规划建议:全面实施“人工智能+”行动,抢占人工智能产业应用制高点;黄仁勋GTC大会最新演讲勾勒AI蓝图;退出中国市场?SA...
钛媒体APP· 2025-11-03 10:12
大模型与生成式AI技术进展 - 智源发布多模态世界大模型悟界·Emu3.5,通过自回归方式实现多模态序列的“Next-State Prediction”,获得可泛化的世界建模能力,能实现跨场景具身操作、泛化动作规划与复杂交互 [2] - 美团LongCat团队发布并开源LongCat-Video视频生成模型,通过“二阶段粗到精生成+块稀疏注意力+模型蒸馏”三重优化,视频推理速度提升至10.1倍 [6][7] - 火山引擎上线豆包视频生成模型1.0 pro fast,生成速度最高提升约3倍,价格直降72% [10] - MiniMax发布海螺2.3视频生成模型,在动态表现力、风格化呈现及人物表演细腻度方面较上一代提升,并将海螺Video Agent迭代为支持全模态创作的Media Agent [15] - OpenAI推出由GPT-5驱动的自主网络安全研究代理Aardvark [29] AI平台与开发生态 - 零一万物联合开源中国发布Open AgentKit平台,该平台为开发者提供一站式开源解决方案,通过Framework、Runtime、Builder和Studio四大核心模块覆盖AI Agent全开发周期 [3] - 探迹科技推出针对AI数字员工打造的大模型智能体平台,AI数字员工具备类人思考、自主执行等特征,覆盖B2B、B2C核心业务场景,已与华为、小米、vivo等头部硬件厂商达成合作 [17] - 全球人工智能平台MAI推出旗舰产品“营销AI Agent”,可自主管理与优化效果营销,已帮助一些客户提升超过40%销售额,并每月管理数百万美元的谷歌广告支出 [34] - 前字节剪映、火山AI产品负责人创业项目“极致上下文”科技获硅谷美元基金与BV百度风投数百万美元投资,早期目标为打造面向营销场景的多模态Agent [36] 量子计算与前沿技术应用 - 玻色量子中标招商银行量子计算采购项目“天秤AI”,将基于自研的1000量子比特相干光量子计算机真机,为招行提供量子组合优化算法方案及量子真机算力服务 [4] - 一目科技在IROS展示自主研发的仿生视触觉传感器,传感器厚度仅为行业同类产品的一半,可同步“感受”物体软硬、表面纹理及滑动趋势,使机器人能完成精细操作 [11] - 全球首款进入课堂教学场景的全尺寸仿生机器人在合肥市师范附属小学正式“开讲”,身高1.4米的机器人“小安”作为助教参与科学教育课 [12] - 深圳鹏脑科技完成数千万元天使轮融资,资金将重点用于脑机接口技术的深化研发与产品迭代升级 [31] 企业合作与行业解决方案 - 汉得信息在电话会议中表示,今年计划努力完成3亿元AI相关收入,订单规模争取达到4-5亿元,明年希望实现规模翻倍,将AI收入目标设定在5-6亿元 [5] - 钉钉发布“1+4+N”矿业AI解决方案,钉钉大制造与矿业总经理表示近50%的中国五百强涉矿企业正在使用钉钉 [9] - 里伍铜业与华为签署框架合作协议,双方将在数字化基础设施、数智平台、智慧矿山大模型等方向深度合作,利用AI和5G技术推动高原地下铜矿的智能化转型 [13] - 中国科学院香港创新研究院与华为达成合作,联合推出新一代医疗AI大模型CARES 3.0,该模型在华为AI算力集群平台上训练完成,覆盖12+原生多模态医学数据集,能理解CT、MRI等影像并完成智能诊断 [14] 基础设施与安全 - 盛邦安全发布200G高速链路加密网关产品,整机加解密能力高达200Gbps以上,加密时延低于3微秒,经检测整机加解密吞吐能力达200Gbps,时延性能较现存纪录提升300倍,可应用于国家“东数西算”、智算中心等场景 [8] - 钉钉AI录音卡片DingTalk A1青春版正式上市,售价499元,依托钉钉AI听记和AI大模型能力,用户可实现语音内容记录、转写、总结分析并与钉钉工作流程打通 [20] - 黑石支持的数据中心平台AirTrunk与沙特人工智能公司达成战略合作,将在沙特投资约30亿美元建设数据中心园区 [27] - 国家发改委表示将以算力基础设施规模化、集约化、绿色化发展为重点,鼓励小、散、低效的存量算力设施向集约化、高效率转变 [50] 资本市场与融资并购 - 人形机器人研发制造企业松延动力完成近3亿元Pre-B轮融资,由方广资本领投,其旗下人形机器人“Bumi 小布米”定价9998元,10月23日晚一小时内订单突破100台,2天内首批500台售罄 [33] - 蚂蚁集团入股AI硬件研发商艾德未来智能,安徽艾德未来智能科技有限公司发生工商变更,新增蚂蚁集团旗下公司为股东,注册资本由约2512万人民币增至约2809万人民币 [32] - 英伟达计划向AI初创公司Poolside投资高达10亿美元,该交易将使Poolside估值飙升至原来的四倍,其正以120亿美元估值融资20亿美元进行谈判 [40] - 中金智算(安徽)科创投资基金合伙企业成立,出资额10亿人民币,经营范围为私募股权投资基金管理、创业投资基金管理服务 [38][39] 政策与行业趋势 - 山东省通信管理局等部门印发专项规划,提出到2030年底实现山东省低空通信网络全城全域连续覆盖和载人无人机航路全场景互联互通,到2035年底构建“空天地一体、通感算智融合”的低空通信网络数字基础设施 [41][42] - 上交所理事长邱勇表示,将支持人工智能、商业航天、低空经济等更多前沿科技领域适用第五套标准,支持具有参与全球竞争潜力的硬科技企业上市 [43] - “十五五”规划建议指出,将全面实施“人工智能+”行动,以人工智能引领科研范式变革,加强人工智能同产业发展相结合,抢占人工智能产业应用制高点 [46] - 上海市通信管理局等部门发布通知,开展城域“毫秒用算”专项行动,力争到2027年基本形成全域覆盖、高效畅通的城域毫秒用算网络能力体系,实现算力应用毫秒可达(网络时延<10毫秒) [48] 海外动态与国际合作 - OpenAI为印度用户提供为期一年的免费ChatGPT Go服务,该服务年费为399卢比(不到5美元) [21][22] - 英伟达GTC大会公布多项进展,包括与甲骨文为美国能源部建造最大AI超算Solstice系统,配备10万块英伟达Blackwell GPU;与CrowdStrike在AI网络安全模型方面合作;与Palantir整合GPU加速计算能力到其AI平台 [23] - 富士康董事会批准一项投资计划,将花费高达13.7亿美元用于人工智能计算集群和超级计算中心采购设备,投资将在2025年12月至2026年12月期间进行 [24] - 亚马逊宣布计划裁减约1.4万名公司职员,以精简运营、加快人工智能部署,自2022年以来亚马逊已累计裁员超过2.7万人 [28]
腾讯研究院AI速递 20251103
腾讯研究院· 2025-11-03 00:06
AI驱动的代码安全与漏洞修复 - OpenAI发布由GPT-5驱动的白帽智能体Aardvark 能自动发现并修复代码库安全漏洞 已识别92%的已知与人工注入漏洞 [1] - Aardvark工作流程运用LLM推理能力 包括威胁建模、提交扫描、沙盒验证和Codex修复 不依赖传统程序分析技术 [1] - 谷歌、Anthropic、微软等科技巨头在10月密集发布类似白帽智能体 以应对AI时代漏洞数量激增和攻击手段智能化的挑战 [1] 中国开源AI模型的商业化应用 - AI编程应用Cursor和Windsurf新发布的Composer-1和SWE-1.5模型被发现可能基于中国模型 [2] - Cursor Composer-1使用与DeepSeek相同的分词器 Windsurf被证实基于智谱开发的GLM模型 [2] - 中国开源模型在性能榜单占据TOP5甚至TOP10 物美价廉成为初创公司的理性选择 [2] 大模型注意力架构的技术演进 - 线性注意力机制正在回归 MiniMax-M1、Qwen3-Next、DeepSeek V3.2等国产模型引领采用线性或亚二次方注意力变体 [3] - MiniMax新模型M2放弃线性注意力回归常规注意力 团队解释线性注意力在推理和多轮对话任务中存在明显精度问题 [3] - Kimi Linear提出混合注意力策略 每三个线性注意力块搭配一个全注意力块 实现75%KV缓存缩减和最高6倍解码吞吐量提升 [3] Canva的AI战略与市场定位 - 估值420亿美元的Canva推出自训练基础模型 能输出带可编辑图层的完整设计文件 并将收购的Affinity永久免费开放 [4] - 核心功能Ask @Canva深度嵌入设计界面每个角落 用户可用自然语言修改任何元素 AI还能对整个设计提出改进建议 [4] - Canva年化收入约30亿美元且持续盈利 月活超2.4亿 市场预期将在2026年正式IPO 直接对标Adobe的70%市场份额 [4] Neuralink的脑机接口商业化进展 - 马斯克表示首位Neuralink接受者Noland Arbaugh可能首个接受升级或植入双芯片 预言Neuralink接受者最终能在游戏中击败所有人 [5] - Neuralink已有12名用户累计使用超2000天总活跃时间超1.5万小时 首批3位试验者研究成果已提交《新英格兰医学杂志》 [5] - 公司启动新临床试验"思维转文字" 目标到2031年实现每年植入2万人 年营收突破10亿美元 2030年开始应用于健康个体 [5] 大模型在医疗健康领域的应用潜力 - 斯坦福大学等研究团队测试15种主流模型对言语障碍识别 目前表现最佳模型准确率仅55%未达FDA要求的80-85%临床标准 [6] - 研究发现模型存在性别、年龄和语言偏见 对男性语音识别优于女性 英语使用者优于其他语言 年长儿童优于幼龄儿童 [6] - 微调技术带来突破口 利用小型儿童语音数据集微调后模型性能准确率提升10% 展现多模态语言模型在言语病理学应用潜力 [6] 企业级AI工作流重构与组织变革 - 估值123亿美元的Brex将内部AI平台当产品打造 基于Retool构建并复用外部产品AI能力 由25人系统工程团队维护运营 [7] - COO重构运营团队工作流 L1工作全交给AI L2从管理人变为管理Agents L3从解决问题变为设计系统 预测运营效率可提升5到10倍 [7] - 招聘策略从青睐"专才"转向"通才" 面试中询问AI使用习惯、要求提交AI案例研究、给出真实业务挑战评估AI应用能力 [7] OpenAI与微软的战略合作深化 - OpenAI完成重组 非营利基金会持有价值1300亿美元股份成全球最大慈善基金之一 首批投入250亿美元用于医疗健康和AI安全 [8] - 新协议明确OpenAI当前及未来AGI模型API将在7年内独家部署Azure 微软持有OpenAI约32.5%股份价值约1350亿美元 [8] - 双方签下2500亿美元Azure预购合同 微软上季度资本开支高达349亿美元较前一季度猛增40% 主要投向新建数据中心和采购AI芯片 [8] OpenAI内部治理与领导层变动 - Ilya Sutskever在马斯克起诉OpenAI案中作证近10小时 [9] - Ilya提交52页备忘录详细记录Altman"问题行为" 指控其欺骗董事会、挑拨离间、制造混乱和纵容Anthropic成长 [9] - 解雇Altman后董事会曾严肃探讨与Anthropic合并可能性 拟让Dario Amodei担任CEO 但因实际操作障碍和700名员工兵变而流产 [10]
英伟达将在韩国部署26万枚GPU,与三星、现代等一起建设人工智能工厂;美的机器人家族公开亮相丨AIGC日报
创业邦· 2025-11-01 09:11
英伟达在韩国的AI基础设施投资 - 计划在韩国部署总计26万枚Blackwell GPU以建设大规模人工智能工厂 [2] - 韩国政府将部署5万枚GPU用于构建国家主权AI平台,旨在优化韩语及产业应用的大型语言模型 [2] - 三星电子、SK集团、现代汽车集团将分别部署5万块GPU,Naver Cloud将部署6万块左右 [2] - 此举将使韩国AI GPU总装机容量从约6.5万个大幅提升至超过30万个,成为美国以外全球最大的AI计算中心之一 [2] 美的集团机器人业务进展 - 美的集团首次公开其已研发的3代共5款人形机器人家族,产品名包括美罗、美罗X、美罗U、美拉、美拉X [2] - 公司机器人研发策略为“发布一代,研发一代,规划一代”,其中第三代机型“美罗U”属于规划中产品 [2] - 公司正规划超人型机器人产品,显示其在机器人领域的持续投入和长远布局 [2] OpenAI新产品发布 - OpenAI宣布推出名为Aardvark的自主网络安全研究代理,该产品由GPT-5驱动 [2] AI技术在公共安全领域的应用 - 澳大利亚警方正利用人工智能技术解码犯罪分子在社交媒体上使用的网络俚语和表情符号,以更有效地预防和打击网络犯罪 [2] - 此项策略的重点打击对象是被警方称为“犯罪影响者(crimefluencers)”的、在社交媒体上活跃的仇恨组织年轻人 [2]
OpenAI发布安全研究智能体:能像人类专家一样挖漏洞、写补丁
36氪· 2025-10-31 13:17
产品发布与核心功能 - OpenAI于10月31日发布名为Aardvark的安全研究智能体,由GPT-5模型驱动,能够自主完成从代码分析到补丁生成的全流程漏洞狩猎与修复 [1] - Aardvark作为智能体系统,通过大语言模型的推理能力与工具调用功能,深入理解代码行为并识别潜在漏洞,完整复现了安全研究员的系统化工作流程 [2] - 该系统采用四阶段防御流程:威胁建模、代码级扫描、验证沙盒和自动修补,深度集成GitHub、Codex及主流开发流程,提供持续且非侵入式的安全扫描服务 [4] 技术性能与实战表现 - 在植入已知漏洞和合成漏洞的基准测试中,Aardvark成功识别出92%的问题 [5] - 该智能体在真实开源项目中发现了多个关键问题,其中包括十个获得CVE编号的高危安全漏洞 [5] - Aardvark还发现了超越传统安全缺陷范畴的复杂错误,包括逻辑错误、不完整修复问题和隐私风险 [5] 公司战略与行业定位 - Aardvark是OpenAI智能体产品矩阵的关键一环,此前公司已于2025年5月发布Codex智能体,7月发布ChatGPT智能体,表明公司正从通用大模型向垂直领域智能体全面转型 [6] - 选择网络安全作为突破口精准契合市场痛点,2024年全球有超过4万个CVE漏洞被曝光,OpenAI内部数据显示1.2%的代码提交会引入错误 [6] - Aardvark定位为深度集成到开发流程中的主动防御体系,而非传统的事后扫描工具 [6] 市场影响与应用前景 - Aardvark将GPT-5的语言理解能力、Codex驱动的补丁生成机制与验证沙箱环境深度融合,为现代软件开发团队提供完整解决方案 [7] - 该平台有望引领企业在持续集成/持续部署环境中安全防护模式的重大变革,成为网络安全团队的能力放大器,缓解安全团队的警报疲劳问题 [7] - 对于AI工程师和部署分布式AI系统的团队,Aardvark展现出独特价值,其沙箱验证机制与持续反馈循环与基于CI/CD的机器学习运维体系高度契合 [7]
OpenAI首个GPT-5找Bug智能体:全自动读代码找漏洞写修复
36氪· 2025-10-31 10:25
产品发布与核心功能 - OpenAI发布由GPT-5驱动的AI安全研究员Agent“Aardvark”,旨在自动发现并修复代码安全漏洞[1][3] - Aardvark的核心任务是持续分析源代码仓库,通过监控代码提交与变更,自动识别潜在漏洞、推断攻击路径并生成修复建议[4] - 该产品不依赖传统程序分析技术,而是运用大语言模型驱动的推理与工具使用能力来理解代码行为,工作流程包括威胁建模、漏洞发现、沙盒验证、Codex修复、人工复审及提交Pull Request[5][8][9] 性能表现与集成应用 - 内部测试显示,Aardvark在基准测试中对已知与人工注入漏洞的识别率达到92%,并能定位仅在复杂条件下出现的问题[3][12] - 该产品已发现并负责披露了众多漏洞,其中10个已获得CVE编号,并且可无缝集成GitHub、Codex及现有开发流程[10][12] - Aardvark不仅能识别安全漏洞,还能发现逻辑缺陷、不完整修复及隐私风险,OpenAI将为部分非商业开源仓库提供公益扫描服务[11][13] 行业竞争格局 - 整个10月,Anthropic、谷歌、微软等科技巨头相继发布类似的白帽AI Agent,形成密集的产品发布潮[3][14][19] - Anthropic于10月4日将Claude Sonnet 4.5应用于代码安全任务,其性能据称已超越Opus 4.1,且价格更低、速度更快[14][17] - 谷歌于10月6日发布利用Gemini Deep Think模型的CodeMender,微软于10月16日发布Vuln.AI,OpenAI在10月底发布Aardvark[17][19] 市场驱动因素 - 人工Debug与传统的自动化方法已无法满足大规模代码库的漏洞发现与修复需求,推动AI自动化工具成为关键手段[19] - 企业级网络中设备、服务、代码库数量巨大,同时AI技术也被用于快速寻找漏洞和生成攻击代码,导致漏洞数量激增和攻击手段智能化[19]
OpenAI首个GPT-5找Bug智能体:全自动读代码找漏洞写修复
量子位· 2025-10-31 08:58
OpenAI Aardvark产品发布 - OpenAI发布由GPT-5驱动的AI安全研究员Agent Aardvark,旨在自动发现并修复代码安全漏洞 [2][3] - Aardvark在基准测试中识别出92%的已知与人工注入漏洞,并能定位复杂条件下出现的问题 [4][19] - 该产品通过威胁建模、漏洞发现、沙盒验证、Codex修复等流程工作,可集成GitHub和现有开发流程 [9][11][15] Aardvark技术能力与测试成果 - Aardvark运用大语言模型驱动的推理能力理解代码行为,不依赖传统程序分析技术 [10] - 内部测试显示其能识别安全漏洞、逻辑缺陷、不完整修复及隐私风险 [16] - 产品已应用于多个开源项目,发现并披露的漏洞中有10个已获得CVE编号 [20] 行业竞争格局 - 2024年10月,Anthropic、谷歌、微软相继发布类似AI代码安全产品,OpenAI此次发布相对较晚 [7][24][31] - Anthropic于10月4日将Claude Sonnet 4.5应用于代码安全,其性能超越Opus 4.1且价格更低、速度更快 [25][28] - 谷歌于10月6日发布基于Gemini Deep Think模型的CodeMender,微软于10月16日发布Vuln.AI [29][31] 市场驱动因素 - 人工Debug与传统自动化方法已无法满足大规模代码库的漏洞发现与修复需求 [32] - 企业级网络设备、服务、代码库数量巨大,同时AI技术也被用于快速寻找漏洞,导致漏洞数量激增 [33] - 借助AI自动化发现与修复漏洞成为确保软件安全和降低企业风险的关键手段 [34]