通用人工智能
搜索文档
张亚勤:后ChatGPT时代,中国人工智能产业的机遇、5大发展方向与3个预测
36氪· 2025-05-16 12:27
ChatGPT的技术突破与行业影响 - ChatGPT成为历史上最快突破1亿用户的科技应用,两个月内实现这一里程碑 [3] - ChatGPT基于GPT-3.5优化,语言能力显著超越GPT-3,首次通过图灵测试 [1][4] - 生成式AI领域出现技术质变,ChatGPT标志着AI从垂直工具向通用智能体的跃升 [4][6] 大模型驱动的IT行业结构重塑 - 新IT架构分为四层:算力基石层、IaaS层、基础模型层(MaaS)、垂直模型层(VFM)+SaaS层 [9] - 垂直基础模型层和SaaS层是创新风口,边缘计算领域存在大量机会 [11] - 企业可通过精调训练(Fine Tuning)和提示工程(Prompt Engineering)降低开发成本 [12] 中国AI产业的发展机遇 - 中文大模型需多语种训练数据,非中文数据不会成为瓶颈 [15][16] - 国内技术差距集中在高端芯片、算法系统和平台级技术,但追赶潜力大 [17] - 垂直领域(如医疗、边缘智能)是主要机会点,"百模大战"加速市场活力 [18][19] AI大模型的五大发展方向 - 多模态智能:整合文字、图像、视频、生物信息等跨模态数据 [32] - 边缘智能:部署轻量化模型到终端设备,实现低延时处理 [33] - 物理智能与生物智能:推动自动驾驶、机器人及医疗领域突破 [33] 生成式AI的未来技术路线 - 基础大模型+垂直模型+边缘模型构成技术底座,生态规模将超移动互联网10倍 [34] - 统一标识(Tokenisation)和规模定律(Scaling Law)是核心要素 [34] - 5年内可能在Transformer等主流框架外出现颠覆性新技术 [34][35]
人形机器人爆火,这些公司值得关注
市值风云· 2025-05-13 18:03
人形机器人行业发展 - 北京亦庄机器人半马是人类首次与机器人同场竞技,意义重大,20支参赛队伍包含成熟公司和初创团队[4][6] - 松延动力"N2"机器人赛后爆单,排产至11月,定价3.99万元显著低于同行(大几万至几十万)[8] - 2024年被机构定义为人形机器人量产元年,11家厂商启动量产,6家规划超千台,包括优必选、宇树科技等头部企业[9] - 全球人形机器人市场规模2023年10.17亿美元,2030年预计达151亿美元(CAGR 56%),销量从1.19万台增至60.57万台[17] - 行业活动密集:无锡具身智能机器人运动会、深圳全产业链接会显示产业链成熟度提升[11][15] 宇树科技机器狗供应链分析 - 宇树机器狗Go2拆解显示核心部件采用佰维存储LPDDR4X内存(8GB)和64G eMMC,处理器来自瑞芯微[21][23][25] - 2024年宇树机器狗全球市占率近70%,国内四足机器人市占超60%,2025年预计出货1.5万台(同比+100%)[26] - 无线通信模块依赖高通和南亚科技,前端芯片采用唯捷创芯方案[23][25] 佰维存储技术布局与优势 - 产品线覆盖机器人领域eMMC、LPDDR4X/5/5X、UFS、BGA SSD,国产自研主控eMMC(SP1800)已量产[1][30] - LPDDR5X样品尺寸缩小至8.2*12.4mm,BGA SSD容量达1TB并通过谷歌认证[30] - 晶圆级先进封测厂建设中,投资10.2亿,预计2024下半年投产,将成为国内唯一"存储+封测"一体化厂商[36][37] - 2023年营收67亿元(+86.5%),扭亏为盈,研发费用4.5亿元(占比6.7%)[33] - AI眼镜业务2023收入1.06亿元,2024年预计增长超500%,高价值产品Q2起批量交付[34] 产业链机会 - 机器人放量带动灵巧手、peek材料、空心杯电机等上游需求,佰维存储等芯片供应商受益[17][39] - 嵌入式存储是佰维核心优势,通过"存储+封测"能力切入头部企业供应链[27][30]
ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式
机器之心· 2025-05-13 15:08
核心观点 - 通用人工智能研究院与北京大学联合开发了Minecraft Universe (MCU)平台,旨在解决开放世界AI智能体评测的三大瓶颈:任务多样化不足、环境单一、评测效率低下 [1][3][6] - MCU通过3,452个原子任务的无限组合生成、GPT-4o驱动的全自动任务配置、多模态智能评测三大突破,构建了维度丰富的综合评测框架 [6][11][14] - 实验显示当前SOTA模型(GROOT/STEVE-I/VPT系列)在组合任务中的完成率较原子任务下降50%以上,创造性得分普遍低于0.3分(满分1分),揭示泛化能力存在显著缺陷 [17][18][21] 技术架构 任务生成系统 - 支持11大类41子类任务类型(挖矿/合成/战斗/建造等),每个任务可分解为原子级粒度测试控制/规划/推理能力 [13] - 基于GPT-4o实现一句话生成复杂世界场景(含天气/生物群系/初始道具),自动校验任务逻辑可行性(如避免"木镐挖钻石"类错误) [11][14] - 示例任务包括"沙漠建水上屋"、"熔岩坑边缘造瀑布"等,通过调整环境变量(昼夜/地形)生成不同难度版本 [7][20] 评测体系创新 - 引入VLM驱动的多模态评分系统,覆盖任务进度/材料利用率/执行效率等6大维度,评分准确率达91.5% [14] - 采用动态任务进度指标替代传统0/1完成率,可量化阶段性表现(如GROOT在"屋内睡觉"任务中误判率达83%) [21] - 评测效率较人工提升8.1倍,成本仅为1/5,支持单日处理超10万次任务验证 [14] 实验结果 模型性能短板 - 导航类任务:GROOT在熟悉场景平均得分0.72,但环境微调后(草地→屋内)得分骤降至0.33 [18][21] - 组合任务:VPT(RL)在采矿+建造的复合任务中成功率仅23%,较单一采矿任务下降41个百分点 [18] - 创造性缺陷:所有模型在建造类任务的创新得分均未超过0.38分(STEVE-I在"瀑布建造"中得分为0.05) [18][21] 行业启示 - 现有模型过度依赖预设环境(如VPT在陌生生物群系中错误识别率达65%),暴露语义理解不足 [17][22] - 长周期任务(持续数小时)的完成率普遍低于20%,反映长期规划能力缺失 [6][21] - 评测结果指明研发方向:需提升任务本质理解能力而非表面指令执行 [22]
安恒信息高级副总裁王欣:通用模型代替不了垂域场景模型,私有数据是让模型落地到场景中发挥价值的关键因素
每日经济新闻· 2025-05-12 21:44
数据与AI的深度融合 - 数据是AI革命的关键要素,与算法、算力并列为三大核心 [2] - 高质量数据集缺乏导致数据流通受限,成为AI向AGI演进的关键堵点 [2] - 私有数据是模型在垂域场景落地的关键因素,通用模型无法替代垂域模型 [5] 可信数据空间的作用 - 可信数据空间是破解数据要素开发利用与安全防护矛盾的关键 [6] - 可信数据空间包含数据流通架构和安全保障两部分,涉及连接器、隐私计算等技术 [7] - 国家计划到2028年建成100个以上可信数据空间,采用"软硬结合"方式保障安全 [10] AI在数据安全中的应用 - AI可理解文本数据并分析其价值,比传统技术更擅长数据分类分级 [11] - AI能识别API接口的用途及异常行为,提升数据流通过程中的动态安全 [11] - AI+数据安全是重点落地场景,涵盖API安全、数据库审计等领域 [12] 数据流通的挑战与解决方案 - 互联网网页数据存在质量问题,行业私域数据不足推动合成数据发展 [3] - 数据流通是促进AI发展的关键环节,需解决垂域场景的私有数据问题 [5] - "三数一链"是可信数据空间的先行探索技术路线之一 [10]
最先进的AI大模型,为什么都在挑战《宝可梦》?
虎嗅· 2025-05-12 14:57
AI在游戏领域的应用进展 - 游戏作为AI的天然试验场,从AlphaGo到Gemini 2.5 Pro,科技公司持续通过AI通关游戏展示技术突破[2][3][4] - 2023年英伟达开发出能玩《我的世界》的VOYAGER,2025年谷歌Gemini因独立通关初代《宝可梦》引发关注[2][4] - 莫拉维克悖论指出:对人类简单的任务(如游戏通关)对AI反而更困难,这凸显了AI在感知和行动力上的挑战[6][7] 技术实现差异 - 早期AI(如AlphaGo)采用强化学习,依赖预设规则和奖励函数[15] - 大语言模型(如Claude、Gemini)直接操作游戏,需从画面中自主理解规则,类似人类新手学习过程[16][17] - Claude 3.7通关失败(仅获3枚徽章),耗时1年迭代,早期版本甚至无法走出初始城镇[11][12] AI决策能力展示 - Claude能理解属性克制系统并调整策略,如电系技能对岩石系"效果一般"的快速应用[19] - AI决策过程透明化:Claude同步显示思考步骤(如选择技能"翅膀攻击"的分析)[22][23] - 拟人化行为:迷路时主动选择战败回城,或误认NPC后修正[26][28][29] 行业技术演进方向 - Gemini操作步数(10.6万次)比Claude(21.5万次)少50%,但测试条件不同,差异源于代理执行框架优化[30][33][35] - 目标从单一游戏专精(围棋)转向通用能力:感知环境、模糊目标理解和长线规划[37][38] - 《宝可梦》等游戏被选为训练载体,因其模拟现实世界的规则学习和复杂问题解决潜力[39]
Creekstone Ventures专访:梦想的同行人
深思SenseAI· 2025-05-12 11:21
新基金基本情况 - 新基金Creekstone Ventures已完成设立,首次募集规模预计为数千万美金[1] - 已确定投资两个项目:一家ToB企业级AI Coding公司和一家AI眼镜公司,后者聚焦核心功能做减法[2] - 投资策略延续弘毅时期方向,60-70%资金投向AI应用(侧重ToC),15-20%投向AI硬件,具身智能占比较少[4] 投资逻辑与方向 - 垂直领域ASI(超智能)是核心方向,参考Cursor、Midjourney等案例,强调在细分领域建立超越人类的智能[15] - 关注Agent生态关键组件,如MCP类基础设施,尽管早期商业化难但具备长期价值[13] - ToC创新保持开放态度,尤其关注边缘人群需求,如年轻一代或亚文化群体[15] - Coding AI领域存在分层机会:ToC端服务非专业开发者,企业端解决不同规模客户差异化需求[16][17] 市场趋势判断 - 中国ToC AI应用具备全球领先潜力,DeepSeek和元宝的快速增长已验证这一点[5] - 传统美元基金周期结束,新康波周期重启,反全球化背景下中国创业者有独特机会[5] - 春节后项目估值普遍上涨,因供需关系变化(优质项目减少+一级市场有效性提升)[23] - AI硬件赛道竞争激烈,但轻量化、长续航的差异化产品仍有机会[3] 创业者特质与基金服务 - 优秀创业者需具备:假期持续学习能力、高度抽象经验能力、快速执行调整能力[26] - 拒绝项目三大原因:驱动力不足、缺乏理想感、学习能力弱[27] - 基金提供三大支持:思想碰撞(Top-down thinking)、资源插件式对接、情绪价值[6][7] - 深度合作案例:与被投创始人每日交流,组建Coding领域小圈子,共享行业动态[8] 行业标杆启示 - Manus验证了中国团队产品化能力,其框架(虚拟机+语言模型+API)可复用于垂直领域[11] - Cursor估值快速成长至百亿美金区间,证明垂直ASI的商业潜力,其成功源于对程序员群体的深度理解[19][21] - DeepSeek打破美国算力封锁论调,展现中国技术实力;GPT-4o揭示模型演进路径[9] 差异化定位 - 基金核心优势:决策速度快(可当场给Term Sheet)、与创业者共情、资源直接对接[4] - 定位为"思想实验皮条客",连接前沿认知与创业者,保持弱者思维和一线学习[28] - 采取半孵化模式,比传统机构更早介入项目,与创始人共同探索方向[24]
前谷歌CEO:千万不要低估中国的AI竞争力
虎嗅· 2025-05-10 11:55
创始人心理与团队建设 - 创始人类型分为"远见型"和"放大器型",前者擅长技术突破,后者擅长规模化与公司治理 [3][4] - 优秀人才往往具备"验证游戏"特质,通过解决具体问题证明价值后被大公司收购 [6][7] - 顶尖人才的核心动力是解决复杂问题的成就感而非金钱或头衔 [18][20] 初创公司成功要素 - 关键成功组合:出色产品+可扩展的盈利模式,如谷歌的PageRank与AdSense系统 [16][17] - AI初创公司需构建"边做边学"能力,学习速度决定市场主导权 [17][33] - 竞争是检验领导力的核心场景,优秀创始人会主动迎接大公司挑战 [10][11] AI行业发展趋势 - AI发展受三大技术弧线驱动:算力缩放定律、强化学习规划、测试时计算 [33][34] - 中国在开源AI领域快速崛起,DeepSeek以500万美元训练出对标顶级闭源的模型 [45][46] - 未来十年硬件瓶颈在于电力与系统构建能力,芯片行业可能面临繁荣-萧条周期 [48][49] 人才管理与组织文化 - "天后型"员工是变革推动者,需重点保留;"中庸型"员工需淘汰 [21][22] - CEO的核心职能是协调创造性人才,通过短期项目测试工程团队执行力 [24][25] - 初创公司应鼓励冒险文化,成熟公司反而因资源丰富而趋于保守 [14][15] 技术战略与竞争格局 - 开源与闭源模式并存,中国通过开源策略打破西方技术封锁 [42][43] - 强化学习是未来最具潜力方向,奖励函数设计是关键突破点 [50][51] - 行业颠覆常由创始人推动,旧企业易被协议锁死难以转型 [30][31]
我国外贸进出口表现为何如此亮眼?一线见闻中找到答案
央视网· 2025-05-10 11:39
外贸整体表现 - 4月我国货物贸易进出口3.84万亿元,增长5.6%,其中出口2.27万亿元增长9.3%,进口1.57万亿元增长0.8%,带动前4个月外贸整体增长2.4% [1] - 4月进出口增速较一季度加快4.3个百分点 [2] 出口端亮点 - 江苏智能家居企业运用RCEP原产地规则,一季度原产地证申领金额飙升695.4% [3] - 前4个月高技术产品出口1.52万亿元增长7.4%,占出口总值18.1%,其中船舶和海洋工程装备增长16.4%、工业机器人增长58.3%、风力发电机组增长45.5% [9] - 山东省船舶和海工装备出口额突破160亿元,同比增长超80% [11] - 机电产品成为出口主力,集成电路、汽车等高端产品增速超14% [20] 进口端布局 - 海南食品企业通过全链条布局,前4个月椰子进口额同比增长80% [5] - 进口结构显示国内产业升级,对资源依赖度下降 [19] 行业转型升级 - 海工装备制造从"建大船"向"建强链"转型,青岛西海岸新区形成50余家企业的完整产业生态 [11] - 制造业向高端化、智能化、绿色化转型,高新技术产业和战略性新兴产业快速发展 [20] 企业动态 - 广东东莞机器人企业开发自主导航复合机器人,满足家庭到工业场景需求 [14] - 民营企业前4个月进出口8.05万亿元增长6.8%,占进出口总值56.9%,拉动整体进出口增长3.7个百分点 [18] 市场多元化策略 - 对美出口占比降至15%以下,东盟、非洲、拉丁美洲等新兴市场贡献超60%增量 [19] - 跨境电商等新业态发展有效缓冲关税冲击 [19] 政策支持 - 优化政策组合拳为外贸企业减负增效 [20] - RCEP原产地规则等关税政策助力企业开拓市场 [3]
不追人形机器人,却拿下超百家KA客户:思谋科技给AI落地打了个样
投中网· 2025-05-09 15:44
文章核心观点 - 思谋科技以"去形存智"的工业智能体战略突破AI落地难题,聚焦产业渗透率而非人形机器人形态,实现商业化闭环与规模化应用 [4][8][12] - 公司通过"脑-眼-手"模块化技术架构解决工业场景碎片化需求,技术转化能力获国家级认可,客户覆盖全球300家制造业巨头 [8][9][14][16] - 创始人贾佳亚的产学研融合背景(港科大教授/腾讯优图/思谋创始人)驱动技术零时差转化,形成学术-产业双向反哺的独特模式 [6][18] 非典型的学术大牛创业 - 贾佳亚学术成就包括200+篇论文、90,000+引用量、H指数110+,连续两年获SIGGRAPH Asia时间检验奖,培养40+AI领域领军人才 [6] - 2019年创立思谋科技后,团队将顶刊论文(CVPR/NeurIPS等)直接转化为产线解决方案,入围工信部"揭榜挂帅"等国家级项目 [8] 机器人进厂为什么这么难 - 人形机器人存在续航不足40分钟、运动控制不稳定(行走摔倒)、抓取误差大等硬伤,难以满足工业产线连续性要求 [11] - 行业估值泡沫显现,部分投资人批量退出人形机器人赛道,转向关注效率提升而非形态酷炫的务实解决方案 [12] 遥遥领先的商业化 - 2020年推出SMore ViMo平台解决电动汽车电池产线检测难题,5年拓展300家客户,服务覆盖近百亿件工业品 [14][16] - 2023年发布IndustryGPT工业多模态大模型,整合200+场景、300万+图像、500亿+Tokens数据,实现跨行业方案迁移 [15][16] - 已实现稳定现金流,客户包括苹果/特斯拉/富士康等,完成超十亿人民币融资并持续估值上扬 [17] 产学研协同效应 - 冯诺依曼研究院聚焦具身智能/多模态大模型研发,与思谋产业场景形成技术攻关-数据反哺的双向循环 [18]
大力推动我国人工智能大模型发展(深入学习贯彻习近平新时代中国特色社会主义思想·学习《习近平经济文选》第一卷专家谈)
人民日报· 2025-05-08 06:40
4月25日,习近平总书记在主持二十届中共中央政治局第二十次集体学习时强调:"面对新一代人工智能 技术快速演进的新形势,要充分发挥新型举国体制优势,坚持自立自强,突出应用导向,推动我国人工 智能朝着有益、安全、公平方向健康有序发展。"人工智能是引领这一轮科技革命和产业变革的战略性 技术。加快发展新一代人工智能,是我们赢得全球科技竞争主动权的重要战略抓手。习近平总书记高度 重视我国新一代人工智能发展,《习近平经济文选》第一卷中不少著作都对此作出深刻论述。比如, 《贯彻新发展理念,建设现代化经济体系》指出:"推动互联网、大数据、人工智能和实体经济深度融 合";《发展数字经济,抢占未来发展制高点》指出:"要推动互联网、大数据、人工智能同产业深度融 合,加快培育一批'专精特新'企业和制造业单项冠军企业";《加快构建新发展格局,着力推动高质量 发展》指出:"推动战略性新兴产业融合集群发展,构建新一代信息技术、人工智能、生物技术、新能 源、新材料、高端装备、绿色环保等一批新的增长引擎";等等。 人工智能大模型是通过深度学习技术在海量数据上训练出来的、拥有大规模参数和复杂计算结构的机器 学习模型,能够理解和生成多模态内容,具 ...