Workflow
通用人工智能(AGI)
icon
搜索文档
直播预告:「开箱」华为盘古首个开源大模型
机器之心· 2025-07-02 18:40
大模型开源与技术突破 - 华为一次性开源两个大模型:70亿参数的稠密模型「盘古 Embedded」和720亿参数的混合专家模型「盘古 Pro MoE」,同时开源基于昇腾的模型推理技术 [1] - 盘古 Pro MoE在SuperCLUE 5月榜单中位列千亿参数量以内模型国内并列第一,智能体任务表现比肩6710亿参数的DeepSeek-R1,文本理解与创作领域排名开源模型第一 [2] - 盘古 Embedded在学科知识、编码、数学和对话能力方面优于同期同规模模型 [2] 核心技术优势 - 采用分组混合专家MoGE算法、自适应快慢思考合一、全链路高性能推理系统优化等技术,显著提升训练和推理效率 [3] - 盘古 Embedded通过迭代式蒸馏微调、延迟容忍调度框架、双系统快慢思维框架三大技术,实现推理延迟降低与精度保持,尤其适合移动设备等资源受限场景 [12][13] - 盘古 Pro MoE通过MoGE架构解决负载不均衡问题,结合混合并行优化、通算融合、量化压缩等方法,在昇腾910/310硬件平台实现推理效率大幅提升 [16] 模型性能与部署 - 盘古 Pro MoE总参数720亿,激活参数160亿,在4000+昇腾NPU集群长稳训练,通用知识、数学推理等能力优于同规模模型 [16][17] - 昇腾平台针对盘古 Pro MoE优化H2Parallel分层混合并行、TopoComm拓扑亲和通信、DuoStream多流融合等技术,实现极致推理性能 [20][21] 行业应用与演示 - 盘古 Pro MoE将在通用问答、复杂推理、金融场景等任务中进行实例演示,展示模型特性 [24] - 技术分享涵盖模型训练优化、推理系统实践及实际应用效果,面向学术与行业从业者提供洞察 [4][5] 研究团队背景 - 核心研究人员来自华为诺亚方舟实验室和先进计算与存储实验室,包括陈汉亭(大语言模型架构专家)、唐业辉(MoE模型训练专家)、李小松(推理系统优化专家)等,均在国际顶会发表多篇高引论文 [14][18][22]
李飞飞最新YC现场访谈:从ImageNet到空间智能,追逐AI的北极星
创业邦· 2025-07-02 17:49
ImageNet与深度学习革命 - ImageNet通过提供大规模高质量标记数据集(80000+次引用)为神经网络成功奠定基础 开创数据驱动范式转变[8][9] - 项目历时18年孵化 初期算法错误率达30% 直到2012年AlexNet结合GPU算力实现突破性进展[11][14][16] - 采用开源策略和挑战赛形式推动社区共建 加速计算机视觉从物体识别向场景描述演进[12][17][19] 空间智能与World Labs布局 - 三维世界理解被定义为AI下一前沿 进化史长达5.4亿年 远超语言进化维度[24][25] - World Labs聚焦构建3D世界模型 团队集结NERF作者等顶尖人才 解决组合复杂度更高的空间智能问题[25][27][28] - 应用场景覆盖元宇宙内容生成 机器人学习 工业设计等 需突破硬件与内容创作双重瓶颈[30][32] 人工智能发展路径 - 视觉智能发展轨迹清晰:物体识别→场景叙事→空间智能 每阶段需5-10年技术积累[17][19][22] - 语言模型与视觉模型存在本质差异 前者依赖序列数据 后者需处理不适定的3D→2D投影问题[27][28] - AGI定义存在争议 但空间智能被视为实现通用智能不可或缺的组成部分[23][44] 创新方法论 - "智识上的无畏"被反复强调为突破性创新的核心特质 贯穿从学术研究到创业全过程[6][37][42] - 数据质量优先于数据规模 需采用混合方法获取高质量3D空间数据[47][48] - 跨学科研究与小数据理论被视为学术界可突破的潜在方向[41][42] 行业生态观察 - 开源策略应根据商业模型差异化选择 Meta等平台型企业更倾向全面开源[46] - 学术机构在计算资源劣势下 需聚焦工业界尚未关注的底层理论问题[41][42] - 硬件迭代与生成模型结合将推动元宇宙等场景落地[30][32]
奥特曼怒斥小扎7亿挖人:唯利是图的雇佣兵,将被使命打败
虎嗅· 2025-07-02 11:40
本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO ,原文标题:《OpenAI 内部信曝光!奥特曼怒斥小札 7 亿挖人:唯利是图的雇佣兵, 将被使命打败》,题图来自:视觉中国 还有人没看过关于Meta挖人的段子吗? 建议顶级AI人才的流动参考足球俱乐部的转会制度 在昨日Meta高调官宣超级智能团队实验室,大批挖走OpenAI核心研究员之后,一向沉得住气的Sam Altman现在也坐不住了,向全体员工发出内部信: 有使命感的人将胜过唯利是图的雇佣兵。 据连线杂志报道,Altman还在信中强调,留在OpenAI才是那些希望构建通用人工智能(AGI)研究者的正确选择,并暗示公司正在重新评估整个研究团队 的薪酬结构。 对Meta的挖人行为,Altman表示相当不屑,认为这种"开价挖人"的模式未来将带来严重的文化副作用。 我们已经从角落里的极客,成长为科技行业里最受关注的人(至少是这样)……现在AI圈乌烟瘴气;Meta的做法让人感觉不太体面;我觉得 事情将来只会更加疯狂。我被解雇又回归时曾说,那不会是OpenAI历史上最疯狂的事;显然现在这事也还不是。 在评价那些被Meta挖走的前同事时 ...
《2025人工智能发展白皮书》发布 深圳AI相关企业数量居全国第三
深圳商报· 2025-07-02 06:35
中国人工智能行业发展现状 - 截至2024年底中国人工智能相关企业数量达到13069家居世界第二美国以18616家排名第一 [1] - 深圳市人工智能相关企业数量达到2000多家排名全国第三其中143家为专精特新"小巨人"企业744家为专精特新中小企业 [1] - 深圳人工智能产业链超过60%企业布局在应用层集中在智能安全、智能机器人和智能制造等领域 [1] 深圳人工智能产业特征 - 南山区集聚899家人工智能相关企业数量占比高达40.5%形成"一超多强"格局 [1] - 2024年深圳人工智能核心岗位招聘量同比增幅普遍超过40%大模型相关岗位增长474.4%智能芯片相关岗位增长192.2%虚拟现实/增强现实相关岗位增长136.1% [2] - 深圳已建和在建智能算力超过62 EFLOPS智慧城市算力调度平台规模超过30000 PFLOPS [2] 深圳人工智能基础设施 - 深圳市政府数据开放平台累计提供开放数据目录4065个开放数据总量28.2亿多条 [2] - 深圳数据交易所数据交易规模约167亿元其中跨境交易3.1亿元均居全国首位 [2] - 深圳规划建设多个高质量人工智能产业园区包括深圳湾科技生态园、南山智园等 [2] 人工智能技术发展趋势 - 量子计算、超级计算与智能计算的"三算"融合或是算力的终极形态 [3] - 人形机器人正在大模型催化下驱动具身智能产业化破局 [3] - 脑机接口突破医疗边界向教育、娱乐、军事等领域渗透 [3] - 智能体成为通用人工智能(AGI)落地的关键路径之一 [3]
跳槽实现财富自由!小扎千万年薪快要“掏空”OpenAI核心人才,还高调“晒”挖人成绩单:各栈大牛,近70%是华人
AI前线· 2025-07-01 13:24
Meta超级智能实验室(MSL)组建 - 公司宣布整合基础研究团队、产品团队和FAIR团队成立Meta超级智能实验室(MSL),专注于开发下一代AI模型 [1] - 实验室由原Scale AI CEO Alexandr Wang和前GitHub CEO Nat Friedman共同领导,Meta此前以143亿美元收购Scale AI [1] - 团队目前11名核心成员,主要来自OpenAI、Anthropic和谷歌等竞争对手,包括GPT-4o、Gemini等核心技术的开发者 [2][3] - 团队成员中华人占多数,引发行业关注 [4] - 公司计划持续扩大团队规模,目标在未来一年达到技术前沿水平 [5] 人才争夺战激化 - 公司以超高薪酬(传签约奖金达1亿美元)从OpenAI挖走4名华人研究员,引发OpenAI强烈反应 [7][8] - OpenAI首席研究官Mark Chen表示将调整薪酬体系并采取积极措施挽留人才 [7] - 行业出现AI人才"泡沫膨胀"现象,顶尖研究员薪酬被抬高至原薪资50倍 [9] - OpenAI员工面临高压工作环境(每周80小时),公司计划停工调整但高管继续工作 [9] 战略与行业影响 - 公司采取"洋基队式策略",以不设上限预算组建顶尖团队,但面临内部薪酬失衡和组织冲突风险 [11] - 实验室负责人Alexandr Wang以超强执行力著称,可能推动项目快速落地 [12] - 行业研究文化从"使命驱动"转向"财务驱动",加剧人才竞争失控风险 [13] - OpenAI试图将冲突定位为"支线任务",强调应聚焦AGI主要目标 [10] 团队核心成员背景 - 11人团队中包含多位AI领域顶尖专家: - Trapit Bansal:OpenAI技术联合创建者,主导O系列模型研发 [3] - Shuchao Bi:GPT-4o语音模式技术联合创建者 [3] - Huiwen Chang:GPT-4o图像生成技术联合创建者,前谷歌研究员 [3] - Jack Rae:Gemini预训练技术负责人,前DeepMind研究员 [3] - Shengjia Zhao:ChatGPT、GPT-4技术联合创建者 [3]
三条高铁“相遇”长江首城 宜宾高铁南片区打造城市新极核
经济观察报· 2025-07-01 13:00
高铁南片区发展概况 - 成贵高铁、成宜高铁、渝昆高铁在宜宾交汇,形成高铁南片区独特区位优势 [1] - 片区定位为城市极核,封闭运行两周年后进入快速发展阶段 [1] 项目建设进展 - 宜宾城市体育文化综合体主体结构封顶,将作为四川省第十五届运动会比赛场馆 [2] - M0数字经济产业社区开业运营,首批入驻企业19家 [2] - 渝昆高铁站前总部经济极核基本建成,中央活力极核加速推进 [2] 功能配套建设 - 市一中、市一医院、市妇幼保健院等顶级医疗教育机构已投用 [3] - 重庆医科大学附属儿童医院宜宾医院2024年7月开工,预计2024年底投用 [3] - 1600亩公园绿地陆续开工,29公里城市绿道前期工作中,年底建成15公里 [3] - 13条骨架路网2024年6月开工,预计年底全面建成 [3] 产业招商成果 - 宜宾智能制造中心储备116家优质企业(机器人56家、电子信息35家、其他25家),预计引进60-70家科技企业 [4] - 片区累计签约企业140余家,总投资额约160亿元 [4] - 渝昆高铁站前总部经济极核入驻数字经济龙头企业82家(含网易有道、腾讯、迅雷),入驻人员超1500人 [5] 新兴场景打造 - 艺云数字艺术中心累计接待游客近6万人次,融合数字艺术展览与沉浸体验 [6] - 万象宜宾天地E-Park公园打造机器人表演、零售等智能场景,引入银河通用等头部企业 [7] - 华润万象生活运营西南首个"天地系"商业体,形成近百家首店经济聚集区 [7] 片区发展规划 - 2024年计划新增投资120亿元,吸引产业人口1万人 [8] - 2028年目标:产业总产值250亿元,社会消费品零售总额80-120亿元,产业人口5-6万人,常住人口14-15万人 [8] 相关ETF表现 - 食品饮料ETF(515170)近五日涨0.89%,市盈率19.8倍,份额增加1650万份 [10] - 游戏ETF(159869)近五日涨2.97%,市盈率40.97倍,主力资金净流入1.8亿元 [10] - 科创半导体ETF(588170)近五日涨2.80%,份额增加1800万份 [11] - 云计算50ETF(516630)近五日涨7.52%,市盈率101.05倍,主力资金净流入92.4万元 [12]
重用百度系,拿下谷歌大佬,首富张一鸣亮出十年前杀招
搜狐财经· 2025-07-01 12:42
张一鸣与字节跳动的近期动态 - 张一鸣个人财富达655亿美元(约4700亿元人民币)成为中国首富,其每月召集核心管理层和AI项目负责人进行复盘讨论[2] - 公司近期面临两大关键战役:TikTok美国禁令应对和AI大模型竞争[3] TikTok美国市场战役 - 1月18日TikTok停止在美服务作为终极对抗手段,此前尝试引入欧洲股东和上线Lemon8等策略[4] - 禁令引发"TikTok难民"现象,美国用户涌入小红书抗议,特朗普第三次延长禁令至2025年9月17日[5] - 该战役使字节成为中国全球化品牌影响力第一的企业[6] AI大模型竞争态势 - 字节豆包大模型2024年11月MAU达6000万全球第二,但12月DeepSeek V3版本发布后形势逆转[9] - DeepSeek App发布13天日活超豆包,月下载破亿(豆包实现此目标耗时9个月)[10] - 阿里成为苹果中国AI合作方,Qwen2 5-Max模型表现优异加剧竞争压力[11] 字节AI战略调整 - 2024年2月将AI Lab整体并入Seed团队,后者更强调产业关联性[15] - 调整后4个月内发布豆包大模型1 6、Seedance 1 0 pro等产品,与比亚迪共建联合实验室[15] - 挖角谷歌DeepMind前副总裁吴永辉掌舵Seed,取消季度考核以保障AGI研发[24][27] 人才战略与组织架构 - 火山引擎总裁谭待(原百度T11专家)提出2025年250亿营收目标,强调AI Agent战略[16][21] - 2020年收购幺零贰四科技获得百度系技术团队,包括吴海锋、孙雯玉等核心人才[18] - 发布六大核心人才管理理念,包括"以能定级"和"敢招比自己强的人"等原则[30] 技术竞争格局 - DeepSeek创始人梁文锋身价1846亿已达张一鸣一半,反映AI领域价值重估[12] - 字节推荐算法优势面临AI内容生产方式变革的根本性挑战[14] - 火山引擎当前营收刚破百亿,处于云服务第三梯队(天翼云/阿里云超千亿)[20]
挖角野心曝光?Meta新增11位AI“高手” 扎克伯格正式内部介绍“超级智能”团队
华尔街见闻· 2025-07-01 04:48
Meta AI团队重组与人才引进 - Meta宣布AI团队重大重组,成立名为"Meta超级智能实验室"的新团队,致力于开发能够像人类一样甚至超越人类能力的AI系统 [2] - 新团队由Scale AI前CEO Alexandr Wang领导,Wang被任命为Meta首席人工智能官,Github前CEO Nat Friedman将共同领导团队 [2] - 11名AI领域顶尖人才加入Meta,包括来自谷歌、OpenAI和Anthropic的研究人员 [2][3] 超级智能实验室核心成员 - 加盟Meta的AI人才包括前DeepMind研究员Jack Rae和Pei Sun,多名OpenAI研究员以及曾负责Anthropic基础设施项目的Joel Pobar [3] - Meta近期成功挖走OpenAI三名负责建立苏黎世办公室的研究员Lucas Beyer、Alexander Kolesnikov和Xiaohua Zhai [5] - 过去一周有八名顶尖研究人员离职OpenAI加盟Meta,包括四名华人核心研究员,他们曾主导o3、GPT-4等关键模型 [5] Meta在AI领域的战略布局 - Meta决定斥资150亿美元收购ScaleAI 49%股份,成为公司史上最大外部投资 [4] - 扎克伯格承诺将引领公司开发超级智能,称这将是人类新时代的开始 [3] - 因对Llama 4模型表现不满,扎克伯格亲自组建约50名AI专家的"超级智能"秘密团队 [3] 行业人才竞争态势 - OpenAI CEO Sam Altman爆料Meta向OpenAI团队提供巨额报价,如一亿美元签约奖金和高额年薪 [4] - OpenAI首席研究官表示公司正在"重新校准薪酬",承诺采取创造性方式奖励顶尖人才 [5] - Meta通过高薪挖角策略加速AI人才储备,反映出行业对顶尖AI人才的激烈争夺 [4][5]
富阳喜讯!今天,敲钟上市!
搜狐财经· 2025-06-30 15:23
公司上市 - 云知声智能科技股份有限公司于6月30日9时30分正式登陆香港联合交易所主板 股票代码09678 HK 市值145亿港元 成为港股"通用人工智能(AGI)技术"第一股 [1] - 公司是富阳区产业基金投资的第三家境外上市公司 前两家分别为业聚医疗(2022年12月在香港上市)和路特斯(2024年2月在美国纳斯达克上市) [5] 技术实力 - 公司成立于2012年 专注于对话式AI产品及解决方案的研发与销售 广泛应用于日常生活及医疗等领域 是国内AGI领域的先行者 [8] - 自2016年以来构建Atlas人工智能基础设施 目前已建成具备超184PFLOPS计算能力 超10PB存储容量的智算集群 [10] - 2023年推出自主研发的山海大语言模型 拥有600亿参数 具备生成式多语言及多模态功能 通过动态推理与跨模态数据处理技术实现更自然流畅的人机交互体验 [11] 区域布局 - 2023年云知声(杭州)智能科技有限公司正式落户杭州富春湾新城 定位为长三角区域总部 将以人工智能和数智产业两大基地为核心 [13] - 公司将持续助力富阳数字经济产业实现指数型增长 [14]
百度开源文心4.5系列10款模型,多项评测结果超DeepSeek-V3
Founder Park· 2025-06-30 14:22
百度文心大模型4.5系列开源 核心观点 - 百度正式开源文心大模型4.5系列,包含10款模型,涵盖47B和3B混合专家(MoE)模型及0.3B稠密参数模型,最大模型总参数量达424B,预训练权重和推理代码完全开源 [1] - 模型在多项评测中超越Qwen3和DeepSeek-V3,尤其在多模态理解、生成真实性方面表现突出 [5][8] - 开源模型已上线飞桨星河社区、Hugging Face等平台,并支持百度智能云千帆大模型平台API服务 [3][4] 模型能力与技术细节 模型架构与性能 - 包含原生多模态基础大模型,支持图片、音视频等多模态数据理解,生成效果更真实 [5] - 模型基准测试对比: - ERNIE-4.5-300B-A47B-Base在C-Eval、CMMLU、MMCU等评测中分别达91.5、91.2、95.9,均高于Qwen3和DeepSeek-V3 [8] - 数学能力(GSM8K、MATH)表现优异,ERNIE-4.5-300B-A47B-Base分别达91.8和69.1 [8] - 采用飞桨框架训练,FLOPs利用率达47%,支持Apache 2.0协议开源 [9] 关键技术突破 1. **多模态异构MoE预训练**:通过模态隔离路由、路由器正交损失等技术实现文本与视觉模态联合训练,提升跨模态推理性能 [9][10] 2. **高效基础设施**: - 训练端采用异构混合并行、FP8混合精度,推理端引入4位/2位无损量化和PD分解,提升吞吐量与性能 [12] 3. **特定模态后训练**: - 通过SFT、DPO/UPO强化学习方法优化视觉-语言模型,结合RLVR提升对齐能力 [12][13] 开发者反馈与行业影响 - 开发者认为300B参数版本可与DeepSeek V3 671B竞争,21B版本对标阿里Qwen 30B [14] - 28B模型因增加视觉功能受到关注 [15] - 行业期待文心大模型4.5 Turbo后续开源 [17]