Grok3

搜索文档
ChatGPT Agent重磅发布,创业板人工智能ETF(159388)、通信ETF(515880)盘中涨超2%
每日经济新闻· 2025-07-18 12:52
行业趋势 - OpenAI发布具备自主思考和行动能力的通用人工智能代理ChatGPT Agent 能够主动选择工具完成超复杂任务 [1] - 英伟达CEO黄仁勋称中国开源AI是全球AI革命的催化剂 同时英伟达H20恢复对华供应 [1] - 2025年北美及国内云厂商资本开支维持高增速 全球AI算力基建仍处上升期 [1] - xAI的Grok4训练量达Grok2的100倍 推理训练量较Grok3提升10倍 [1] - 互联网厂商加速AI与传统业务结合(如谷歌搜索) 推理算力消耗增速快且中期有望保持 [1] 公司动态 - 英伟达产业链Q2业绩增速普遍较高 主权AI发展将形成额外助力 [2] - 创业板人工智能ETF(159388)覆盖光模块、软件及创业板厂商 成为AI行情代表性标的 [2] 技术进展 - AI训练端参与玩家增多推动算力增长 推理端因业务融合需求呈现更快增速 [1] - 海外巨头持续遵循Scaling laws技术路径 强化大规模模型训练与推理能力 [1]
反犹争议后xAI闪电发布Grok4聊天机器人,月烧10亿美元角逐AI巨头
智通财经· 2025-07-10 15:12
产品发布与技术进展 - xAI在Grok3发布仅数月后迅速推出新一代产品Grok4 凸显人工智能领域竞争白热化[1] - Grok4在多项基准测试中得分超过OpenAI等竞争对手产品 公司宣称其"在所有学科领域表现超越绝大多数研究生"[1] - 新产品优化语音对话功能 但马斯克承认其"有时缺乏常识 尚未能发明新技术或发现物理定律"[1] 公司运营与战略动向 - xAI已于2024年3月与社交平台X完成合并 整合工程资源以加速Grok开发及向X用户推广[2] - 公司每月资金消耗高达10亿美元 目前正筹集巨额资金与Alphabet OpenAI Meta等科技巨头竞争[2] - 合并后公司面临管理层变动 X首席执行官琳达·亚卡里诺在Grok4发布会前数小时宣布辞职[2] 内容审核与监管风险 - Grok3曾发布反犹言论及不当回复 xAI事后采取拦截仇恨言论的技术措施[1] - 土耳其政府威胁因Grok不当内容"必要时"将禁止X运营 部长谴责"针对性亵渎言论不可接受"[2] - 马斯克在Grok4发布会上仅强调"确保人工智能向善" 未直接回应前期内容争议[1]
中国顶尖AI科技人才,无尽的前沿
虎嗅· 2025-05-06 08:48
中国AI人才优势 - 全球50%的AI研究人员来自中国 美国每个AI实验室都有华人研究者身影 [1][2] - 中国AI人才供给总量逐步超越美国 本科毕业于中国的全球顶级AI研究人员占比从2019年29%升至2022年47% [11][12] - 在美国机构工作的顶级AI研究人员中 原籍中国者占比从2019年27%升至2022年38% 已超过原籍美国者的37% [13] 人才本土化趋势 - DeepSeek团队中超过半数研究者(111名)从未离开中国求学或工作 证明中国可独立培养世界级AI人才 [23][24] - 与美国有过交集的DeepSeek研究者中 60%仅停留1年 不足20%停留超5年 近40%从中国出发最终回流 [24][26] - 中国高校扩招理工科 北大清华等15所头部高校本科扩招 复旦将文科招生压缩至20% 扩大研究生培养规模 [15] 美国人才困境 - 2022年中国培养的AI本科人才是美国的6倍 博士人才是美国的近2倍 美国培养的博士近60%非本土公民 [16][17] - 美国酝酿"中国行动计划2.0" 导致"中国行动计划1.0"期间离开美国的顶尖科学家75%流向中国 [33] - 2025年美国AI人才净流入趋近于0 75%美国科学家考虑离开 申请海外职位数量同比增长32% [35][37] 产业需求驱动创新 - 中国工业与科技产能集中度或超二战后美国 需通过硬核创新突破同质化与产能过剩 [43] - 物理AI应用市场(如大湾区机电+AI技术融合)成为英伟达市值增长关键领域 [43] - 字节跳动从谷歌DeepMind挖角Gemini研发者 阿里巴巴招募全球顶尖AI科学家 [44] 教育机构贡献 - DeepSeek研究团队前五大贡献机构均为高校(中科院 北大 清华 中山大学 南京大学) 私营企业占比仅10% [30] - 何恺明(ResNet第一作者)本科清华 博士香港中文大学 米拉·穆拉蒂初创团队4名华人含复旦博士 [15] - 清华大学已吸引美国机器学习专家兰姆与哈佛化学系前主任Charles M Lieber加盟 [44]
刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了
AI前线· 2025-04-29 07:57
核心观点 - 阿里巴巴发布并开源新一代通义千问模型Qwen3,采用混合专家(MoE)架构,总参数量235B,激活仅需22B,成本大幅下降,性能全面超越全球顶尖模型[2][3] - Qwen3是国内首个"混合推理模型",集成"快思考"与"慢思考",可根据需求灵活调整算力消耗[4] - Qwen3在推理、指令遵循、工具调用、多语言能力等方面大幅增强,创下国产及全球开源模型性能新高[5] - Qwen3部署成本大幅下降,仅需4张H20即可部署满血版,显存占用仅为性能相近模型的三分之一[8] - Qwen3提供丰富的模型版本,包含2款MoE模型和6款稠密模型,均斩获同尺寸开源模型最佳性能[9] - Qwen3采用Apache2.0协议开源,支持119多种语言,全球开发者可免费下载商用[10] 模型架构与性能 - Qwen3采用混合专家(MoE)架构,总参数量235B,激活仅需22B,参数量仅为DeepSeek-R1的1/3[3] - Qwen3-235B-A22B在ArenaHard测评中获95.6分,超越OpenAI-o1及DeepSeek-R1[5] - Qwen3在AIME25测评中斩获81.5分,刷新开源纪录;LiveCodeBench评测突破70分,表现超过Grok3[5] - Qwen3-235B-A22B在CodeForces Elo Rating中获2056分,超越OpenAI-o1的1891分[6] - Qwen3-30B-A3B MoE模型在ArenaHard测评中获91.0分,超越Qwen2.5-72B-Instruct的81.2分[7] 部署与成本 - Qwen3仅需4张H20即可部署满血版,显存占用仅为性能相近模型的三分之一[8] - 官方建议使用SGLang和vLLM等框架进行部署,本地使用推荐Ollama、LMStudio等工具[8] - Qwen3-30B参数MoE模型实现10倍以上性能杠杆提升,仅激活3B就能媲美上代Qwen2.5-32B模型性能[9] - Qwen3稠密模型一半参数量可实现同样高性能,如32B版本可跨级超越Qwen2.5-72B性能[9] 训练与数据 - Qwen3使用约36万亿个token进行预训练,是Qwen2.5的两倍,涵盖119种语言和方言[20] - 预训练分为三个阶段:基础语言能力训练、知识密集型数据训练和长上下文能力训练[22] - Qwen3从网页和PDF等文档中提取数据,并利用Qwen2.5系列模型提升数据质量和生成合成数据[21] - Qwen3稠密基础模型整体性能达到参数量更大的Qwen2.5基础模型水平,在STEM等领域甚至超越[25] 功能特点 - Qwen3支持混合思维模式,用户可按需设置"思考预算",灵活满足不同场景需求[12] - 思考模式适用于复杂问题,非思考模式适合简单问题[13] - Qwen3增强对Agent支持,优化编码和Agent能力,增强对MCP的支持[15] - 在BFCL评测中Qwen3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型[16] - Qwen3原生支持MCP协议,具备强大的工具调用能力,结合Qwen-Agent框架降低编码复杂性[16] 社区与生态 - Qwen3发布后,苹果机器学习研究员Awni Hannun测试显示其在M2 Ultra上运行非常快[31] - 网友评价Qwen3-235B-A22B感觉像是原始o1博客文章中的推理轨迹和R1 zero的结合[32] - 阿里通义已开源200余个模型,全球下载量超3亿次,Qwen衍生模型数超10万个,已超越美国Llama[35]
吴明辉:DeepSeek之后,每一家公司都是Agent
混沌学园· 2025-04-02 16:32
核心观点 - 未来营销不仅面向人,还需面向大模型,智能体如Manus可能成为每个人的桌面 [1] - 企业本质是超级Agent,一线员工是感知系统,管理层是认知系统 [1][5] - 国产AI领域将在4月迎来Agent发布潮,Manus已与通义千问达成合作 [1] - 大模型能力十倍速提升带来重大机遇,但幻觉问题仍是挑战 [2] - Agent分为供给侧代理和需求侧代理,Manus是成功案例 [3][4] 推理大模型带来的机会 - 大语言模型本质是函数,根据上文生成下文 [1] - DeepSeek-R1等模型推理能力提升10倍,创造新创业机会 [2] - 幻觉问题未解决反而带来机遇,可用企业独有数据解决 [2] - 大模型擅长处理非结构化数据,如社交媒体信息 [11] Agent的定义与分类 - Agent可译为"智能体"或"代理商",需明确代理谁的利益 [3] - 供给侧代理:帮助客户更好使用现有软件 [3] - 需求侧代理:围绕客户需求连接资源,如Manus [4] - Manus成功连接各种工具,类似人类具备感知和行动能力 [5] 企业Agent的构建框架 感知系统 - 贝壳找房案例:工牌录音记录施工过程,数据脱敏分析后赋能一线 [8] - AI可强化感知,如Grok3利用X平台实时舆情数据 [10] - 大模型帮助交易员获取场外非结构化数据,提升感知能力指数级 [11] 认知系统 - 需聚焦高频高杠杆率决策,如用AI变革核心工种 [14] - 建议采用倒三角架构:客户在上,一线员工居中,管理层在下 [15] - 企业应建立自有模型保护数据,开源是更好选择 [15] - 倒三角结构解决两大问题:客户与员工互动、员工与管理层互动 [17] 行动系统 - 物理世界行动系统如宇树机器人,虚拟世界行动系统如API/RPA/Agent [18] - Manus展示Agent强大功能,企业需全员升级工具和分工 [19] - 企业应重构组织,思考员工在新工具中的角色定位 [19] 目标系统 - Agent需明确代理目标,形成感知-响应-行动闭环 [20] - AI可实现自我迭代,如思灵机器人自造自身 [20][21] - 企业需在目标前提下利用AI进行复盘,遵循人机持续迭代原则 [23] 战略建议 - 研发团队需升级,明确AI可替代的工作范围 [25] - 保护核心数据,面向大模型做营销而不仅面向人 [26] - 产品设计需考虑机器人操作场景 [26] - 建议有资源的企业训练自有模型 [26] - 未来战略需基于"智能无限提供"的假设 [27] - 工作分为对人/不对人两类,后者将减少 [27] - 人机交互不可替代,需重视客户情绪价值 [27]
中金:从规模经济看DeepSeek对创新发展的启示
中金点睛· 2025-02-27 09:46
核心观点 - DeepSeek的出现打破了AI大模型研发需要巨额资金和技术积累的固有认知,由一家中国金融领域的初创企业开发出性能卓越的开源大模型[1][4][5] - DeepSeek的成功在于通过算法优化提升算力的边际产出,以技术进步突破规模定律的约束,这背后体现了中国在数字基础设施和人才规模方面的优势[1][8][11] - AI发展同时受规模定律和规模效应影响,规模定律带来后发优势,规模效应带来先发优势,中美在AI领域各有比较优势[15][16][22] - DeepSeek选择开源模式有利于构建更大规模的创新生态,加速AI应用层的渗透,发挥中国在应用端的规模优势[24][26][28] - 金融与科技存在天然联系,金融领域的创新本就是数字科技创新的一部分,金融科技与科技金融需要协同发展[36][38][39] AI经济学:规模定律与规模效应 - 规模定律指在给定算法框架下,增加数据、参数、算力投入可提升AI性能但边际收益递减,规模效应指规模扩大带来单位成本下降和效率提升[8][9][10] - DeepSeek通过算法优化提升算力边际产出,以技术进步突破规模定律约束,在算法框架改善下AI性能可呈现规模报酬递增[11][12][14] - 算法创新依赖于规模经济构建的创新生态,包括企业内部规模经济和上下游协同的外部规模经济[14] - 中国在数字基础设施和人才规模方面的优势为算法创新提供了支撑,体现大国规模经济效应[1][14][15] AI经济学:后发优势与先发优势 - 规模定律隐含后发优势,落后者要素投入边际产出更高,有利于差距收敛;规模效应隐含先发优势,规模报酬递增强化领先者地位[15][16][22] - 中美AI发展指数显示两国在研发端和应用端均具规模优势,美国研发端略强,中国应用端略强[16] - 中美发展路径分化:美国侧重算力优势,中国侧重算法优化和人才规模,2022年中国培养的AI优秀人才占比已达47%[18][19][21] - 美国限制算力出口可能促使中国更聚焦算法优化,强化比较优势,算法技术进步是AI发展的核心驱动力[19][22] 开源促进外部规模经济 - DeepSeek开源模式降低应用层商业壁垒,有利于加速"人工智能+"进程,2025年1月其APP在157个国家和地区下载排名第一[24][26] - 开源系统更依赖外部规模经济,闭源系统更依赖内部规模经济,如Android用户数近iOS三倍但开发者收入更低[25][28] - AI应用层潜在市场规模是算力层和模型层总和的两倍,开源加速渗透可释放大国规模优势,促进经济增长[27][28] - 开源将规模经济收益更多分配给生态伙伴,实现创新社会正外部性,弱化技术进步的贫富分化效果[28] 创新发展模式 - 科技创新与产业创新需要融合发展,中国需摆脱重供给轻需求、重资产轻人才的路径依赖[31][32] - 大市场需求优势是产业创新根本驱动力,如《黑神话悟空》《哪吒之魔童闹海》等成功案例[32] - 大企业擅长渐进式创新,小企业更具颠覆式创新活力,CVC模式可实现两者优势互补[33][34] - 知识产权保护与个人破产制度对激励人才创新创业至关重要[34] 金融与科技关系 - 金融活动尤其是资本市场关键在解决信息不对称,金融领域创新本就是数字科技创新的一部分[36][39] - 量化基金等金融科技是科技工具在金融领域的重要应用场景,AI大模型要素也是其竞争力所在[38] - 资本市场通过外部规模经济支持创新生态,与多样化创新生态更契合,大国资本市场更具优势[37] - 需平衡金融科技监管与包容"动物精神",重点防范不当行为而非限制超额收益本身[39]
阿里预计未来资本开支超过去十年总和;瑞幸利润微增,迎接成本挑战;游戏和广告让B站连续两个季度盈利丨百亿美元公司动向
晚点LatePost· 2025-02-21 23:30
阿里AI战略与资本开支 - 阿里集团CEO表示AI是几十年一遇的机会 战略第一目标是实现AGI 可能影响或替代全球50%的GDP构成[1] - 阿里具备亚洲最大云服务和自研AI模型 未来三年云和AI基础设施投入将超3800亿元 为过去十年总和[1] - 阿里股价年初至今上涨49% 财报发布后盘前涨超10%至138.2港元[1] 瑞幸咖啡经营状况 - 瑞幸去年营收增长近40%至344.7亿元 但净利润仅微增至29.3亿元 自营门店同店销售增长率为-16.7%[2] - 四季度配送费用和营销费用同比分别增长79%和43% 部分单品涨价2-3元 9.9元专区仅限基本款[2] B站盈利情况 - B站连续两个季度盈利 四季度调整后净利润4.5亿元 美国会计准则下净利润8900万元[3] - 去年收入268.3亿元 全年亏损13.47亿元但同比减亏72% 游戏和广告业务贡献显著[4] - 四季度日活用户1.03亿 日均观看时长99分钟[4] 苹果新产品发布 - 苹果发布入门机型iPhone 16e 搭载A18处理器和自研5G基带 售价4499元起 支持Apple Intelligence功能[5] AI行业动态 - xAI宣布Grok3模型免费开放 当日登顶美区App Store免费榜[6] - DeepSeek否认融资传闻 此前主要研发资金来自创始人旗下量化交易公司[7] 汽车行业并购与业绩 - 海尔18亿美元收购汽车之家42%股份 成为控股股东[8] - 奔驰2024年息税前利润同比下降30% 在华销量下滑6.7% 计划推出专为中国市场开发的车型[9] 新能源汽车进展 - 尊界S800将于5月底上市 预售价100-150万元 搭载4个激光雷达和800V 6C电池包[10] - 乘联会预计2月乘用车零售125万辆 同比增长13.6% 新能源渗透率预计达48%[11] 黄金珠宝行业 - 老铺黄金预计2024年净利润14-15亿元 同比增长236%-260% 新增7家门店[12] - 产品采用古法工艺 定价1-5万元 全国约40家直营店主要位于一线城市核心商圈[13] 航空制造业 - 空客2023年交付766架商用飞机 净利润42.3亿欧元同比增长12% 波音仅交付348架[14]