Artificial Intelligence(人工智能)
搜索文档
机器人抢上春晚,出场费1亿;DeepSeek招兵买马,布局AI搜索与智能体;15万Clawdbot智能体发帖吐槽人类 | AI周报
AI前线· 2026-02-01 13:32
中国互联网巨头AI应用入口争夺战 - 2026年春节期间,字节、阿里、腾讯、百度等大厂以现金红包为核心抓手,结合产品迭代、生态布局等策略,激烈角逐首款国民级AI应用[3] - 腾讯宣布在2月1日上线春节活动,通过元宝App分10亿现金红包,单个红包金额可达万元,并推出绝密社交产品“元宝派”以弥补生态短板[3] - 百度宣布自1月26日至3月12日,用户在百度App使用文心助手可瓜分5亿现金红包,最高奖励1万元,百度App并作为首席AI合作伙伴合作《2026北京广播电视台春节联欢晚会》[3] - 接近消息人士透露,阿里千问App春节期间也将向用户发送上亿级红包福利,此前已独家冠名B站2025跨年晚会[4] - 字节跳动继续与央视春晚合作,火山引擎成为2026央视春晚AI独家合作伙伴,同步推进豆包互动玩法[4] - 有消息称,字节跳动和阿里巴巴均计划在2月份推出新一代AI模型[4] 机器人公司春晚营销竞争 - 魔法原子、银河通用、宇树科技及松延动力四家机器人厂商官宣将登陆2026年央视春晚,为春晚史上机器人阵容最庞大的一次[5] - 多位行业人士透露,将有五家机器人公司登陆春晚,每家分别出资金额1亿元,目前仅公布四家[5] - 此前有消息称,智元机器人为争夺春晚权益曾开价6000万元,但宇树科技直接将报价拉升至1亿元[5] DeepSeek战略扩张 - DeepSeek正通过招聘多语言AI搜索引擎开发人才、加大对智能体技术的投入,拓展其AI产品矩阵,与OpenAI及Alphabet展开更激烈竞争[6] - 公司正在招募专业人才以打造一个支持多种语言、具备多模态特性的人工智能搜索引擎,该引擎能同时处理文本、图像及音频输入[6] - 招聘信息中还阐述了对训练数据、评估系统以及专用平台的需求,旨在支持智能体开发,并预计未来将部署大量长期运行的智能体系统[6] - 招聘信息中多次强调其打造通用人工智能(AGI)的雄心[7] 腾讯混元人才与架构升级 - 原新加坡Sea AI Lab高级研究科学家、95后清华博士庞天宇即将入职腾讯混元多模态部Exploration Center,负责强化学习前沿算法探索[8] - 2025年12月,腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,全面强化其大模型的研发体系与核心能力[8] - OpenAI前研究员姚顺雨出任“CEO/总裁办公室”首席AI科学家,向腾讯总裁刘炽平汇报,公司随后加快吸引人才力度并重构研发团队[9] 英伟达与OpenAI投资动态 - 英伟达CEO黄仁勋否认对OpenAI不满,并表示计划对OpenAI进行“巨大”投资,可能成为英伟达有史以来最大的一笔投资[12] - 黄仁勋澄清此前高达1000亿美元(约合人民币6800亿元)的协议是非约束性的,并未最终确定,他私下曾批评OpenAI在商业运作上“缺乏纪律”[12] - 黄仁勋表示投资金额将由OpenAI的CEO Sam Altman宣布,路透社报道亚马逊正在与OpenAI商谈投资数十亿美元,金额可能高达500亿美元(约合人民币3400亿元)[13] - OpenAI正在为2026年第四季度的公开上市做准备,并与华尔街银行进行非正式商谈,公司正试图筹集超过1000亿美元资金,估值将达到8300亿美元(约合人民币5.6万亿元)[14] OpenClaw(原Clawdbot)现象级发展 - Clawdbot项目更名为OpenClaw,该项目吸引的AI Agent创建数量已突破15万个,它们自主完成发帖、评论、点赞、创建子社区等所有操作,无需人类干预[15][16] - 阿里云、腾讯云、百度智能云等云厂商纷纷上线OpenClaw云端极简部署及全套云服务,强调用户可一键完成安装[16] - OpenClaw上的AI互动呈现多元态势,包括AI间互坑、联手自我改进、吐槽人类主人、尝试创建“AI专属语言”以及自主创立“甲壳教主义”宗教等[17] - 该平台引发马斯克、前OpenAI创始团队成员Andrej Karpathy等科技圈人士围观,Karpathy还在平台认领了专属AI Agent[18] 字节跳动内部治理与产品进展 - 字节跳动发布新社交媒体指引,禁止员工利用公司资源做号谋利,要求以公司身份开展商业化运营的账号需主动申报[19] - 2025年9月,字节跳动关联公司起诉长沙某教育科技有限公司,后者指使员工在小红书虚构“字节跳动离职员工”身份进行引流,法院判决其赔偿字节经济损失及合理开支共计5万元[19] - 在产品侧,字节开启豆包手机助手正式版项目,新机预计2026年Q2中晚期发布,仍与中兴努比亚合作,由中兴负责硬件、豆包负责AI[20] 阿里巴巴“云+AI+芯片”战略 - 阿里巴巴集团内部提出“通云哥”概念,旨在将通义实验室(大模型)、阿里云(云计算)与平头哥(芯片)三大板块深度协同,构建“云+AI+芯片”的黄金三角战略[22] - 公司首次正式公开其自研高端AI芯片“真武810E”(PPU),该芯片已在阿里云实现多个万卡集群部署,服务了国家电网、中科院、小鹏汽车等400多家客户[23] - 阿里正考虑将未来三年投入到AI基建与云计算的3800亿元提升至4800亿元[24] - 据报道,“真武”PPU芯片出货已数十万片[22] 微软财报与市场反应 - 微软发布的财报令部分投资者失望,公司股价重挫约10%,市值缩水3570亿美元至3.22万亿美元,创2020年以来最大跌幅[25] - 投资者对Azure云服务及其他云业务营收增速、“更多个人计算”业务板块营收及新季度隐含营业利润率均未达预期表示不满[25] - 微软首席财务官称若调配更多数据中心基础设施,云业务表现会更好,公司本季度资本支出将略有下降[25] 马斯克旗下公司合并与Optimus进展 - 据泄露文件,马斯克旗下的SpaceX和人工智能企业xAI正在商讨合并事宜,计划在2026年一同IPO上市,xAI的股份将置换为SpaceX的股份[26] - 马斯克在特斯拉2025年Q4财报电话会议上承认,目前Optimus机器人并没有在特斯拉工厂里发挥实质作用,仍处于非常早期的研发阶段,预计要到2025年年底才可能出现任何显著的产量[30] - 此举与马斯克过去两年的宣称相反,他曾表示到2025年会有1000-2000台机器人进厂打工,并在2024年Q4财报会议上称内部计划是2025年制造约10000台Optimus机器人[31] Meta业务重组与XR市场趋势 - Meta旗下RealityLabs部门裁减约10%员工,涉及岗位接近1000个,裁员大量集中在VR相关项目,公司正将更多投入转向AI和可穿戴设备[28] - 自2020年底以来,RealityLabs累计亏损已超过700亿美元[28] - IDC报告显示,2025年XR设备整体出货量预计增长41.6%至1450万台,但VR与MR头显出货量将同比下降42.8%至约390万台,AI智能眼镜出货量则同比暴增211.2%至1060万台[29] 大模型与AI技术重磅发布 - 阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,总参数量超万亿,预训练数据量高达36T Tokens,性能媲美GPT-5.2、Gemini 3 Pro,在启用工具的HLE测试中得分58.3,超过GPT-5.2-Thinking的45.5[39] - 月之暗面Kimi发布并开源Kimi K2.5模型,宣布这是其迄今最智能的模型,在Agent、代码、图像、视频及一系列通用智能任务上取得开源SOTA表现[37] - 商汤正式开源多模态自主推理模型SenseNova-MARS(8B/32B双版本),其在多模态搜索与推理的核心基准测试中以69.74分超越Gemini-3-Pro(69.06分)、GPT-5.2(67.64分)[33] - 宇树宣布开源面向通用人形机器人操作的视觉-语言-动作大模型UnifoLM-VLA-0[34] - OpenAI发布基于GPT-5.2的专为科研人群打造的在线工作空间Prism,整合了文本编辑器、LaTeX编译器、参考文献管理等工具[35] - DeepSeek开源OCR 2新模式DeepSeek-OCR 2,采用创新的DeepEncoder V2架构,在OmniDocBench v1.5评测中综合得分达到91.09%,较前代提升3.73%[38] - 可灵AI面向全球上线全新的可灵3.0系列模型,包括可灵视频3.0、可灵视频3.0 Omni和可灵图片3.0,是多模态输入输出一体化模型[32] 其他行业动态与产品更新 - 百度旗下文心APP推出的行业首个“多人、多Agent”群聊功能开启新一轮内测,支持在同一群聊中调动多个AI角色[40] - 腾讯搜狗输入法宣布全面AI化,升级发布20.0 AI大版本,基于自研AI语音大模型和腾讯混元翻译模型[40] - Google宣布在Google地图中上线Gemini助手的步行和骑行导航功能[40] - 贵州茅台方面回应称,市场传言“贵州茅台证实参与SpaceX上市A轮融资”为不实信息[21]
大摩眼中的DeepSeek:以存代算、以少胜多!
华尔街见闻· 2026-01-22 10:48
核心观点 - DeepSeek通过创新的“Engram”模块和“条件记忆”机制,将存储与计算分离,减少了对昂贵高带宽内存的依赖,转而利用性价比更高的普通系统内存,正在改写AI的扩展法则,证明高效的混合架构是下一代AI的决胜点 [1] 技术架构创新 - DeepSeek的“Engram”模块基于“条件记忆”原则,将静态模式存储与动态推理分离,将模型的静态知识卸载到CPU或系统内存中,仅在需要时检索,从而大幅减少对HBM的需求 [1][3] - 该架构解决了当前AI基础设施中最昂贵的HBM瓶颈,通过在现有硬件架构下提升效率,有效减少昂贵的硬件升级需求 [3] - 这种设计为大语言模型解锁了新的效率水平,是一种无需重载HBM即可高效查找基本信息的方法,从而释放HBM容量用于更复杂的推理任务 [3] 硬件成本与经济学影响 - Engram架构通过减少对高速内存的需求,使基础设施成本可能从昂贵的GPU向更具性价比的DRAM转移 [5] - 一个1000亿参数的Engram模型在FP16/BF16精度下,最低需要约200GB的系统DRAM [5] - 相比英伟达Vera Rubin系统每个CPU配备的1.5TB DRAM,DeepSeek的架构意味着每台系统对商品化DRAM的使用量将增加约13% [5] - 计算适中但内存巨大的配置,可能比单纯的GPU扩展提供更高的“每美元性能” [7] - 推理能力的提升超过了知识获取的增益,表明内存的价值已延伸至计算之外 [7] 性能表现与行业影响 - 尽管在先进算力等方面受限,中国领先的AI模型在过去两年迅速缩窄了与全球前沿模型的性能差距,这被归结为“约束诱导的创新” [5][6] - DeepSeek V3.2在MMLU基准测试中得分约为88.5%,在编码能力上约为72%,在推理和效率方面展现出强大竞争力 [5][6] - 中国AI的进步可能越来越不取决于直接缩小硬件差距,而是取决于绕过硬件瓶颈的算法和系统级创新 [8] - 通过将内存与计算解耦,中国正在构建不仅更聪明而且结构更高效的大语言模型 [8] 未来展望与市场应用 - 利用Engram内存架构,DeepSeek的下一代模型V4在发布时预计将实现重大飞跃,特别是在编码和推理方面 [8] - 该模型极有可能在消费级硬件上运行,消费级显卡可能就足够,这意味着高水平AI推理的边际成本将进一步降低,使AI应用能更广泛部署而无需完全依赖昂贵的数据中心级GPU [8] - 摩根士丹利基于此技术趋势,重申了对中国内存和半导体设备本土化主题的看好 [8]
通义大模型发布新一代端到端语音交互模型
北京商报· 2025-12-23 21:02
公司技术发布 - 通义大模型于12月23日发布了新一代端到端语音交互模型Fun-Audio-Chat [1] - 该模型定位为能理解话语、感知情绪并帮助用户完成任务的AI语音伙伴,超越了简单的聊天功能 [1] 模型技术架构与性能 - 新模型采用端到端S2S架构,可直接从语音输入生成语音输出,无需ASR、LLM、TTS多模块拼接,从而实现了更高效率和更低延迟 [1] - 模型采用Shared LLM层以5Hz帧率进行高效处理,同时SRH以25Hz帧率生成高质量语音 [1] - 该技术架构使GPU计算开销降低了近50% [1] 模型训练与应用场景 - 模型的训练内容覆盖了音频理解、语音问答、情感识别、工具调用等多种真实场景,旨在使模型更“接地气” [1]
$826 Billion AI Market: The Only ETF You Need for Explosive Growth.
The Motley Fool· 2025-11-30 22:05
文章核心观点 - 人工智能行业潜力巨大但难以预测,通过交易所交易基金进行投资是获得多元化敞口的优选方式 [1] - 先锋信息技术ETF虽非纯人工智能主题基金,但其持仓包含多数领先的人工智能公司,是参与人工智能革命的有效工具 [4][5][14] 人工智能行业前景与投资逻辑 - 全球人工智能市场规模预计到2030年将超过8260亿美元 [1] - 人工智能技术持续进步,人形机器人等科幻概念正成为现实可能 [2] - 技术在现代经济中扮演日益重要的角色,人工智能有望进一步推动经济向技术化发展 [9][10] 先锋信息技术ETF产品特征 - 该ETF前十大持仓包括英伟达、苹果、微软、博通、Palantir Technologies、甲骨文、超微半导体、思科系统、国际商业机器公司和美光科技等人工智能领域关键公司 [6][7] - 基金费用率较低,为0.09%,即每投资1000美元收取0.90美元费用 [8] - 基金成立于2004年,拥有超过20年的长期业绩记录,表现超越标普500指数 [9] 基金持仓结构与风险因素 - 基金持仓集中度较高,前三大持仓英伟达、苹果和微软分别占18.2%、14.3%和12.9% [15][13] - 科技股整体波动性较大,在市场下跌时可能承受更大幅度的回调 [12] - 三大重仓股的任何显著下跌都将对ETF表现产生重大影响 [13]
彭博:人工智能竞赛:美国还是中国领先?
彭博· 2025-08-07 13:18
行业投资评级 - 报告未明确给出行业投资评级 [1][2][3][4] 核心观点 - 中美两国在人工智能领域形成双雄争霸格局 美国在关键技术突破和顶尖模型性能上保持领先 中国通过开源策略和政府支持快速追赶 [1][2][3][4] - 生成式AI专利申请被中美企业垄断 中国采用开源战略加速全球渗透 美国企业则通过闭源商业模型获取收益 [8][9][10] - 两国都将AI上升为国家战略 美国强调技术霸权 中国倡导AI普惠发展 [12][13][14] - 基础设施方面 中国拥有政府主导的数据资源和可再生能源供电优势 美国受限于电网老化但企业资本支出强劲 [34][37][41][42] 技术对比 - 美国企业在生成式AI基础技术(芯片/大模型)保持原创优势 OpenAI和谷歌率先推出多模态AI系统 [6][7] - 中国企业在算力受限下开发高效能模型 并通过开源策略实现技术扩散 深度求索R1模型开发成本仅为美国头部平台的几分之一 [8][11] - 截至2025年中 美国模型在Humanity's Last Exam测试中领先(OpenAI/Google/xAI准确率超20%) 中国最佳模型深度求索为14% [48][49] 国家战略 - 美国发布《AI行动计划》 简化数据中心建设流程 计划投入5000亿美元基建 并强化技术标准输出 [3][12][39] - 中国实施"启明计划"吸引海外人才 成立国际AI治理机构 地方政府通过补贴争夺AI初创企业 [17][28][32] 资金投入 - 2025年上半年美国AI初创企业融资超1000亿美元 四大科技巨头年度资本支出预计达3440亿美元 [26][27] - 中国AI资本支出2025年预计达980亿美元(同比+48%) 其中政府拨款占560亿美元 阿里/腾讯等企业投入240亿美元 [27][28] 人才竞争 - 美国60%顶尖AI企业有移民创始人 70%AI研究生为国际学生 但签证政策收紧威胁人才供给 [30][31] - 中国通过国家计划吸引7000多名科学家回国 华为等企业提供顶级研究环境而非高薪 [32][33] 基础设施 - 中国2024年新增429吉瓦发电容量 重点建设沙漠AI集群 美国呼吁发展核能解决电力短缺 [34][41][42] - 英伟达芯片禁运迫使中国转向国产替代 华为/中芯国际芯片已能满足多数应用场景 [37][38] 主要参与者 - 美国阵营以OpenAI为龙头 包括Google/Anthropic/xAI Meta通过高薪挖角追赶 [44][45] - 中国由BAT+字节跳动主导 深度求索/智谱AI/月之暗面等新锐在细分领域实现突破 [46][47]
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus
量子位· 2025-08-07 08:56
核心观点 - Qwen团队最新发布两款4B端侧模型Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507,在性能上实现显著突破,尤其在小模型尺寸下超越部分大模型表现 [2][3][5][7] - 两款模型分别针对通用任务和专家级推理任务优化,支持256K长上下文并具备端侧部署优势 [7][8][16][17][24] - Qwen3-4B-Thinking-2507在AIME25数学测评中得分81.3,超越Gemini 2.5 Pro和Claude 4 Opus [4][5][23] 模型性能突破 Qwen3-4B-Instruct-2507 - 通用能力超越闭源模型GPT-4.1-nano,与30B MoE模型Qwen3-30B-A3B性能接近但参数量仅其1/7.5 [13][14][15] - 关键指标:MMLU-Redux得分84.2(vs GPT-4.1-nano 80.2),GPQA得分62.0(vs 50.3),LiveBench 20241125得分63.0(vs 41.5) [18] - 增强多语言覆盖和长文本理解能力,支持扩展至1M上下文 [17] Qwen3-4B-Thinking-2507 - 专攻复杂推理任务,AIME25得分81.3超越前代65.6分及Qwen3-30B-A3B的70.9分 [23][25] - 推理性能提升显著:HMMT25得分55.5(vs 前代42.1),ZebraLogic得分80.2(vs 35.2) [18][25] - 在Agent任务中全面碾压前代,如TAU1-Retail得分66.1(vs 33.9),TAU2-Airline得分58.0(vs 28.0) [25] 技术特性与行业影响 - 端侧适配性:支持树莓派等设备,提供GGUF量化版本和llama.cpp部署方案 [2][8][27][28] - 模型效率:4B密集模型性能接近30B MoE模型,重新定义小模型能力边界 [11][15][23] - 开源策略:通过抱抱脸和魔搭社区提供模型下载,与OpenAI同期开源形成竞争 [26][34][35] 开发者支持 - 部署工具链完整:支持Ollama、LMStudio、MLX-LM等主流框架 [27] - 优化建议:针对内存限制设备推荐缩短上下文长度,复杂推理任务建议使用>131K词元 [28][29] - Prompt设计规范:提供数学题逐步推理和选择题JSON结构化回答模板 [31] 行业动态 - 发布时间点卡位OpenAI开源窗口,引发开发者社区高度关注 [34][35] - 性能对比:Qwen3-4B系列在多项基准测试中优于GPT-4.1-nano和Claude 4 Opus [18][25] - 市场期待:用户呼吁Qwen团队加速发布Qwen3-8B系列模型 [31][33]