Workflow
AI科技大本营
icon
搜索文档
腾讯混元开源首个13B激活MoE大模型:推理提升超2倍,单卡可跑!
AI科技大本营· 2025-06-27 17:31
【编者按】首个13B激活参数的MoE大模型 Hunyuan-A13B重磅来袭:总参数80B、256K原生长上下文、推理速度是同类模型2倍以上,单卡可跑、效果拉 满,日均调用超1.3亿次! 出品丨AI 科技大本营(ID:rgznai100) 6月27日,腾讯混元宣布开源首个混合推理MoE模型 Hunyuan-A13B,总参数80B,激活参数仅13B,效果比肩同等架构领先开源模型,但是推理速度 更快,性价比更高。这意味着,开发者可以用更低门槛的方式获得更好的模型能力。 即日起,模型已经在 Github 和 Huggingface 等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。 项目相关链接 AI产品爆发,但你的痛点解决了吗?8.15-16 北京威斯汀·全球产品经理大会,3000+AI产品人社群已就位。 添加小助手进群,抢占AI产品下一波红利 进群后,您将有机会得到: 这是业界首个13B级别的MoE开源混合推理模型,基于先进的模型架构,Hunyuan-A13B表现出强大的通用能力,在多个业内权威数据测试集上获得 好成绩,并且在Agent工具调用和长文能力上有突出表现。 体验入口:https ...
与技术谈实现,与客户谈价值,与高管谈钱!硅谷顶级产品专家亲述生存法则
AI科技大本营· 2025-06-27 09:54
作者 | Rich Mironov 责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 为什么那么多聪明的团队,最终却做出了没人要的产品? 这往往不是因为技术不行,或者销售不努力。根本原因在于,一家公司里,人们在说着不同的"语言": 每个人都在自己的轨道上全力冲刺,但彼此之间却像隔着一堵无形的墙。这堵墙,就是大多数产品走向失败的起点。我们缺的不是更快的工程师或更强 的销售,而是一个能打破这堵墙的" 翻译官 "。 这正是硅谷传奇产品专家 Rich Mironov 用整个职业生涯在扮演的角色。 他称自己为"跳伞救火员"(smokejumper)——当森林大火燃起,空降到火场后方,制造隔离带,扑灭混乱的根源。过去数十年,他先后"空降"到 15 家陷入危机的公司,曾在 6 家硅谷初创公司工作,亲手拆解过无数个因沟通失效而濒临失败的企业软件项目。 在 全球产品经理大会(PM-Summit) 的舞台上,这位身经百战的"救火员",以《如何构建产品领导力》为主题分享了他从无数火场废墟中带回的洞 察: " 产品失败的最大元凶,不是开发太慢,而是我们对客户的问题理解得不够透彻,或者我们构建的解决方案对客户来说行 ...
通往 AGI 之路的苦涩教训
AI科技大本营· 2025-06-26 19:10
" 未来 5 到 10 年内,我们有 50% 的概率实现通用人工智能(AGI)。 " Google DeepMind CEO、 诺贝尔化学奖得主 Demis Hassabis 在本月初的一个采访中给出了惊人的预测。 AI 浪潮正以前所未有的速度加速进行中,在这条被追捧、被加速、甚至被神化 的 AGI 之路上,我们是否也踩过无数"看似正确却最终失败"的岔路? 早在 2019 年,"强化学习之父"Richard Sutton 发表了著名的《The Bitter Lesson》(苦涩的教训)一文,他指出:过去 70 年,AI 研究最大的弯路 就是我们太依赖人类已有的知识与直觉,而历史一再表明,真正能带来突破的,反而是那些"摒弃人类经验、依靠计算规模"的方法。 在 Sutton 看来,算力与数据才是推动 AI 向前的根本引擎,而不是人类引以为傲的"智慧"本身。 这句话听起来也许刺耳,却道出了一个时代的真相——在这场智能革命中,许多我们曾深信不疑的"路径"与"经验",正在变成新纪元的障碍。 这也正是我们本期《万有引力》直播对话的主题——「 通往 AGI 之路的苦涩教训」 。 6 月 27 日 12:00-14:00,C ...
AI 时代最大的“幻觉”:我们有了最强工具,却正在失去定义真问题的能力
AI科技大本营· 2025-06-26 09:17
作者 | 杨一溪 责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 当 AI 能在一秒内生成无数种方案时,我们反而比任何时候都更容易迷失在"可能性"的汪洋里。我们似乎拥有了解决一切问题的能力,却正在失去定 义"真问题"的耐心。 这正是 BAT 增长顾问、前快手产品总监 杨一溪 ,在全球产品经理大会(PM-Summit)上试图击穿 的迷思。 这位曾亲手将快手 DAU 拉升 117 个百分 点、把美团商家钱包从 0 做到 500 万,甚至参与过"天宫"空间站计划的增长实战派,带来的不是更复杂的 AI 模型,而是一个返璞归真的常识: 在算力 爆炸的时代,最稀缺的,是对人心的洞察力。 "所有增长的出发点都是用户需求和洞察,这是不变的。" 这些都不是聪明工具的胜利,而是"笨拙"洞察的胜利。它证明了,无论技术如何演进,商业的本质,依旧是人与人的连接。杨一溪的分享,与其说是一 套增长方法论,不如说是一份清醒剂。它提醒每一个被技术浪潮裹挟的人: 有时候,知道用户为什么离开,比知道他们为什么留下更重要。 以下,是杨一溪的完整分享。 AI 产品爆发,但你的痛点解决了吗? 8.15-16 北京威斯汀·全球产品经 ...
模型训练最重要的依然是 Scaling —— 对话阿里通义千问 Qwen 多语言负责人杨宝嵩 | Open AGI Forum
AI科技大本营· 2025-06-25 14:49
以下文章来源于GOSIM开源创新汇 ,作者Open AGI Forum 出品 | GOSIM 开源创新汇 近年来,随着大模型技术在全球范围内快速崛起,"出海"成为每家 AI 公司绕不开的话题。在这场激 烈的全球竞逐中,阿里巴巴通义实验室研发的通义千问( Qwen )表现尤为抢眼。 作为全球开源社 区 Hugging Face 上下载量最高的模型之一,Qwen 甚至在欧美用户中收获了超越中文用户的热情 拥趸。 这种国际化成功的背后,是通义实验室在多语言技术上的深度布局与战略眼光。 在法国巴黎举行的 GOSIM AI Paris 大会现场, CSDN&《新程序员》执行总编唐小引 与 阿里巴 巴通义实验室研究科学家杨宝嵩 进行了深入交流。作为 Qwen 多语言能力的负责人,杨宝嵩带领团 队赋予了 Qwen 模型备受称赞的支持全球 119 种语言 的能力。采访中,他透露了 Qwen 一开始就 将国际化视作核心战略 ,优先考虑多语言数据优化,确保全球用户都能公平享受 AI 带来的技术普 惠。 杨宝嵩指出,大模型出海并非简单的语言翻译问题,而是要直面不同语言背后复杂的文化规范和禁忌 内容。在多语言安全性与文化对齐方面,团 ...
被 AI 大厂逼至绝望,这帮欧洲人发起了一场“科学复兴运动”
AI科技大本营· 2025-06-24 15:45
作者 & 采访 | 王启隆 Eric Wang 出品丨GOSIM 开源创新汇 2021 年 1 月,当 OpenAI 的 DALL-E 模型用一串文本便能生成"精彩绝伦的图像"时,整个科技界为之震动。 然而,在这片赞叹声中,一种更复杂的情绪正在一群科学家、工程师和爱好者心中悄然发酵——那是一种混杂着敬畏与深刻挫败感的"绝望"。 这种绝望,源于一个日益尖锐的矛盾:人工智能领域最前沿、最具革命性的成果,正被越来越多地锁在少数科技巨头的"黑箱"之中。模型不开源,数据 集不公开,研究过程无法复现。对于视"可复现性"为基石的科学界而言,这无异于前路被巨石阻断。你如何去研究一个你甚至无法独立验证的现象? 火花,在德国一间普通的高中课堂之外被点燃。Christoph Schuhmann,一位物理与计算机科学教师,在读完 DALL-E 的论文后,内心深受震撼。一 个强烈的念头在他心中萌发:我们必须能够复现这样的模型!他立刻意识到,首要的、也是最大的障碍,是那个外界无从知晓的海量训练数据集。 在 Elute AI 服务器,一个 AI 爱好者的在线社群里,Schuhmann 提出了一个看似简单却极具开创性的想法:我们或许可以从 ...
李建忠对话 KK 凯文.凯利:通用智能是个伪命题,AI 不应该模仿人类 | AI 进化论
AI科技大本营· 2025-06-23 16:38
AI 的人机交互、单一设备 VS 多元设备 - 凯文·凯利预测智能眼镜将在25年后取代智能手机成为个人计算中心设备,但需攻克储能技术等五项关键突破 [5][6] - 镜像世界的构建不依赖眼镜,特斯拉自动驾驶汽车和TikTok等已在扫描真实世界训练AI的空间智能 [6][7] - 技术发展呈现钟摆效应,未来设备可能回归专业化,但智能手机是例外,AR眼镜或成为通用平台连接专业化应用 [7][8][9] AI 的路线之争、通用智能 VS 专用智能 - 技术路线呈现从专用模型向通用模型统一趋势,大语言模型已统一文本任务,但应用层面专用AI更实用 [10] - AI发展路径存在巨大不确定性,分为"扩展派"(持续扩大模型规模)和"专业化派"(终端小模型、领域专用AI) [11][12] - 凯文·凯利个人倾向专业化路线,认为需为不同场景做好准备,避免垄断生态 [12] AI 哲学思辨、"异人智能"与人类智能 - AI智能与人类智能本质不同,AI意识将是"异人意识",其智能构成和演进环境(人类需求)决定差异 [13][14][16] - 人类价值在于责任承担能力,未来工作核心是管理AI并为其决策担责,人性本身成为稀缺资产 [15][16] AI 的创新 VS 人类的创新 - AI创造力分为日常创新(当前可实现)和颠覆式创新(25年内或部分实现),后者将开辟全新领域 [17][18] - AI创新呈现"异人"特质,如AlphaGo第37手,但社会消化现有AI技术仍需10年,重大突破尚需时间 [17][19] Agent 的生态与入口之争 - Agent生态将推动互联网从"信息网络"升级为"行动网络",入口之争涉及超级AI助理、操作系统或新型设备 [20] - 智能眼镜可能成为Agent交互界面,需支持多模态交互(语音、手势、表情),苹果等公司正探索相关设备 [20][21] AI 时代的操作系统 - AIOS需定义自然语言交互标准,实现跨Agent协作,开源属性可避免垄断,责任是规范人机交互协议 [23] AI 变革内容创作与内容消费 - 未来内容向3D/4D沉浸式体验迁移,AI将具备情绪反应能力,引发人机情感联结革命 [24][25] - AI成为内容主要消费者,催生为AI创作的新模式,如传记专供AI阅读,重塑互联网商业模式 [26][27] AI 时代的创业公司与巨头竞争 - 科技巨头面临创新者窘境,OpenAI等创业公司更可能主导AI变革,因巨头难以冒险投入高风险新业务 [28][29] - 突破窘境需强决断力领导者,如盖茨和乔布斯,但成功概率极低 [29][30] 人形机器人 VS 专用机器人 - 绝大多数机器人非人形但适配人类尺寸基础设施,仅家用机器人可能拟人化,工作场景优先普及 [31][32][33] AI 时代的组织变革 - 小公司AI应用速度快于大公司,因需重构组织而非简单添加AI工具,亚马逊要求15万员工强制实验AI [34] - 成功关键为持续试错(容忍10次失败)、量化评估人机协同效果,中层管理者受影响最大 [34][35] 行业活动与趋势 - 《AI进化论》系列直播吸引超50万人观看,聚焦DeepSeek等前沿技术,构建高信噪比思想策源地 [1][37]
Andrej Karpathy最新演讲刷屏:软件 3.0 时代已经到来!
AI科技大本营· 2025-06-20 13:49
软件范式变革 - 过去70年软件底层范式几乎未变,但近几年连续经历两次剧烈跃迁,进入Software 3.0时代 [6][7][21] - Software 1.0:人类用Python、C++等语言明确编写代码,主导过去70年 [16] - Software 2.0:以神经网络权重为核心,通过数据集和优化算法自动生成程序,典型代表如Hugging Face托管模型 [15][16][17] - Software 3.0:以自然语言提示词编程大型语言模型(LLM),实现更灵活的组合与编排 [25][26] LLM的生态定位 - LLM具备公共事业属性,服务中断会导致全球性"智能停电",依赖度将持续增长 [39][43][44][45] - 训练LLM类似建造芯片工厂,需巨额资本投入(CAPEX)和尖端技术,通过API按量计费(OPEX) [46][47] - LLM是新时代操作系统,生态演化路径与计算机历史相似:闭源提供商(如OpenAI)与开源替代品(如Llama)并存 [50][55][58] 技术扩散路径反转 - LLM颠覆传统技术扩散路径,直接进入消费市场解决日常问题,而非优先服务军事/政府需求 [73][74] - 公司需追赶消费者使用步伐,应用起点与演化路径将不同于以往技术 [74] LLM的认知特性与局限 - LLM具有"人类灵魂"特质:百科全书式记忆但存在幻觉、智能不均衡、顺行性遗忘等认知缺陷 [75][76] - 安全风险突出,易受提示词注入攻击,需设计机制规避风险 [77] 应用开发范式迁移 - 特斯拉案例显示:Autopilot中Software 2.0神经网络逐步替代传统C++代码(Software 1.0) [30][31][33][34] - 自然语言编程降低门槛,实现"人人可编程",但产品化涉及支付/认证等非代码环节仍是痛点 [99][104][106] - 未来需构建LLM友好型基础设施,如上下文构建器(Gitingest)、协议标准(MCP)等 [109][110][111] 人机协作发展方向 - 短期应聚焦"部分自治应用",通过图形界面和"自治滑块"实现可控自主 [83][84][95] - 长期需平衡增强与自主,类似钢铁侠战衣的人机融合模式 [93][94][115]
从 OpenAI 回清华,吴翼揭秘强化学习之路:随机选的、笑谈“当年不懂股权的我” | AGI 技术 50 人
AI科技大本营· 2025-06-19 09:41
受访者 | 吴翼 采访 | 王启隆 编辑 | 屠敏 出品 | CSDN(ID:CSDNnews) 人工智能的浪潮席卷而来,从大模型竞赛到智能体系统的探索,从生成模型到推理模型,技术巨头们 纷纷入场,推动着一场"AI 重新定义一切"的时代跃迁。但在这场热潮背后,真正推动技术向前的, 从来不是一场场轰动的发布会,也不是那些令人眼花缭乱的融资神话,而是一群敢于直面复杂性、埋 头钻研底层机制的工程师与研究者。 吴翼,就是其中一位。 1992 年出生的他,高中时期便在全国青少年信息学奥林匹克竞赛(NOI2009)中斩获金牌,并代 表中国参加国际信息学奥林匹克竞赛(IOI2010)。此后,他被清华大学交叉信息研究院提前"签 下",保送进入以"顶尖人才训练"著称的姚班,成为 图灵奖得主姚期智教授的桃李门生 。在本科阶 段,吴翼先后前往微软亚洲研究院、Facebook 实习,积累了丰富的经验。 2014 年本科毕业后,吴翼赴加州大学伯克利分校,攻读人工智能方向的博士学位,师从著名 AI 学 者 Stuart Russell,深入研究深度强化学习的泛化性以及多智能体学习。博士毕业后,他加入 OpenAI,成为全职研究员。 在 ...
与“硅谷精神之父”凯文·凯利(KK)对话,聊聊一万天后的 AI 产品
AI科技大本营· 2025-06-18 15:55
凯文·凯利对中国互联网的影响 - 凯文·凯利的思想深刻影响了马化腾、张小龙等中国互联网开拓者,其著作《失控》被奉为行业"必读圣经"[1] - 2012年马化腾在与凯文·凯利对话中,就微信的"野蛮生长"、垄断指控和平台战略等腾讯面临的现实问题寻求解答[4] - 凯文·凯利提出的"自然垄断"、"共同控制"和"涌现"等概念被张小龙应用于微信开发,并将《失控》作为团队招聘标准[5] 历史预言与行业演变 - 凯文·凯利2012年预言"消灭你的那个人不会出现在既定名单中",随后字节跳动创始人张一鸣用抖音冲击腾讯社交根基[5] - 2013年搜狗CEO王小川、创新工场李开复均与凯文·凯利展开深度对话,如今二人分别创立百川智能和零一万物投身AI浪潮[6] - 凯文·凯利的去中心化理论在中国被用于构建"超级App",形成历史性反差[5] AI时代的未来展望 - 凯文·凯利新书《2049》预测:智能眼镜取代手机、人类专注低效创新、专业AI生态取代单一AGI、中国文化输出成为全球力量[14] - 提出AI时代核心问题:开发者角色定位、人类创新根基存续、AI Agent生态的权力分配等[14] - 全球产品经理大会将汇聚3000+AI产品精英,探讨AI落地难题[6][13] 行业活动与思想碰撞 - 8月15-16日北京全球产品经理大会将围绕产品设计、智能落地等12大专题展开,聚集互联网大厂与AI创业公司实战专家[13] - 凯文·凯利与CSDN李建忠的对话将聚焦未来25年技术演进,探讨AI产品方向[10][12]