Workflow
开源与闭源
icon
搜索文档
硬核「吵」了30分钟:这场大模型圆桌,把AI行业的分歧说透了
机器之心· 2025-07-28 12:24
大模型技术演进与发展之路 核心观点 - 大模型技术从预训练为主转向强化学习主导的范式转变 [10][17][19] - 行业面临Transformer架构局限性、数据枯竭、开源闭源博弈等核心挑战 [31][41][59] - Agent应用爆发与基础模型研发需双轨并行 [53][54][55] 训练范式转变 - OpenAI从GPT-4o的预训练主导转向o1的强化学习后训练,提出测试时间扩展新维度 [13][14][15] - 强化学习可解决行为克隆难以建立目标导向推理能力的问题,但需突破自然语言反馈限制 [21][22][23] - 预训练仍是强化学习冷启动的基础,但需解决奖励机制和算力效率挑战 [25][26][27] 模型架构演进 - Transformer面临O(n²)扩展性、显存占用和长期记忆三大瓶颈 [31] - 优化路径包括RoPE位置编码、分组查询注意力等改进,以及Mamba等非Transformer架构探索 [33][34] - 智能体时代可能推动RNN架构回归,需建模无限上下文能力 [37][38] 数据供给挑战 - 高质量语料预计2028年耗尽,合成数据被Anthropic/OpenAI等广泛应用但存在迭代崩溃风险 [41][42][43] - 英伟达提出物理仿真生成边缘案例,需建立真实世界验证闭环 [44][45] - 行业数据未充分挖掘,应建立非敏感数据共享机制提升预训练质量 [46][48][51] 商业化落地路径 - 2025年Agent产品成爆点(如OpenAI Operator、智谱AutoGLM),但基础模型研发仍持续 [53][54] - 大模型当前相当于自动驾驶L3阶段,距AGI仍有差距 [55] - 金融等领域落地需突破大规模数据处理等技术瓶颈 [56][57] 开源生态影响 - DeepSeek等开源模型性能逼近闭源,冲击传统GPU/闭源产业链 [60][61] - 开源推动资源合理配置并形成行业压力,但需解决分叉滥用问题 [63][64][67] - 英伟达支持开源算力引擎,未来可能走向混合模式 [65][66]
深度|微软CTO最新访谈: 我不相信通用Agent,未来是成千上万Agent协作的时代,聊天界面只是过渡的交互模式
Z Finance· 2025-04-19 14:31
AI可持续价值与行业趋势 - 下一代AI领域正处于技术范式转变初期,价值分布尚不明确但充满探索机会[3] - 模型需通过产品与用户需求连接才能实现价值,产品层将承载主要价值[6] - 初创公司与成熟企业将均衡分享AI价值,大公司需结合现有资源创新[6][7] - 当前工具和基础设施成本达历史低点,大幅降低创新门槛[7] Scaling Law与数据效率 - Scaling Law尚未见极限,边际收益递减的临界点仍不可见[8] - 高质量数据token价值远超低质量数据,合成数据占比持续提升[9] - 缺乏科学的数据评估手段,数据实际贡献与宣称价值常存在差距[10][11] Agent发展路径 - 未来12个月将出现更多异步任务型Agent,突破即时交互模式[21][22] - Agent记忆功能是下一阶段突破重点,需实现长期行为积累[21] - 不会出现"全能Agent",而是细分领域专业化Agent网络[18] - 5年内95%新代码将由AI生成,但核心设计仍依赖人类[23] 开源与闭源生态 - 开源与闭源将长期共存,类似搜索引擎领域的分层结构[15] - DeepSeek R1开源引发行业关注,显示中国AI实力被低估[37] 技术债务与工程变革 - AI有望将技术债务从零和问题转为非零和问题,实现自动修复[30][31] - 小团队+AI工具将释放更大能量,改变传统工程团队结构[28] 医疗AI应用前景 - AI诊断能力已超越普通全科医生,亟待规模化应用[38] 中国AI竞争力 - 中国AI研发能力被系统性低估,DeepSeek案例打破偏见[37] 开发范式演进 - 编程抽象层次持续提升,提示工程将成主流交互方式[25][26] - 图形界面构建工具的发展轨迹预示AI编程工具演进路径[25]
谷歌不会自废武功
虎嗅APP· 2025-03-28 07:50
谷歌AOSP策略调整 - 谷歌决定不再维护现有的AOSP公开分支,逐渐关闭相关支持资源,并可能停止更新法定开源义务外的组件源代码 [2] - 从3月27日开始,所有安卓系统的开发工作将集中于谷歌内部代码库中进行,代码修改不再实时公开,仅在新版本分支发布时统一对外发布 [3] - 谷歌近几年在大方向上逐渐从开放走向封闭,但不会完全放弃AOSP [4][5] AOSP的历史与现状 - AOSP项目最初目的是借助厂商与开发者对开源的贡献完善Android体验,以对抗iOS系统 [6] - 早期有大量基于AOSP魔改的第三方UI/OS,谷歌无法从中获得流量分发利润 [8] - 谷歌将搜索、地图、Gmail等应用打包到GMS中,以出售许可证形式提供给终端厂商 [9] - 目前AOSP已不剩多少本地应用,仅保留Wifi、蓝牙等链接协议 [12] 谷歌调整AOSP的战略考量 - 将所有开发工作集中于内部代码库可大幅削减运营成本 [10] - 可逼迫需要紧跟Android更新的OEM厂商通过付费获得最新安全补丁和优化支持 [10] - 过去15年谷歌战略是不断"损AOSP肥GMS",将基础性应用从AOSP中移除并在Google Play发布 [11] - 基于AOSP打造的终端数量可能达上百亿台,涵盖移动终端、智能家居、工业应用等 [13] 操作系统行业的垄断竞争 - 如果AOSP停止维护,厂商可选择Linux、Ubuntu或JingOS等其他操作系统 [13] - 做操作系统本质上是围绕垄断的竞争,谷歌不会轻易放弃AOSP的生态优势 [14]
对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示
中国经济网· 2025-02-27 07:41
行业趋势与市场动态 - DeepSeek AI智能助手在2025年春节前夕同时登顶中美iOS免费应用排行榜第一,因其技术优化、成本压缩及开源模式优势在全球AI大模型圈引发冲击波 [2] - 资本对大模型创业公司态度从技术信仰转向务实落地,金沙江创始合伙人朱啸虎从认为"大模型六小虎最佳命运是被大厂收购"转变为"今年最佳投资主题是China AI" [4] - 2024年12月美国AI数据分析公司Databricks获得100亿美元融资,创当年风险投资纪录,反映数据+AI市场前景广阔 [5] - 2025年预计成为AI+Agent元年,行业AI渗透率将迅速突破临界点,各领域AI应用将类似移动应用般爆发 [2][29] 技术创新与研发突破 - DeepSeek-R1采用MoE+RL(混合专家模型结合强化学习)技术路线,在仅有极少标注数据情况下显著提升模型推理能力,训练成本仅为ChatGPT的1/10-1/20 [6] - DeepSeek预训练Token规模达14.8万亿,验证Scaling Law(规模化法则)在预训练阶段的关键作用 [11] - 中科闻歌自研雅意大模型训练历时6-9个月,算力成本达数千万,最终使其基础模型进入全球主流榜单前十 [24][25] - 未来技术突破方向包括:降维Scaling Law、强化学习创新、端侧算力芯片发展,可能孵化出下一个英伟达级别的企业 [29] 企业战略与商业模式 - 中科闻歌采用"底层大模型+上层行业应用"双轨战略,2024年数亿级收入中超一半与雅意大模型直接相关,80%以上收入受益于其技术支撑 [3][5] - 公司智川X-Agent平台全面接入DeepSeek全系大模型,通过多模型支持帮助客户快速构建AI搜索、翻译、客服等应用,将复杂项目交付周期从6-9个月缩短至3个月 [2][14] - 商业模式核心在于数据与AI结合,认为二者分离如同"拿锤子盲目找钉子",参考Databricks和Palantir(市值近3000亿美元)的成功案例 [17] - 头部客户续约率近100%,连续签约5年客户占比高,但C端产品仍需等待时机推出 [17] 技术生态与产业影响 - DeepSeek通过开源技术论文、允许R1模型用于数据蒸馏训练,极大促进国内AI生态发展,缩小中美AI技术差距 [6] - 开源与闭源之争将持续存在,闭源模型在前沿探索中投入大量资源,应保护其知识产权成果,逐步开源是行业螺旋上升过程 [7] - 构建自主统一计算框架将推动国内GPU芯片生态建设,需AI开发公司与研发公司共同突破底层硬件优化 [8] - 决策智能化时代到来,需突破动态实时感知、长程规划等能力,错误决策可能带来灾难性后果 [28] 公司发展历程 - 中科闻歌2017年由中科院自动化所科研团队创立,初期专注AI+媒体领域,创始人王磊2018年飞行174次拓展业务 [3] - 2022年ChatGPT问世后果断投入大模型研发,虽面临财务压力但最终提升客户竞争力,2024年收入验证战略正确性 [24][25] - 经历AI 1.0(经典人工智能)、2.0(数据驱动深度学习)、3.0(生成式AI)三个阶段,成为少数跨越三个技术周期的企业 [16] - 早期抓住国家融媒体建设机遇,从县级市场切入,逐步拓展至金融、医疗、能源等领域,形成"技术立得住+业务接地气"的发展路径 [21][22]
DeepSeek突然宣布:最高降价75%!
21世纪经济报道· 2025-02-26 20:08
API价格调整 - DeepSeek推出错峰优惠活动,北京时间每日00:30-08:30为优惠时段,API调用价格大幅下调,其中DeepSeek-V3降至原价的50%,DeepSeek-R1降至25% [1] - 在标准时段(北京时间08:30-00:30),V3和R1的百万tokens输入(缓存命中)价格分别为0.5元和1元,百万tokens输出分别为8元和16元 [2] - 在优惠时段(北京时间00:30-08:30),V3和R1的百万tokens输入(缓存命中)均降为0.25元,百万tokens输出均降为4元 [2][3] - 2月6日公司曾暂停API服务充值,2月25日重新开放API充值 [4] 模型技术参数 - DeepSeek主要有两款主力模型:deepseek-chat(基础大模型,对应V3)和deepseek-reasoner(推理模型,对应R1) [2] - 两款模型的上下文长度均为64K,最大输出长度均为8K [3][5] - deepseek-reasoner的最大思维链长度为32K [3][5] - 在缓存未命中情况下,标准时段V3和R1的百万tokens输入价格分别为2元和4元 [3][5] 开源战略 - DeepSeek启动"开源周",连续五天开源五大软件库 [6] - 2月24日开源FlashMLA,是针对Hopper GPU优化的高效MLA解码内核 [7] - 2月25日开源DeepEP,是用于MoE模型训练和推理的EP通信库 [7] - 开源策略带动AI渗透率加速,有望促进行业应用发展和算力需求增长 [8] - 行业出现开源趋势,Meta坚持开源路线,Google采取混合策略,OpenAI可能重新考虑开源 [10][11][12] 行业影响 - DeepSeek的出现改变了大模型企业对开源闭源的态度,百度宣布将在2025年6月30日起开源下一代文心大模型 [11] - OpenAI创始人承认需要制定不同的开源策略,可能再次开源大模型 [12] - MiniMax和阶跃星辰等国内企业已开始响应开源潮流 [12][13] - 开源被证明是能够快速占领市场、推动技术创新的战略路径 [14]
马克·安德森最新访谈:DeepSeek、宇树和AI影响下的权力结构
IPO早知道· 2025-02-16 21:39
核心观点 - AI技术正在重塑技术和地缘政治格局 美国在AI领域仍保持科学和技术领先地位 但中国公司如DeepSeek通过开源策略实现了突破性进展 [6][7] - 开源AI模型如DeepSeek的R1带来了30倍成本降低 使推理能力普及化 这将深刻改变多个行业 [7][8][9] - 全球权力结构正在经历精英与反精英的对抗 这种动态在政治、媒体等多个领域显现 [25][26][27] - 风险投资行业将因AI推理能力而发生变革 但早期投资中的人际互动仍难以被替代 [18][19][21] - 中国正在构建完整的科技供应链 从手机、无人机到汽车和机器人 形成系统性竞争优势 [36][37][38] DeepSeek与AI行业竞争 - DeepSeek通过开源策略实现了技术突破 发布了LLM V3和推理器R1的代码及技术论文 使AI推理能力普及化 [7] - 开源模式使AI推理成本降低30倍 用户可在6000美元硬件上运行与OpenAI相当的系统 [7] - DeepSeek的蒸馏技术允许模型压缩 使其能在MacBook或iPhone等设备上运行 [7] - Meta等公司正在借鉴DeepSeek的开源技术 推动行业整体进步 [7] - 专有模型公司如OpenAI和Anthropic成为主要输家 英伟达也面临挑战因其高利润芯片需求可能减少 [9][10] 开源与闭源之争 - 开源对学术研究和教学至关重要 使大学重新获得AI研究能力 [15] - 开源避免了技术成为少数公司的黑盒子 保障了透明度和创新 [15] - 风险投资公司支持最大程度的竞争 包括大公司、小公司和开源项目共同发展 [14][15] - 开源促进了AI技术的普及和成本降低 对行业整体有益 [15] 风险投资行业变革 - AI推理能力将改变投资分析方式 可能比人工分析年度报告更有效 [18][19] - 早期风险投资的核心仍是对人的评估和深度合作 这种人际互动难以被算法替代 [21] - 风险投资公司需要在永恒不变的价值观与紧跟时代变化之间找到平衡 [22][24] - 政治因素已成为风险投资必须考虑的新维度 这在过去并不常见 [22][32] 全球权力结构演变 - 全球正在经历精英与反精英的对抗 这种现象在政治、媒体等多个领域显现 [25][26] - 现有精英阶层的支持率普遍下降 反精英运动在各国崛起 [26][27] - 精英阶层需要通过不断吸纳新人才来保持活力 避免腐化 [27][28] - 媒体领域也经历精英与反精英的更替 传统媒体影响力下降而新媒体崛起 [26] 技术与供应链发展 - 中国正在构建完整的科技供应链 从手机、无人机到汽车和机器人 [36][37][38] - Unitree等中国公司以显著更低价格提供与波士顿动力相当的机器人产品 [37][38] - 现代电动汽车更像"带轮子的智能手机" 中国正在这一领域复制手机和无人机的成功 [37] - 全球供应链的复杂性带来效率但也存在脆弱性 政治因素增加了不确定性 [33][34][35] 生物技术前景 - 生物技术可能是下一个重大突破领域 包括生命延长、生殖技术等 [38][40] - 基因编辑技术如CRISPR可能带来智力增强等可能性 [38] - 干细胞技术可能解决生育问题 允许在更大年龄生育生物学意义上的孩子 [38]