Workflow
AGI
icon
搜索文档
姜大昕走“窄门”
36氪· 2025-06-12 18:11
公司动态 - 阶跃星辰Tech Fellow段楠离职并加入京东探索研究院担任视觉与多模态实验室负责人 [1] - 公司于2023年4月成立 被称为"多模态卷王" Step系列基座模型研发速度快 [5] - 2024年7月发布Step-2万亿参数语言大模型正式版 Step-1.5V多模态模型 Step-1X图像生成大模型 [5] - 2025年1月一周内发布6款模型 包括推理模型 [5] - 2025年4月30日发布Step-1o-Vision-32k (highres)视觉大模型 [11] 产品调整 - 2024年12月停止大范围投入角色扮演类Agent产品"冒泡鸭" 团队合并至对话产品"跃问"(现更名为"阶跃AI") [1] - 产品策略从早期探索转向聚焦Agent方向 计划在汽车 手机 具身智能 IoT等场景布局 [17] - 与OPPO合作提供"一键全能搜" "一键问屏"服务 与吉利汽车探索"AI+车"场景 与智元机器人合作探索AI+具身机器人 [17][18] 技术路线 - 选择开发端到端的原生多模态大模型 不同于OpenAI式的逐步添加模态的路径 [15] - 认为多模态是实现AGI的必经之路 坚持原生多模理念 [5][21] - 批评Sora技术路线 认为大模型发展主线应是理解生成一体化 [15] - 视觉大模型Step-1o-Vision-32k在chatBot Arena细分榜单排名21位 [11] 市场表现 - 阶跃AI未进入月活TOP15的AI原生APP榜 推测月活不足300万 [6] - 在chatBot Arena总榜未上榜 在六小龙中落后于DeepSeek 零一万物 智谱 [9][10] - 市场投入谨慎 相比Kimi MiniMax等公司投流力度较小 [8] - 开发者认知度较低 被视为大模型调用备选项 [14] 融资与竞争 - 融资规模在AI六小龙中不是最多 单轮融资额也不是最高 [13] - 面临来自科技巨头(腾讯 阿里 字节)和其他创企(Kimi MiniMax 智谱)的激烈竞争 [25] - 2025年国内大模型融资几乎停滞 需要向投资人证明技术路线可行性 [26][28] 团队与挑战 - 创始人姜大昕曾任微软全球副总裁 主导过Bing Azure Microsoft 365等产品的自然语言理解系统 [13] - 视频模型团队部分核心成员跟随段楠加入京东 [1] - 技术路线激进但难度大 需要突破原生多模态模型的技术瓶颈 [15][17] - 缺乏独特市场标签 相比竞品存在感较弱 [4][22]
杨立昆的“反ChatGPT”实验,能救Meta吗?
第一财经· 2025-06-12 17:20
Meta的AI双线战略 - 公司采取双线并进策略应对AI竞争,一方面推进杨立昆主导的"世界模型"V-JEPA 2,另一方面由扎克伯格组建"超级智能"团队押注主流LLM路线 [1][12] - Llama 4发布后表现不佳导致公司在开源大模型领域落后于GPT/o系列、Gemini和Claude,同时面临中国DeepSeek和Qwen的竞争压力 [10] - 公司2025年资本开支指引上调至640-720亿美元,重点增加数据中心和基础设施投资以支持AI发展 [12] 世界模型技术路线 - V-JEPA 2采用联合嵌入预测架构(JEPA),放弃主流Transformer架构,拥有12亿参数,训练使用超过100万小时视频和100万张图像 [4][6] - 该模型比英伟达Cosmos快30倍,专注于物理世界交互能力,使AI能预测行为后果并规划行动方案 [6] - 杨立昆认为自回归LLM存在事实错误、逻辑缺陷等问题,世界模型能提供更接近人类直觉的物理世界理解能力 [4][5] 超级智能团队布局 - 扎克伯格亲自组建约50人顶尖AI团队,提供数千万美元薪酬方案,目标成为AGI领域领导者 [11] - 已招募谷歌DeepMind首席研究员Jack Rae和Sesame AI机器学习负责人Johan Schalkwyk,二人曾参与Gemini项目 [11] - 公司投资数十亿美元(传闻150亿)于数据标注公司Scale AI,其CEO将加入Meta团队,Scale AI当前估值超百亿美元 [12] 战略资源投入 - 公司广告业务现金流可支撑AI巨额投入,计划建设世界顶级算力数据中心 [12] - 杨立昆作为图灵奖得主坚持非主流路线20年,认为自回归预测彻底失败,但当前仍面临内外压力 [7][10] - 扎克伯格回归"创始人模式",认为公司有能力和责任率先实现AGI [2]
下一个十年,AI的大方向
虎嗅· 2025-06-12 09:16
人工智能行业发展回顾 - 2015年AlphaGo击败李世石标志着人工智能技术出圈并迎来爆发期,AI四小龙等公司纷纷创业,主打视觉识别技术 [1] - 2025年行业回顾显示AI四小龙已纷纷凋零,中国AI领域涌现出文心、通义、混元等十余个大模型 [3][4] - 2015-2025年被视为AI上半场(视觉识别),2025-2035年可能转向视觉生成领域 [4] 当前AI技术热点 - 文本生成领域聚焦代码生成和文案生成 [4] - 语音生成领域集中在音乐生成和播客生成 [4] - 图片生成技术应用于海报制作和美颜功能 [5] - 视频生成技术覆盖广告制作和影视创作 [5] - 除中国代码生成外,中外AI企业已在其他生成领域实现商业化变现 [6] 技术里程碑事件 - 2017年Transformer架构颠覆传统专有模型研究范式,导致大量学者回归学术界 [7] - 2023年ChatGPT突破引发行业震动,谷歌仓促推出Gemini应对 [7] - 2024年OpenAI先后发布Sora视觉模型和深度思考o1系统,推动行业突破文本长度竞赛 [8] 头部企业技术路线 - ChatGPT和DeepSeek未重点布局生成技术,而是强化推理能力建设 [10] - DeepSeek的核心优势被归纳为国产化、开源架构、资源效率高、中文语料优化和媒体背书 [10] 技术发展方向争议 - 行业存在AGI(通用人工智能)与AIGC(生成式AI)发展路径的哲学争论 [11] - 可回收火箭案例显示技术创新价值常需事后验证,类比当前AI技术争议 [13][14][15] 技术应用原则 - 历史经验表明局域网/互联网/移动互联网/云计算时代均有明确应用边界 [16][17][18][19] - 人工智能时代需要建立类似"若无法实现XX功能则不应强行AI化"的应用准则 [20]
CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源
机器之心· 2025-06-12 08:53
多模态大模型学习新范式 - 提出Crab统一学习框架,通过数据和模型两个角度实现多模态场景理解任务的高效统一,超越垂类专家模型 [2][3][13] - 当前主流的多任务指令微调范式忽视多模态数据异质性和任务间复杂关系,联合训练可能导致任务相互干扰 [2][13] - 新范式明确任务间互助关系,在时序定位、空间定位、像素级理解和时空推理等任务上实现通用理解能力 [3][13][26] 数据集构建与特征 - 构建AV-UIE数据集,包含200K训练样本,涵盖九种任务,其中时序定位任务占比6.8%,空间定位任务占比25.8%,像素级理解任务占比41.6%,时空理解任务占比25.8% [20] - 数据集通过细化现有标签增加显示推理过程,包含具体时空信息,明确任务间互助关系 [16][18] - 采用in-context learning方式利用多模态大模型标注,辅以人工检查纠正,保证数据质量 [18] 模型架构与技术创新 - 设计Interaction-aware LoRA结构,采用共享A矩阵和多个不同LoRA Head B矩阵,每个Head学习数据交互的不同层面 [23] - 通过Router为不同任务分配权重,解耦模型能力,增强特定能力并建立任务间协助桥梁 [23] - 模型包含三个统一多模态接口,处理audio、visual和segmentation mask数据 [21] 实验性能对比 - 在AVE任务上准确率达到80.15%,超过AVT(75.80)、PSP(77.80)和MM-Pyramid(77.80)等专有模型 [27][28] - 在ARIG任务上cloU达到41.78,AUC达到0.42,超过LVS(23.69 cloU)、EZ-VSL(26.43 cloU)和FNAC(27.15 cloU)等专有模型 [28] - 在AVQA任务上平均准确率达到78.94%,超过ST-AVQA(71.59)、COCA(72.33)和PSTP-Net(73.52)等专有模型 [27][29] 任务类型与能力展示 - 时序定位任务要求模型输入音视频并定位时序片段,如找到发生的音视频事件 [5] - 空间定位任务要求模型输入音频和图像并定位发声物体位置 [7] - 像素级理解任务要求模型输入音频和图片并分割发声物体,包含S4、MS3、AVSS和Ref-AVS等多种分割任务 [9] - 时空推理任务要求模型输入乐器演奏音视频并回答相关问题,涉及时序和空间信息理解与推理 [8]
该翻篇就翻篇吧,搞 AI 一定要向前看
Founder Park· 2025-06-11 20:36
Founder Park /AGI Playground 2025 动意以 Agenda 6.20 PM lec 特别单元 22822882 Founder Show x se np 新锐与成熟创业者的 28 深度探讨 30 6.21 AM 主题分享: Why Chapter 2 ? 6.21 PM Al 硬件 垂直 Agent 全球化 50 6.22 AM al Al Cloud 100 China x AGI Playground 6.22 PM 创业新范式 | 出海新方法 | After Party 6.21 22 PM 露天 Social Playground 喝点东西, 坐下唠! Founder Park /AGI Playground (2025 Buy Tickets Now 15 16 17 18 19 20 21 23 Founder Park Founder Park 2 % % 2 % % % /AGI Playground /AGI Plavaround /2025 '2025 /早鸟单日票 早的印度 /6月22日 /6月21日 31 32 33 x751 × 751 34 35 36 ...
他本是浙大医学4+4,现在带队上海机器人冲刺IPO
36氪· 2025-06-11 18:35
公司概况 - 上海仙工智能是一家以"机器人大脑"(控制系统)为核心的智能机器人公司,成立仅5年已成为全球机器人控制器出货量第一的企业[1][4] - 公司采用"控制器+软件+机器人"一站式解决方案,控制器适配超过300种零部件,支持客户模块化搭建机器人[4][6] - 业务覆盖全球30+国家和地区,客户数量从2022年380家增长至2024年832家,年复合增长率48%[4][14] 产品与技术 - SRC系列控制器集成SLAM、自然环境导航等算法,适配20+行业上千场景,2024年单独销售4055台(年复合增长率54.5%)[6][14] - 自研云端软件系统实现全流程数字化管理,支持多类型机器人统一调度,2024年软件收入2029万元(占6%)[8][20] - 提供1000+款预装控制器机器人产品,2024年出货2576台(年复合增长率84.6%),收入占比提升至69.5%[10][20] 财务表现 - 营收从2022年1.84亿元增长至2024年3.39亿元(年复合增长率35.7%),毛利率稳定在45%-49%[18][26] - 机器人业务收入占比持续提升(2024年2.36亿元),但控制器业务毛利率高达81%[20][26] - 经调整净亏损率从2022年-16.7%收窄至2024年-3.1%,主要因股份支付等非现金支出影响[29][32] 研发与团队 - 研发费用占比超20%,154人团队由5位核心成员带领,包括3位浙大校友联合创始人[22][33] - CEO赵越曾获RoboCup机器人世界杯冠军,持股52.89%投票权,核心团队含多位算法专家[35][37][39] - 科沃斯等机构参与四轮融资,IPO前估值32.7亿元(较首轮增长10倍)[43][44][45] 行业趋势 - 全球智能机器人销量从2020年40.66万台增至2024年108.26万台(年复合增长率27.7%),预计2029年达325万台[49][51] - 近期5家机器人公司集中赴港上市,反映AI进步与自动化需求推动行业进入黄金发展期[47][48][53]
36氪冯大刚:努力伴随AGI一代人共同成长|WAVES新浪潮2025
36氪· 2025-06-11 15:25
中国创投市场新纪元 - 中国创投市场处于周期筑底转折点与结构性转型深化期,政策主导、国资与资本高度集中的新生态正在形成 [1] - 36氪WAVES 2025大会聚焦AI技术革新、全球化浪潮与价值重估等前沿议题,汇聚顶级投资人、创业者及跨领域专家 [1] AI技术发展与行业动态 - AGI(通用人工智能)成为新生产力范式,Deepseek、Manus等案例标志技术加速发展 [3][4] - 2023-2024年创投行业活跃度显著提升,融资事件与产品发布频率达每周级别 [5] - 杭州余杭区(良渚)成为AI创业聚集地,涌现"杭州六小龙"等新兴团队 [5][6] 36氪WAVES大会亮点 - 大会设置投资人会场与创业者平行会场,汇集国内AI领域最具话语权的投资人与创业者 [7] - 特别环节"Let's WAVES"聚焦00后创业者,展示其对未来的独特见解 [7] - 36氪成立15周年,定位为伴随AGI时代成长的新一代创投服务平台 [8] 行业代际变迁 - 移动互联网时代成就中国商业科技最伟大公司,当前进入以AGI为核心的新周期 [3][9] - 新一代创业者展现差异化风貌,通过独立演讲形式输出对技术、产品的原创思考 [7]
智擎全球·链算未来:AGI分布式智算网络扬帆出海,重塑全球算力文明新秩序
分布式AI算力国际出海战略 - 香港智擎集团正式启动"分布式AI算力国际出海战略",核心为AGI分布式智算网络区块链,旨在突破集中式垄断并实现社会协同 [1] - 该战略标志着中国技术方案在重塑全球算力秩序中迈出关键一步,以破界之势进入全球市场 [1] 算力资源与行业变革 - 算力资源已成为驱动数字文明的"新石油",但硬件垄断、高昂成本和僵化调度机制制约全球创新活力 [2] - AGI分布式智算网络通过区块链技术重构算力生产关系,构建去中心化、全球共享的算力神经网络 [2] - 智能合约的不可篡改性降低协作成本,跨链交互协议释放算力资产流动性,使算力成为可自由交易的基础性生产资源 [2] 技术创新与多维赋能 - AGI分布式智算网络采用"使用即增值"经济模型,每笔算力交易自动触发部分Token销毁,形成稀缺性与生态价值增长的动态平衡 [3] - 初创团队可接近边际成本获取海量算力资源,使3D实时渲染、量子模拟、大模型训练等高算力应用走向普惠化 [3] - 催生"算力产消者"新物种,企业可将闲置设备接入网络转化为收益来源,个体可将消费电子产品转变为生息资产 [3] 社会与国家战略意义 - 打破技术话语权垄断,使全球技术边缘群体获得平等参与智能革命的入场券 [3] - 致力于将算力从资本垄断中释放,重塑为支撑人类集体智慧进化的公共基础设施 [3] - 填平国家、区域间的技术鸿沟,实现"算力即民主"的理想 [3] 法治化与国际化路径 - 依托《民营经济促进法》构建企业安全发展空间,借鉴杭州、深圳等地方政府的前沿天使投资模式 [4] - 战略路径包括参与长三角算力枢纽建设、与浙江大学展开前沿合作、打造标杆应用 [4] - 最终目标是携手"一带一路"沿线及全球各国,建设分布式算力网络枢纽节点 [4] 行业范式升级 - AGI分布式智算网络代表对人类协作文明范式的深刻升级,追求算力资源分配正义和全球算力民主化 [5] - 通过算法共识机制缔造个人利益与集体福祉深度融合的协作范式 [5] - 推动构建更平等、高效、可持续的数字文明新秩序 [6]
13410亿,字节跳动的万亿野心
投中网· 2025-06-11 10:36
字节跳动AI战略布局 - 字节跳动在2024年显著加强AI领域投入,将原AI Lab并入大模型部门Seed,强化研产一体化和AGI研究,并取消季度考核以保障长期创新 [5] - 公司启动"2026届Top Seed校招计划",面向全球招募30名顶尖博士,提供80万-220万年薪及独立算力资源 [5] - 2024年第一季度推出超过20款AI应用,布局10个赛道,产品线整合包括将"猫箱"和"星绘"并入豆包App,发布Agent产品"扣子" [5][6] 人才战略与组织调整 - 字节跳动延续"抢人"策略,招聘数百个AI相关职位,同时重用资深高管如朱骏(原TikTok负责人)和陆游(原抖音社交负责人)主导新项目 [8][9][10] - 内部采用"先外后内"策略,海外版Coze率先上线测试市场,国内版扣子空间上线首日用户突破50万 [12][14] - 公司向创投圈输送大量人才,包括高管和产品经理,其中字节系产品经理成为VC争抢对象 [6][26] 产品与商业化进展 - 豆包大模型成为战略核心,2024年5月正式发布并升级视频通话功能,为AI眼镜上线铺路 [15][20] - AI硬件布局涵盖耳机、眼镜等设备,2024年收购Oladance后推出AI无线耳机,中秋推出AI玩具"显眼包" [15] - 2024年AI资本开支达800亿元,超过BAT总和,2025年计划支出1600亿元(后被公司否认) [18] 市场竞争与行业影响 - 字节采用"多点开花"策略,与阿里(侧重B端)、腾讯(聚焦微信生态)形成差异化竞争 [19][20] - 字节系创业者2023年以来成立至少30个项目,覆盖硬件、基础设施、应用等方向,获红杉、高瓴等机构投资 [23][24][25] - 公司净利润率从2023年26%降至2024年21%,但预计2025年营收将达1860亿美元(约13410亿人民币),接近Meta水平 [19]
Report: Meta taps Scale AI's Alexandr Wang to join new ‘superintelligence' lab
TechCrunch· 2025-06-10 23:22
Meta AI战略布局 - 公司计划成立专注于"超级智能"的新AI研究实验室 以增强在AI领域的竞争力 [1] - 已聘请Scale AI创始人兼CEO Alexandr Wang加入新实验室 同时考虑对Scale AI进行数十亿美元投资 并吸纳其员工 [1] - 从OpenAI和谷歌挖角多名首席研究人员 强化团队实力 [1] 管理层动态与战略目标 - CEO Mark Zuckerberg对公司AI进展不足感到不满 亲自在Lake Tahoe和Palo Alto住所面试研究人员 计划组建约50人团队 包括新任AI研究负责人 [2] - 管理层认为公司有能力且应当超越其他科技企业 率先实现通用人工智能(AGI) [2] 用户规模里程碑 - Meta AI上月月活跃用户突破10亿 [3]