AGI(通用人工智能)
搜索文档
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
虎嗅· 2025-05-08 19:50
公司概况 - 阶跃星辰由前微软全球副总裁姜大昕于2023年创立,总部位于上海,北京办公室距离微软中国办公地仅504米 [1] - 公司核心管理团队包括CEO姜大昕(战略与技术研发)、首席科学家张祥雨(技术研发)、系统负责人朱亦博(AI基础设施) [1] - 公司员工规模达400余人,其中80%为技术研发人员,采用扁平化管理模式,员工可通过私信直接与CEO沟通 [2] - 2024年12月完成B轮数亿美元融资,是"AI六小虎"中少数坚持预训练路线的公司 [3] 技术战略 - 核心聚焦多模态基础模型研发,坚持"理解生成一体化架构"技术路线,认为这是实现AGI的必经之路 [1][11] - 已建立Step系列通用大模型矩阵,涵盖语言模型和多模态模型,2024年下半年多模态API调用量增长超45倍 [1][11] - 2025年1月发布推理模型Step R1-V-Mini,计划未来三个月推出满血版Step-R1 [14] - 近期将算法团队重组为"生成理解"团队,体现对理解生成一体化架构的重视 [1] 行业趋势判断 - 多模态领域尚未出现"GPT-4时刻",核心瓶颈在于缺乏统一的理解生成一体化架构 [1] - 模型演进路径分为三阶段:模拟世界(模仿训练)→探索世界(强化学习)→归纳世界(自主发现规律) [5][7] - 当前两大技术趋势:1) 将长思维链推理能力融入语言/多模态模型 2) 视觉领域理解生成一体化 [18][19] - 智能体(Agent)发展需要两个条件:多模态能力和慢思考能力,2024年这两方面取得突破性进展 [31] 产品应用 - 主要收入来源:面向品牌客户的ToB服务和面向开发者的API接口业务 [3] - 已推出Step 1X-Edit图片编辑模型,采用初级理解生成一体化技术,未来几个月将发布更先进版本 [30] - 重点布局智能终端Agent生态,与手机、汽车、机器人领域头部企业合作,提供云端Agent开发平台 [34][35] - 实际应用案例包括茶百道/瑞幸门店巡店系统,通过视觉推理实现90%以上的操作规范检测准确率 [17] 竞争格局 - 基础模型领域竞争激烈,过去半年仅OpenAI/Google/Meta/Grok/Anthropic就发布不少于8款新品 [3] - 国内竞争对手包括月之暗面、MiniMax等,但阶跃星辰在多模态覆盖广度和原生多模理念上具有差异化优势 [3][12] - 公司认为当前竞争焦点仍是"追求智能上限",将持续投入强化学习和多模态前沿技术研发 [4][15]
小米开源首个推理大模型 曾说不做OpenAI类大模型,现开出百万元年薪给团队“招兵买马”
每日经济新闻· 2025-05-02 00:08
4月30日,小米开源其首个推理大模型Xiaomi MiMo,同时公开了一个此前未曾公开露面的团队:小米大模型Core团队。根据小米 自己的说法,该模型只是团队的初步尝试。至于为何还是赶了"晚班车",小米方面称,2025年虽看似是大模型逐梦的后半程,不 过还是坚信AGI(通用人工智能)征途仍漫长。 参数方面,根据介绍,小米经强化学习训练形成的MiMo-7B-RL模型,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,用7B参数规模,得分超过了OpenAI的闭源推理模型o1-mini和阿里Qwen开源推理模型QwQ-32B-Preview。 在这篇推介自家大模型的文章末尾,小米还默默公开了一个简历投递邮箱,为刚成立不久的团队"招兵买马"。 每经记者 杨卉 每经编辑 魏官红 曾说不做OpenAI类大模型的小米变了。 《每日经济新闻》记者注意到,在部分招聘软件上,小米已经上线了大量与大模型相关的招聘信息,如"大模型算法专家""大模型 推理工程师""大模型数据策略工程师"等,其中公布的年薪最高可达128万元。此外,从招聘详情里也能看到小米给大模型落地找 到的一些场景,如智能门 ...
AI浪潮录丨对话刘知远:通往AGI不易,长跑要顶住资本寒冬
贝壳财经· 2025-04-29 09:18
北京AI产业发展现状 - 北京已成为AI大模型领域的战略高地,汇聚了智源研究院、月之暗面、DeepSeek、智谱等人工智能独角兽 [1] - 北京正积极打造"全球开源之都",开源生态已深入汽车、机器人等行业 [1] - 智源研究院发布的"悟道2.0"成为中国第一个万亿大模型 [4] 中国AI技术发展历程 - 2011-2012年科技部973计划项目投入数千万元支持自然语言处理研究,是国内最早的大规模专项支持 [6] - 2013年word2vec方法发布,国内团队立即跟进,与国外领先水平差距约3-4年 [6] - 2018年BERT模型发布,国内团队转向预训练模型研究,同年推出首个知识增强预训练模型ERNIE [7][8] - 2020年GPT-3发布,国内团队训练了CPM(中文预训练模型)第一个版本 [10] - 2024年DeepSeek成功复现OpenAI的o1模型,中美技术差距缩小至半年 [9] 智源研究院的作用 - 采用"投资就是投人"理念,成为顶尖学者的"天使投资人",支持面向未来的科研探索 [11] - 支持机制灵活,2020年拨款数百万元购置10台A100 GPU机器用于大模型训练 [10] - 通过"小同行评议"选拔优秀学者,支持青年科学家3年,理念先进 [11] 企业发展战略 - 面壁智能采取"小而美"的端侧模型战略,避开大厂竞争,从局部优势领域出发 [17][19] - DeepSeek通过算法创新与高效训练克服算力限制,2024年DeepSeek-R1火爆市场 [20] - AI创业者终极目标是奔向AGI,但需要分阶段实现,是一场"持久战" [17][18] 行业竞争格局 - 2023年后国内AI领域明显加速,多个AI"小龙""小虎"涌现,大模型百花齐放 [5][15] - DeepSeek的成功证明中国AI技术已具备国际竞争力,中美差距正在缩小 [5][20] - 行业需要更多耐心,中国可能涌现10个以上类似DeepSeek的企业 [21][22] 技术发展趋势 - AI发展两大主旋律:能效更高(Densing)和能力更强 [20] - 端侧大模型在数据保护、隐私安全方面具有优势,适合汽车座舱等场景 [19] - 未来将通过提高模型能力密度来获得市场竞争力 [20]
李善友:DeepSeek,是国运的AI支点
混沌学园· 2025-04-27 18:16
AI行业发展趋势 - 未来20年将是AI在中国的黄金发展期 [2] - 当前处于AI黎明阶段,技术变革速度达到10倍速 [57] - AGI实现时间预测在2026-2029年间 [52] - 中国正从技术跟随者转变为技术贡献者 [156] OpenAI发展历程 - 2015年成立时定位为非营利实验室,目标是开发安全开源AI [6] - 核心团队包括马斯克、奥特曼和Ilya [7] - 技术演进路径:从Transformer架构到GPT系列模型 [35][39][45] - ChatGPT发布5天用户破百万,2个月破亿成为增长最快应用 [44] - 最新o1模型准确率从GPT的13%跃升至83% [47] - 公司已从开源转向闭源,估值达3000亿美元 [228][230] 关键技术突破 - 1943年McCulloch和Pitts提出MP神经单元模型,奠定神经网络基础 [24][26] - 1986年Hinton提出反向传播算法,成为深度学习核心技术 [30][31] - 2012年AlexNet在ImageNet大赛错误率降至15%,证明深度学习可行性 [33] - 2017年Transformer架构问世,成为智能革命的"内燃机" [35][37] - Scaling Law法则:模型参数、数据量和GPU规模越大性能越强 [41] DeepSeek创新路径 - 2025年1月发布DeepSeek-R1,成为中国AI发展重要里程碑 [61][64] - 采用MLA和MoE架构,训练成本仅557万美元,为同类1/10 [75][81] - R1模型采用GRPO算法实现纯强化学习,公开推理过程 [89][91][98] - 定位为开源AI实验室,专注基础研究而非商业化 [110][118][123] - 团队由本土年轻人才组成,采用涌现式组织模式 [175][179][185] 行业竞争格局 - OpenAI已从挑战者变为行业主导者,商业化导向明显 [204][229] - DeepSeek填补了OpenAI放弃的开源生态位 [272][275] - 中国企业在基础研究领域开始突破传统跟随模式 [125][156][282] - 算力限制和芯片禁运是中国AI发展主要挑战 [71][72][280] 技术创新方向 - 涌现现象是AI发展的核心机制 [27][136] - 大语言模型成为智能时代基础设施 [46][282] - 工程创新在资源受限情况下展现巨大价值 [67][73][97] - 组织交互模式创新对技术突破至关重要 [179][183]
4.25犀牛财经晚报:腾讯音乐拟收购喜马拉雅 传Manus融资7500万美元
犀牛财经· 2025-04-25 18:38
上市公司董监高违反公开承诺案 - 全国首例上市公司董监高未履行公开增持承诺引发的证券侵权纠纷案件宣判 袁某、罗某在无资金准备情况下作出增持承诺 并以过桥资金制作虚假存款证明 构成虚假陈述 [1] - 上海金融法院判令袁某、罗某共同赔偿两名原告投资损失合计783,537.38元 其中刘某某获赔506,130.96元 郑某某获赔277,406.42元 [1] - 金某泰化工尽到基本审查义务 无证据表明其知晓虚假陈述行为 故不承担民事赔偿责任 [2] 科技企业动态 - 蚂蚁集团推出"Plan A"AI人才专项计划 面向全球招募顶尖AI硕博毕业生 首场宣讲会在新加坡ICLR 2025峰会举办 将加强AGI领域研发投入 [2] - 腾讯音乐拟收购喜马拉雅 交易已启动两个月 管理层已签字 但需监管部门批准 喜马拉雅在职人员超2300人 [2] - Manus据传完成7500万美元融资 由Benchmark领投 估值达5亿美元 计划拓展美国、日本和中东市场 [3] 人事变动 - 摩根士丹利任命胡霁光为中国区副主席 将推动中国地区投行业务增长 [3] - 曹慰将出任平安银行信用卡中心总裁 原为招商银行信用卡中心副总经理 [5] 企业运营 - 英特尔将裁撤约2万个工作岗位 占员工总数五分之一 裁员从第二季度开始持续数月 2024年8月已裁员1.5万人 [3] - 猿辅导回应武汉员工猝死事件 称事发时正值倒休假期 未安排加班 已成立专项工作组处理后续事宜 [5] 资本市场动态 - 林文杰以3.90亿元竞得汉富控股持有的全新好4500万股股票 占总股本12.99% 买入价8.67元/股 较市价溢价33.17% [4][5] - 千分一智能启动IPO辅导 为触控书写解决方案供应商 拟A股上市 [6] - 粤芯半导体启动IPO辅导 从事12英寸芯片制造 拟A股上市 [6] 上市公司业绩 - 中国电信一季度营收1345.09亿元 同比持平 净利润88.64亿元 同比增长3.11% [6] - 兴业证券一季度营收27.92亿元 同比增长17.48% 净利润5.16亿元 同比增长57.32% [7] - 金海高科一季度营收2.27亿元 同比增长20.57% 净利润4367.87万元 同比增长132.17% [8] - 东吴证券2024年营收115.34亿元 同比增长2.24% 净利润23.66亿元 同比增长18.19% 拟10派2.37元 [9] - 大商股份2024年营收69.49亿元 同比下降5.20% 净利润5.86亿元 同比增长16.05% 拟10派10元送1股 [10] 市场表现 - 创业板指涨0.59% 沪深两市成交额1.11万亿元 较前日放量45.5亿元 超2800只个股上涨 [11] - 电力板块表现强势 西昌电力等10余股涨停 算力股反弹 拓维信息涨停 统一大市场概念股冲高 [11]
深度|理想的“中等收入陷阱”
Z Finance· 2025-03-20 16:46
文章核心观点 - 2024年理想汽车营收和交付量增长,但面临利润下滑、毛利率承压等问题,增程和纯电市场竞争激烈,2025年需凭借纯电SUV与AGI技术突破,现金储备是优势也是考验 [1][14] 收入与利润情况 - 2024年全年营收1445亿元,连续两年破千亿,增速较2023年显著放缓,同比增长16.6% [2] - 净利润同比下降31.9%至80亿元,第四季度净利润同比降幅扩大至38.6% [2] - 毛利率从21.5%降至19.8%,主要受车型结构向低端倾斜及降价影响 [2] 现金流与现金储备 - 全年经营现金流达159亿元,同比下滑69% [3] - 现金储备突破1128亿元,同比增幅超30%,优于蔚来、小鹏和比亚迪 [3] 交付量与车型情况 - 2024年交付量达50.05万辆,同比增长33.1%,首次突破50万大关 [4] - 理想L6自2024年4月推出后成走量担当,全年销量约19万辆,占全年销量近40% [4] - 2024年理想MEGA、L7、L8、L9全系降价2 - 3万元不等 [4] 市场竞争情况 增程市场 - 高端市场新款问界M9已占据新能源汽车高端市场绝对地位,问界M8将与理想L9正面竞争,预售12小时订单量突破2.8万台 [7] - 中低端市场零跑C系列对标理想,C10以“理想平替”策略抢占家庭用户,2024年零跑收入321.6亿元,毛利率8.4%,全年交付近30万台,最后两月均交付超4万台,分流理想L6潜在用户 [7] - 小鹏、极氪、智己、埃安等品牌规划了增程式车型产品计划 [8] 纯电市场 - 2024年3月发布的纯电MPV车型MEGA市场表现未达预期,首月交付超3000辆后大多低于1000辆 [9] - 纯电车型面临客户转换、品牌认知和充电基础设施不足等问题,2024年新增超充站1427座、充电桩7900个,资本支出78亿元 [9] - 2025年将发布两款全新纯电SUV,首款理想i8预计7月发布,起售价约45万元,对标特斯拉Model X和蔚来ES6、ES8等,面临智能驾驶技术和消费者接受度等挑战 [10][11] AGI战略情况 - 李想提出理想汽车要做AGI时代的终端企业,预测未来将出现三种主要类型机器人 [12] - 公司核心目标是突破L3和L4级自动驾驶技术,但2024年研发投入控制,全年研发费用总支出111亿元,同比仅增长4.6%,下半年季度支出降低 [14]
解剖「百川」:王小川的AI医疗赌局
36氪· 2025-03-17 20:34
公司战略调整 - 百川智能经历三次战略变动:从聚焦模型研发和B端落地,到试水C端和多模态,最终裁撤B端聚焦医疗[8] - 2024年8月医疗组成为核心业务,筹措"过冬钱"的关键筹码[17] - 2025年3月裁撤B端组和PE团队,集中资源应对华为等竞争[29] 业务布局与挑战 - C端产品百小应日活未突破5000,被定位为"过渡型产品"[11] - 多模态模型Baichuan-Omni研发5个月后开源,但技术社区评价基础能力不足[14] - 医疗领域面临AI诊疗系统精确度不足和医院生态复杂等挑战[21][22] 医疗领域进展 - 投资医疗数据服务商"小儿方",组建30多名医生的医学产品部[25] - 高薪引进海外医疗专家,强化医疗模型训练的专业性[26] - 内部评测显示AI病例生成仅70-80分,需医生标注提升至90分落地标准[24] 市场竞争格局 - 华为组建医疗军团对百川形成直接竞争压力[3][4] - 医疗被视为差异化融资概念,避开智谱和月之暗面的优势领域[23] - 讯飞医疗2024年上半年亏损1.34亿且持续扩大,显示行业盈利困难[20] 财务与目标 - 现金流超过48个月,在"AI六小虎"中处于最稳健梯队[9] - 2025年营收目标设定为10亿元上市门槛[26] - DeepSeek开源推理模型R1加剧行业竞争,倒逼资源集中[27][28] 技术发展方向 - 从文本模型转向全模态模型研发,但面临技术路线不成熟和算力消耗问题[13][14] - 医疗模型被视为AGI路径的重要环节,强调医生在训练中的核心作用[24][26] - 计划结合百小应开发C端医疗产品,规避与华为的正面竞争[31]
1445亿元,理想汽车发布财报,李想透露新计划!
证券时报网· 2025-03-15 08:31
文章核心观点 3月14日理想汽车公布2024年第四季度及全年财报,营收增长但净利润下滑,交付量提升,公司计划2025年发布新车、研发新智驾模型并拓展国内外市场 [2] 营收与利润 - 2024年全年总收入1445亿元,同比增长16.6%,连续两年突破千亿元,但增速较2023年显著放缓;第四季度营收443亿元,环比增长3.3% [3] - 2024年净利润80亿元,较2023年的118亿元同比下降31.9%;非美会计准则净利润为106.7亿元,同比下降12.5%;第四季度净利润35亿元,环比增长25.3%,但同比减少38.6% [3] - 2024年毛利297亿元,同比增长7.9%;毛利率从2023年的22.2%降至20.5%,车辆毛利率降至19.8%,同比降1.7个百分点,主要因产品组合及定价策略变化,部分被成本下降抵销 [3] - 展望2025年第一季度,预计交付量8.82 - 9.3万辆,同比增长9.5% - 15.7%;营业收入234 - 247亿元,同比减少8.7% - 3.5% [4] 现金流与研发 - 2024年经营现金流159亿元,自我造血能力突出;到2024年末,现金储备1128亿元,同比增长8.8%,为行业最高水平之一 [4] - 2024年研发费用111亿元,占收入总额的7.7%,同比增长4.6%,连续两年超百亿元,重点投入智能驾驶、AI大模型及纯电技术;年末研发人员增至5930人 [4] 交付量与市场表现 - 2024年全年交付量50.05万辆,同比增长33.1%,成为中国首个年销量超50万辆的豪华品牌(20万元以上市场);第四季度交付15.87万辆 [5] - 截至2024年12月31日,累计交付超113.39万辆,在20万元以上新能源市场的全年累计市占率升至15.3% [5] 产品与技术 - 2024年发布家庭科技旗舰MPV理想MEGA和2024款理想L7、理想L8、理想L9;4月发布理想L6,定价20 - 30万元,第四季度月销量超2万台 [5] - 智能驾驶方面,端到端和视觉语言模型(VLM)架构全量推送用户,支持城市与高速全场景辅助驾驶 [5] - 2025年将发布两款全新纯电SUV,首款理想i8 7月发布,理想i6下半年发布 [7] - 公司正在研发下一代VLA智驾大模型,计划与i8同时在7月发布 [8] - 智驾系统升级到基于1000万Clips训练的V13版本后,智驾能力大幅提升,今年将陆续推出理想L系列和理想MEGA的智驾焕新版 [8] 销售与服务网络 - 截至2024年底,在全国150个城市拥有502家零售中心;已有1727座理想超充站投入使用,配备9100根充电桩,建成全国车企规模最大的高速超充网络 [7] - 推出“繁星计划”,与售后服务合作伙伴增加四线和五线城市门店覆盖;在全国高端商场开设超200个零售展厅和60个快闪店 [9] - 2025年计划新增2500座超充站,首款纯电SUV理想i8上市时投入使用2500座理想超充站 [7][9] 国际化布局 - 2025年1月德国慕尼黑研发中心成立,推动全球化战略 [6] - 依托中亚市场豪华品牌形象继续拓展市场,加大中东、拉美、亚太等市场开拓力度,2025年是海外市场战略正式开启元年 [9]
3 位连续创业者打造 Manus,应用潮里有更多 “underdog” 的机会(文末附 Manus、Open Manus 实测)
晚点LatePost· 2025-03-08 20:17
编辑 丨 程曼祺 3 月 6 日,AI 产品 Manus 引发关注。开发 Manus 的三位关键人物是:创始人、CEO 肖弘(小红);联 合创始人、首席科学家季逸超(Peak);以及产品合伙人张涛(hidecloud)——两位 90 后连续创业者 和一位 15 年换了 10 家公司的 85 后产品老兵。 一个边缘地带的 "underdog" 小团队 ,以车库创业的开发方式,出乎意料地搅起了一场小风暴。 "硬科技创业者基本都是名门正派,光谱另一端的消费级产品创始人则几乎都是畎亩之中。" 真格基金投 资人刘元说。他也是 Manus 的天使投资人。 毕业于华中科技大学的肖弘是江西吉安人,创业起点在武汉,曾开发过两款微信生态的插件:微信公众 号排版工具壹伴和企业微信客户关系管理工具微伴,卖给一家独角兽公司。 高中阶段就开始创业的季逸超是北京人,他在苹果 App Store 上线不久,就开发出猛犸浏览器,后来做 了 Magi 知识搜索引擎。季逸超曾告诉我们,那时有投资人 "诱惑" 他:我给你一笔钱,敢不敢做个 Google?他拒绝了,不是觉得做不到,而是他觉得只有 "抛开利益" 才有可能。 重庆人张涛则先后在烽火国际、 ...
深度|Sam Altman对AI经济的三大洞察和未来AI世界的展望
Z Potentials· 2025-03-07 10:29
文章核心观点 - 探讨AGI对人类社会经济的影响,认为其是人类进步新工具和开端,会带来巨大经济增长,同时指出发展中面临的机遇、挑战及应对方向 [2][3][11] 分组1:AGI的定义与意义 - AGI是能在多领域达人类水平、处理复杂问题的系统,是人类进步脚手架上的新工具和新开端,将带来惊人经济增长 [2][3] 分组2:AI经济学观察 - AI模型能力大致等于训练和运行资源的对数,投入资金可获持续可预测收益 [4] - 使用给定水平AI的成本约每12个月下降10倍,价格降低会增加使用,变化比摩尔定律更迅猛 [4] - 线性增长的智能带来的社会经济价值本质上是超指数的,指数级增长的投资短期内不会停止 [5] 分组3:AI Agent的影响 - AI Agent最终会像虚拟同事,如软件工程Agent能完成有几年经验软件工程师大部分任务,虽需人工监督指导,但设想大量此类Agent在各知识工作领域应用,影响巨大 [6] 分组4:AGI时代的社会经济变革 - AGI在经济上类似晶体管,短期内生活基本不变,长期对社会经济变化巨大,人们将有新工作和竞争方式 [7] - 十年内地球上每个人可能完成比当今最有影响力的人更多的事,2035年任何人能调动相当于2025年所有人的智力能力 [8] - AGI将成为人类意志力最大杠杆,自主性、意志力等有价值,其影响不均衡,科学进步加快,部分商品价格下降,奢侈品和稀缺资源价格上涨 [9][10] 分组5:AGI带来的机遇、挑战与应对 - 技术道路清晰,但将AGI融入社会的公共政策和集体意见重要,应让社会和技术共同发展 [11] - AI将渗透各领域,期望给予人们更多技术控制权,接近实现AGI时应倾向个人赋权,防止被专制政府利用 [11] - 确保AGI收益广泛分配至关重要,资本和劳动力力量平衡易被破坏,需早期干预,可考虑提供“算力预算”等方法 [11][12]