AGI

搜索文档
对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示
中国经济网· 2025-02-27 07:41
行业趋势与市场动态 - DeepSeek AI智能助手在2025年春节前夕同时登顶中美iOS免费应用排行榜第一,因其技术优化、成本压缩及开源模式优势在全球AI大模型圈引发冲击波 [2] - 资本对大模型创业公司态度从技术信仰转向务实落地,金沙江创始合伙人朱啸虎从认为"大模型六小虎最佳命运是被大厂收购"转变为"今年最佳投资主题是China AI" [4] - 2024年12月美国AI数据分析公司Databricks获得100亿美元融资,创当年风险投资纪录,反映数据+AI市场前景广阔 [5] - 2025年预计成为AI+Agent元年,行业AI渗透率将迅速突破临界点,各领域AI应用将类似移动应用般爆发 [2][29] 技术创新与研发突破 - DeepSeek-R1采用MoE+RL(混合专家模型结合强化学习)技术路线,在仅有极少标注数据情况下显著提升模型推理能力,训练成本仅为ChatGPT的1/10-1/20 [6] - DeepSeek预训练Token规模达14.8万亿,验证Scaling Law(规模化法则)在预训练阶段的关键作用 [11] - 中科闻歌自研雅意大模型训练历时6-9个月,算力成本达数千万,最终使其基础模型进入全球主流榜单前十 [24][25] - 未来技术突破方向包括:降维Scaling Law、强化学习创新、端侧算力芯片发展,可能孵化出下一个英伟达级别的企业 [29] 企业战略与商业模式 - 中科闻歌采用"底层大模型+上层行业应用"双轨战略,2024年数亿级收入中超一半与雅意大模型直接相关,80%以上收入受益于其技术支撑 [3][5] - 公司智川X-Agent平台全面接入DeepSeek全系大模型,通过多模型支持帮助客户快速构建AI搜索、翻译、客服等应用,将复杂项目交付周期从6-9个月缩短至3个月 [2][14] - 商业模式核心在于数据与AI结合,认为二者分离如同"拿锤子盲目找钉子",参考Databricks和Palantir(市值近3000亿美元)的成功案例 [17] - 头部客户续约率近100%,连续签约5年客户占比高,但C端产品仍需等待时机推出 [17] 技术生态与产业影响 - DeepSeek通过开源技术论文、允许R1模型用于数据蒸馏训练,极大促进国内AI生态发展,缩小中美AI技术差距 [6] - 开源与闭源之争将持续存在,闭源模型在前沿探索中投入大量资源,应保护其知识产权成果,逐步开源是行业螺旋上升过程 [7] - 构建自主统一计算框架将推动国内GPU芯片生态建设,需AI开发公司与研发公司共同突破底层硬件优化 [8] - 决策智能化时代到来,需突破动态实时感知、长程规划等能力,错误决策可能带来灾难性后果 [28] 公司发展历程 - 中科闻歌2017年由中科院自动化所科研团队创立,初期专注AI+媒体领域,创始人王磊2018年飞行174次拓展业务 [3] - 2022年ChatGPT问世后果断投入大模型研发,虽面临财务压力但最终提升客户竞争力,2024年收入验证战略正确性 [24][25] - 经历AI 1.0(经典人工智能)、2.0(数据驱动深度学习)、3.0(生成式AI)三个阶段,成为少数跨越三个技术周期的企业 [16] - 早期抓住国家融媒体建设机遇,从县级市场切入,逐步拓展至金融、医疗、能源等领域,形成"技术立得住+业务接地气"的发展路径 [21][22]
微软CEO纳德拉最新访谈:开源是对赢者通吃的最大制约
IPO早知道· 2025-02-25 10:39
微软量子计算突破 - 微软发布全球首款拓扑量子芯片Majorana 1,采用半导体砷化铟和超导体铝材料,基于全新"拓扑"物质状态构建[3][4] - 该芯片历时近20年研发,目标在2030年前上市并实现百万量子比特规模,被视为量子计算的"晶体管时刻"[3][15][16] - 技术突破在于验证了马约拉纳零能模在新物相中的存在,使量子信息可被可靠隐藏和测量[15][16] 量子计算战略布局 - 微软采用软硬件分离策略,同时与中性原子、离子阱团队合作开发多种量子计算机类型[17] - 计划2027-2029年推出容错量子计算机,预计可容纳百万物理量子比特和数千逻辑量子比特[17] - 量子计算将专注于化学物理、生物学等非数据密集型但需探索指数级状态空间的领域[17][18] AI与量子计算协同 - AI可作为"模拟器的模拟器",量子计算则作为"自然模拟器",两者结合可生成合成数据训练更优模型[18] - 量子计算不会取代经典计算,但能增强高性能计算能力,尤其在材料科学等领域的模拟应用[17][18] AI市场格局判断 - 超大规模云服务(如Azure)和模型层将共存,但AI市场不会形成赢者通吃格局,企业客户会要求多供应商并存[7][8] - 开源模型将制约闭源垄断,政府监管也将介入防止私营公司主导AI领域[7] 计算基础设施需求 - AI工作负载(如ChatGPT)推动计算需求指数级增长,训练和推理阶段均需大规模计算集群[6][9] - 全球分布式计算集群成为刚需,需就近部署存储与计算资源以突破"光速限制"[9] AGI经济影响标准 - AGI实现的真正标志是全球经济增长率达到10%(当前发达国家平均2%),而非技术基准炒作[10][20] - 若实现10%增长,全球年新增价值将达10万亿美元(基于100万亿美元全球经济规模)[10] 智能成本与普及 - 遵循"杰文斯悖论",智能成本下降将刺激需求弹性,尤其在发展中国家医疗等领域的应用[14] - 智能需同时提升能力并降低成本,类似云计算通过弹性付费模式扩展市场的历史路径[14] 技术投资方法论 - 公司选择进入TAM(潜在市场总量)大且能容纳多个赢家的赛道,避免押注赢者通吃领域[8] - 研发需平衡短期需求与长期相关性,保持对失败的高容忍度以探索未来技术[23] 认知劳动演变 - 当前认知劳动可能被自动化,但会催生更高层次的认知任务,形成动态平衡而非完全替代[23][24] - AI工具应作为人类认知增强器,例如开发具备长期记忆的会议协调代理提升决策效率[25] 材料科学革命愿景 - 量子计算+AI有望加速新材料研发,目标在25年内实现传统需250年完成的工业革命级突破[25]
印奇携新身份公开亮相:聚焦「AI+车」,一个产业的发展节奏有时比方向更重要
IPO早知道· 2025-02-24 22:33
印奇认为,"AI+车"或是"AI+"第一个落地的核心应用场景。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,在日前举行的2025阶跃星辰生态开放日上,旷视科技创始人印奇携"千里科技董 事长"这一新身份出席,这也是2月18日"力帆科技"正式更名为"千里科技"后、印奇首次在公开场合 亮相。 据 印奇 透露,今年是他A I创业 的 第14年 。值得一提的是, 印奇 在本次活动上强调—— 一个产 业的发展方向和节奏,有可能节奏比方向更重要 。 "刚刚开始创业时,就有一个机器人模型在门口。在大模型的驱动下,我自己认为最大的应用,也几 乎是大家的共识,偏具身类的终端载体姑且叫他机器人。"印奇补充道,"大家经历了这十几年,有 一波一波AI创业者,技术一直在往前发展,商业化、商业模型也有很多变化。 我自己感觉,需要在 技术成熟的最后, 自己 总结 为 3年冲刺期, 要 同时找到一个最核心的载体 。 这波大模型时代, 有可能是AI创业者最幸福的时代。技术上最让人兴奋的是AGI,载体上可能 就 是车。根据我的判 断,车是通向具身智能的必要路径。 " 在印奇看来,到今 ...
晚点对话王小川丨不是文本创作、不是物理模型,AGI 的尽头是生命科学
晚点LatePost· 2025-02-10 17:50
公司战略与定位 - 百川智能聚焦医疗领域,认为医疗是大模型皇冠上的明珠,而非垂直场景,因医疗需求不会被超级模型覆盖[7][19] - 公司提出"造医生等价于AGI",将医生职业复杂度作为AGI标尺,计划2025年实现AI医生助理覆盖海淀居民[7][9][61] - 采取"水涨船高"策略而非"沿途下蛋",医疗场景天花板高,模型能力提升会持续增强应用价值[19] 技术路线与产品进展 - 发布首个全场景推理大模型Baichuan-M1-preview,具备复杂病症诊断能力,案例显示其诊断水平达市一级医院之上[6][12] - 医疗模型采用强化学习技术,2024年7月后明确医疗增强方向,计划2025年Q1推出超级医生模型并落地北京儿童医院[11][24][62] - 坚持语言是智能主轴的观点,认为多模态主要用于交互增强而非智力提升,技术重点在AI使用工具和制造工具的能力[69][75] 商业化与落地规划 - 已与北京儿童医院、海淀卫健委等机构合作,推出"一大四小"产品矩阵,涵盖居家至医院多场景[61][62] - 商业模式设计包含G端(政府)、H端(医院)和C端三层,AI辅助诊断已进入国家医保局服务项目立项指南[63] - 中国年就诊84亿人次,百度日健康搜索请求超5000万人,公司认为医疗具备超级应用潜力[48][49] 行业竞争与差异化 - 避开通用模型红海竞争,选择医疗赛道定位"在大厂射程之外",观察到百度腾讯等减少医疗投入[53][8] - 累计融资超50亿元但未大规模烧钱,被部分投资人评价为"最稳的大模型独角兽之一"[5][27] - 开源14B医疗增强模型促进产学研合作,医疗评测得分超过72B版本,可用消费级GPU部署[34] 创始人理念与长期愿景 - 创始人王小川从2000年基因测序研究起持续关注生命科学,提出"把生命变数学"的技术理想[5][39][30] - 认为AI将推动从科学时代到智能时代的范式迁移,医疗数据未来可支持生命科学研究突破[45][38] - 长期目标是实现"生物自由",通过AI医生解决医疗资源不可能三角,并推动新医学科研范式[87][100]
美国恢复中国小额包裹免税清关;软银拟投资OpenAI400亿美元;车企1月召回超300万辆车丨百亿美元公司动向
晚点LatePost· 2025-02-09 20:51
跨境电商政策调整 - 特朗普暂时撤销对中国低货值商品免税禁令,允许包裹关税豁免直至新系统建立[1] - 新政导致美国海关清关拥堵,Temu、Shein等平台被迫涨价或下架部分商品[1] - 物流服务商云途、燕文取消报关手续费与预收保证金[1] OpenAI融资与估值 - 软银拟400亿美元投资OpenAI,投后估值达3000亿美元,较去年1570亿美元增长91%[2] - 部分资金用于"星际之门"项目,总投资额或达5000亿美元[2] 汽车行业召回事件 - 1月15家车企召回353.7万辆车,创单月新高[3] - 本田召回136.7万辆涉及HR-V等车型,特斯拉召回33.6万辆因后视摄像头故障[3] - 小米、方程豹、通用五菱分别召回3.1万/6843/1116辆车[3] AI技术发展动态 - OpenAI CEO称GPT-5将超越人类智力水平[4][5] - 东风、上汽智己等四家车企宣布接入DeepSeek模型[10] 企业资本运作 - Shein拟伦敦IPO估值下调至500亿美元,较2023年融资估值缩水25%[7] - 雷诺寻求出售所持日产36%股份,富士康为潜在买家[9] 零售与消费行业 - 百果园2024年预计亏损3.5-4亿元,关店965家至5116家,加盟店单店营收下降14%[8] - Coach四季度收入增长10%至17亿美元,新增客户中超半数为年轻群体[13] 房地产政策 - 重庆取消执行7年的住房限售政策,核心区域房价同比下跌20%[11] 科技与社交媒体 - TikTok为美国用户提供Android安装包下载,特朗普或推动主权财富基金收购[6] 服饰行业业绩 - 加拿大鹅四季度营收下降2.2%至6.08亿加元,下调年度利润预期[12]
晚点独家丨字节启动 Seed Edge,加码 AGI 研究
晚点LatePost· 2025-01-23 08:47
字节跳动AGI研究布局 - 公司设立代号"Seed Edge"的AGI前沿研究项目,拟定5大长期研究方向[2] - 研究方向包括下一代推理、感知、软硬一体模型设计、下一代范式及Scaling方向[6][10] - 项目以虚拟项目组形式运行,探索不确定性强的课题[7] - 创始人张一鸣深度参与AI研究,亲自研读论文并与顶尖学者交流[4] - 新加坡团队协助技术研究规划,包括前国立大学教授冯佳时[4] 技术研发成果 - 豆包1.5 Pro模型实现7倍性能杠杆,激活参数量仅为稠密模型1/7[8] - 自主数据生产体系不使用其他模型数据,确保独立性[8] - 豆包App日活突破千万级,成为中国最大大模型应用[8] - 2024年发布100+AI论文,NeurIPS入选近50篇[8][11] - SuperClass论文提出节省50%显存、响应提速20%的视觉预训练方法[11] 人才战略 - 组建Seed团队聚集高水平研究员,来源包括顶尖院校毕业生和行业专家[13][14][20] - 启动Top Seed计划招募30名应届博士[14] - 实施宽松考核机制:延长考核周期,突破后补偿历史绩效[15] - 中国AI领域人才密度最高,吸引MiniMax等公司核心人才[13] 行业定位与战略 - 从工程能力优势转向原创式创新,探索智能边界[3] - 目标不仅是跟进领先模型,更要做下一代突破[8] - 大公司具备投入前沿技术创新的资源优势[21] - 学习调整研发节奏,容忍长期不确定性[22] - 研究深度广度超出外界认知,论文数量接近Google(120篇)、微软(100篇)水平[9][11] 技术争议与验证 - 提出与OpenAI相反的结论:视频生成模型无法提炼物理规则[11] - 获得图灵奖得主杨立昆对研究成果的正面评价[11] - 在CLIP替代方案等基础问题上取得突破[11]
晚点播客丨MiniMax 闫俊杰聊大模型 2024:一个非共识判断引起的回声
晚点LatePost· 2025-01-22 21:56
模型能力与用户规模关系 - 更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型 [5] - 字节跳动发布 Doubao-1.5-pro 模型技术报告,提到通过用户数据飞轮持续提升模型实际使用体验 [5] - 行业误区认为更好的智能水平依赖更多用户,但实际并非如此 [7] MiniMax 公司概况 - MiniMax 的 AI 社区产品 Talkie 最新月活用户数已超 Character.ai,成为同类产品全球第一 [6] - 中国 AI 社区产品 "星野" 用户数、使用时长和留存率均为第一,高于字节旗下同类产品 [6] - 视频生成平台海螺 AI 是全球访问量最高的视频生成网站 [6] 技术驱动与开源策略 - MiniMax 开源新模型系列以加速技术迭代和加强技术品牌 [7] - 明确公司为技术驱动,追求模型能力上限提升而非依赖用户规模 [7] - 模型架构改进:将传统 Transformer 的非线性注意机制改为线性注意力机制,提升 long-context 处理能力 [29] Agent 与多模态发展 - Agent 需在专业领域达到专业人士水平,处理复杂任务 [25] - 多模态能力在 OpenAI AGI 路线图中占据重要位置 [39] - AI 编程助手 Cursor 的成功并非基于特定方向模型 [41] 市场竞争与公司定位 - 大模型竞争与移动互联网逻辑不同,更多人意识到这一差异 [01:11:19] - 未考虑被字节收购,公司目标非出售而是技术突破 [01:12:29] - 大厂投入和竞争激烈程度在预料之中 [01:16:28] 团队管理与 CEO 反思 - 公司需要两种人才:技术能力强和认知能力突出 [01:23:24] - CEO 决策关键在于组织有共同标准,而非个人决策 [01:26:56] - 去年反思最多的问题是认知能力提升速度不足 [01:32:08] 产品与用户洞察 - Talkie 和星野的领先优势源于更懂用户需求 [01:06:48] - 海螺文本的失利因未坚持技术驱动策略 [01:04:44] - 市场可同时容纳模型和应用公司,无需非此即彼 [01:01:38]
晚点播客丨李开复聊零一万物调整:只有大厂能追逐超大模型
晚点LatePost· 2025-01-14 17:35
文丨程曼祺 ▲扫描上图二维码可收听《晚点聊 LateTalk》第 98 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目。"最一手的商业、科技访谈,最真实的从业者思考。" 不再追求 AGI,他第一个讲了出来。 上周初开始,市场陆续出现有关零一万物的新调整传闻,关键词包括:"放弃预训练,资金链紧张、被阿里收购……" 传 闻出现的第二天,我们在零一万物办公地,中关村鼎好大厦,采访了李开复。 他解释了实际发生的变化:零一万物已经和阿里云成立了 "产业大模型联合实验室",零一万物的大部分训练和 AI Infra 团队会加入这个实验室,成为阿里的员工,侧重超大模型研发等。零一自己接下来会聚焦做更快、更便宜、更小,更能 支持普惠应用的模型,同时自己做应用。 在李开复的描述里,超大模型和更快、更便宜、更小的模型的关系类似于 "老师和学生",超大模型可以通过标注结果和 生成更多合成数据的方式帮更小的模型提升性能。 去年 5 月,我们也访谈过一次李开复,当时的话题是从中国 "最年长的 AI 大模型创业者" 开始的,在 2023 ...
AI 一年过山车:从狂想到放下幻想丨晚点回望 2024 ⑤
晚点LatePost· 2025-01-13 19:40
当 OpenAI 不再技惊全场,这是技术扩散的开始。 文丨贺乾明 张家豪 王与桐 李梓楠 制图丨 黄帧昕 编辑丨程曼祺 贺乾明 2024 年的开始,解决了 OpenAI 政变的山姆·阿尔特曼和天才科学家伊利亚·苏茨克维重修于好,发布视频生成模型 Sora,重演 ChatGPT 上线时的震撼。 在中国,阿里巴巴从年初起连续投资月之暗面、MiniMax 等大模型公司近 15 亿美元,为 AI 创业公司送去新的弹药。 不久后,月之暗面创始人杨植麟在一次行业活动上被围着要签名——这是中国创投领域许多年未见的光景。 图片、文字到视频,技术突破在 ChatGPT 发布的第三年开了个好头。行业关注点从模型、应用到商业化,要建立一套 AI 时代的商业模式;创业公司不断融资,向大公司发起冲击,誓要颠覆互联网平台,解锁阶层跃升的新机会。 然而到了年底,大部分乐观期望已经落空。 OpenAI 的 Sora 延期 10 个月才发布,实际效果不如年初的演示,和同行的视频生成模型同样不再令人惊喜。同时让 ChatGPT 变成现实的最关键人物——OpenAI 前首席科学家伊利亚·苏茨克维、CTO 米拉·穆拉蒂、技术奠基者阿列克· 拉德福德 ...
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红;AI 幻觉不全是坏处
晚点LatePost· 2025-01-07 22:59
技术进展 - OpenAI训练GPT-5遇阻,已投入20个月和至少10亿美元算力成本,但性能提升未达预期,两次从头训练均未突破博士生水平目标[4] - 数据短缺迫使OpenAI采用人工生成数据(工程师/科学家每日5000字)和模型生成数据(o1模型)补充,但规模仍远低于GPT-4的10万亿字训练量[5] - o3模型在CodeForces编程竞赛得分比o1提升44%,数学测试EpochAI解决25.2%问题(其他模型<2%),但AGI评测得分因数据预训练存在争议[7][9] - 强化学习重要性提升,OpenAI推出RFT微调方法,LangChain报告显示人类反馈强化学习应用增长18倍[5][9] - 世界模型取得突破:DeepMind的Genie 2生成可交互虚拟场景,李飞飞团队实现AI图片转3D场景,CMU/英伟达开源机器人模拟系统Genesis[14] 行业竞争 - Google Gemini 2.0 Flash系列模型抢占Chatbot Arena前三,OpenAI首次失去榜首地位[18][21] - 中国开源模型崛起:DeepSeek-V3以578万美元训练成本逼近GPT-4o性能,Qwen2.5-plus超越Meta Llama 3.1[23][26] - 芯片领域博通市值破万亿美元,2024年AI收入增长220%至122亿美元,为Google/Meta等提供自研芯片方案[29] - 英伟达推出B300 GPU适配o系列模型,算力/显存提升50%,xAI计划将H100算力中心从10万张扩展至100万张[33][34] 应用与商业化 - OpenAI推出12项ChatGPT升级:订阅费最高2000美元/月,集成Sora视频生成、电话交互、生产力工具插件等功能[36] - Agent成为新趋势,Google Gemini 2.0专为Agent优化,YC预测其市场规模将比SaaS大10倍[12][13] - 大模型嵌入传统行业:Salesforce招聘2000人推广AI Agent,微软Phi-4模型(140亿参数)性能超越更大模型[38][12] - AI硬件进展:Meta计划为Ray-Ban眼镜增加屏幕,OpenAI重组机器人团队,中国预计2025年出现"百镜大战"[40] 投融资动态 - 21家AI公司获超5000万美元融资:中国智谱AI获30亿元(估值200亿元),阶跃星辰聚焦多模态模型,Liquid AI开发新型神经网络架构[42][43] - 基础设施领域Databricks融资86亿美元(估值620亿美元),Tenstorrent获7亿美元开发RISC-V架构AI芯片[44] - 应用层公司多成立于ChatGPT前:Zest AI(金融风控)、Tractian(工业设备监测)、Speak(语言学习)等获大额融资[46][47][48] 科学价值 - 大模型"幻觉"被科学家重新定义:加速抗生素研发(MIT)、生成全新蛋白质(诺奖得主Baker实验室获100项专利)[50][51]