Workflow
Scaling law
icon
搜索文档
AI正在诞生一个万亿级公司
投资界· 2024-12-25 16:24
人工智能"加减乘除"。 报道 I 投资界PEdaily 2 0 24年12月1 0 - 11日,由中共重庆市委金融委员会办公室指导,清科创业、投资界主 办,重庆渝富控股集团联合主办的"第二十四届中国股权投资年度大会"走进西部金融中 心重庆。作为股权投资行业晴雨表,本次大会将以"万象耕新"为主题,回顾行业风云, 重塑格局策略,探索价值发现,持续为中国股权投资行业注入力量。 本场《人工智能+-×÷》圆桌论坛,由光速光合合伙人 孙健 主持,对话嘉宾为: 真格基金 合伙人 刘元 啟赋资本 合伙人 宋昶 广州基金 首席投资官 易沙 合力投资 管理合伙人 张敏 以下为对话实录, 经投资界(ID:peda il y 2 0 1 2)编辑: 孙健 :很荣幸主持这场圆桌讨论,主题是人工智能加减乘除,为什么是加减乘除?我在 想,是不是可能半年前人工智能还处于(X),发展到今天大家面临着各种各样的疑问 和困惑,就演变成了一个加减乘除,不知道该选择哪一个符号。在开场前,还是请大家 先自我介绍。 张敏 :我来自合力投资,主要关注早期投资,2001年进入到天使投资,现在做了2 3年。 易沙 :广州基金是由广州市委、市政府为推进广州产业转 ...
AI 月报:马斯克加速 GPU 竞赛;大模型真撞墙了? 风口转到 Agent
晚点LatePost· 2024-12-11 22:30
技术发展 - OpenAI在12月开启为期12天的密集发布活动,包括推出完整版o1模型、每月200美元的ChatGPT Pro、视频生成模型Sora等 [2] - 大模型行业面临能力提升瓶颈,Google、OpenAI、Anthropic等公司在开发下一代模型时未能实现前几年的显著性能跃升 [4][5] - OpenAI尝试用合成数据训练新模型Orion但效果不理想,同时行业探索更高精度数据、后训练优化等新方向 [16][17][18][19] 市场竞争 - OpenAI企业市场份额从50%降至34%,Anthropic份额从12%增至24% [22] - xAI以500亿美元估值融资50亿美元,Anthropic获亚马逊追加40亿美元投资,Writer以19亿美元估值融资2亿美元 [27] - 视频生成领域竞争加剧,Runway上线新功能,腾讯开源对标Sora的HunyuanVideo模型 [25][26] 算力竞赛 - 亚马逊、微软、Meta、Google四家公司今年资本支出超2000亿美元建设算力中心,并计划加大投资 [28] - Anthropic CEO预测2026年将出现耗资超100亿美元的算力集群,OpenAI提议建造千亿美元级数据中心 [28] - 英伟达加速产品迭代,计划2025年发布机器人专用芯片Jetson Thor [35][37] 应用落地 - ChatGPT周活用户达3亿,企业生成式AI支出飙升500%至138亿美元 [38] - AI编程成为竞争焦点,GitHub Copilot生成微软近半启动代码,Cursor以25亿美元估值获融资 [6][23][43] - Agent成为行业新赛点,OpenAI、Anthropic、智谱等公司加速布局智能体产品 [51][52][53] 行业投资 - 沙特宣布500-1000亿美元AI投资计划,波兰投入2.44亿美元开发本土大模型 [31] - AI制药公司Cradle获7300万美元融资,Enveda筹1.3亿美元推进药物研发 [61] - 具身智能领域Physical Intelligence以24亿美元估值融资4亿美元,银河通用获5亿元人民币投资 [29]
独家专访 Tripo CMO,揭秘如何实现 3D 用户破圈增长和多社区联动策略
深思SenseAI· 2024-09-30 11:04
产品与技术能力 - 公司专注于3D大模型研发,核心产品Tripo支持文本和图片输入生成3D模型,例如输入"火烈鸟站在蓝色的球上"或上传帆船图片可快速生成对应3D模型[3][5] - 在图像输入场景中,几何形态还原度达95%以上,尤其擅长家居类标准物品,材质还原方面优化了贴图细腻度和PBR真实感[8][12] - 采用Scaling Law路线,探索高斯泼溅等新型3D表示方法,Tripo 2.0版本将在10月发布重大技术进展[13] 用户画像与商业模式 - 核心用户分为三类:AI科技爱好者、泛互联网/工业设计师、Roblox等内容消费转创作者群体,第三类用户比例自5月起快速增长[20] - 商业模式包括Web订阅、API调用收费(占主要收入)、GMV抽成(如3D打印农场合作)及社区扶持项目[27] - 典型落地场景包括家居行业快速打样闭环、游戏场景生成(如梵高房间3D化),相关研究被SIGGRAPH Asia收录[21] 社区运营与增长策略 - 早期以"8秒生成速度"为卖点吸引技术圈用户,后通过Blender社区举办"小屋杯"比赛吸引5000+创作者,并与ComfyUI社区合作扩展AI+2D用户群[28] - 关键策略包括:通过KOL争议事件获取曝光(如日本艺术家RuiHuang作品引发讨论)、马斯克转发空间站作品、ComfyUI节点开发降低创作门槛[34][37][39] - 针对Roblox青少年用户推出虚拟饰品生成服务,15天内吸引5万用户领取2万份道具,类比"虚拟时尚淘宝店"运营模式[44][46] 全球化与技术品牌建设 - 采取"模型出海"策略,通过开源TripoSR算法与Stability合作,在GDC大会渗透独立游戏开发者圈层,强化技术品牌影响力[49][51] - 举办全球AI 3D渲染大赛"Behind the Scenes"和3D打印国际象棋大赛"The Master Piece",以作品驱动传播[52] - X账号定位"3D与AI领域唯一必关注账号",价值观强调技术开放性与创意包容性[52]
晚点播客丨OpenAI o1 如何延续 Scaling Law,与硅基流动袁进辉聊 o1 新范式
晚点LatePost· 2024-09-20 23:22
"如果每天和开发者打交道,你不会感觉这个行业停滞或变冷。" 文丨程曼祺 贺乾明 扫描图中右下角二维码,可收听播客。* 这是《晚点聊 LateTalk 的第 80 期节目,欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目,在文字报道之外,用音频访谈形式捕捉商业世界变化的潮流和不变的逻辑,与这 其中的人和故事。 OpenAI 发布新模型 o1 后的第二天,我们邀请了硅基流动创始人袁进辉与我们分享了 o1 的技术意义,也讨论了今年 1 月至今,袁进辉观察 到的 AI 开发者社区变化。 o1 的一个重要变化就是增加了分配给推理(inference,即大模型的使用)阶段的算力,推理阶段计算(test-time compute)重要性提升。 而袁进辉今年初创立的硅基流动(SiliconFlow)就是一家做推理加速优化的 AI Infra(中间层软件)公司。他是一位连续创业者,曾在 2017 年创立一流科技(OneFlow),在 2023 年加入王慧文组建的大模型创业公司光年之外,成为联合创始人。(袁进辉的上两段创业故事,可 听 ...
发布视频生成模型、日均交互 30 亿次,MiniMax 第一次线下活动记录
晚点LatePost· 2024-09-02 23:40
"如果我们在竞争中打不赢,就应该被淘汰,没有其他选择。 文丨程曼祺 由 MiniMax 视频生成大模型制作的短片《魔法硬币》,MiniMax 称其中每个场景都由大模型生成,未经任何修改。 发布会所在的 "西岸漩心" 被巨大的螺旋式阶梯环绕,游人可沿着步道一直走到顶层露台,眺望浦东风景。这 是一条上升、平缓,然后再上升、平缓,最终达到顶点的路。此时 AI 领域似乎也处在螺旋中的相对平缓期。 当 MiniMax 创始人闫俊杰放映完由视频生成模型制作的动画短片后,观众席传来数声尖叫。至少 3 位在场的 投资人说, 视频生成模型是他们当天最在意的成果 。 但视频生成模型本身不新鲜了,自 OpenAI 年初发布 Sora,数家中国公司跟进这一方向。 "期货" 也在成为行业关键词:GPT-5、GPT-4o 的语音视频功能、Sora……它们要么上线晚于预期,要么亮相多 时后仍未大规模公测。据我们了解,国内 "六小龙"(MiniMax、月之暗面、智谱 AI、百川智能、零一万物、 阶跃星辰 6 家大模型独角兽)今年的基础模型或多模态模型的更新时点也多晚于原计划。 发布结束后,闫俊杰被问起如何看待技术进展放缓。他说,一条上升、平 ...
C.AI 被收购的宿命论与万恶的 Scaling Law | 42章经
42章经· 2024-08-18 21:52
C.AI被收购的核心逻辑 - 交易本质是以授权协议变相收购 旨在规避反垄断监管[1] - 30名底层模型开发人员加入Google 100余名产品团队保留在C.AI[1] - 公司结局由创始人Noam Shazeer的决策路径决定 其作为Transformer论文核心作者选择AGI赛道[1] 公司定位与战略失误 - 2022年12月明确"全栈AGI公司"定位 导致资源分散在模型研发与产品两端[1] - 2023年产品团队仅0.5人 模型团队数十人 反映资源错配[3] - 创始人提出"AGI公司+产品优先公司"并列定位 引发投资人质疑商业模式闭环[3] 行业竞争格局演变 - 2023年三大2C产品形态:ChatGPT类、Perplexity类搜索、C.AI类陪聊[1] - 开源模型崛起加速推理成本下降 自研模型必要性降低[3] - 底层模型战争结束 形成Google/Anthropic/OpenAI三足鼎立[4] 大厂战略布局对比 | 厂商 | 模型战略 | 关键动作 | |--------|--------------|---------------------------------| | Google | 全链路自研 | 收购C.AI团队 巩固Gemini生态[6] | | 微软 | 混合策略 | 收购Inflection对冲OpenAI风险[8] | | Meta | 开源主导 | 推动Llama生态 放弃商业变现[9] | 资本市场的决定性作用 - Scaling Law导致资源向头部集中 第二梯队难获融资[4] - 2021年SaaS公司PS达60-70倍 2023年暴跌至6-7倍 凸显融资时机重要性[10] - 出行行业"大黄蜂案例"显示资本站队决定竞争结局[4] 行业趋势判断 - 模型商品化成为共识 工程落地能力取代底层研发壁垒[4] - 端到端全栈模式被证伪 开源方案成为产品公司首选[3] - 大厂战略摇摆直接影响创业公司退出路径[10]
C.AI 被收购的宿命论与万恶的 Scaling Law | 42章经
42章经· 2024-08-18 21:52
C.AI被收购的核心逻辑 - 交易本质是以授权协议变相进行的收购 主要目的是规避反垄断监管[1] - 公司定位为底层模型研发企业而非应用公司 30名核心模型开发人员加入Google 100余人产品团队独立运营[1] - 创始人Noam Shazeer作为Transformer论文核心作者 创业初期选择"全栈AGI公司"定位埋下后续发展路径依赖[1][3] 公司战略定位问题 - 2023年A轮融资时以"0收入 10亿美元估值"获得资本青睐 依赖模型研发叙事支撑高估值[1] - 同时宣称"AGI公司"与"产品优先公司"造成定位混淆 产品团队仅0.5人全职 模型研发人员占比超80%[3] - 开源模型崛起加速推理成本下降 自研模型失去性价比优势 被迫转向Meta的Llama等第三方解决方案[3] 行业竞争格局演变 - 底层模型战争进入终局阶段 OpenAI/Anthropic/Google形成第一梯队 创业公司需依附大厂生存[4] - 模型商品化趋势明显 类似云计算成为基础设施 产品公司可专注工程落地与开源方案结合[4] - Scaling Law导致资源向头部集中 资本仅支持少数代理人 类似出行市场滴滴快的的垄断格局重现[4] 科技巨头战略对比 | 公司 | 技术栈特征 | 典型案例 | |---------|---------------------------|-------------------------| | Google | 全链路自研 TPU芯片至Gemini模型 | 收购C.AI团队补充模型能力[6] | | 微软 | 模块化合作 Azure绑定OpenAI | 收购Inflection作为备选[8] | | Meta | 全面开源策略 聚焦Llama生态 | 不依赖模型商业化[9] | 创始人决策启示 - 2023年市场狂热期应更激进融资 维持大模型第一梯队地位[4] - 战略定位需避免"既要也要"矛盾 国内某公司"模型即产品"叙事更具逻辑一致性[3] - 退出时机选择关键 25亿美元收购价在行业下行周期仍属成功[10]
中国首批核聚变创业者谭熠:它总在你绝望时又给你希望|TECH TUESDAY
晚点LatePost· 2024-07-30 21:15
"核聚变永远还有 50 年是对的,现在不到 10 年可能也是对的。" 文丨 贺乾明 编辑丨程曼祺 "如果核聚变发电就是实现不了呢?" 听到这个问题,在清华大学研究核聚变 20 多年的谭熠沉默了几秒,然后笑了起来。他觉得这个问题 "根本没道理",因为核聚变 "从科学上是可行的"。 70 多年前的曼哈顿工程期间,科学家就了解核聚变原理。二战结束后,美国很快就用它造出了氢弹。但用核聚变发电的研究几经起伏,冷战后几乎停滞了 20 多年。 情况在 2021 年发生变化 ,美国的核聚变公司 Helion 宣布把等离子体加热到 1 亿摄氏度,实现原本只有政府项目才能做到的壮举;从麻省理工分拆的核聚变 公司 CFS 开发出形成更强磁场的高温超导磁体,把低成本建造能实现核聚变装置可能性大幅提高。 核聚变创业热潮出现:OpenAI 联合创始人山姆·阿尔特曼、PayPal 联合创始人彼得·蒂尔、比尔·盖茨、乔治·索罗斯等硅谷科技名流和富豪,以及 Google、DFJ 等机构在短时间里朝核聚变行业投资了 30 多亿美元,是美国政府数年来累计拨款的数倍。 这一年,谭熠创办核聚变公司星环聚能,担任首席科学家,在 2022 年 6 月拿到 ...
上半年 AI 市场有多差?为什么机构出手这么少? | 42章经
42章经· 2024-07-21 21:50
Q1. 今年以来,AI 市场的温度在如何变化? A: 今年上半年,整个一级市场(尤其是 AI 领域)之差可以说是十年所未见。 AI 赛道从去年 3 月左右开始火起来,下场创业的很多都拿到了融资,但 9 月之后形势开始急转直下 (原因我们在去年的 年终总结 里也有写 过)。到了今年,市场还在进一步变冷,从 1 月到 5 月,拿到主流机构投资的 AI 公司不会超过 30 家,其中相当一部分还是追加轮次的公 司。 这个数字大概是十年前的百分之一,也就是说整个市场的融资难度提高了百倍。在这个数字之下,绝大多数人的任何选择和努力都是无效 的。 Q2. 为什么机构出手这么少?是他们需要更多时间跟踪和学习吗? A: 我们接触了这么多机构,其实非常能理解为什么他们不出手: 1)讲大故事的是否能做出来?AI 能做到吗?大厂竞争怎么办?大模型做了怎么办? 2)现在能赚钱的、有数据的,会不会不够 AI?是不是太像生意?市场是不是不大? 3)AI 未来到底会怎么发展?甚至大模型到底行不行? 其实说穿了,就是现在这件事有太多的不确定性。机构如果仍然在之前的评价体系里,就一定是无法出手的。 所以我觉得问题不是说大家 对于这事的了解还不够 ...
对话香港大学马毅:“如果相信只靠 Scaling Laws 就能实现 AGI,你该改行了”
晚点LatePost· 2024-06-04 18:05
马毅的学术观点与研究方向 - 马毅认为当前AI大模型仅实现局部记忆功能,本质是数据压缩而非真正智能,知识不等于智能,智能应能自我纠正和发现新知识[4][5][51] - 反对Scaling Laws路线,认为单纯扩大数据、算力和参数规模无法实现AGI,现有模型依赖记忆和统计而非因果推理[16][17][22] - 提出智能的简约与自洽原则:规律表达需简洁高效(简约),预测需与外部世界一致(自洽),引用爱因斯坦名言作为理论依据[52][53][54] 白盒大模型技术路径 - 团队开发白盒框架CRATE,用数学解释深度学习网络的压缩过程,目标提升效率并超越黑盒模型[33][34][35] - CRATE在同等参数下性能接近ViT(如CRATE-L参数77.64M,ImageNet-1K准确率71.3%,ViT-S参数22.05M准确率72.4%),新版本CRATE-α通过编码优化已媲美ViT[41][43][47] - 白盒模型可降低试错成本,训练资源仅为经验方法的1/3-1/4,算子更稳定且可解释[38][39][49] 行业现状与批判 - AI行业存在同质化问题,过度追逐Scaling Laws导致研究趋同,国内投入规模大但创新不足[19][21][22] - 批评AI威胁论是"无知或别有目的",指出当前模型无自主意识,危险论调可能阻碍创新[26][28][29] - 工业界更关注实用效果而非理论突破,学界与工业界算力差距加剧模型效果分化[8][9][10] 商业化与教育实践 - 创立忆生科技推动白盒路线产业化,公司定位"下一代智能系统",聚焦完整记忆和闭环学习[83][84][85] - 在香港大学设计AI通识课程,面向所有专业学生教授计算思想,强调正确理解AI基础[81][82] - 认为资源应投向有创造力的年轻人,中国需建立支持年轻团队的创新机制[94][95][96] 历史视角与跨学科启发 - 梳理AI历史发现理论重复现象,如去噪扩散模型本质是250年前的拉普拉斯方法[69][70] - 借鉴神经科学发现,猴子大脑的低维编码与白盒压缩结构相似,闭环反馈机制受生物智能启发[70][71][72] - 区分科学家与工程师思维,前者追求必要性(简约),后者接受冗余(经验试错)[73][74][75]