Workflow
Artificial Intelligence
icon
搜索文档
50亿,南宁人工智能母基金完成备案
FOFWEEKLY· 2026-04-17 18:07
基金设立与备案 - 南宁市人工智能创新合作发展产业投资基金(南宁人工智能母基金)已完成中国证券投资基金业协会备案,备案编码为SBSR76 [1] - 基金总规模为50亿元 [1] - 出资结构为:南宁市本级财政委托南宁财金资本公司代表出资30亿元,南宁金融集团下属南宁朱槿资本集团出资19.99亿元 [1] - 基金管理人为南宁投资引导基金公司 [1] 基金运营原则与投资策略 - 基金运营坚持“政府引导、市场运作、专业管理、鼓励创新”原则 [2] - 投资方式采取“参股子基金+直投”模式 [2] - 基金旨在引导社会资本加速集聚,发挥母基金杠杆效应 [2] - 重点投资方向为人工智能、智算中心、数据资产、数据应用等前沿领域 [2] - 具体从“大数据+大算力+大模型”三个维度培育壮大人工智能产业生态 [2] 战略定位与发展目标 - 基金立足南宁面向东盟的独特区位优势,聚焦国家所需、广西所能、东盟所盼 [2] - 战略目标包括推动优质项目、高端人才、核心技术向南宁集聚 [2] - 致力于以“人工智能+”赋能千行百业,推动传统产业智能化升级 [2] - 协力构建“北上广研发+广西集成+东盟应用”的差异化发展路径 [2] - 服务中国—东盟人工智能创新合作中心建设,打造区域性人工智能产业高地 [2] - 最终目标是为服务面向东盟的人工智能创新合作高地建设、构建中国—东盟命运共同体贡献力量 [2] 资源整合与生态构建 - 基金将积极对接国家和自治区产业基金、金融机构、龙头企业及科研平台 [2] - 围绕产业招引、企业培育、场景应用等关键环节搭建资本对接桥梁 [2] - 下一步将坚持市场化专业化运营,撬动更多社会资本、产业资源汇聚南宁 [2]
π0.7来了!涌现出组合泛化、跨本体迁移能力,VLA又行了?
机器之心· 2026-04-17 18:04
模型核心能力与突破 - 新模型π0.7展现出**组合泛化的初步迹象**,能够将训练中零散的技能和概念组合起来,以完成全新的、未在训练中直接演示过的任务,例如“用空气炸锅烤红薯” [3][4] - 模型具备**跨本体迁移能力**,能够控制从未训练过的、形态差异很大的机器人(如双臂UR5e系统)完成任务,其成功率与拥有平均**375小时**遥操作经验的专家在零样本操作时的成功率持平 [7] - 通过知识蒸馏,π0.7这一个通用模型学会了Recap算法优化的所有技巧,在叠衣服、做咖啡、折盒子等任务上的**成功率和速度都达到了之前专门训练的Recap专家模型水平,有时甚至更好**,实现了用一个通用模型替代多个任务专家模型 [9][12] 模型架构与规模 - π0.7基于π0.6的VLA架构与MEM记忆系统构建,新增多模态上下文条件调制 [24] - 模型包含以**Gemma3 4B**视觉语言模型初始化的VLM主干(含**0.4B**视觉编码器),以及**0.8B**参数的流匹配动作专家,**总参数约5B** [24] 成功关键因素 - 模型泛化能力强的核心在于**数据要杂,但提示要细**,汇集了几十种不同机器人的操作记录、人类演示视频及自主策略数据 [17][18] - 研究人员设计了一套**多样化的提示结构**,包含多模态信息,如文字描述、视觉子目标图片、期望任务时长、操作方式元数据等,以消除行为歧义并充分利用不同类型的数据源 [19][21][22] - 研究结论表明,**大规模多样数据 + 正确上下文**,就能自然涌现出惊人的组合泛化能力 [34] 应用场景与未来展望 - π0.7是一个通用模型,能够控制各种不同的机器人执行多种日常任务,如削蔬菜、用清洁剂擦玻璃门等 [15] - 未来,此类能力强、可操控的模型有望通过自身“思考”和利用提示遵循能力,解决更复杂、从未见过的任务,将语义推理转化为物理行动 [32] - 随着模型能力提升,**评估成为新的瓶颈**,如何定义泛化以及确定模型是否见过相关任务数据是未来需要发力的方向 [37]
This Is the SpaceX Number No One Is Talking About -- and History Says It May Total $175 Billion
Yahoo Finance· 2026-04-17 17:26
IPO市场前景与格局 - 2026年可能成为有史以来最伟大的首次公开募股年份[1] - 人工智能大型语言模型开发商OpenAI和Anthropic都在考虑在今年晚些时候上市[1] - 太空基础设施和人工智能巨头SpaceX的目标是抢先于它们上市[1] SpaceX IPO核心信息 - SpaceX据称已于4月1日秘密提交了IPO申请[4] - 公司寻求1.75万亿美元的估值和750亿美元的融资[4] - 若估值准确,SpaceX将成为有史以来规模最大的IPO,并成为美国第八大上市公司,超越特斯拉[4] - 公司旗下业务包括星链太空宽带服务、大型语言模型Grok、xAI、社交媒体平台X以及数十艘可重复使用航天器[4] SpaceX财务与市场表现 - 据报道,SpaceX去年收入高达160亿美元,并实现了80亿美元的利润[5] - 与特斯拉花费多年才实现持续盈利不同,SpaceX似乎已经跨过了这一门槛[5] - 自2010年6月特斯拉上市以来,截至4月14日收盘,其股价在马斯克的领导下实现了近23000%的回报[6] 相关行业市场机遇 - 麦肯锡公司认为,到2035年,全球太空经济是一个价值1.8万亿美元的机会[7] - 普华永道分析师预计,到2030年,人工智能将为全球经济创造超过15万亿美元的价值[7] 历史大型IPO案例 - 自1999年以来,美国出现了一批大型IPO,包括阿里巴巴集团、Visa、Meta Platforms、通用汽车和联合包裹服务公司[9] - 2019年12月,见证了有史以来全球最大的IPO——沙特阿美[9]
对谈CREAO:20人团队、每天上线8个功能,在Pivot产品之前,我们先Pivot了组织
Founder Park· 2026-04-17 17:11
公司背景与转型历程 - 公司成立于2025年1月底,核心团队约六七人,95%的员工在2025年6月才到位 [7] - 公司最初的产品是Vibe Coding平台,于2025年9月上线,旨在用Coding Agent帮助普通人快速搭建SaaS应用等工具 [10] - 公司意识到最初的产品方向存在问题,因为“自己公司做出来的产品,自己人都用不起来”,并发现为AI构建传统软件界面的思路是错误的 [3][12] - 公司于2025年1月开始转型,2025年2月完成对开发团队的彻底重构,完全用AI驱动开发,并于2025年3月31日正式上线新产品Super Agent版本 [24][25] - 公司已完成三轮融资,累计融资额超过3000万美元,团队规模约20人 [5] 核心产品与理念 - 新产品CREAO Super Agent以Coding Agent为底座,更通用、更主动、更能交付结果 [4] - 公司的核心目标是让所有人用AI把自己的工作任务自动化,认为这是技术带来本质效率提升的关键 [8] - 公司认为,未来是AI来工作,因此AI应该自己给自己构建工具、解决问题,而不是用AI给人构建传统的软件界面 [3][10] - 产品强调“主动性”(proactive),系统会主动发现用户完成的任务,并建议将其转化为可复用的Agent,降低用户使用门槛 [34][35] - 产品定位为未来工作场景的入口平台,帮助用户构建Agent、执行任务、管理工具,并让工具间能互相协作 [33] 技术架构与优势 - 产品坚持以Coding Agent为底层技术,认为这是最小单元的自由度,能通过写代码实现任何东西的自定义,解决长尾的通用问题 [9][41][42] - Coding Agent的能力不仅限于写代码,还包括文件系统访问、内存管理、工具调用、API调用以及长时间稳定运行复杂任务 [40] - 公司采用云端架构,认为云端在协作、经验共享和基础设施统一优化方面具有本地端无法比拟的优势 [36] - 公司构建了“沙盒”(Sandbox)机制,为每个用户请求启动独立的隔离运行环境,以保证Agent运行的稳定性和可重复性 [53][56][58] - 公司拥有三层级的Memory管理机制,用于管理线程内、跨线程的记忆以及在新线程启动时注入相关历史记忆 [60] 组织与开发流程的AI Native改造 - 公司进行了彻底的AI Native组织改造,将95%的工作交给AI来完成 [3] - 开发流程被重构,从产品规划、开发到测试、上线及AB测试的整个过程完全自动化,由名为“Harness”的系统驱动 [22][23] - 改造后,功能迭代速度极快,过去14天平均每天上线5-8个新功能 [32] - 在新的流程中,人的角色分为两种:少数“架构师”负责整体方向把控和规划判断;其他人则接收AI分配的具体任务(如修复bug、调整UI) [26][27] - 新需求由AI系统主导发现和提出,AI会持续扫描行业动态(如GitHub新项目)并自动生成待处理的需求任务,由架构师判断是否推进 [28][30] 市场表现与用户反馈 - 新产品上线后,在海外市场迅速扩散,Revenue Run Rate提升了4倍 [19] - 有用户在短短一周内额外支付了5000到6000美元,因为Agent将其大量手工工作自动化 [19] - 公司目前的ARPU(每用户平均收入)约为其他普通C端AI工具的六七倍 [20] - 早期测试阶段,内部marketing团队使用新产品后,发现95%的工作流都可以用AI完成,成为产品有效的应用样板 [19] - 用户主要分布在美国、加拿大和巴西,70%为20至35岁的男性用户,但年龄段在扩展 [62] - 增长策略上,公司首先瞄准ChatGPT重度用户(月费20美元但仍觉不够用的群体),然后按职能细分,再打包成端到端的业务解决方案 [62] 行业观点与竞争策略 - 公司认为,今天所有的AI产品可能都是中间态,能活到最后的公司不是在某个时刻做出了最好产品,而是在每一个变化节点都能最快转身的公司 [4] - 公司的护城河不是产品,而是组织效率和pivot(转向)速度 [4][68] - 在AI产品竞争格局中,竞争是多维度的:在智能层面与模型提供商竞争;在产品形态上与其他Agent创业公司竞争;在价值交付上与垂直SaaS竞争 [67] - 公司押注的是“AI主导工作”的未来,即AI主导的经济体,而非仅仅是“人借助AI工作” [70][71] - 公司认为,创业公司最大的机会在于效率,如果能达到同行竞争对手效率的100到1000倍,将极具竞争力 [68] 对AI创业的反思与建议 - 公司认为AI创业最大的误区不是选错方向,而是如何构建AI Native的组织形态,让团队真正接受AI first的工作方式 [74][76] - 许多有经验的从业者,其经验可能成为转向AI Native工作方式的包袱 [74] - 对AI市场的认知存在偏差,用户对新技术的接受和教育需要时间,不能高估其普及速度 [75] - 给其他AI创业者的建议是:先把自己的公司变成一个真正由AI驱动的公司,让AI主导从需求发现到产品开发再到市场推广的全流程 [79] - 从市场进入(GTM)角度看,AI创业容易犯的错误是只做好产品而忽略了用户教育,手把手教用户转变工作方式比做产品本身更耗精力但也更重要 [79]
Elephant走红:AI开始为“Token浪费”算细账
华尔街见闻· 2026-04-17 16:44
行业范式转移:从模型狂热到工程理性 - 大模型行业正从追求顶级性能的“高烧”阶段,转向关注成本与效率的“理性”阶段,企业级AI应用中约50%的Token被浪费[1] - Token浪费的核心原因是AI应用从“对话”转向“执行”,Agent处理复杂多轮任务时,历史信息累积导致大量冗余计算,Token消耗呈指数级增长[1] - 行业趋势表现为“大模型控榜,小模型控场”,旗舰模型仍主导复杂任务,但100B–300B参数区间的轻量化、高性价比模型调用量明显上升,形成“腰部力量”[11] Token浪费的成因与现状 - 浪费的直接原因是企业使用最昂贵的旗舰模型处理所有任务,如同“用最贵的车跑最短的路”[1] - 随着Agent需要“执行”大量工作,例如客服Agent处理单张工单可能需调用模型十几次,当调用量达每日百万级别时,成本溢价问题在账单上开始显现[4] - 实际测试显示,多轮对话的Token成本增长惊人:第五轮对话成本是第一轮的13.3倍(0.0665美元 vs 0.0050美元),第十轮成本达到第一轮的26倍(0.13美元)[5] - GitHub上关于“Token Waste”的议题数量激增,相关讨论至少有5200个,仅2026年一季度就新增了4150个,表明控制Token浪费已成为开发者的普遍痛点[5] 工程侧的应对:Agent Harness与模型分层 - 当前大多数Agent工程实现粗糙,多步任务中Token消耗线性增长,催生了名为“Agent Harness”的新工程概念,它作为模型外部的“缰绳”,负责管理上下文、编排工具以提升效率[7] - 提升Token效率的压力来自两条并行路线:一是Agent框架侧(如Harness),二是模型侧,推动厂商用更精简的参数完成同等质量推理[7] - 模型选型逻辑走向成熟,分层调用模式变得实用:由大型模型负责决策与规划,小型模型快速、大规模地执行具体子任务[13] - 这种分工类似于CPU从追求单核主频转向多核协作,或数据库领域OLTP与OLAP共存,旨在实现整体吞吐与性价比的最优化[17] 模型格局演变:效率模型崛起 - 模型竞争焦点转向“单位Token成本下的推理速度、指令遵循度及长上下文稳定性”,而非单纯比拼参数规模[10] - 根据OpenRouter的LLM Leaderboard(4月16日数据),小尺寸模型涨幅惊人:排名第17位的GPT-5.4 Nano以48%的涨幅领跑,100B模型Elephant单日涨幅达38%[11] - 100B-300B参数区间成为“实用主义区间”,代表模型如GPT-5.4 Mini,以更低延迟和成本大幅缩小与旗舰模型的性能差距[13] - 新模型如Elephant Alpha(100B参数)定位“智能效率”优先,重点优化Token使用效率,适合代码补全、快速文档处理等场景,上线后单日流量暴涨500%[1][13] - 从应用情况看,OpenClaw、Hermes Agent等成为小尺寸模型的“最大流量贡献者”,开发者将其作为高频、低延迟任务的首选[12] 未来展望:效率定价与分工明确 - 旗舰模型不会消失,在需要跨领域深度推理、多步骤规划等复杂任务上仍不可替代[17] - 在日常业务执行层,将流量迁移到效率更高的模型上是更具性价比的决策,因为使用旗舰模型是在为不需要的能力付费[17] - Token效率正成为工程师评估模型的核心维度之一,因为它直接关系到高频调用场景下产品的商业可行性[17] - 行业路线日渐清晰:模型规模继续重要,但效率开始被市场定价,那些在单位成本下能提供足够推理质量的模型,正成为Agentic应用的默认底座[17][18]
Anthropic引发AI国有化论
日经中文网· 2026-04-17 16:00
Anthropic发布新型AI模型Claude Mythos及其性能 - 公司于4月7日发布了新型AI模型“Claude Mythos” [4] - 该模型在发现软件漏洞方面的能力高于大多数专家,并能够自主发动网络攻击 [6] Claude Mythos模型引发的国家安全关切 - 有观点认为,这是第一个让人感觉一旦权重数据被敌对势力窃取就会引发重大问题的模型,可能会影响国家安全 [2][5] - 由于Mythos有助于通过AI自动进行网络攻击,有些国家很有可能会试图获取其技术 [5] - 如果这种AI在全球扩散,可能会被用于网络战,并对国家的重要基础设施构成威胁 [6] - 美国记者托马斯·弗里德曼指出,Mythos可能会成为与核武器问世同等的“重要的根本性转折点” [6] 美国政府对公司及行业的介入与施压 - 美国国防部已将Anthropic列为国家安全供应链风险对象,一度暗示将动用总统权限适用《国防生产法》进行管控 [9] - 美国政府与公司在对立,施压要求其允许AI广泛使用,而公司曾要求限制使用AI(如不用于完全自主武器) [7] - 有分析指出,政府针对公司的一系列举措是试图将AI“准国有化”,以采购合同为筹码迫使合作伙伴接受政府条件 [9] - 据美国媒体报道,美军曾在对伊朗的军事打击中使用Anthropic的AI产品Claude [7] - 美国财政部长与高盛等美国大型银行的CEO举行紧急会议,美国特朗普政府也在密切关注Mythos在网络领域的高性能 [4] 行业趋势:AI开发国家管控或将加剧 - 随着Mythos这类模型出现,AI能力越强,政府介入就会越深 [11] - 行业创业者已将高端AI开发定位为与核武器同等重要的国家项目,OpenAI的CEO萨姆·奥尔特曼曾将AI比作“曼哈顿计划” [10] - 前OpenAI研究员预测,2027年美国政府可能向一家模仿OpenAI的美国虚拟企业增派人员,最终将其置于政府监管之下 [10] - 现实正逐步逼近中美两国推动AI国有化的预测场景 [11]
OpenAI花数亿收购两个播客——这是AI时代最清醒的一笔账
深思SenseAI· 2026-04-17 15:24
文章核心观点 - 在AI技术大幅降低产品开发门槛的时代,构建产品的技术壁垒已大幅削弱,而获取用户注意力的能力(即“分发”)已成为企业最核心且唯一的护城河 [38][39] - 行业领先的AI公司OpenAI以数亿美元估值收购一档日常播客TBPN,以及多家知名投资机构/公司收购媒体/注意力资产,表明最聪明的资本正在押注“注意力比技术更稀缺” [7][8][9] - 通过Rizz应用案例证明,一个可量化、可规模化、按效果付费的有机内容分发网络,其价值远高于单纯的产品技术优势,并能有效抵御大量仿冒竞争 [20][21][31][35] 行业趋势:技术壁垒坍塌与注意力竞争加剧 - AI工具导致应用开发门槛趋近于零,新网站、新iOS应用、GitHub代码提交量在2025年底至2026年初出现近乎垂直的增长,技术护城河价值大幅降低 [13] - 全球内容供给无限增长,但用户注意力总量固定(80亿人,每人每天24小时),导致产品间的注意力竞争变得异常激烈 [14] - 产品极易被复制,例如Rizz应用在一年内出现超过200个仿冒者,其中一些由个人利用AI工具在周末即可建成,但仿冒者平均自然下载量仅200次,平均寿命90天 [17][18] 传统获客渠道失效与成本飙升 - 付费广告渠道效果下降且成本飙升,例如Meta平台B2C广告千次展示成本(CPM)在部分品类超过40美元,用户获取成本(CAC)在过去几年上涨了222%,平均应用付费流量转化率仅1.2% [24] - 传统网红合作模式成本高、效果不确定,例如一次4000美元的联合帖子合作平均仅带来3000次观看,每次观看成本超过1.3美元,且无效果保证 [24][25] - 算法优化(如Meta移除手动定向)使每次转化成本下降22.6%,但这进一步削弱了中小公司依靠精准定向对抗大预算竞争对手的能力 [24] 新兴分发模式:播客作为“切片工厂”与创作者网络 - 现代成功播客的核心价值在于其“切片工厂”能力,即将长内容加工为30-60秒的短视频切片进行分发,切片触达的受众可达完整播客收听者的20到50倍 [26] - OpenAI收购TBPN播客,实质是购买其成熟的切片生产能力和每日稳定的高质量受众触达能力,这种能力在AI时代比代码更难复制 [28] - 短视频切片分发已成为核心影响力渠道,例如2024年美国大选期间,哈里斯竞选团队的60秒辩论切片在TikTok等平台触达的选民比历史上任何电视广告都多 [26][27] 成功案例剖析:Rizz的可量化分发飞轮 - Rizz应用未投入任何付费广告,通过向匿名创作者网络支付200万美元,获得了500亿次播放量,并最终带来1500万美元总收入 [31] - 其分发模式与传统网红合作有本质区别:按播放量付费、效果可量化、创作者匿名(不依赖个人IP)、网络可无限扩大 [31] - 该模式已系统化为AffiliateNetwork.com平台,数据显示59.35万美元广告花费带来了31.59亿次有机播放,每百万次播放成本约187美元,远低于Meta等付费渠道 [34][35] 高效分发平台的运作逻辑 - 平台运作基于绩效付费(RPM,即每千次播放报酬),品牌方只为真实播放量付费,创作者只在达到最低播放量门槛后获得报酬,无平台抽成 [36] - 内容格式固定且创作者匿名,使得一个创作者可运营多个账号,实现内容的批量生产与规模化,其上限远高于依赖稀缺头部网红的传统模式 [31][37] - 平台在防虚假流量检测上投入大量资金,以确保付费播放量的真实性,解决了内容营销行业的信任痛点 [36] 对产品与创业者的启示 - 产品开发与分发应同步甚至优先设计,目标用户的内容消费场景即是建立产品存在感的起点 [39] - 应将固定的广告投放成本转化为按效果付费的绩效成本,Roman的案例(59万美元换31亿次有机播放)证明了该模式的有效性 [39] - 内容格式的可复制性与规模化能力比单纯的内容质量更重要,稳定的、可批量生产的内容模板是构建分发飞轮的关键,胜过依赖个人魅力的偶发爆款 [39]
Anthropic又发新模型了,但手里藏着更强的“杀招”
第一财经· 2026-04-17 14:53
公司产品更新与性能 - Anthropic于4月16日发布旗舰新模型Claude Opus 4.7,距离上一代发布仅间隔两个多月,新模型能以更严谨态度处理长时间任务,更精确遵循指令,并在报告前验证输出 [3] - 在编程能力基准测试SWE-bench Verified中,Opus 4.7得分从上一代的80.8%升至87.6%,是目前公开模型中的第一名,超过Gemini 3.1 Pro的80.6% [6] - 在更难的SWE-bench Pro测试中,Opus 4.7得分从53.4%升至64.3%,对比GPT-5.4为57.7%、Gemini 3.1 Pro为54.2% [7] - Opus 4.7视觉能力大幅提升,视觉推理的CharXiv分数从上一代的69.1%提升到了82.1% [10] - 用户反馈显示,能够自信地将最困难的、以前需要密切监督的编码工作交给Opus 4.7 [9] 公司技术储备与竞争地位 - Anthropic拥有比Opus 4.7更强大的内测模型Claude Mythos Preview,该模型在代码与漏洞扫描上展现出“破坏性”的跨代提升,公司认为其“过于强大”,公开发布是不负责任的 [6] - 在SWE-bench Verified测试中,内测的Mythos Preview分数达到93.9%,在SWE-bench Pro测试中达到77.8%,均为目前最高水平 [6][7] - 过去一段时间,Anthropic产品迭代节奏加速,据不完全统计,在今年2月1日至3月24日短短52天里,公司一共更新了74款产品,平均不到两天一个 [11] - Anthropic通过每一次产品发布,都影响一批公司的股价,并靠着大模型产品能力坐稳AI圈“顶流” [11] 公司定价与市场策略 - Opus 4.7基础定价未上涨,仍为每百万token输入5美元、输出25美元,但因引入新分词器,同样文本会拆分出比原来多1到1.35倍的token,导致实际消耗成本上升 [11] - 对众多开发者而言,Claude是攻坚编程难题的首选工具,只要产出效率带来的杠杆足够大,增加的token成本对企业级用户而言是可接受的经济账 [11] - Anthropic在划定业务边界,例如禁止“龙虾”(OpenClaw)等第三方工具使用Claude订阅服务,并为部分使用场景引入强制实名认证,分析指出这是“合规清场”,对内完成用户分层与责任追溯,对外精准过滤非战略市场 [12] 公司财务与行业竞争 - Anthropic宣布公司年化收入(ARR)已超过300亿美元(约合人民币2048亿元),和2025年底的90亿美元(约合人民币614亿元)相比实现大幅增长 [13] - 从数据上看,Anthropic的收入已反超OpenAI,后者最新年化收入为250亿美元(约合人民币1706亿元) [13] - OpenAI首席营收官指出,由于计算云分发合作伙伴收入方式存在差异,统一到净额口径后,Anthropic宣称的300亿美元年化营收实际约为220亿美元,低于OpenAI的250亿,但按Anthropic目前增长速度,超过OpenAI或许只是时间问题 [13] - Anthropic最快或将于今年10月在美国上市,OpenAI目标2027年上市,估值可能高达1万亿美元 [13] - AI竞争已进入拼收入、拼治理、拼上市时间表的新阶段 [14]
阿里首个世界模型:快乐…生蚝
量子位· 2026-04-17 14:45
产品发布与核心功能 - 阿里新成立的ATH事业群发布全球首个主动式实时交互的世界模型产品“HappyOyster”(快乐生蚝)[2][5] - 产品核心主打四大功能:漫游(Wander)、导演(Direct)、创造(Create)、分享(Share)[5][10] - “漫游”模式允许用户通过文本或图片输入生成可交互小世界,并使用WASD和方向键实时控制角色位移与镜头视角,沉浸式探索[5][7] - “导演”模式是一个实时AI视频导演引擎,允许用户在视频生成的任意节点,用文字指令实时控制镜头、调整角色、改变剧情走向,实现“边拍边改”[8][9] - “创造”功能将体验从“生成一段视频”进化到“创造一个世界”,用户成为深度参与的创造者[9] - 用户创建的世界可以分享,供他人探索和二次创作[10] 产品技术规格与体验 - “漫游”模式支持最长1分钟探索,分辨率为480p,时间结束后需重新进入[13][18] - “导演”模式支持最长3分钟视频生成,分辨率可选480p或720p[13] - 两种模式均支持多模态输入,以及音频和视频输出[13] - 产品生成速度快,且生成的世界自带背景音乐(BGM)并包含动态NPC,增强代入感[16][21] - 在“导演”模式下,用户可调整分辨率(720p、480p),设定叙事风格与情感基调(常规、平和、戏剧化),控制运镜方式与画面稳定度(稳定、快速)[26] - 产品目前处于邀请制体验阶段,需要申请邀请码[11] 核心技术突破 - 产品基于原生多模态架构与流式生成世界模型,重点突破三大核心技术难点以实现“实时交互、长时连贯、音画同步”[35] - 第一项突破是**长时世界建模**:采用长时间跨度的世界演化建模方式,通过海量长视频数据学习世界运行规律,并加入持续状态复用机制,通过历史注意力状态的连续传递来维持长时间生成时的场景结构与动态连贯性,解决“生成久了就错乱”的问题[36][37][38] - 第二项突破是**实时交互控制响应**:在建模初期设计多样控制信号(文本、动作、图像等),使外部指令能持续影响世界演化,实现生成质量、长时一致性与实时可控性的协同优化,模型从“被动生成内容”升级为“主动模拟世界”[40][41] - 为实现实时性,模型采用流式生成框架,通过对世界状态进行高度压缩的隐式建模来降低单步计算开销,并将控制信号设计为可在线注入的条件变量,确保无需重置生成过程即可实时响应[43] - 第三项突破是**音视频联合生成**:采用统一的音视频生成框架,在同一世界状态下同步生成视觉与听觉信号,通过共享条件约束与协同解码机制,保障音画同步与语义一致,提升沉浸感[44] 战略定位与未来应用 - 阿里ATH事业群于2024年3月16日成立,核心目标是“创造Token、输送Token、应用Token”,旗下涵盖从基础模型研发到个人与企业端AI应用的完整布局[35] - HappyOyster的核心能力是对开放世界状态进行持续建模、预测与响应,天生适合延伸到需要“实时感知—实时生成—实时反馈”闭环的现实场景中[32] - 潜在应用方向包括文旅展陈、线下娱乐、机器人训练、数字人陪伴、教育演练、智能空间交互等[32] - 模型可作为实时演化的世界引擎,与摄像头、麦克风、空间传感器、显示终端、机械装置或可穿戴设备连接,根据人的位置、动作、语言和环境变化动态生成内容或交互结果[32] - 与硬件系统结合后,产品将承载一个能被现实输入持续驱动的生成式环境系统,打开未来的应用场景[33] 行业意义与产品愿景 - 该产品标志着从传统“文生视频”模型向“生成可交互世界”的跃迁,旨在打破用户与数字世界之间的“第四面墙”[45][46] - 下一代生成式AI的目标是生成一个完整的、可进入的世界,这个世界包含空间、物理、因果、角色和故事,用户可以进入、改写、离开并邀请朋友进入[46] - 产品名称“HappyOyster”灵感来源于莎士比亚的名言“The world is your oyster”,寓意通过一句话就能拥有一个完整的、可漫游、可导演、可分享的数字世界[48]
今年最火的AI产品,不止龙虾|榜单申报中
量子位· 2026-04-17 14:45
评选活动概述 - 量子位正在发起一项针对AI企业和产品的评选活动,旨在寻找并表彰2026年度值得关注的AIGC企业与产品[3][6] - 评选结果将于2026年5月在北京举办的中国AIGC产业峰会上公布,并邀请数百万行业从业者共同见证[6][7] - 评选活动报名截止日期为4月27日,企业可通过扫描二维码或联系指定工作人员进行申报[4][16][17] 评选核心目标与标准 - 评选旨在发现真正跑通应用场景、已被用户验证的AI产品,以及拥有技术实力和潜力的AI企业,而非仅关注短期热度[3] - 对于企业,关注其是否拥有清晰落地的应用场景、真实且持续增长的用户数据,以及在细分领域做出差异化体验或效率提升[8] - 对于产品,关注其是否基于生成式AI能力、已投放市场并拥有一定用户规模,且在近一年有重要的技术创新或功能迭代[16] 企业评选具体维度 - **技术维度**:评估公司的技术实力、研发能力、创新性,包括技术成果、研发投入和人才储备[12] - **产品维度**:评估核心产品的创新性、市场适配性和用户体验,包括产品创新性、用户规模和体验[12] - **市场维度**:评估公司在市场中的表现和增长机会,包括商业模式、市场规模、营收情况和合作生态[12] - **潜力维度**:评估核心团队实力和品牌潜力,包括核心团队、投融资进展和品牌影响力[12] 产品评选具体维度 - **产品技术力**:评估产品在技术方面的先进性、成熟度和高效性,包括技术架构、技术成果和产品效果[16] - **产品创新力**:评估产品在功能、体验和应用场景方面的创新性与独特性,包括核心功能、应用场景和解决的痛点[16] - **产品表现力**:评估产品的用户反馈和市场表现,包括用户规模、留存率、用户反馈和产品影响力[16] - **产品潜力**:评估产品在未来发展和市场扩展方面的潜力,包括产品生态、市场潜力和战略规划[16] 行业背景与峰会主题 - AI行业正从“观望期”迈入“全民参与期”,AI技术正从论文和发布会走向短视频创作工具、手机助手等广泛的实际应用[19] - 2026中国AIGC产业峰会以“@所有人,马上AI起来”为主题,聚焦“如何用好AI”,旨在帮助更多人迈出实际应用AI的第一步[19] - 峰会诚邀AI创业者、开发者和资深玩家参与,共同探讨如何将AI讲清楚、用起来、跑起来[19]