Workflow
Oasis
icon
搜索文档
26岁,创业两年,他的公司估值超200亿
创业邦· 2025-08-23 11:25
融资与估值 - 公司完成1亿美元B轮融资,投后估值达31亿美元,约合人民币222.5亿元 [4] - 累计募资金额达1.53亿美元,约合人民币11亿元 [4] - 估值在8个月内从5亿美元增长至31亿美元,涨幅超过6倍 [4] - 投资方包括红杉资本、Benchmark、Zeev Ventures等老股东,以及新投资方Aleph VC [4] 创始团队背景 - 联合创始人兼CEO Dean Leitersdorf 23岁获得博士学位,具有学术天赋和军队背景 [5][9] - 联合创始人Moshe Shalev来自极端正统派家庭,未上大学,在以色列精英情报部队8200服役14年 [5][9] - 团队在8200部队结识,2023年共同创立公司,初始团队15人,两年扩展至60人 [9][10] - 旧金山研发中心由前Snap、谷歌专家Kfir Aberman领导 [10] 技术与产品 - 推出全球首个无限长视频生成模型MirageLSD,实现小于40毫秒超低延迟实时转换 [6][15] - 模型采用扩散强制技术,解决长视频生成误差累积问题,保持画面稳定 [16][17] - 支持实时响应新指令,如中途修改场景要求 [21] - 首款产品GPU优化工具将AI模型推理成本从100美元/小时降至25美分/小时 [11] - 面向消费者的AI游戏Oasis发布几天内吸引上百万用户,社交媒体观看量达数亿次 [11] 商业与战略 - GPU优化工具已实现盈利,带来数百万美元收入 [11] - 公司目标成为市值万亿美元企业,聚焦娱乐和创意领域 [25][26][28] - 计划开发十亿用户级APP,改变科技互动方式 [25][26] - 实际运营成本低,过去11个月仅花费不到1000万美元融资资金 [26] 行业影响与评价 - 技术有望重塑游戏、直播、视频通话、影视制作、AR/VR等领域生态 [7][21] - 红杉资本合伙人评价团队为超精英AI工程师,技术天赋顶尖 [13][22] - 前特斯拉AI总监Andrej Karpathy称其为实时魔法,认为技术具有通用性和强大潜力 [21]
每 2 周新增 100 万美金 ARR GEO 已来,实时 AI 2 年 31 亿美金估值
投资实习所· 2025-08-12 13:42
融资与估值 - Decart完成1亿美元B轮融资 估值达31亿美元 11个月内完成3轮融资 上一轮估值仅5亿美元 半年多估值增长6倍 [1] - 本轮融资由Aleph VC新加入 Sequoia、Benchmark和Zeev Ventures等原有投资方继续跟投 [1] - 公司由以色列情报单位8200部队退伍军人Dean Leitersdorf和Moshe Shalev联合创立 [1] 核心产品技术 - Mirage实时AI视频转换模型实现40毫秒响应时间 突破传统AI视频10秒以上延迟限制 支持无限视频流实时转换 [3] - Oasis实时生成式AI开放世界模型 前3天用户突破100万 通过"下一帧预测"技术实现用户操作实时影响环境 [4] - 两项技术将AI应用从静态内容扩展到动态交互领域 显著降低3D内容创作门槛 [5][6] 商业模式 - 当前两大收入来源:GPU加速服务已产生数千万美元收入 Mirage模型API将成为未来核心收入 [9][10] - GPU专有优化技术将视频生成成本从10-1000美元/小时降至0.25美元/小时 相比Google Veo 3 Fast模型的1400美元成本优势显著 [10] - 计划打造开放生态 即将推出Mirage API赋能开发者 [9] 市场定位 - 瞄准AI改造互联网娱乐与创造领域的机遇 认为知识、电商、沟通三大类已被AI Agent改造 [8][9] - 目标成为拥有10亿用户的消费级应用 愿景是打造万亿美元市值公司 [8] - 产品应用场景包括视频会议实时风格转换、游戏画面实时渲染、广告内容动态调整等 [3] 行业趋势 - GEO(生成式AI搜索优化)成为新兴热点领域 已有产品实现每两周新增100万美元ARR [11] - AI基础设施和工具类产品融资活跃 如智能戒指Oura融资2亿美元估值52亿美元 [12]
一款80个粉丝的小游戏,让我看到了人类的未来
36氪· 2025-07-31 08:24
游戏形态变革 - 纯文字冒险游戏《Tower-Crawl》通过AI生成动态剧情,玩家可自由输入行动指令,系统基于规则和常识实时反馈不同剧情走向 [6][8][10] - 游戏机制继承DND桌游精髓,AI替代传统地下城主角色,实现高度自由化和非预设剧情 [9][13][14] - 与传统3A游戏相比,AI文字冒险突破线性叙事框架,每次游玩产生独特体验,无固定攻略或隐藏内容 [17][19][20] 商业模式创新 - 采用订阅制收费,基础会员5美元/月,高级会员10美元/月,按输入次数消耗游戏币 [22] - 开发成本极低,开发者仅需设定基础世界观,AI完成剧情生成和美术素材,单人数周即可完成作品 [25][26][27] - 欧美市场存在DND情怀用户群,中年玩家付费意愿强,单个游戏数百玩家即可盈利 [29][31][35] 行业技术演进 - AI已应用于传统游戏开发环节,如NPC对话生成、场景建模和宣传素材制作,大幅提升效率 [38][40] - 初创公司推出实时AI游戏引擎Oasis和Mirage,实现动态场景生成和自然语言交互,但存在画面连续性缺陷 [42][44][46] - 技术方向聚焦解决生成一致性难题,未来可能转向算力付费模式,玩家通过氪金获取更高质量生成内容 [48][50][51] 市场竞争格局 - 欧美独立开发者密集涌入AI文字冒险赛道,主流平台AI dungeon收录数千款作品,头部产品Discord粉丝超3万 [31][33] - 题材从魔幻向多元扩展,包括科幻IP改编、恋爱模拟等,同质化严重但试错成本近乎为零 [34][35] - 传统大厂加速AI工具应用,动视等公司在宣传物料制作中已采用AI生成 [40]
大神Karpathy都投的AI实时视频生成模型:直播都能立即转,无限时长几乎零延迟
量子位· 2025-07-19 13:15
核心技术突破 - 推出全球首个零延迟无限实时视频生成模型MirageLSD,采用自定义实时流扩散模型Live-Stream Diffusion(LSD),攻克传统自回归视频模型中误差累积的核心难题[4][9][11] - 通过因果自回归结构和Diffusion Forcing技术实现逐帧生成时保持时间连贯性,支持无限时长视频生成[14][15] - 历史增强策略主动添加模拟伪影训练模型预判纠正能力,推理阶段明确告知历史帧可能不准确以持续纠错[16][17] - 改进Transformer架构搭配视觉编码器和位置编码优化,处理速度比前代模型快16倍,达每秒24帧[6][18] - 应用KV缓存技术和蒸馏策略减少延迟,动态输入系统支持超低延迟响应玩家指令[20][21][22] 产品性能优势 - 实现40毫秒以下延迟,支持直播/游戏/视频通话等多形式输入,无时长限制实时生成[5][6] - 前代产品Oasis已实现每秒20帧零延迟生成,MirageLSD性能提升至24帧/秒[26][28] - 集成帧级提示词处理机制,可即时解析键盘指令和自然语言,实现"抖衣换装"等实时交互效果[21][23] 公司发展动态 - Decart为2023年成立的加州AI初创公司,获AI专家Karpathy天使投资[7][25] - 2024年推出首款实时生成式AI开放世界模型Oasis,MirageLSD为最新迭代产品[26][28] - 计划定期升级模型功能,包括面部一致性/语音控制等模块[28] 应用场景展示 - 支持用扫帚/盒子等日常物品替代专业设备进行沉浸式直播[1] - 实时修改游戏画面风格满足个性化需求[2] - 全双工通信通道实现输入输出并行处理,消除数据传输延迟[22]
ICCV2025 | One image is all you need,多模态指令数据合成,你只管给图,剩下的交给Oasis
机器之心· 2025-07-18 11:14
多模态指令数据合成方法Oasis - 核心观点:提出一种新型多模态指令数据合成方法Oasis,仅需用户提供图片即可自动完成指令合成、质量控制和回复生成,显著降低人工成本并提升数据多样性[1][6][21] - 方法优势:打破依赖预设文本提示词的传统模式,利用图像输入诱导MLLM自主生成多样化指令,完全无需人工前置文本提示[6][14][15] - 质量控制:设计四维度筛选标准(可解性/清晰度/幻觉程度/无意义性),高质量指令接受率为50.9%[19][49][50] 技术流程 - 三步法:构造钩子提示词诱导自回归采样→LLM分类保留指令型数据→质量控制与回复生成[11][16][18] - 分类机制:采样结果分为指令型(保留)和描述型(舍弃),通过率为49.9%[15][16][46] - 垂域合成:基于OCR相关图片合成70k垂域数据,在OCR任务benchmark上提升显著[43] 数据特性 - 规模与扩展性:基于Cambrian-10M图片合成500k训练数据(Oasis-500k),数据量可线性增长[21] - 语言多样性:覆盖英文(78.52%)、中文(18.66%)及多种小语种[27] - 任务多样性:指令平均长度76.8(LLaVA-NeXT为55.03),动词-名词组合覆盖更广[24][28][33] 性能验证 - 基准测试:在14个benchmark上平均提升Vicuna1.5/Qwen2.5/Llama3模型性能3.1%/1.8%/3.2%[36][38] - 增量实验:500k Oasis数据使LLaVA-100k模型性能提升5.2%,300k→500k阶段增益达4.0%[40][41] - 消融结果:指令质量控制使模型整体性能提升1%,DocVQA/InfoVQA任务提升超7%[45][50] 开源生态 - 代码库MM-INF:集成Oasis及常用多模态数据合成方法,支持模块化数据合成流程[2][52] - 资源开放:提供论文、代码及数据集链接,涵盖Qwen2-VL等模型实现细节[4][12][52]
生成视频好看还不够,还要能自由探索!昆仑万维开源Matrix-Game,单图打造游戏世界
机器之心· 2025-05-13 10:37
世界模型技术进展 - 开源世界模型Oasis首次实现实时可交互虚拟环境,包含画面及物理规则理解[1] - 微软开源MineWorld提升视觉效果和动作生成一致性[2][3] - 创业公司开源"多元宇宙"支持多玩家在同一世界模型游戏[4] - 英伟达提出"物理图灵测试"作为具身智能新标准[4] Matrix-Game技术突破 - 昆仑万维开源17B参数世界基础模型Matrix-Game,实现完整可交互游戏世界生成[6][10] - 模型特点包括细粒度交互控制(键盘指令准确率超90%)、高保真视觉物理一致性、多场景泛化能力[17][20][25][26] - 建立GameWorld Score评估体系,在视觉质量(0.72)、时间一致性(0.97)、交互可控性(0.95)、物理规则(0.76)四大维度超越竞品[30][31][35] 技术实现路径 - 采用两阶段训练策略:无标签数据预训练+标注数据可控训练[41] - 构建Matrix-Game-MC数据集,包含2700小时中质量+870小时高质量无标签数据及1000小时有标签数据[41][42] - 模型架构基于图像到世界建模,通过DiT生成潜在表示并由3D VAE解码为视频序列[44][45] 应用场景与行业影响 - 应用领域涵盖游戏开发、具身智能训练、影视与元宇宙内容生产[7][51] - 可与公司其他AI产品(天工大模型、Mureka、SkyReels)联动构建完整创作生态[51][52] - 代表空间智能发展方向,推动国内在交互式视频生成领域的技术突破[50][51] 行业趋势 - 三维世界AI研究加速发展,计算平台可能从处理token转向处理原子级单位[4] - 空间智能被视为生成式AI下一个发展方向,将推动更高级的智能实现[48][49] - 行业呈现技术全面兴起态势,类似大模型爆发的局面可能重演[4]