Mirage

搜索文档
每 2 周新增 100 万美金 ARR GEO 已来,实时 AI 2 年 31 亿美金估值
投资实习所· 2025-08-12 13:42
融资与估值 - Decart完成1亿美元B轮融资 估值达31亿美元 11个月内完成3轮融资 上一轮估值仅5亿美元 半年多估值增长6倍 [1] - 本轮融资由Aleph VC新加入 Sequoia、Benchmark和Zeev Ventures等原有投资方继续跟投 [1] - 公司由以色列情报单位8200部队退伍军人Dean Leitersdorf和Moshe Shalev联合创立 [1] 核心产品技术 - Mirage实时AI视频转换模型实现40毫秒响应时间 突破传统AI视频10秒以上延迟限制 支持无限视频流实时转换 [3] - Oasis实时生成式AI开放世界模型 前3天用户突破100万 通过"下一帧预测"技术实现用户操作实时影响环境 [4] - 两项技术将AI应用从静态内容扩展到动态交互领域 显著降低3D内容创作门槛 [5][6] 商业模式 - 当前两大收入来源:GPU加速服务已产生数千万美元收入 Mirage模型API将成为未来核心收入 [9][10] - GPU专有优化技术将视频生成成本从10-1000美元/小时降至0.25美元/小时 相比Google Veo 3 Fast模型的1400美元成本优势显著 [10] - 计划打造开放生态 即将推出Mirage API赋能开发者 [9] 市场定位 - 瞄准AI改造互联网娱乐与创造领域的机遇 认为知识、电商、沟通三大类已被AI Agent改造 [8][9] - 目标成为拥有10亿用户的消费级应用 愿景是打造万亿美元市值公司 [8] - 产品应用场景包括视频会议实时风格转换、游戏画面实时渲染、广告内容动态调整等 [3] 行业趋势 - GEO(生成式AI搜索优化)成为新兴热点领域 已有产品实现每两周新增100万美元ARR [11] - AI基础设施和工具类产品融资活跃 如智能戒指Oura融资2亿美元估值52亿美元 [12]
一款80个粉丝的小游戏,让我看到了人类的未来
36氪· 2025-07-31 08:24
游戏形态变革 - 纯文字冒险游戏《Tower-Crawl》通过AI生成动态剧情,玩家可自由输入行动指令,系统基于规则和常识实时反馈不同剧情走向 [6][8][10] - 游戏机制继承DND桌游精髓,AI替代传统地下城主角色,实现高度自由化和非预设剧情 [9][13][14] - 与传统3A游戏相比,AI文字冒险突破线性叙事框架,每次游玩产生独特体验,无固定攻略或隐藏内容 [17][19][20] 商业模式创新 - 采用订阅制收费,基础会员5美元/月,高级会员10美元/月,按输入次数消耗游戏币 [22] - 开发成本极低,开发者仅需设定基础世界观,AI完成剧情生成和美术素材,单人数周即可完成作品 [25][26][27] - 欧美市场存在DND情怀用户群,中年玩家付费意愿强,单个游戏数百玩家即可盈利 [29][31][35] 行业技术演进 - AI已应用于传统游戏开发环节,如NPC对话生成、场景建模和宣传素材制作,大幅提升效率 [38][40] - 初创公司推出实时AI游戏引擎Oasis和Mirage,实现动态场景生成和自然语言交互,但存在画面连续性缺陷 [42][44][46] - 技术方向聚焦解决生成一致性难题,未来可能转向算力付费模式,玩家通过氪金获取更高质量生成内容 [48][50][51] 市场竞争格局 - 欧美独立开发者密集涌入AI文字冒险赛道,主流平台AI dungeon收录数千款作品,头部产品Discord粉丝超3万 [31][33] - 题材从魔幻向多元扩展,包括科幻IP改编、恋爱模拟等,同质化严重但试错成本近乎为零 [34][35] - 传统大厂加速AI工具应用,动视等公司在宣传物料制作中已采用AI生成 [40]
腾讯研究院AI速递 20250704
腾讯研究院· 2025-07-03 23:31
一、AI游戏引擎Mirage - 谷歌、英伟达等八大机构联合发布全球首款AI原生UGC游戏引擎Mirage,支持通过自然语言指令实时生成游戏内容 [1] - Mirage突破传统游戏局限,支持16FPS流畅体验和5-10分钟连续游玩,画面质量直逼GTA和极限竞速 [1] - 核心技术基于Transformer和扩散模型打造的"世界模型",通过大量游戏数据训练实现动态交互与实时控制 [1] 二、OmniGen2图像生成模型 - 智源研究院发布OmniGen2统一图像生成模型,采用分离式架构与双编码器策略,支持文生图、图像编辑和主题驱动图像生成 [2] - 模型创新性引入图像生成反思机制,显著提升上下文理解能力、指令遵循能力和图像生成质量 [2] - OmniGen2已开放科研体验版,模型权重、训练代码及训练数据全面开源,GitHub星标一周内突破2000 [2] 三、Gemini for Education - 谷歌将Gemini为首的AI工具套件免费提供给全球教育工作者,深度集成到Google Classroom和ChromeOS中 [3] - Gemini in Classroom包含30多个AI工具,可自动生成教案、课堂活动和测验题,节省教师备课时间 [3] - 推出NotebookLM和Gems等教师主导的AI工具,以及全新数据分析功能,实现个性化学习体验和数据驱动教学 [3] 四、星流Agent创作平台 - 星流Agent是一个多功能AI创作平台,可通过自然语言指令一键完成批量表情包、品牌VI设计、视频生成、3D建模等多种创意任务 [4] - 核心功能包括批量高质量内容生成、Kontext智能图像编辑功能和全媒体工作流支持,实现"Vibe designing"设计新范式 [5] - 平台提供免费体验额度和积分,支持多样化创意输出,将设计师角色从"掌握技术"转向"理解需求与表达创意" [5] 五、腾讯元宝新功能 - 腾讯元宝新增一句话搜索功能,能智能匹配图片和视频号内容,支持全部模型使用 [6] - 回答结果可智能引用视频号相关教程,实现文字与视频配合讲解的形式,并支持一键跳转视频号观看 [6] - 用户可在获取初始回答后继续追问,此前5月份元宝已打通微信读书和起点读书,实现搜索直接跳转阅读功能 [6] 六、Blender Fusion框架 - 谢赛宁团队发布Blender Fusion框架,实现通过方向键或滑块精准控制画面中物体的移动、旋转和缩放,无需依赖文本提示词 [7] - 技术核心是三步流程:先用SAM模型分离物体和场景,再用Blender进行3D编辑,最后用扩散模型生成高质量合成图像 [7] - 系统采用双流扩散合成器接收原始场景和编辑后渲染图像,并通过源遮挡和模拟物体抖动等技巧提高泛化能力和真实感 [7] 七、Grok 4新模型 - xAI即将发布新模型Grok 4系列,包括旗舰版Grok 4和专用编程模型Grok 4 Code,预计于美国国庆日后推出 [8] - Grok 4特性包括13万tokens上下文窗口、支持函数调用、结构化输出和推理能力,但仅支持文本到文本模态 [8] - 马斯克表示希望用Grok 4重写人类知识库,补充缺失信息并删除错误,而Grok 4 Code将作为专业编程助手 [8] 八、DeepSeek-R2神秘模型 - 大模型竞技场秘密上线代号为"steve"的神秘模型,通过对话透露来自DeepSeek,引发网友猜测其为DeepSeek-R2或其他新版本 [10] - "steve"模型知识截止时间为2023年10月,通过部分智力测试,但表现不够惊艳 [10] - 此前The Information报道称DeepSeek-R2再度延期,原因是内部对模型表现不满意,同时可能受英伟达H20芯片缺乏影响 [10] 九、EDA行业动态 - 西门子、新思、楷登电子宣布收到美国商务部BIS通知,解除对中国大陆市场的临时禁令,恢复中国客户对其软件和技术的全面访问 [11] - 此前5月下旬BIS对EDA三巨头突然下发出口限制通知且未设缓冲期,导致三巨头股价暴跌,新思科技曾预测中国区收入将同比下降28% [11] - 国产EDA行业面临"成熟度与市占率"困境,中国已有三家EDA公司上市,但芯片设计公司为保证流片成功率仍倾向使用成熟度高的国外产品 [11] 十、AI就业影响 - 世界经济论坛《2025年全球未来就业报告》显示AI与机器学习专家成为增长最快职业,岗位数量预计增长86% [12] - AI将重塑全球劳动力市场,大数据、网络安全和技术素养成为增长最快的三大技能,同时数据录入员和行政助理等传统岗位面临需求下降 [12] - 全球约39%员工技能将在2025-2030年间发生显著变化,但仅50%员工接受过系统培训,63%雇主将技能差距视为业务转型最大障碍 [12]
全球首款AI原生UGC游戏引擎诞生!输入文字秒建GTA世界,试玩体验来了
机器之心· 2025-07-03 11:26
游戏引擎技术突破 - 全球首个由实时世界模型驱动的AI原生游戏引擎Mirage问世,由Dynamics Lab开发[2] - 系统支持通过自然语言、键盘或控制器实时生成并修改整个游戏世界,专为动态交互式体验设计[3] - 当前演示版本包含GTA风格的《都市乱斗》和极限竞速风格的《海岸漂移》,所有场景均为实时动态生成[5][6] 核心技术架构 - 基于Transformer的大规模自回归扩散模型,融合LLM与扩散模型优势,支持生成高保真游戏序列[21][28] - 采用垂直训练流水线,通过互联网游戏数据与人类录制互动样本训练模型掌握复杂游戏逻辑[22][23] - 定制版因果Transformer模型增强KV cache驱动的长上下文窗口,确保实时演变时的视觉一致性[29] 产品功能特性 - 实现16FPS标清分辨率实时交互,支持自然语言动态UGC创作与分钟级扩展型游戏体验[35] - 云串流技术实现跨平台即时游戏无需下载,多模式控制支持文本/按键/控制器输入[26][35] - 影视级画质超越早期像素块风格,连续交互时长突破十分钟[14] 行业革新意义 - 打破传统游戏预制设计边界,玩家可实时生成逃亡巷道/召唤载具/扩展城市天际线[18][19] - 代表UGC 2.0革新,游戏世界从可交互升级为与玩家共同进化[17][20] - 开发团队认为该技术将重塑游戏产业未来格局,创造无需下载/设计的全新媒介[16][34] 团队与开发现状 - 团队成员来自谷歌/英伟达/微软等科技巨头及卡内基梅隆等顶尖院校[33] - 当前体验存在网络延迟问题,人物移动灵敏度需优化[10][11] - 用户可上传初始图片生成游戏,但实际效果与预期仍有差距[12]