量子位
搜索文档
特斯拉世界模拟器亮相ICCV!VP亲自解密端到端自动驾驶技术路线
量子位· 2025-10-27 13:37
世界模拟器技术 - 特斯拉在ICCV顶会上推出世界模拟器 可生成看似真实的驾驶场景用于自动驾驶测试 [1][4] - 模拟器功能包括生成新的挑战场景 如右侧车辆突然连并两条线闯入预设路径 以及让AI在已有场景中执行避障任务 [5][7] - 生成的场景视频不仅用于自动驾驶模型训练 还可作为电子游戏供人类体验 [9] 端到端自动驾驶技术路线 - 特斯拉自动驾驶副总裁明确表示端到端AI是自动驾驶的未来 该方法利用多摄像头图像、运动信号、音频、地图等数据直接生成控制指令 [12][13][17] - 与模块化方法相比 端到端优势包括更易从数据中学习人类价值观、通过梯度整体优化网络、可扩展性更强以及具有确定性延迟 [17][18] - 端到端架构面临评估难题 特斯拉世界模拟器通过合成未来状态来连接策略模型 以闭环方式评估性能并支持强化学习 [22][23][24] 技术挑战与解决方案 - 端到端系统面临维数灾难 输入信息可达20亿Token 需精简为2个控制动作 [26][27][28] - 公司通过庞大车队每日收集相当于500年驾驶总和的数据 并利用数据引擎筛选高质量样本以提升模型泛化能力 [29][30] - 针对可解释性问题 模型可生成中间Token用作推理Token 生成式高斯泼溅技术可建模动态物体并与端到端模型联合训练 [32][35] 行业技术路线分歧 - 业界存在VLA和世界模型两条端到端自动驾驶技术路线分歧 华为、蔚来代表世界模型路线 元戎启行、理想选择VLA路线 [38][39] - VLA路线支持者认为该范式可利用互联网海量数据积累常识 并通过语言能力进行长时序推理 有观点认为不用VLA是因算力不足 [39][40] - 世界模型支持者如华为车BU CEO认为VLA路径看似取巧不能真正实现自动驾驶 特斯拉方案因历史选择正确而受关注 [41][43][44]
相机参数秒变图片!新模型打通理解生成壁垒,支持任意视角图像创作
量子位· 2025-10-27 11:31
核心技术突破 - 提出Puffin统一多模态模型,首次在统一框架下融合以相机为中心的理解与生成任务,解决了此前两类任务被独立研究、模型受限于固定视角的问题[1][2][11][12] - 模型具备“与相机共思”能力,通过将抽象相机参数转化为专业摄影术语和分析空间线索,弥合了视觉-语言-相机模态间的鸿沟,支持空间想象和灵活的跨视角应用[4][18][20][44] - 在生成任务网络设计中引入像素级相机透视场作为连续潜在变量,并结合共享的思维链机制,实现了对图像生成更精细的空间控制和更合理的空间结构生成[16][27][28] 模型架构创新 - 引入几何对齐的视觉编码器,通过语义教师网络与视觉教师网络的双重蒸馏获得,兼具几何保真度和强语义理解能力,克服了现有多模态大模型视觉编码器缺乏几何保真度的局限性[14] - 采用渐进式解冻与联合微调的分阶段优化策略,使模型在底/中层结构线索与高层语言推理之间建立紧密联系[14][15] - 设计连接模块,通过可学习的queries将文本描述和相机参数对应的LLM隐式状态映射为扩散模型可理解的条件信号[15] 数据集与基准建设 - 构建Puffin-4M大规模高质量数据集,包含约400万张图片-语言-相机三元组,弥补了多模态空间智能领域同时覆盖视觉、语言与相机模态的数据集稀缺的空白[29][30] - 数据集构建流程涵盖360°全景数据收集与预处理、2D透视图像渲染生成、场景描述与空间推理打标以及跨视角场景扩展四个阶段[32][33] - 开源Puffin-Gen和Puffin-Und两个评测基准数据集,分别为相机可控生成和相机理解提供更具挑战性和综合性的验证标准[34] 性能表现 - 在相机理解任务中,Puffin模型在Roll、Pitch、FoV等参数估计上全面超越现有方法,例如在Roll参数估计上达到0.32度误差和84.9%/93.4%/96.2%的1/5/10度AUC精度[36] - 与GPT-4o、Qwen-Image、Nano Banana等主流多模态模型相比,Puffin在Up Vector、Latitude、Gravity等几何参数估计上误差显著更低,例如Up Vector平均误差为11.94度,远低于GPT-4o的24.11度[38] - 模型在AIGC图像和真实世界摄影图像等多种场景中均表现出良好的鲁棒性和合理的空间生成能力[39][41] 应用前景 - 模型能够通过精确预测相机参数,在自然场景图像中辅助虚拟三维物体的插入,并可通过指令微调灵活扩展至空间想象、世界探索和摄影指导等跨视角任务[43][44] - 在世界探索任务中,对初始视角与生成视角进行三维重建可视化显示,生成结果在空间结构上保持了良好的一致性[44] - 未来计划进一步提升跨视角能力,并扩展至以相机为中心的视频生成与理解,促进在动态与沉浸式场景中的更广泛应用[45]
OpenAI IPO计划第一步曝光,奥特曼骚操作看傻华尔街
量子位· 2025-10-27 11:31
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI距离IPO更近一步。 最新消息,软银批准了对OpenAI剩余的225亿美元投资,这笔融资的 条件是OpenAI要在年底前完成重组 ,为上市铺平道路。 与此同时,奥特曼各种骚操作被曝光: 他 绕过投行和律师 ,主要依靠自己的心腹和英伟达、AMD等谈判,操盘了价值 1.5万亿美元 的芯片交易。 这种非常规的交易流程导致达成的协议缺乏详细的财务条款,以及构成循环交易,遭到分析师广泛批评。 如果OpenAI重组不成,拿到的钱会变少 软银这次是真的豁出去了。 第二笔225亿美元的投资,加上之前的75亿美元,对OpenAI总投资额已经达到300亿美元。 不过这笔钱可不是白给的,OpenAI必须在年底前完成公司重组,从非营利组织转型为公益企业(public benefit corporation),为IPO铺平 道路。 这是OpenAI在4月份宣布的410亿美元融资轮的一部分,这轮融资直接把OpenAI的估值推到了2600亿美元。 不过软银也给自己留了后路:如果OpenAI年底前搞不定重组,投资额就会从300亿美元缩水到200亿美元。 与英伟达、甲骨文、AM ...
这种眼镜我建议外卖快递小哥人手一个
量子位· 2025-10-27 11:31
亚马逊智能眼镜产品“Amelia” - 零售业巨头亚马逊为自家快递员配备智能眼镜“Amelia”,其早期版本正由数百名送货员进行测试[5] - 该眼镜基于计算机视觉和人工智能技术,使物流人员无需掏出设备即可扫描包裹、获取步行路线导航及送货证明[6] - 产品镜片搭载显示屏,配有两个摄像头及手电筒,支持安装定制近视镜片,控制系统集成于专用马甲以减轻重量[8][10] - 配套马甲的左侧设备提供8-10小时续航,右侧圆形旋钮为控制器,用于选择工作模式和控制拍照[11][12] - 眼镜在送货员安全停车后自动激活,核心功能包括显示客户备注、提供精准路线指引、快速扫描条码及异常情况拍照记录[15][16] - 亚马逊计划于2026年中期大规模量产该物流眼镜,初始产量目标约为10万副[18] 亚马逊的战略布局与行业竞争 - 亚马逊官方表示,推出眼镜旨在利用AI技术打造端到端智能系统,提升从分拣到“最后一公里”配送的安全性与效率[19][20] - 公司此举亦被解读为与Meta在智能眼镜领域展开竞争,亚马逊还计划推出代号“Jayhawk”的面向大众消费级的眼镜,预计在2026年底或2027年初推出[21][22][23] 智能眼镜行业动态 - 2024年Meta雷朋智能眼镜全年销量达142万台,预计2025年将突破400万台[24] - 苹果正研发不依赖外接计算单元的AR眼镜原型机,目标在2026年前后推出日常佩戴型产品;谷歌重启“Project Iris”项目并引入Gemini模型;三星与高通、谷歌合作打造MR平台[25] - 国内市场热度显著,小米、华为、百度等大厂及Rokid、影目科技等创业公司均将AI眼镜作为重点方向[25] - 国内公司Rokid已融资超10轮,估值达10亿美元,其产品Rokid Glasses在5天内售出4万台[26][27] - 行业共识认为AI眼镜正迎来“iPhone时刻”,产业即将爆发,影目科技CEO指出价格低于2000元是进入大众市场的关键,潜在爆款价格带可能在六七百元以下[28][30][31][32]
99%的AI产品都没有真正的护城河,初创产品需要做好「细分场景+生态协同」 | 对话AI播客工具Podwise
量子位· 2025-10-26 16:13
产品定位与目标用户 - 产品核心定位是将线性音频转化为可检索、可复用、可沉淀的结构化知识,专为播客听众设计[8] - 产品聚焦于有硬核内容、高信息量的“干播客”,如科技、AI、历史、健身等领域节目[11][16] - 核心用户群体为投资人、自媒体从业者和终身学习者三类人群,男性用户占比较高[11][17][20][22] 核心功能与竞争优势 - 核心功能包括对播客进行转录、生成摘要、思维导图、标注高光片段和金句,并支持一键同步至Notion、Obsidian、Readwise等知识库[8][14][22][25][27] - 转录准确率远高于泛化的自动语音识别工具,优势在于转录前会先提取播客核心内容和关键词[11][28][29][61] - 具备全平台声纹识别能力,能精准识别特定人物(如罗永浩、马斯克)在不同节目中的发言[11][30][68] - 拥有超长内容处理能力,可轻松应对超过4小时甚至10小时以上的播客节目,而许多工具最多仅支持2到4小时[11][31] 产品市场匹配与商业化策略 - 判断产品市场匹配的核心标准是用户付费意愿,而非单纯用户数量,付费率在SaaS产品中靠前[11][33][35][40] - 产品上线即盈利,最关注的业务指标是续费率,而非虚高的年度经常性收入,退订率一直维持在较低水平[4][11][38][39] - 采用免费增值模式,免费用户每月可处理4期转录和4期总结内容,标准版和专业版分别支持20期和50期节目转录[11][43][44] - 选择早期直接追求付费模式是因为处理长播客内容消耗大量GPU资源和token,成本压力大[41][42] 用户获取与增长策略 - 用户增长的核心策略是出现在目标用户活跃的平台,如即刻、小红书、Reddit等信息平权平台[11][45][46] - 通过优质内容吸引用户自发传播,而非依赖付费推广,初期通过播客节目自身听众社群获得第一批用户[11][33][36][45][47] - 建立了联盟推广计划,主要面向自媒体人员,通过分润链接鼓励其帮助产品传播[48] 产品开发与功能迭代 - 功能开发优先级基于是否对核心价值有帮助,通过用户反馈渠道收集需求,但最终判断标准是功能产生的数据量[11][49][52][54] - 对于上线后数据表现差的功能(如Ask AI)会考虑下架或隐藏入口,将资源集中于更有价值的功能[50][56][57] - 业务边界明确,专注于知识类“干播客”的信息获取领域,避免将工具做得过于庞杂[11][58] 技术选型与成本控制 - 选取底层模型的核心标准是能否处理长内容(如10小时以上播客),并需测试多语言、多风格场景下的表现[11][64][65] - 采用混合模型策略,根据不同功能场景分配使用Gemini、GPT顶尖模型和DeepSeek等模型[66] - 转录功能基于Whisper开源方案进行自研定制,增加了声音活跃探测、声纹识别等模型,成本比使用OpenAI API低10倍以上[11][67][69][70] 竞争壁垒与市场策略 - 认为99%的AI应用产品没有真正的技术护城河,面对大厂竞争的策略是切入精细化人群,所有产品体验围绕特定用户需求设计[11][72][73] - 通过连接Notion、Obsidian、Readwise等知识管理工具满足核心用户刚需,这些功能对大厂而言过于小众[73] - 核心布局是做好细分场景与生态协同,不与大厂正面竞争,目标是在小众赛道找到1万至5万付费用户即可[11][73][74]
人工智能年度榜单火热报名中!五大奖项,寻找AI+时代的先锋力量
量子位· 2025-10-26 12:01
评选概述 - 正式启动2025人工智能年度榜单评选报名 旨在让从业者感受智能浪潮跃迁并给予同行掌声与鼓舞 [1] - 评选从企业、产品、人物三大维度设立五类奖项 共同见证年度之星并点亮未来方向 [2][4] 企业榜奖项 - 2025人工智能年度领航企业面向中国AI领域评选最具综合实力企业 [5] - 参选条件包括注册地在中国或主营业务面向中国市场 主营业务属AI及相关产业或已广泛应用AI并在细分领域领先 具备成熟产品或服务并获得市场认可 近一年在技术创新、产品落地、市场拓展或商业模式上取得显著突破 [6] - 评选标准涵盖业务能力如市场占有率与营收规模、商业模式与盈利能力、客户数量及行业覆盖面、增长潜力 技术能力如科研实力与技术成果、研发投入比例、技术核心竞争力、创新案例 资本能力如融资情况、财务状况、市值/估值水平 其他综合能力如企业综合情况、品牌影响力与行业口碑 [11] - 2025人工智能年度潜力创业公司聚焦中国AI领域创新创业力量 评选最具投资价值和发展潜力AI创业公司 [9] - 参选条件包括公司未上市 拥有人工智能相关产品或服务落地并具备可行商业模式且初步获得市场认可 近一年在技术研发、产品创新或行业应用方面取得显著成果 [12] - 评选标准涵盖业务潜力如商业模式、目标市场规模、营收增长情况、客户拓展能力 技术创新如科研实力、技术成果、差异化优势、落地案例 资本能力如融资情况、财务状况、估值水平 其他综合能力如企业综合情况、核心团队构成、品牌影响力与行业口碑 [12] 产品榜奖项 - 2025人工智能年度杰出产品评选标准包括产品力与技术力如功能完整性、性能表现、技术先进性、差异化优势 落地情况如市场占有率、用户规模、营收情况、行业应用价值 其他综合能力如品牌影响力、用户口碑、产品生态 [17] - 2025人工智能年度杰出解决方案聚焦AI在不同行业与场景中的典型应用 评选在创新性、落地性和行业推动力方面表现突出方案 [15] - 参选条件包括解决方案以自主创新AI技术为核心或特色且具备明确应用场景与价值 已在实际业务或行业场景中落地实施并获得客户验证 近一年在技术融合、应用创新或商业模式上有显著突破并对行业智能化转型产生积极推动作用 [18] - 评选标准涵盖创新性如技术融合能力、应用模式创新、差异化优势 落地情况如市场占有率、客户情况、营收情况、潜在市场规模 其他综合能力如销售与服务能力、品牌影响力、客户口碑、行业生态 [18] 人物榜奖项 - 2025人工智能年度焦点人物参选条件包括国籍为中国或所属公司主体在中国且为创始团队成员或核心高管 所属公司主营业务属AI及相关产业或已广泛应用AI且公司在领域有影响力 近一年带领团队在AI技术或商业化方面取得显著突破并对行业发展产生重要影响 具有持续贡献潜力和较高行业认可度 [23] - 评选标准涵盖企业情况如企业基本情况、行业地位、商业模式、营收情况 个人能力如技术能力、商业能力、创新能力及团队领导力 其他综合能力如个人学术或行业背景、品牌影响力、社会及行业认可度 [23] - 科研院所中符合条件且在AI领域具有同等影响力个人也可参与评选 [19] 行业活动 - 量子位主办MEET2026智能未来大会以共生无界 智启未来为主题 承袭MEET系列年度行业观察视角 邀请科技、产业与学术领域领军人物齐聚见证行业变革 [25] - 大会作为年度影响力科技商业峰会 每年吸引上千名科技从业者参与、百万观众线上围观、近百家合作媒体联合曝光 已成为智能科技行业年度风向标 [26] - 大会聚焦聚变智能科技产业 邀请技术、产业、投资领域代表性企业和人物 探讨人工智能+、AI Infra、智能终端、智能驾驶、低空经济、能源电力等前沿科技话题 [26]
OpenAI被曝瞄准AI音乐赛道商业化,Suno首当其冲
量子位· 2025-10-26 12:01
OpenAI进军AI音乐的战略动向 - OpenAI已与茱莉亚学院合作进行乐谱标注,旨在利用先进模型创作高质量音乐内容[6][7] - 新产品未来可能整合进Sora 2视频生成模型,实现视频BGM自动生成及人声轨道伴奏添加[7] - OpenAI正探索AI音乐的To B市场,广告行业是最清晰赛道,可用于构思歌词、创作广告歌曲及视频风格模仿[8][9] AI音乐行业竞争格局 - 当前AI音乐生成赛道头部效应不明显,前十大平台合计市场份额约24%[12] - 主要初创公司包括估值20亿美元的Suno(主打人人可创作音乐)和Udio(偏向专业用户)[12][13] - 科技巨头已纷纷布局:谷歌推出Lyria模型,字节跳动、阿里、腾讯等国内公司也在逐步进入市场[16][17] AI音乐商业模式与技术特性 - Suno凭借订阅模式实现年经常性收入1.5亿美元,同比增长近四倍,毛利率超过60%[29][30] - 音频模型相比大语言模型更轻量且成本更低,但市场潜在规模和用户付费意愿不逊于语言模型[32][33] - OpenAI此次举动是商业驱动,旨在通过可落地产品抵消算力开支,而非单纯技术探索[26][34] 历史技术积累与行业影响 - OpenAI早在2019年就推出音乐模型MuseNet(支持10种乐器),2020年推出带人声的Jukebox模型[22][24] - 巨头入场将加速行业创新步伐,消费者可获得更多选择并从中受益[19][20] - 该事件引发对AI应用公司壁垒的思考:通用模型公司进入垂直领域后初创公司的生存空间[35][36]
破解AI对不同上下⽂位置的敏感度不⼀致,新框架使出“解铃还须系铃人”
量子位· 2025-10-26 12:01
文章核心观点 - 语言模型存在严重的位置偏见问题,即模型对输入序列中不同位置的敏感度不一致,这制约了其在复杂推理、长文本理解及模型评估等任务上的表现 [1] - 论文提出了一种名为Pos2Distill的创新“位置到位置”蒸馏框架,旨在将模型在优势位置的强大能力迁移至劣势位置,从而有效缓解位置偏见 [3][4] - 该框架针对“检索”和“推理”两类任务中位置偏见的不同表现,分别设计了Pos2Distill-R1和Pos2Distill-R2两个专用系统,实验表明该方法能显著提升模型在不同位置上的性能一致性 [5][22][27] 位置偏见问题分析 - 位置偏见导致模型在关键信息任意分布在输入不同位置时,无法有效识别和整合核心内容,引发应用中的意外失败 [8] - 在检索任务中,位置偏见主要表现为“词元偏移”,即黄金文档位置不同会导致模型在关键生成位置出现分歧 [10] - 在推理任务中,位置偏见既影响检索过程也影响推理过程,最终导致“思维偏移”,即思维链条发生变化 [10] Pos2Distill方法原理 - 方法核心是利用模型自身已习得的知识来纠正其系统性偏差,遵循“解铃还须系铃人”的思路 [4] - 基本原是利用位置本身造成的性能不均衡来对抗位置偏差问题 [5] - Pos2Distill-R1通过引入KL散度损失提供细粒度纠正信号,缓解检索任务中的词元偏移 [12] - Pos2Distill-R2通过蒸馏来自优势位置的优质思维链响应,来指导和纠正劣势位置的推理轨迹 [13] 算法设计细节 - Pos2Distill-R1框架包含平凡位置激活和优势位置锚定两个核心模块,前者促进能力迁移,后者确保优势位置性能保持 [14] - 平凡位置激活利用KL散度作为对齐信号,位置感知对齐则优先对高对齐难度位置实施梯度更新 [15][16] - 训练目标损失融合了激活损失和锚定损失,形式化为 ${\mathcal{L}}={\mathcal{L}}_{\mathrm{Act}}+\lambda{\mathcal{L}}_{\mathrm{And}}$ [21] 实验结果 - 在WebQ数据集上,Pos2Distill-R1使Llama-3-8B在20个位置上实现56.7%的平均准确率,与黄金文档位于最佳汇聚位置时的57.9%相当 [22][23] - 在MusiQue数据集上,Pos2Distill-R2实现了42.8的精确匹配得分,优于所有领先基线;在HotpotQA数据集上达到58.3的EM得分,最强基线为50.9 [27] - 两个系统表现出显著的跨任务泛化能力:Pos2Distill-R1对推理任务产生3.3%的增长,Pos2Distill-R2也增强了上下文感知能力 [29]
P图老本事搭上了对话框,美图这AI Agent到底香不香?
量子位· 2025-10-26 12:01
RoboNeo产品功能特点 - 产品定位为AI Agent,支持通过自然语言对话进行图像生成和编辑操作,用户可通过聊天对话框输入需求生成图片[3][9][10] - 具备独特的"追问模式",当用户指令模糊时,AI会主动提供选项让用户充实提示信息,提升指令理解准确性[12][14][15] - 整合美图传统修图功能,包括AI改图、扩图、超清、抠图等基础操作,操作界面布局采用左边聊天、右边编辑的设计[9][10][17] 图像处理核心技术 - 搭载创新的拆分图层功能,可自动识别图片元素并分解为独立图层,实现类似Photoshop的精细化编辑体验[20][21][23] - 在特定场景下生成效果出色,如iOS风格3D贴纸头像能完美复刻项链、姿势、眼睛和服装细节,与官方贴纸相似度高[26][28] - 存在部分生成效果不足,如清透感人像写真未能实现预期的俯视角度和氛围感,仅简单替换背景[31][33] 视频生成能力 - 支持将静态图片转为动态视频,例如将真实城堡转绘为像素风格视频,实现现实与像素感的交融过渡[7][36][37] - 视频生成存在明显技术缺陷,包括画面逻辑错误(如披萨未切即自动瓦解)、口型与语音不同步、字幕扭曲等问题[40][42][44] - 生成速度表现不稳定,后期生图速度明显下降,可能受资源分配影响[33][44] 产品开发与行业背景 - 开发团队采用非传统敏捷开发模式,由小团队在一个月内通过封闭开发完成,砍掉层层审批流程和传统产品经理角色[47][48] - 开发效率显著提升,设计师可直接训练模型并云端上线,反映公司应对激烈市场竞争的快节奏打法[47][48] - 产品推出背景源于2025年影像类AI产品密集涌现的行业环境,公司通过快速迭代抢占市场先机[48]
盲人复明!马斯克Neuralink联创实现人工视觉里程碑
量子位· 2025-10-26 12:01
人工视觉技术PRIMA的突破性进展 - 世界首创的人工视觉技术PRIMA帮助一位70岁高龄、失明15年的年龄相关性黄斑变性患者重获光明,使其能够再次阅读[2][5][6][11] - 该技术首次证明人工视觉可以恢复患者的功能性中央视力,为失明者带来了希望[10] - 该研究发表于《Nature》期刊,是2025年一项低调但闪亮的科技进展[1][2] PRIMA技术的原理与优势 - 技术原理在于成为光敏细胞的替代物,通过光伏视网膜植入物模拟光子撞击视网膜,刺激幸存的视网膜神经元以恢复视觉[25][27] - 与只能延缓视力丧失的传统疗法不同,PRIMA能够直接逆转并恢复功能性视力[17][24][27] - 整个系统由2mm x 2mm x 30μm的超薄无线植入物和一副特殊眼镜组成,无需外部电线,由捕获图像的红外光束激活[27] PRIMA的临床试验数据 - 临床试验涵盖5个国家、17个临床地点的38名地图样萎缩患者[29] - 最终评估显示,PRIMA系统能让84%的患者恢复功能性中央视力,80%的患者视力实现0.2 logMAR的水平上升[30] - 患者平均视力改善25.5个字母,相当于能看到标准视力测试表下方约5行[30] - 术后部分患者出现排异反应,但95%的症状在2个月内消退,且未对周边自然视力造成显著影响[32] 技术当前局限与未来方向 - 当前系统存在局限性,包括最大视觉敏锐度有待提升,且视觉效果为黑白[35] - 现有植入物包含381个像素,每个像素为100微米平方,用户阅读过程并非快速流畅[35] - 研究团队正在开发下一代植入物和眼镜,旨在实现更小像素、更有效率的视觉性能以及色觉[38] 背后公司Science Corporation的背景 - PRIMA技术由Science Corporation开发,该公司由Neuralink联合创始人Max Hodak于2021年创立[40][41][43] - 公司专注于神经工程和脑机接口技术,旨在治疗视力、认知及行动能力受损的患者[43] - 公司拥有自主的微型医疗芯片制造工厂,可实现从材料、制造到临床实验的全流程自主[44][45] - 公司在2025年4月完成了由Khosla Ventures领投的超1亿美元融资,以加速技术开发和商业化[45] 目标市场与疾病应用 - 技术主要针对年龄相关性黄斑变性的晚期地图样萎缩患者,该患者群体在全球超过500万人[18] - 该技术不仅适用于AMD,对于如色素性视网膜炎等其他感光细胞死亡但视网膜神经元尚存的疾病同样具有应用潜力[33] - 技术被类比为“视力版”人工耳蜗,旨在推动人工视觉成为现实[48][49]