Workflow
计算摄影
icon
搜索文档
Z Potentials|专访a16z被投Phota Labs联创张璇儿:在Photoshop与美图之间,如何杀出一条新路?
Z Potentials· 2025-10-29 13:16
公司核心观点 - Phota Labs是一家专注于利用生成式AI技术重构照片记忆场景的初创公司,其目标不是简单的图像修复或增强,而是通过算法重新演绎拍摄时的决策过程,将日常照片转化为美好的记忆[1][6][9] - 公司定位为品类定义者,致力于解决摄影行业长期未被满足的情感连接需求,其核心理念是“Transform everyday photos into beautiful memories”,让AI技术成为用户记录生活时的“第二视角”[6][8][36] - 公司采用纯软件解决方案,通过身份保持和上下文理解两大技术原则,确保生成结果既真实又符合用户的记忆场景,未来商业模式将包括C端订阅和B端API授权[37][56][58] 创始人背景与创业契机 - 创始人Cecilia Zhang拥有深厚的计算摄影学术和工业背景,本科就读于Rice大学计算机和电子工程,在伯克利攻读计算机博士期间专攻计算摄影,导师是光场相机公司Lytro的创始人[11][13][14] - 在Adobe工作期间,Cecilia参与了Project Indigo等计算摄影项目,积累了从研究到产品化的全流程经验,并观察到生成式AI技术成熟带来的创业窗口[18][19][20] - 创业灵感来源于用户反馈“我不是想修好这张照片,我只是希望能‘再回到那个瞬间’”,这促使她思考如何用AI技术建立情感连接而非仅仅提供工具[2][3][20] 产品定位与技术特点 - 产品与现有图像工具的根本区别在于从“修复增强”转向“场景重构”,通过理解人物身份、场景内容和拍摄环境等上下文信息,结合摄影学知识进行生成[37][41][42] - 技术管线分为理解和生成两大部分,理解层依赖语言模型的语义理解能力,生成层则融合摄影美感原则,整个系统强调身份保持和审美一致性[41][42][47] - 产品初期需要用户提供30到50张照片建立个人档案,以实现跨照片的身份一致性,未来计划支持视频输入并从动态内容中自动挑选最佳瞬间[23][51][54] 目标市场与竞争策略 - 初期目标用户定位为有摄影基础的人群,这类用户对成片效果有清晰预期,能提供高质量反馈,但长期目标是服务所有普通用户[35][36] - 公司认为目前市场上没有完全相似的产品,属于品类定义者,潜在竞争对手可能是掌握照片入口的手机厂商,但创业公司在迭代速度和用户理解深度上具有优势[57] - 明确排除硬件路径,因为硬件创业成本与节奏远高于软件,且现有设备已能满足采集需求,公司更专注于通过算法和审美优势构建壁垒[7][58] 技术演进与未来规划 - 技术进步主要体现在模型架构、推理速度和计算效率的提升,但对用户数据输入量的要求并未降低,身份认知仍需30张左右的照片进行学习[49] - 视觉模型的发展与语言模型深度融合,语言模型提供的世界知识对视觉理解和生成起到关键作用,这是三年前难以实现的技术条件[50] - 长期愿景是成为用户记录生活的“第二视角”,无论使用何种设备拍照,用户都会好奇通过Phota Labs重构后的效果,未来计划探索从视频中自动生成精选照片组[52][54][55]
刚刚,ICCV最佳论文出炉,朱俊彦团队用砖块积木摘得桂冠
机器之心· 2025-10-22 11:30
ICCV 2025会议概况 - 国际计算机视觉大会ICCV于10月22日在美国夏威夷揭幕,是全球计算机视觉三大顶会之一,每两年举办一次[1][4] - 本届大会共收到11239份有效投稿,最终录用2699篇论文,录用率为24%,相比上一届论文数量大幅增长[4] 最佳论文奖 - 最佳论文奖由卡耐基梅隆大学获得,获奖论文为《Generating Physically Stable and Buildable Brick Structures from Text》,由知名青年学者朱俊彦带领团队完成[2][5][6] - 论文提出了BrickGPT,是首个能够根据文本提示生成物理稳定的相互连接积木装配模型的方法[9] - 研究团队构建了大规模、物理稳定的积木结构数据集StableText2Brick,包含47000多个积木结构和超过28000个独特三维对象及其文本描述[11] - 该方法在自回归推理中引入有效性检查和基于物理约束的回滚机制,实验结果显示其有效性达100%,稳定性达98.8%,全面优于基线模型[18][20] - 生成的设计可由人类手动装配或机械臂自动组装,并开发了基于文本的积木贴图方法用于生成带颜色和纹理的设计[11] 最佳论文提名奖 - 同样来自卡耐基梅隆大学的论文《Spatially-Varying Autofocus》获得最佳论文提名奖[21] - 该研究突破了传统镜头单一平面成像限制,构建了能够任意调整景深的计算镜头,实现了全场景清晰成像并保持最高空间分辨率[23] 最佳学生论文奖 - 最佳学生论文奖由以色列理工学院获得,获奖论文为《FlowEdit: Inversion-Free Text-Based Editing Using Pre-Trained Flow Models》[2][24][25] - 论文提出FlowEdit方法,创新地绕开传统图像编辑路径,通过构建常微分方程直接在源图像分布与目标图像分布间建立直接映射路径[27][28] - 该方法实现了更低的传输成本,能最大程度保留原始图像结构和内容,在Stable Diffusion 3和FLUX流模型上取得SOTA效果[31] 最佳学生论文提名奖 - 德州大学奥斯丁分校的论文《RayZer: A Self-supervised Large View Synthesis Model》获得最佳学生论文提名奖[32] - 该模型在训练时无需任何3D监督信息,仅需2D图像即可学习并展现出涌现的3D感知能力,在新视角合成任务上表现优异[35] Helmholtz Prize获奖论文 - 该奖项表彰计算机视觉基准测试贡献,有两篇获奖论文[36] - Ross Girshick的《Fast R-CNN》提出快速区域卷积网络,显著提升目标检测的训练、测试速度和检测精度[36] - 何恺明等人的论文《Delving Deep into Rectifiers》引入PReLU激活函数和He初始化方法,首次在ImageNet上达到超越人类水平的分类性能[38] Everingham Prize获奖团队 - 该奖项表彰对社区有重大贡献的研究者,有两个获奖团队[41] - SMPL团队开发了参数化三维可变形人体模型,精准表示人体姿态与形状,广泛应用于动画、虚拟人及生成式AI领域[41] - VQA数据集团队创建了结合图像理解与自然语言问答的大规模基准数据集,推动多模态AI在视觉理解和语言推理方向的研究[43] Significant Researcher Award获奖者 - 该奖项表彰显著推动计算机视觉领域进展的研究人员,颁给David Forsyth和Michal Irani[45][50] - David Forsyth在颜色恒常性方法、人体动作识别与追踪技术方面作出贡献,影响物体识别和动作分析研究[50] - Michal Irani开创图像内部自相似性与空间-时间视频形状研究范式,通过无监督方法解决超分辨和视频结构分析等核心问题[50] Azriel Rosenfeld Award获奖者 - 该终身成就奖表彰在学术界和工业界具有持续影响力的研究者,颁给Rama Chellappa[51][54] - Rama Chellappa作为计算机视觉与模式识别领域先驱,在人脸识别、运动分析、3D建模和生成式视觉理解等方面作出奠基性贡献[54]
全球影像,进入中国时间
雷峰网· 2025-10-20 12:06
文章核心观点 - 影像产业中心正经历第三次转移,从德国(光学设计与机械制造)到日本(电子化与数码相机),再到以中国为核心的移动影像时代 [3][5][7] - 中国凭借庞大的市场需求、完整的产业集群、高效的垂直整合能力以及领先的AI与规模化制造,正在重新定义影像产业的未来 [7][16][17][21] - 以OPPO、大疆、影石为代表的中国企业,通过深度用户洞察和技术创新,在手机影像、无人机、拇指相机等细分领域引领行业发展 [29][30][40][45] 影像产业中心转移历程 - 德国凭借光学设计(如Planar、Tessar镜头)和极致的玻璃制造工艺(如地下深坑缓慢冷却技术)奠定了产业基础 [4] - 日本抓住电子化浪潮,在CCD/CMOS传感器上取得突破,带动数码相机崛起,2010年全球相机销量达1.2亿台峰值,2024年跌至830万台 [5] - 智能手机成为新影像载体,2010年全球出货量2.97亿部,2024年增至12.4亿部,中国厂商如华为、小米、OPPO、vivo推动影像技术快速迭代 [6][7] 手机影像技术链路的重构 - 传感器从CCD转向CMOS,手机厂商因年迭代多款产品,研发投入密集,使指甲盖大传感器实现2亿像素成为可能,而相机市场萎缩导致迭代缓慢 [9][10] - 后端处理算力差距显著,手机采用3-5纳米制程芯片实现多帧合成、AI降噪等复杂算法,相机仍多用40-60纳米制程芯片 [11][12] - 中国构建了从拍摄到分享的闭环生态,抖音、小红书、微信等平台驱动创作,形成“随拍即享”的体验优势 [13] 中国影像崛起的产业集群优势 - 中国是全球最大的移动影像消费市场,2024年全球手机摄像头模组出货量44亿颗,舜宇、丘钛等三巨头市占率超60% [16][17] - 供应链高度垂直整合,具备除芯片外大部分核心组件自研能力,实现技术调优、成本控制和一站式服务的高效响应 [18][19][20] - AI赋能规模化制造,自动化、数字化、智能化生产体系支撑每年四五十亿颗手机镜头的需求,成本与效率全球领先 [21][22] - 本土供应链信任度高,能快速响应研发需求(如6-12个月出芯片),而外企迭代周期长达三年,且产能投入灵活 [23][25][26] 中国移动影像的典型创新案例 - OPPO Find X9系列通过全焦段8K超清、2亿像素长焦、LUMO超像素融合引擎等技术,解决演唱会等场景下“拍不爽”的用户痛点 [31][32] - OPPO芯链技术将22nm传感器计算任务转移至3nm芯片,实现高像素多帧融合的能效革命,1小时4K视频录制仅耗电约17% [33] - OPPO与小红书打通4K实况照片直接分享功能,并通过风格引擎还原胶片质感,影像研发团队规模超1000人 [35][36] 细分领域的差异化创新 - 影石拇指相机通过全景技术和“隐形自拍杆”设计,将记录权从“郑重其事”变为生活化体验,并以用户创意(如“大头钉”特效)反哺产品 [41][42][43] - 大疆通过技术下沉(如御系列技术下放至Air、Mini系列)和系统化生态,定义行业标准,手持云台从专业器材变为大众消费品 [45][46] - 未来影像新终端如AR眼镜正攻克成本、功耗等瓶颈,向轻薄智能方向演进 [48] 中国影像产业的未来展望 - 高像素(如2亿像素)是技术发展方向,但需与画质性能同步,而非营销游戏,核心是还原人眼“所见所得”的感知 [50] - 中国具备市场规模、制造能力、供应链整合与响应速度优势,有望在未来十年展现令世界瞩目的产业力量 [51]
才发售就崩溃?iPhone 17相机出故障了,翻车成行业常态
36氪· 2025-09-20 09:21
产品发布与初期反馈 - iPhone 17系列及iPhone Air在开售首日即出现相机故障,具体表现为在极亮LED灯光直射下拍摄照片时,可能出现黑色方块和数十条不规则的白色曲线 [1][2][4] - 该问题可被稳定复现,在演唱会等场景下,每拍摄约10张照片中就有1张会出现此成像问题 [4][5] - 问题曝光后引发广泛讨论,但初期测试显示在日常使用场景(如对着MiniLED高亮屏幕)下难以复现,需演唱会等复杂环境才易触发 [23] 技术问题根源分析 - 苹果公司将问题归因于软件算法缺陷,而非硬件损坏,并计划通过后续软件更新修复,但未公布具体补丁推送时间 [4][11] - 分析指出问题根源在于计算摄影的HDR模式:在拍摄高频PWM调光的LED屏幕时,系统连拍的多张曝光不同照片信息冲突,导致合成算法输出错误数据 [8][10][11] - 此现象凸显了计算摄影在应对大光比、动态场景时的局限性,算法在处理剧烈变化的光源时易出现故障 [8][10][21] 行业普遍现象与案例 - 计算摄影相关的“翻车事故”在手机行业并非孤例,苹果公司并非首个也非最后一个出现此类问题的厂商 [12][21][24] - 谷歌Pixel系列曾出现HDR合成鬼影问题,即拍摄移动物体时边缘产生半透明重影,后通过新的空间合并算法更新修复 [19][20][24] - 行业此前亦出现过“P月模式”争议,多家厂商手机被指通过算法识别而非真实拍摄月亮图像,最终部分厂商以增加功能开关告终 [13][15][16] 问题影响与解决前景 - 音乐会等现场活动是智能手机核心拍摄场景之一,该故障对部分用户体验构成影响 [7] - 行业普遍通过软件更新方式对上市后发现的成像问题进行优化,例如谷歌优化Pixel 6的屏下指纹识别速度,国产旗舰机型微调相机色彩科学等 [24] - 由于问题被判定为软件层面缺陷,预计可通过OTA更新快速修复,此类补丁也表明厂商在持续完善产品 [11][23][25]
三星“堕落”惹众怒,千人联名“弹劾”相机负责人
用户请愿与相机业务问题 - 超过2500名用户在Change org平台联名请愿要求撤换相机业务负责人并重构移动影像战略[4] - 请愿书列出八大具体问题包括硬件升级停滞、技术落后竞品、忽视用户反馈、长期技术缺陷、盲目跟风苹果、肤色处理偏见、更新策略歧视和拒绝采用AI计算摄影技术[6] - 用户批评三星高调营销与实际体验存在严重割裂尤其在相机基础性能方面[7][10] 相机硬件与技术短板 - 三星被曝从Galaxy S24 Ultra到S27 Ultra四代旗舰产品将持续使用同款1/2 52英寸5000万像素后置长焦传感器[14] - 自Galaxy S23 Ultra以来持续使用同款2亿像素ISOCELL HP2主传感器该传感器也应用于Galaxy Z Fold 7[14] - 算法策略摇摆不定缺乏统一技术路线部分机型依赖高通和谷歌底层支持缺乏自主优化能力[16] 市场竞争与品牌战略 - 三星在社交媒体发起针对苹果的iCant标签攻势嘲讽iPhone 17像素低和缺乏创新但用户认为应先解决自身基础体验问题[8][10] - 面临小米15 Ultra和OPPO Find X8 Ultra等竞争对手在相机技术上的快速迭代压力[16] - 下一代旗舰Galaxy S26系列原型设计被曝采用横向矩阵镜头模组与iPhone 17 Pro高度相似引发品牌模仿质疑[17] 用户信心与市场影响 - 用户指出三星曾是世界移动影像领军者但现在Galaxy系列在硬件软件算法和整体用户体验上已全面落后[11] - 粉丝群体对三星品牌发展愿景失去信心高端市场份额可能因未能回应核心诉求而进一步流失[16][17] - 三星官方截至发稿尚未对请愿事件作出回应[17]
列举“八大罪状”,千名用户联名控诉三星
虎嗅· 2025-09-12 18:20
用户抗议与产品问题 - 超过2500名用户在Changeorg平台联名请愿要求撤换相机业务负责人并重构移动影像战略[1] - 请愿书列出八大问题包括硬件升级停滞 技术落后竞品 忽视用户反馈 长期技术缺陷 盲目跟风苹果 肤色处理偏见 更新策略歧视 拒绝采用AI计算摄影技术[2] - 用户批评公司高调营销与实际体验存在严重割裂 社交媒体宣传"技术领先"但连最基本夜景噪点都控制不好[4] 产品技术缺陷 - 相机硬件多年未实现实质性创新 核心硬件迭代缓慢 从Galaxy S23 Ultra以来持续使用同款2亿像素ISOCELL HP2主传感器[2][7] - 四代旗舰产品从S24 Ultra到S27 Ultra将持续使用同一款1/252英寸 5000万像素后置长焦传感器[6] - 算法策略摇摆不定 未能形成统一技术路线 部分机型完全依赖高通和谷歌底层支持缺乏自主优化能力[8] 市场竞争态势 - 在算法 成像质量 夜景处理等方面明显落后于苹果 华为等竞争对手[2] - 面临小米15 Ultra OPPO Find X8 Ultra等竞争对手在相机技术方面的快速迭代压力[8] - 高端市场面临苹果在生态体验上的持续优势和中国品牌在硬件算法及性价比上的快速追赶[9] 品牌战略矛盾 - 在社交媒体发起针对苹果的标签攻势嘲讽iPhone 17"像素低 没折叠屏 创新滞后" 但自身存在基础体验落后问题[4] - 下一代旗舰Galaxy S26系列原型设计被曝采用横向矩阵镜头模组与iPhone 17 Pro高度相似 出现"一边嘲讽一边模仿"行为[10] - 折叠屏和AI功能的抢先宣传未能掩盖基础影像技术短板[6]
一加宣布与哈苏结束合作 下一代旗舰将首发自研影像引擎
犀牛财经· 2025-09-12 15:52
公司与哈苏合作状态 - 一加与哈苏的五年合作已圆满落幕 [1] - 一加创始人刘作虎感谢哈苏团队,称合作实现了目标承诺 [1] 新产品与技术发布 - 一加下一代旗舰产品一加15将首发自主研发的影像引擎"OnePlus DetailMax Engine" [1] - 新影像引擎融合了与哈苏合作的传奇色彩科学技术 [1] - 新影像引擎旨在真实、清晰呈现世界细节,拒绝过度美化与失真 [1] - 新影像引擎从底层重构,旨在释放计算摄影潜力 [1] - 团队已测试原型机,成果振奋 [1] 产品定位与市场预期 - 一加15将重新定义同级别产品的"清晰"标准 [1] - 新影像引擎秉持还原清晰、自然和真实画面的理念 [1] - 公司期待搭载新引擎的一加15带来惊喜 [1]
刘作虎官宣一加哈苏合作结束:一加15全球首发自研影像引擎
新浪科技· 2025-09-05 11:55
公司战略转型 - 一加宣布与哈苏五年合作结束 进入自主研发影像引擎新阶段 [1][14][15] - 下一代旗舰一加15将首发自研"OnePlus DetailMax Engine"影像引擎 旨在通过底层重构实现最清晰真实的成像效果 [1][4][7] - 公司强调新引擎拒绝过度美化和失真 专注于还原场景本质 通过计算摄影技术提升图像深度和真实感 [6][7][15] 用户需求洞察 - 经过全球范围用户访谈和焦点小组调研 发现用户核心需求是清晰真实的图像 而非技术参数 [5][15] - 用户首要行为是放大查看照片细节 这成为评判相机质量的关键标准 [5][15] - 公司基于该洞察开发新影像引擎 重点优化放大后的细节表现 [1][7][15] 技术演进方向 - 计算摄影已从人工增强阶段进化到利用强大处理能力和先进算法处理海量数据的新阶段 [6][15] - 新引擎充分利用计算摄影潜力 可捕获和解释更多数据以实现无与伦比的深度和真实感 [6][7][15] - 早期原型测试显示 promising 结果 公司预计新相机将为同类产品清晰度设立新标准 [8][16] 合作伙伴关系 - 与哈苏五年合作期间共同开发传奇色彩科学 融合双方工程和计算摄影技术 [13][14] - 合作帮助数百万人准确捕捉记忆时刻 哈苏的审美意识已融入一加成像DNA [14][16] - 公司对哈苏工艺保持尊重 并对未来移动摄影领域的新合作机会持开放态度 [9][16] 产品开发进展 - 创始人亲自参与早期原型测试 目前仍处于调优阶段 [8][16] - 新影像引擎代表数万小时的精炼成果 旨在确保用户不错过任何拍摄时刻 [10][16] - 公司承诺成像技术投入持续加强 下一代旗舰产品将完全满足用户需求 [10][11][16]
影石创新上半年营收同比增长51.17% 研发投入翻倍
证券时报网· 2025-08-28 22:03
财务表现 - 上半年营业收入36.71亿元 同比增长51.17% 主要得益于全球市场开拓和新品推出 [1] - 净利润5.20亿元 同比增长0.25% [1] - 经营活动现金流量净额2.41亿元 较上年同期6.06亿元下降60.22% 受新增原材料采购备货影响 [1] - 研发费用5.62亿元 同比增长100.35% 研发投入占营业收入比例15.30% 较上年同期11.55%提升3.75个百分点 [1] 技术研发 - 拥有境内外授权专利998项 包括发明专利222项 实用新型378项 外观设计398项 [1] - 新申请发明专利69件 实用新型专利32件 外观设计专利52件 新授权专利101项 [1] - 核心技术包括全景图像采集拼接 防抖 AI影像处理 计算摄影 最高支持11K2D及10K3D分辨率影像 [2] - AI影像处理技术实现120个以上场景识别 150个以上物体识别 结合ReID行人重识别技术提升追踪稳定性 [2] - 计算摄影技术包含单帧HDR 单帧超级夜景等画质优化技术 [2] 产品体系 - 消费级产品包括ONEX系列全景相机 Ace系列运动相机 GO系列穿戴式相机 ONEX4支持8K全景视频拍摄 AcePro2搭载AI双芯片优化降噪与画质 [2] - 专业级产品包括Pro系列 TITAN系列VR全景相机 Connect系列AI视频会议一体机 [2] 市场布局 - 采用线上+线下 直营+经销全球化销售模式 线上通过官方商城 亚马逊 天猫 京东等平台销售 [3] - 线下覆盖全球60多个国家和地区 与AppleStore BestBuy BicCamera等知名渠道合作 [3] - 海外销售收入占比72.38% 主要集中于美国 日本及欧洲市场 [3] 新业务拓展 - 瞄准无人机赛道 计划推出自有品牌及影翎Antigravity全景无人机品牌 [3] - 全景无人机业务与第三方合作运营 产品处于公测阶段 尚未正式发售 预计对2025年度经营业绩无重大影响 [3] 法律风险应对 - 针对国际贸易摩擦及关税风险 持续优化海外供应链布局 [3] - 涉美337调查初步裁决显示仅部分产品落入GoPro1件外观专利范围 新外观设计方案未侵权 其余5件发明专利指控不成立 目前对生产经营无实质性影响 [3]
从 “拍得到”到“拍得绝”:华为 Pura 80系列如何改写影像规则
第一财经· 2025-07-11 17:22
移动影像技术革命 - 华为Pura 80系列通过硬件与算法协同革命解决手机影像"剪影困境",构建全场景高动态影像能力[1] - 行业竞争聚焦影像技术战略高地,头部厂商年研发投入突破十位数,但华为采取"反参数化"创新路径[3] - 公司自2017年起引领多摄时代,通过结构性创新重构移动影像底层逻辑,如首创"彩色+黑白"双摄方案[5] 主摄技术创新 - 华为突破行业惯性,采用RYYB传感器提升40%进光量,解决暗光拍摄痛点[5] - P50系列引入10档物理可变光圈,Pura 70采用伸缩式镜头平衡画质与轻薄设计[6] - Pura 80 Ultra搭载1英寸超大积分电容传感器,动态范围达16EV,推动行业转向集成化光学设计[9] 差异化技术突破 - 超级夜景模式通过算法突破硬件极限,噪点控制能力远超纯硬件方案[5] - 超大底一镜双目长焦技术通过可移动棱镜实现光路切换,解决长焦画质与机身空间矛盾[17] - TCG三重实时融合技术+第八代ISP实现火焰纹理与环境细节同步捕捉[11] 市场表现与行业影响 - Pura70系列首季度出货量同比P60增长125%,总销量达1300万台[16] - Pura80系列上市15天销量近20万台,Pro机型销量达上代同期160%[17] - 公司累计研发投入超1.2万亿元,构建覆盖光学/机械/成像/处理的完整技术体系[17] 行业标准定义 - 潜望式长焦、超级夜景模式等技术已成为行业标配,推动移动影像从"能拍"向"拍好"进化[15] - 一镜双目技术激发行业长焦创新竞赛,促使厂商转向精密光学设计[18] - 公司技术突破不止于产品升级,更持续为行业划定新技术坐标系[16]