量子位
搜索文档
不靠死记布局也能按图生成,多实例生成的布局控制终于“可控且不串脸”了丨浙大团队
量子位· 2025-12-19 15:20
文章核心观点 - 浙江大学ReLER团队发布基于DiT的新框架ContextGen,通过分层解耦上下文和双重注意力机制,解决了多实例图像生成中布局控制与身份保真度难以兼顾的难题,在多项关键指标上取得了SOTA突破 [4][5][52] 技术框架与创新 - 核心创新是提出了双重上下文注意力机制,将全局控制和局部注入任务在DiT的不同层级进行部署 [7] - **宏观布局锚定 (CLA)**:将包含实例位置信息的布局图像整合到上下文中,部署在DiT模块的前置和后置层,以实现对全局结构和位置的鲁棒锚定,保障精确的布局控制 [8][9][10] - **细节身份注入 (ICA)**:针对细节丢失问题,在DiT模块的中间层引入ICA,利用原始高保真参考图像和定制注意力掩码,约束每个实例区域仅与对应参考token交互,实现身份隔离式注入,保障多实例身份一致性 [11][12] 数据与优化策略 - 团队同步推出了**IMIG-100K数据集**,这是首个面向图像引导多实例生成任务设计的大规模、具备详细布局和身份标注的合成数据集,其构建代码和处理流程已开源 [13][14][15] - 为避免监督微调导致的布局僵硬复制问题,引入了基于偏好优化(DPO)的强化学习阶段,通过将布局图像作为非偏好输入,鼓励模型生成更具多样性的图像,在保持身份的同时提升生成自由度 [16][17] 性能表现与基准测试 - 在**COCO-MIG基准**上,模型在空间准确性 (mIoU) 提升**5.9%**,显著优于基线模型 [19][20] - 在**LayoutSAM-Eval基准**上,ContextGen在多项指标上均实现了SOTA,尤其在实例的属性保持(Color, Texture, Shape)方面表现出色 [20] - 在**LAMICBench++的身份保持能力测试**中,ContextGen超越了开源SOTA模型,展现了身份保持能力(IDS, IPS)和综合性能的显著提升 [24] - 在基准测试中,ContextGen在多主体任务中的身份保持能力,甚至相较于**GPT-4o、Nano Banana**这样的闭源模型仍保持显著优势 [25] 应用与展示 - 团队开发了一个简单易用的前端,支持多参考图上传、自动抠图、自定义布局设计等功能,方便用户体验ContextGen的功能 [50] - 文章通过多个复杂提示词(如包含多个特定物体和场景的描述)的效果图,展示了ContextGen与现有开源和闭源方法的对比效果,直观体现了其在复杂多实例生成任务上的优越性 [26][27][28][29][30][33][34][36][37][38][40][41][42][43][44][45][46]
量子位编辑作者招聘
量子位· 2025-12-19 15:20
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在第三方数据平台(如新榜、清博)是AI及前沿科技行业的TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向的岗位招聘:AI产业方向、AI财经商业方向、AI产品方向[2][6] - 岗位面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招面向应届毕业生并接受实习转正[4][6] - 工作地点位于北京中关村[2] AI产业方向岗位详情 - 岗位职责包括跟进AI基建层新进展(芯片、AI Infra、云计算)、解读前沿论文与开源社区技术报告、参与产业专家访谈并撰写案例[5][6][7] - 任职要求包括对芯片、GPU、服务器、云计算等有基本理解,熟悉AI行业供应链与生态,具备技术背景者优先[8][11] AI财经商业方向岗位详情 - 岗位职责聚焦AI领域创投、财报、产业链资本动向,产出融资分析、财报解析、战略分析稿件,并访谈投资人及创业者[9][11] - 任职要求包括对数据与财报敏感、逻辑与商业叙事能力强、热爱对话采访[9][11] AI产品方向岗位详情 - 岗位职责关注AI在软件应用及硬件终端的落地,撰写产品深度评测、跟踪新品发布,并访谈产品专家与创业者[10][11] - 任职要求包括对智能硬件与AI终端趋势敏锐、熟悉终端厂商生态、具备强逻辑与体验表达能力[10][11] 员工福利与发展机会 - 员工可第一时间接触AI最新技术与产品,构建完整认知体系,并将AI工具应用于工作以提升效率[6] - 员工可通过撰写原创内容建立个人影响力,成为AI领域意见领袖,并拓展行业人脉[6] - 公司提供行业TOP薪资待遇、五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6] - 应届新人可获得主编级编辑的一对一指导,团队氛围扁平、开放、多劳多得[6]
当年带你上网冲浪的头号老玩家,这回是真AI上头了
量子位· 2025-12-19 15:20
文章核心观点 - QQ浏览器已全面升级为AI浏览器,依托腾讯自研大模型底层能力,实现了从工具到智能助手的转型,其AI相关数据表现已进入行业前列[1][2][3] - 浏览器的演进逻辑是将复杂能力简化,将掌控权还给用户,当前AI转型的核心是结合AI的“聪明”与浏览器的“全面”,以更简单智能的方式满足用户需求[7][8][11] - 浏览器行业正经历从“阅读网页”到“完成任务”的方向性变化,QQ浏览器的转型恰好契合了用户希望结果更快、步骤更少的关键习惯转变[56][57] 产品战略与市场表现 - QQ浏览器按下转型键,将产品路线彻底切向AI,全面升级为AI浏览器[2] - 公司在“AI Agent”和“AI 搜索”赛道的数据表现已率先跑进行业前排,整体表现相当亮眼[3][6] - 转型背后是腾讯长期布局的主线,公司作为在C端深耕十几年、同时在模型和云底座上有完整体系的玩家,清楚用户真实场景中的痛点[57] - 外部数据机构XSignal的行业侧数据验证了用户对浏览器的核心需求是“好用”,即易上手、不打扰、聪明能干且能接住不同场景的需求[57] AI能力与产品功能升级 - **界面与入口设计**:传统首页信息流布局让位于集传统搜索与AI对话于一体的极简入口[12];腾讯元宝常驻搜索框,也可从侧边栏一键唤起,同时支持在AI搜索、搜狗、百度、谷歌、Bing多种引擎间切换[14][15] - **AI+小窗**:在右上角集成10多种AI能力和部分Agent能力的轻量入口,能根据当前浏览场景自动递送最可能用到的功能(如阅读场景自动弹出“网页总结”)[17][18][20][21] - **核心AI功能**: - 网页总结:通过悬浮窗快速总结网页内容,原文与重点分屏显示[23] - 思维导图:将全文拆解为层级清晰的知识树框架,能自动拆解到三级,提升阅读效率[25][27] - 网页翻译:可将网页英文一键全文翻译为中文[29] - AI翻译:支持对单词或句子进行逐词逐句翻译[31] - 其他功能:包括阅读模式、AI资源嗅探、标签智能分组等[33] QBot Agent中心与场景化应用 - QQ浏览器推出了QBot Agent中心,集成了八个擅长不同场景的Agent,以解决传统浏览器“只能看不能干”的痛点[34] - **AI视频助理**:支持16种语言的多语种字幕生成、内容总结、沉浸式播放、字幕视频合成导出;提供实时滚动字幕,支持中英文对照排版,并可细调语种、字号、复制字幕等;视频总结功能可将长视频拆解为带图示的章节重点[35][36][37][38];该功能也可在AI+小窗中直接调起[39] - **AI订阅助理**:专门解决信息筛选、聚合、追踪问题,能在极短时间内(如不到1分钟)扫描全网相关信息,过滤去重后打包成图文并茂的订阅报告(包含核心概览、信息汇总、表格、来源链接),并支持按设置的关键词、时间和有效期主动推送最新资讯[41][42][43] - **AI下载助理**:可全网搜索并下载免费靠谱的网络资源(如1分钟左右完成搜索并下载大学英语四级考试真题PDF),同时提供在线阅读版本[45][46] - **AI更新助理**:可监控指定网页的动态更新,框选关注位置并设置提醒频率后,AI会将最新动态及改动位置同步到消息通知[47][48] - **其他垂类Agent**:还包括AI财经助理、AI学术助理、AI高考通、较真AI查真假等[50];未来将继续融合更多腾讯内部原生Agent[50] 移动端AI能力拓展 - QQ浏览器的AI能力已拓展至移动端[51] - 文档能力覆盖更完整,支持八种格式互转,以及编辑、扫描、翻译等功能[52] - 针对学生场景,推出了行业首个高考Agent“高考通”,已为超过5000万用户提供高考服务;移动端上线的“学习阵地”以AI学习助手为核心,支持拍照解题、生成错题本、定制学习计划[53] - 移动端搜索联合元宝推出AI Overview,支持智能问答,并内置一套有趣的AI小工具(如星座运势、BMI计算器)[54] - 生态上,与腾讯自选股、腾讯新闻、腾讯地图、腾讯医典完成内容打通[55]
首个文本到3D生成RL范式诞生,攻克几何与物理合理性
量子位· 2025-12-19 15:20
强化学习在文本到3D生成领域的应用探索 - 核心观点:一项由多所高校及实验室合作的研究,系统性探索了强化学习在文本到3D生成中的应用,发现RL能够提升3D模型的推理与生成质量,并提出了层次化RL范式和首个相关评测基准[1][2][3] 研究背景与挑战 - 在LLM推理和2D文生图领域,强化学习已被证明能显著提升思维链推理能力和生成质量[3] - 3D物体具有更长、更稠密、更具几何约束的特性,为RL的应用带来挑战[3] - 研究方向面临奖励设计、算法适配及缺乏专门评测基准等问题[4][6] 奖励设计层的关键发现 - 对齐人类偏好信号是提升整体3D质量的关键,其他奖励维度单独使用提升有限,但叠加后可带来持续增益[7] - 对于同一奖励维度,专门化的奖励模型通常比大型多模态模型表现出更强的鲁棒性[7] - 通用多模态模型在3D相关属性上出乎意料地鲁棒,为“低成本奖励”提供了可能[7] RL算法与训练策略 - 在3D自回归生成中,强化学习更偏好token级策略,其带来的提升显著大于序列级的重要性采样与剪切方法[8] - 简单的技巧即可稳定训练,例如动态采样,只要策略更新受控[9] - 完全移除KL惩罚会导致性能下降,而鼓励对低概率token探索的方法仍能带来性能增益[9] - 扩大量级的训练数据能有效缓解偏好奖励带来的偏差并提升整体表现[9] - 适度增加RL迭代能进一步优化模型,但过度训练可能损害泛化能力[9] 评测基准MME-3DR的构建与发现 - 研究构建了首个针对3D推理场景的系统评测基准MME-3DR,涵盖空间结构几何、机械可供性与物理合理性、生物有机形态、长尾稀有实体和风格化抽象形态五类[10] - 该基准更关注“在困难约束下是否还能保持一致、合理、可解释”,而非只展示多样性[11] - 近期Text-to-3D模型在机械结构和非刚性生物体上表现尚可,但在其余三个类别上仍存在明显不足[11] - RL训练在所有五类任务上都带来了显著提升[11] - MME-3DR能同时评估隐式推理与通用3D生成能力,验证了其多样化物体覆盖带来的评测有效性[11] 层次化RL范式与模型实现 - 将3D生成视为从粗到细的过程:第一步由高层语义决定整体几何骨架,第二步在几何稳定的前提下细化纹理与局部结构[14] - 针对两个步骤单独设计专有奖励模型进行监督,并基于此提出了层次化RL范式Hi-GRPO[14] - 实现了首个RL加持的Text-to-3D自回归模型AR3D-R1[14] 关键发现与行业洞察 - RL正在帮助3D生成模型“学会思考”,不仅仅是调整美观度,在空间几何、一致性和物理可行性等维度都有显著提升,表现出隐式3D推理能力的增强[15] - 范式对齐结构先验很重要,尊重“先几何、后纹理”的层次结构设计,比简单在最终图像上打分更有效且更可解释[16] - 存在性能与稳定性的二元博弈:奖励过于稀疏或RL迭代数过大会导致训练不稳和模式坍缩;高质量人类偏好或强多模态奖励可在同等训练预算下取得更高回报[17] - 结果清晰显示了当前模型的能力边界:对极复杂几何、长尾概念和强风格化场景,模型仍会“逻辑崩坏”;真正可扩展的3D RL仍受限于算力与奖励获取成本[18]
DeepMind掌门人万字详解通往AGI之路
量子位· 2025-12-19 15:20
通往AGI的路径 - 实现AGI需要技术创新与规模扩展各占约50%的努力,二者结合是关键路径 [1][2][55] - 当前模型扩展并未遇到不可逾越的“墙”,进步依然显著且投资回报可观,未见明显放缓迹象 [45][46][50] - 数据耗尽等挑战可通过合成数据生成等技术解决,尤其是在编程和数学等答案可验证的领域 [51] 当前AI的局限与待解决问题 - AI存在“锯齿状智能”现象,能在国际数学奥林匹克竞赛中获奖,却可能在简单逻辑问题上犯错,反映出系统在一致性与可靠推理方面的不足 [5][19][21] - 幻觉问题仍待解决,模型常在不确定时强行作答,未来需发展类似AlphaFold的概率评估机制,使模型能判断自身不确定性并合理拒绝回答 [5][56][57] - 当前大模型本质上是人类知识(如互联网内容)的压缩与泛化,类似于AlphaGo,缺乏在线学习与持续更新的能力 [5][27][33][34] 下一代AI的发展方向 - 未来目标是实现类似AlphaZero的自我知识生成与持续在线学习能力 [5][32] - 世界模型通过模拟物理规律(如重力、流体)来增强对现实的理解,弥补语言模型在描述空间动态与感官体验方面的局限,对机器人、通用助手及科学模拟至关重要 [5][64][65][69] - 通过仿真环境(如Genie、SIMA项目)将智能体投入AI生成的动态世界,可实现无限任务生成与复杂行为训练,并有望用于探索生命与意识的起源 [5][76][80][90] AI在基础科学领域的应用(根节点问题) - AlphaFold的成功验证了AI解决基础科学难题的潜力 [8] - 当前研究正拓展至材料科学(如室温超导体、更优电池)、核聚变及量子计算等领域 [5][9] - 与Commonwealth Fusion等公司的深入合作,旨在利用AI加速核聚变(如约束等离子体、材料设计)进程,核聚变被视为能改变一切的“圣杯”级清洁能源 [10][11][13][16] 商业化、竞争与社会影响 - AI领域存在短期过度炒作与长期被系统性低估的现象,某些初创公司估值可能存在泡沫,但大型科技公司有真实业务和长期投入支撑 [94][95][96] - 需警惕AI商业化重蹈社交媒体覆辙,避免过度追求用户参与度导致“单人回音室”,应构建具有科学精神、适度反馈且支持个性化调节的AI人格 [5][101][104][105] - AI引发的社会变革可能比工业革命规模大10倍、速度快10倍,需提前规划劳动力转型、经济模式调整(如UBI)与社会治理创新 [14][118] 对AGI及超级智能的终极思考 - 目前宇宙中未发现非可计算现象,若意识不依赖量子效应,则理论上图灵机可模拟一切心智过程,信息可能是宇宙最基础的单元 [14][134][136][144] - 公司的工作核心是不断向前推进经典计算的能力边界,探索其终极极限 [139][140] - 基于智能体(Agentic AI)的下一阶段系统将更加自主,其带来的风险(如网络安全)显著上升,需提前准备 [14][164][165]
认知偏差、落地断层、体验割裂是目前AI产品的三大痛点|百度王颖@MEET2026
量子位· 2025-12-19 09:01
文章核心观点 - AI能力增强但用户完成复杂任务更“累”,存在认知偏差、落地断层与体验割裂三大痛点 [1] - 百度提出“超级个人智能体”愿景,旨在超越问答与生成,深度融合个人记忆、理解复杂意图并自主调度多能力协同执行 [1] - 公司通过核心调度中枢GenFlow及智能体生态,将百度文库与百度网盘重塑为“最懂你、能搜索、会干活”的超级个人助手 [1] 当前AI产品痛点与解决愿景 - **认知偏差**:AI存在幻觉问题,且缺乏对个人知识的有效沉淀与利用 [14] - **落地断层**:AI“手脑分离”,能想到的多但能做到的少 [14] - **体验割裂**:用户需在多个工具间切换,不同能力、模态和格式难以一站式整合 [14] - 解决目标是让AI应用想得全、想得对、做得好,实现个性化、自由化、通用化,使每个人能力加倍 [5][8] 核心调度框架:GenFlow - GenFlow是超级智能体框架的调度中枢,月活用户达千万级,成为全球最大的通用智能体 [5][10] - 作为首个全模态、全链路的通用智能体,覆盖学习、办公、生活、娱乐全场景,满足聊天、问答、检索、创作等核心需求 [5][10] - GenFlow 3.0已内置到百度文库和百度网盘双端 [5][10] - **记忆中心升级**:基于用户历史规划和任务形成长期记忆,实现深度个性化内容生成 [13][17] - **多智能体调度**:能拆解用户复杂意图,调度多个智能体同时协作,在几分钟内同步完成海报、绘本、研究报告、视频、PPT、Excel等系列任务,并在同一平台交付 [28] 关键智能体能力 - **Office Agent**:首个能深度处理办公套件的智能体,基于自然语言一键搞定Excel复杂计算、Word深度排版、PPT生成编辑美化等 [20][21] - **Gen X Agent**:行业首个多模态通用智能体,已上线百度文库和百度网盘双端,聚焦个性化创意、自由化编排、全模态通用三大核心能力 [22][23][24] - 两大智能体通过GenFlow调度,支持用户随时干预、插话或追问,实现人与AI、AI与AI之间的全向协作 [28][29] 产品进展与数据 - **百度文库AI学习平台OREATE AI**:能端到端完成全场景全模态创作,新版本上线一个月月活突破140万,登顶ProductHunt全球日榜第一名 [5][37] - **百度网盘全球化**:于今年9月上线全球175个国家和地区,具备多语言字幕、AI相机、AI笔记等特色功能 [5][38] - **百度网盘企业版**:在沧舟OS和GenFlow 3.0加持下,提供领先行业的企业级AI知识库,实现知识沉淀与流转 [33][34] - **行业效率案例**:在照片直播行业,通过“存算一体”模式实现工作流效率1110%的提升,并达到超过80%的综合成本降幅 [34] 协作与组织赋能 - 发布全新升级的自由画布,支持团队成员在同一空间内实时协作、共同碰撞创意 [29] - Office Agent与自由画布均支持多人实时同步协作及人与AI智能体之间的智能协作 [30] - 超级个人智能体赋能个人成为超级个体,进而形成超级团队与超级组织,提升组织工作流效率 [31][33] - 企业级AI知识库确保组织内知识完整沉淀与无缝流转利用 [34]
LeCun创业首轮估值247亿!Alexandre当CEO
量子位· 2025-12-19 09:01
公司概况与融资计划 - 新公司名为Advanced Machine Intelligence Labs (AMI Labs),计划于2026年1月在巴黎正式启动[5] - 公司正以30亿欧元(约247亿人民币)的目标估值寻求首轮5亿欧元(约41亿人民币)融资[2][11] - 公司CEO人选并非LeCun本人,而是其老部下、医疗AI独角兽Nabla的创始人兼CEO Alexandre LeBrun[4][14] 技术路线与研究方向 - 公司研究方向是LeCun一直主推的“世界模型”,旨在让AI理解物理世界的运行规律,而非仅进行文本概率预测[3][6] - 公司认为基于自回归机制的大语言模型存在根本缺陷,是通往AGI的“死路”,其智能水平甚至不如一只狗[6] - 技术上将通过JEPA(联合嵌入预测架构)构建底座,该架构在抽象表示空间中学习预测未来状态,专注于关键信息动态变化,以具备真正的推理和规划能力[8][9] - 公司将坚持开源路线,与当前Meta逐渐转向封闭生态的背景形成对比[5] 核心团队与治理结构 - LeCun本人大概率不会出任CEO,其核心动力是“提升人类智能”,而非陷入行政管理[13] - 拟任CEO Alexandre LeBrun是LeCun在Meta FAIR实验室时期的直接下属,曾协助其管理工程团队[25] - 预计将形成“LeCun主内负责科研、LeBrun主外负责商业”的双核架构[29] - LeBrun是连续创业者,曾创立客户服务AI公司VirtuOz和语音交互平台Wit.ai,后者被Facebook(Meta)收购[23][25] 战略合作与行业背景 - 老东家Meta将与AMI Labs建立合作,但不会直接注资[12] - 公司成立的初衷是抛弃当下大模型的捷径,攻克物理世界认知的挑战[32] - LeCun视此为职业生涯的又一次豪赌,尽管已到可退休年纪,但为完成“提升人类智能”的使命而继续前行[30][31]
不儿,这谁还能看出是AI演的视频啊
量子位· 2025-12-18 17:26
产品发布与核心功能 - 火山引擎在FORCE原动力大会上推出了最新的豆包视频生成模型Seedance 1.5 Pro [5] - 该模型主打音画高精同步和一镜入戏,能够通过单一Prompt同时生成人物对白配音、背景音乐和音效 [4][6] - 模型已上线即梦AI、豆包APP和火山方舟体验中心,企业用户自12月23日起可在火山引擎使用该模型API [11][12] 技术亮点与性能 - 采用原生音视频联合生成架构,基于MMDiT建立双分支DiT架构,实现视觉流与听觉流在潜在空间的实时通信,从底层解决音画同步问题 [40][41][42] - 通过高质量音视频数据框架,筛选了数以亿计的高清视频并进行自动化标注,为模型注入丰富的视觉描述和匹配的音频语义信息 [43] - 引入针对音视频场景定制的RLHF算法进行后训练优化,从视觉美感、运动连贯性、音频保真度及音画匹配度进行全方位调优 [44] - 通过多阶段蒸馏技术和高效推理加速框架,将推理速度提升了10倍以上,实现快速生成 [47] - 在审美、运动质量以及音画对齐等核心评测指标上处于行业领先地位,在多语言对白和方言口型匹配任务中表现显著优于主流模型 [52][53] 实测效果与应用场景 - 模型能够精准理解Prompt,实现音画精准同步,生成具有电影级气场和叙事张力的视频片段 [18] - 能够复刻复杂的专业运镜,例如成功复刻了周润发在MAMA颁奖典礼中的百万级运镜效果 [22][25] - 原生支持多人对话及多种方言,如四川话、粤语、上海话、台湾腔等,并能精准捕捉方言独特的韵律和情感张力 [11][27][28] - 总体体验方便快捷,对于非复杂场景基本可以“一条过”,具备低成本制作短剧、广告片及辅助影视创作的实战能力 [30][59] 未来功能与效率提升 - 即将推出Draft样片功能,允许用户先生成低分辨率草稿视频以快速试效果和调方向,并能锁定关键元素确保与最终成片内容一致 [32][33] - 据官方数据,Draft样片功能预计能将整体创作效率提升约65%,同时减少60%无效创作成本 [35]
港股通用GPU第一股也冲刺了!哈佛博士带队,估值209亿
量子位· 2025-12-18 17:26
公司概况与市场地位 - 壁仞科技是一家研发通用GPU芯片及智能计算解决方案的AI基础计算公司,为AI训练和推理提供从云端到边缘的全栈支持 [3] - 公司已通过港交所聆讯,即将上市,冲刺港股“国产GPU第一股”,隐含投后估值达209亿元人民币 [1][40] - 本月已有三家国产GPU公司(壁仞科技、摩尔线程、沐曦)在资本市场传出好消息,显示行业集体冲刺IPO的态势 [2][43] 核心产品与技术 - 核心产品为智能计算整体解决方案,由基于自研GPGPU架构的硬件系统和自研BIRENSUPA软件平台组成 [3][10] - 硬件系统包括支持AI负载(尤其是LLMs)的GPGPU芯片,可集成到PCIe板卡、OAM及服务器集群中 [3] - 已开发出壁砺106(用于训练和推理)、壁砺110(用于边缘推理)两款芯片,并通过芯粒技术推出性能更高的壁砺166芯片 [5][6] - 软件平台BIRENSUPA采用分层架构,覆盖驱动、库、编程平台、机器学习框架及解决方案,兼容PyTorch、TensorFlow等主流框架 [11] - 产品路线图包括计划于2026年商业化的第二代架构壁砺20X系列,以及预计2028年上市的壁砺30X/31X系列 [8] - 公司将硬件、软件与合作伙伴的基础设施整合为智能计算集群,以整体解决方案形式提供给客户 [13] 商业模式与客户 - 运营采用“无晶圆厂模式”,专注研发设计,委托第三方生产 [17] - 产品服务于AI大模型训练、数据分析、智能计算等领域 [14] - 客户涵盖AI数据中心、电信、金融科技、互联网等高算力行业,包括9家财富中国500强企业,如三大电信运营商 [15] 财务表现 - 营业收入快速增长:从2022年的50万元人民币增长至2024年的3.37亿元人民币,2025年上半年收入为5890万元人民币,同比增长约50% [19] - 收入结构:核心收入来自智能计算解决方案(2023年起),2025年上半年新增智能计算集群租赁收入 [20][21][23] - 毛利与毛利率:2022年至2024年毛利分别为50万元、4740万元、17920万元人民币;同期毛利率分别为100%、76.4%、53.2%;2025年上半年毛利为1877万元人民币,毛利率为31.9% [23][27] - 毛利率波动主要因销售产品组合变化所致,如2023年销售服务器集群,2024年主要销售PCIe板卡,2025年上半年入门级产品贡献更多收入 [24][25] - 公司仍处亏损阶段:2022年至2024年及2025年上半年,年内亏损分别为14.74亿元、17.44亿元、15.38亿元和16亿元人民币;同期经调整净亏损分别为10.38亿元、10.51亿元、7.67亿元和5.52亿元人民币 [27] 研发与运营 - 研发投入巨大:2022年至2024年研发开支分别为10.18亿元、8.86亿元、8.27亿元人民币;2025年上半年研发开支为5.72亿元人民币,同比增长44% [28][29] - 研发团队强大:拥有657名研发人员,占员工总数83%,其中78%拥有知名大学硕士以上学历 [30] - 截至2025年上半年末,现金及现金等价物为12.85亿元人民币 [31] 创始团队与融资历程 - 创始人张文为哈佛法学博士,曾任商汤科技总裁,拥有丰富的产业和投资经验 [2][32] - 核心团队包括CTO洪洲(前英伟达主架构师)、COO张凌岚(前AMD GPU SoC架构师)、总经理肖冰(前商汤科技业务发展副总裁)等资深人士 [34][35][36] - 资本市场备受追捧:成立3个月即获天使轮融资,投后估值约1.3亿美元(约9亿元人民币);成立一年后投后估值达71.5亿元人民币,成为独角兽;成立18个月累计融资超47亿元人民币,创国内芯片创业公司融资纪录 [39] - 累计完成10轮融资,投资方包括启明创投、IDG资本、高瓴创投、格力创投等众多知名机构 [2][39]
量子位编辑作者招聘
量子位· 2025-12-18 17:26
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在第三方数据平台(如新榜、清博)是AI及前沿科技行业的TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向的岗位招聘:AI产业方向、AI财经商业方向、AI产品方向[2][6] - 岗位面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招面向应届毕业生并接受实习转正[4][6] - 所有岗位工作地点均为北京中关村[2] AI产业方向岗位详情 - 岗位职责:关注基建层创新,包括芯片、AI Infra、云计算领域新进展及核心玩家动态[5][6] - 岗位职责:对前沿论文、开源社区、技术大会(如Hot Chips、NeurIPS、MLSys)的技术报告进行大众化解读[6] - 岗位职责:参与核心采访,对话产业专家、技术大牛,撰写AI云落地案例[7] - 任职要求:对芯片、GPU、NPU、服务器、模型训练架构、云计算等有基本理解[11] - 任职要求:熟悉AI行业的供应链与生态(如训练-推理、算力-成本、云-芯片关系)[11] - 任职要求:具备将复杂技术内容结构化表达的能力,有技术背景、理工或CS/EE方向优先[11] AI财经商业方向岗位详情 - 岗位职责:聚焦创投、AI创业公司、上市公司、商业模式、产业链资本动向[11] - 岗位职责:产出创投融资、招股书财报解析、公司战略分析等稿件[11] - 岗位职责:访谈对话投资人、创业者、产业分析人士[11] - 任职要求:对数据敏感,对财报、股权结构、战略规划感兴趣[11] - 任职要求:逻辑结构强,对商业叙事敏感[11] - 任职要求:热爱对话采访,具备社交型人格[11] AI产品方向岗位详情 - 岗位职责:关注AI在终端的落地,包括软件应用产品和硬件方向[11] - 岗位职责:撰写AI应用产品深度评测,跟踪多终端新品发布(如手机、PC、XR、车机等)[11] - 岗位职责:对话访谈AI应用创业者、产品专家、终端技术专家[11] - 任职要求:对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士[11] - 任职要求:熟悉各大终端厂商业态和体验方法论[11] - 任职要求:具备强逻辑、体验表达和结构化能力[11] 岗位通用职责与要求 - 主编岗位需具备选题和带队能力及经验[6] - 主笔岗位需具备原创深度稿件能力[6] - 编辑岗位需热爱表达,喜欢挖掘信息,能够用通俗语言解读AI新进展[6] 加入公司的潜在收获 - 能第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系[6] - 能将各种AI新技术、新工具应用于工作,提升效率和创造力[6] - 通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领袖[6] - 能与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业视野[6] - 应届新人会获得主编级编辑的一对一指导,以更快成长[6] - 能与志同道合的年轻人一起工作,享受扁平、简单、开放、多劳多得的团队氛围[6] - 能获得行业TOP薪资待遇及五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6]