量子位
搜索文档
跨境电商的疑难杂症,被1688这个AI全包了...
量子位· 2025-12-07 12:35
文章核心观点 - AI正从辅助工具转变为能创造真实商业价值的生产力,特别是在B2B领域[1] - 阿里巴巴旗下1688平台正全力押注AI,以重塑跨境电商行业,其新推出的AI智能体“遨虾”旨在通过提升选品、采购、上架等核心环节的效率,降低跨境贸易门槛[2][3][54] - AI通过解决信息不对称和规模效应两大难题,有望将分散的海外市场“拼接”成一个可规模化运营的大市场,使跨境电商变得像内贸一样简单[66][78][80] 1688平台与AI战略布局 - 1688是中国最大的B2B供应链平台,连接了超100万家产业带源头工厂与上亿B端买家[5] - 平台年交易额已超8000亿元,其中跨境交易额超过2000亿元[6] - 公司以“梭哈”的决心布局AI,已推出1688 AI版App、诚信通AI版及跨境电商AI智能体“遨虾”等一系列AI原生产品[2][3] 跨境电商的传统痛点与AI解决方案 选品环节 - 选品是跨境电商成功的关键,选对爆品可带来3~5个月的持续进账,选错则导致亏损[11][12] - 传统选品高度依赖人力,一家200人规模的跨境电商公司需约30多名买手,耗时一周进行信息搜集,且结果往往依赖“直觉”[12] - 跨境选品面临巨大挑战:需提前数月预测海外流行趋势(如2月需决定5月在美国销售的T恤款式),且需应对不同国家、族裔在文化、审美、尺寸上的巨大差异[14][15][20] - AI解决方案:以“遨虾”为例,其具备选品规划和工具调用能力,能在几十秒内完成海量商品筛选和多线程分析,自动计算垄断系数、平均得分、中国商家占比等指标,并生成量化的商业分析报告[22][24][26] - 示例:针对“flare leggings”的选品分析显示,AI在不到一分钟内完成了原本需一周的工作,并给出“推荐进入”的市场评级,报告包含详细供给(商品垄断系数0.13,中国卖家占比88.8%)、需求(Amazon近30天销量12,880,环比增17.38%)分析[27] 采购环节 - 采购需寻找匹配的供应商,需确认工厂外贸能力、改版、起订量(MOQ)、账期、交期、质检等多项信息,单位信息密度大,耗时耗力[31][35] - 传统流程中,仅凭关键词或图片找工厂效率低下,从看到商品到找到工厂可能耗费一上午,且向每家供应商询盘需重复相同流程[33][34][35] - AI解决方案:用户只需上传商品图片,AI便能识别款式、材料,并从1688供应链数据库中匹配相似款式的工厂,整个过程仅需几十秒[36][37] - AI能根据供应商销量、服务分、跨境经验等维度筛选,并支持批量向多家供应商发起询盘,自动生成结构化的比较报告,极大提升效率[38][39] 上架环节 - 上架涉及为商品创建多语言标题、描述、关键词、图片等,以适应不同平台规则[41] - 跨境电商需适配十几种语言和十几家平台(如俄罗斯Wildberries、中东Noon、拉美Mercado),若靠人工,运营人力成本呈十倍增长[43][44][45] - AI解决方案:利用多模态生成能力,可一次性完成多语言、多平台、多素材的适配,将内容生成变为可复制、规模化的工程[46][47][49] - AI将摄影棚、相机、灯光等生产资料“打包”成基础设施,使不懂拍照、文案的工厂也能轻松完成跨境店铺装修[51][52] AI带来的效率与商业价值提升 - AI未改变跨境电商运作逻辑,但使整条链路在效率与成本上发生翻天覆地变化[54] - 实测显示,许多原本月盈利三四十万元的客户,嵌入“遨虾”后,月利润一度增长至四五十万元[55] - AI通过解决信息不对称(实时汇聚趋势数据、结构化供应商信息)和规模效应(一键多语言翻译、多版本素材生成)两大核心难题,降低了跨境门槛[66][67][77][78] - 当进入海外市场的成本趋近于零,跨境贸易与内贸将无本质区别,跨境电商有望迎来迅猛扩张[80][81] “遨虾”AI智能体的技术基础与竞争优势 - “遨虾”基于阿里“通义千问”系列模型,并为选品、询盘等模块进行了定制化训练,引入了人工专家标注以强化电商垂直领域Agentic Model能力[82] - 其独特优势在于能调用阿里巴巴过去26年在B2B电商链路中沉淀的真实、私域业务数据,构建了壁垒极高的供应链知识库[83] - 这些私域供给端数据(如供应商资质、成本信息)纯净且不易受AIGC“污染”,对于训练模型理解真实商业逻辑(如利润率计算)至关重要,是公开数据无法替代的[84][85][86] - 依托数据护城河,该AI助手能更有效地完成微调与强化学习,成为一个真正懂跨境生意且值得信任的助手[87] 对行业竞争格局的潜在影响 - 国内电商内卷严重,跨境电商被视为更蓝海的市场,在“中国供应链”加持下,“出海”成为新战略方向[56][57] - 但海外市场“肉多狼少”,中国约一千多万内贸电商卖家中,成功出海者不到十分之一,主要因跨境环节复杂度高[59][60] - AI平台遵循“无差别利他”逻辑,不偏袒大卖家,将原本专属大团队的运营能力下放给个人与小微商户[88][90] - 这将使市场竞争的胜负手重新回到商品本身,可能改变行业竞争格局,促进更广泛的参与[90]
量子位编辑作者招聘
量子位· 2025-12-07 12:35
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号平台拥有超过240万订阅用户,全网用户超过700万,日均阅读量超过200万[12] - 公司在新榜和清博等第三方数据平台被评为AI及前沿科技行业TOP1新媒体[12] 招聘岗位总览 - 公司开放三大方向的全职岗位招聘,工作地点位于北京中关村[2] - 招聘岗位面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招面向应届毕业生并接受实习转正[6] - 所有岗位的不同能力层级职位均在开放,应聘者可根据个人履历和经验申请[4] AI产业方向岗位详情 - 岗位职责聚焦于AI基建层创新,包括芯片、AI Infra、云计算领域的新进展及核心玩家动态[6] - 职责包括对前沿论文、开源社区及技术大会(如Hot Chips、NeurIPS、MLSys)的技术报告进行大众化解读[6] - 职责还包括参与核心采访,对话产业专家、技术大牛,并撰写AI云落地案例[7] - 任职要求应聘者对芯片、GPU、NPU、服务器、模型训练架构、云计算有基本理解[11] - 要求熟悉AI行业的供应链与生态,包括训练-推理、算力-成本、云-芯片关系[11] - 要求具备将复杂技术内容结构化表达的能力,有技术背景、理工或CS/EE方向者优先[11] AI财经商业方向岗位详情 - 岗位职责聚焦于AI领域的创投、财报、产业链资本动向,关注创投、AI创业公司、上市公司、商业模式[11] - 职责包括产出创投融资、招股书财报解析、公司战略分析等稿件[11] - 职责包括访谈对话投资人、创业者、产业分析人士[11] - 任职要求应聘者对数据敏感,对财报、股权结构、战略规划感兴趣[11] - 要求具备强逻辑结构,对商业叙事敏感,并热爱对话采访,具有社交型人格[11] AI产品方向岗位详情 - 岗位职责关注AI在应用和硬件终端方向的进展,包括软件应用产品和硬件方向落地[6][11] - 职责包括撰写AI应用产品深度评测,跟踪多终端新品发布(如手机、PC、XR、车机等)[11] - 职责包括对话访谈AI应用创业者、产品专家、终端技术专家[11] - 任职要求应聘者对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士[11] - 要求熟悉各大终端厂商业态和体验方法论,并具备强逻辑、体验表达和结构化能力[11] 加入公司的潜在收益 - 员工可站在AI浪潮之巅,第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系[6] - 员工可将各种AI新技术、新工具应用于工作,提升工作效率和创造力[6] - 员工可通过撰写独家原创内容,建立个人知名度,成为AI领域的意见领袖[6] - 员工可与AI领域大咖零距离接触,参与重要科技活动和发布会,拓展行业视野[6] - 应届新人会由主编级编辑出任mentor,提供一对一指导,以帮助更快成长[6] - 员工可加入扁平、简单、开放、多劳多得能者上位的活力团队[6] - 员工可获得行业TOP薪资待遇,以及五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6] 岗位通用能力要求 - 主编岗位需具备选题和带队能力及经验[6] - 主笔岗位需具备原创深度稿件能力[6] - 编辑岗位需热爱表达,喜欢挖掘信息,能够用通俗语言让所有人看懂AI新进展[6] 应聘方式 - 应聘者需将个人简历发送至指定邮箱zhaopin@qbitai.com,邮件主题需注明应聘方向及姓名[11] - 随简历需附上科技行业代表作品,或能展现个人写作水平和风格的作品[11]
英伟达巧用8B模型秒掉GPT-5,开源了
量子位· 2025-12-06 13:40
文章核心观点 - 英伟达与香港大学合作开源的Orchestrator-8B模型,通过扮演“工具主理人”角色协调调用各类工具,在多项关键性能测试中超越了GPT-5等顶级大模型,同时实现了更低的成本和更快的运行速度,展示了小模型驱动复合系统的巨大潜力[1][2][23] 模型性能与优势 - **性能超越**:在人类终极考试HLE测试中,Orchestrator-8B得分达37.1%,超过了GPT-5的35.1%[16] - **成本优势**:Orchestrator-8B的成本仅为GPT-5的1/2.5,具体成本为9.2(单位未明确),而GPT-5为30.2[16] - **速度优势**:运行速度比GPT-5快一倍多,具体延迟为8.2(单位未明确),而GPT-5为19.8[16][18] - **综合领先**:在FRAMES、τ²-Bench测试中也取得了SOTA(State-of-the-Art)成绩[18] - **社区热度**:模型在HuggingFace平台受到高度关注,冲到了热门模型前五[4] 技术原理与架构 - **核心功能**:模型自身不直接解题,而是作为“工具主理人”,负责判断、协调并控制调用外部工具的顺序和次数,兼顾效果、成本与用户偏好[6][9][14] - **工具团队**:其协调的工具库包括GPT-5、Claude Opus 4.1等顶级大模型,Qwen2.5-Math等专业数学工具,以及网页搜索、本地检索、代码解释器等实用工具[7] - **训练方法**:采用名为ToolOrchestra的训练方法,核心包括有奖有罚的强化学习以及量身定制的ToolScale数据集[11][12] - **奖励规则**:训练时设立三条强化学习规则:1) 效果奖(解题正确加分);2) 效率奖(花费少、耗时短加分);3) 偏好奖(遵循用户指令如隐私保护、节省成本加分)[15] 行业背景与趋势 - **研究脉络**:行业内在探索让小模型学会调用工具的赛道上已有先例,如谷歌DeepMind的Toolformer(2023年)、MIT与CMU的ToolRL,以及香港大学与微软的Optimal Tool Calls(OCT)[19][20] - **领域关注**:越来越多的研究团队关注并投入该领域,旨在解决大模型成本高、速度慢的落地难题[21][22] - **未来方向**:该模型的成功表明,AI的未来可能并非依赖参数庞大的单一模型,而是通过低成本、高效率的小模型协调专业工具系统来实现高智能[23]
SpaceX估值8000亿美元超OpenAI,IPO就在明年
量子位· 2025-12-06 13:40
核心估值与融资动态 - 据华尔街日报报道,SpaceX正与投资者就新一轮内部股份出售进行谈判,若交易达成,公司估值将飙升至**8000亿美元**(约合人民币5.66万亿元)[1] - 此次估值的**8000亿美元**,其规模已接近瑞士最新的GDP(约**9000亿美元**)[2] - 此次估值将超越OpenAI此前**5000亿美元**的估值,成为全球估值最高的私营企业之一[3] - 公司估值在不到半年内实现翻番,从今年7月的**4000亿美元**(约合人民币2.83万亿元)暴涨至目前的**8000亿美元**[4][11] - 本轮融资计划为**二次股票出售**,即现有股东向新投资者出售股份,资金不直接进入公司账户,公司通常每年进行两次此类“要约收购”[11] - 估值数字在交易最终敲定前仍可能变化,有媒体(如彭博社)报道交易可能以每股约300美元进行,届时估值约为**5600亿美元**[12] 公司业务与市场地位 - SpaceX成立于2002年,是一家美国私营航空航天和太空运输公司,其两大核心业务为**火箭发射**与**卫星**[6][18] - 公司在火箭发射市场已占据主导地位,为商业卫星公司和NASA等官方机构提供服务[19] - 公司的卫星业务,特别是旗下Starlink部门拥有的约**9000颗卫星**,被认为是推动其高估值的主要理由[20][25] - 公司正在推进下一代完全可重复使用的运载火箭**星舰(Starship)**,这是迄今为止建造的最强大的火箭,旨在将人类送往火星,自2023年以来已完成**11次试飞**[21][22] - 公司从猎鹰1号成功入轨开始,逐步通过猎鹰9号、龙飞船、猎鹰重型火箭以及可重复回收技术,确立了行业优势地位并实现了全球最高的发射能力[21] 财务表现与上市计划 - 据马斯克今年6月透露,SpaceX今年全年营收预计将达到**155亿美元**[27] - 这一预计营收略高于OpenAI今年**130亿美元**的预计营收金额[28] - 公司被曝最早将于**2025年下半年**进行IPO(首次公开募股)[17] - 在上市计划上,SpaceX可能比OpenAI(传闻最早2026年下半年提交申请)更快一步[28] - 关于上市结构,公司高管目前更倾向于将火箭发射和Starlink卫星业务**打包上市**,而非拆分Starlink独立上市[26]
图像编辑缺训练数据?直接从视频中取材,仅用1%训练数据实现近SOTA效果
量子位· 2025-12-06 11:21
文章核心观点 - 百度研究团队提出了一种名为Video4Edit的创新图像编辑方法,该方法将图像编辑任务重新定义为视频生成的一种特殊退化形式,通过利用视频预训练模型中的单帧演化先验,实现了从视频生成到图像编辑的知识迁移,从而在仅需主流编辑模型约1%监督数据的情况下,达到与当前第一梯队模型相当的性能[1][21] 行业背景与现有挑战 - 当前基于扩散模型的图像编辑方法严重依赖大规模、高质量的三元组数据进行训练,数据成本高昂且难以覆盖多样化的用户编辑意图[3] - 现有方法在结构保持与纹理修改之间存在根本性的权衡难题,过度强调结构保持会限制编辑灵活性,而追求大幅度的语义修改又容易导致几何失真[3] 技术原理与创新 - 将图像编辑任务重新定义为视频生成的特殊退化形式,即把源图像视为视频第0帧,编辑后图像视为第1帧,从而将图像编辑建模为一个2帧的极短视频生成过程[4][6] - 利用视频预训练模型中蕴含的单帧演化先验,该先验包含了强大的时序一致性约束和帧间演化规律,天然地平衡了结构保持与语义变化[7] - 通过时间退化建模,将图像编辑过程视为从t=0到t=1的时序演化,使结构保持约束转化为视频生成中成熟的时间注意力机制,该机制天然倾向于在相邻帧之间保持高频细节和几何结构[8][9] - 在潜在空间中,将视频模型学习到的转移概率分布通过文本指令进行条件化引导,从而将通用的时序演化能力导向特定的编辑意图,实现了参数的高效复用[11][12] - 从信息论角度看,引入视频先验极大地降低了假设空间的熵,提供了更强的有效泛化能力,使得基于时序演化的微调具有更高的样本效率[15][16] 数据效率与性能 - Video4Edit仅需主流编辑模型约1%的监督数据即可收敛,使用的监督数据量约为MagicEdit等基线方法的1%[1][21] - 在CLIP Score和Structure Score等关键评估指标上,Video4Edit与使用全量数据的基线方法性能相当,部分场景下实现了性能提升[21] 应用效果展示 - Video4Edit在风格迁移、物体替换和属性修改等多种图像编辑任务上进行了系统性评估[17] - 在风格迁移任务中,能够准确捕捉目标风格特征,同时有效保留源图像的结构信息[19] - 在物体替换任务中,实现了自然的语义融合,边缘处理质量高,无明显伪影[19] - 对于复杂的自然语言编辑指令,能够准确理解语义意图并生成符合要求的编辑结果,表明单帧演化先验在语义对齐方面具有良好的泛化能力[19]
14岁华人小孩,折个纸成美国天才少年
量子位· 2025-12-06 11:21
核心观点 - 一名14岁华裔少年通过创新改进“三浦折纸”结构,设计出可承受自重1万倍以上重量的新型折纸,并因此赢得含金量高的科学挑战赛最高奖及2.5万美元奖金,其研究展现了在应急避难所等领域的巨大应用潜力[1][3][5][14] 人物与成就 - 14岁的华裔少年Miles Wu(吴迈尔斯)凭借一项创新折纸设计,在近2000名申请者中脱颖而出,最终赢得JIC(赛默飞科学青少年创新挑战赛)最高奖,获得2.5万美元奖金[5] - 该比赛竞争激烈,从近2000人筛选至300人,最终30人进入决赛,许多参赛者项目有资深导师指导或可使用专业实验室资源,而迈尔斯完全依靠个人在家中的客厅独立完成研究[5][6][7] - 迈尔斯自8岁开始折纸,已有6年“工龄”,其作品包括复杂的折纸昆虫,但他将兴趣与科学研究相结合,取得了突破性成果[23][26][27] 技术基础与创新 - 迈尔斯的研究基于由东京大学三浦公亮教授发明的“三浦折纸”结构,该结构因其独特的几何特性(可沿单方向轻松展开和折叠)已被应用于日本卫星太阳能板和NASA的可折叠太阳能阵列[10][11][12] - 迈尔斯提出了全新的三浦折叠变体,据测算,这种新型折纸可以承受自身重量1万倍以上的重量,换算比喻相当于一辆出租车能站4000多头大象[3][4][14][15] - 其研究过程严谨,在家中的临时实验室里,他系统测试了54种手工折叠变体,涉及三种平行四边形宽度、三种角度、两种高度及三类纸张,共完成108组测试,最终确定了最优形态[41][47] 应用前景与设计理念 - 迈尔斯计划基于其改进的三浦折纸,设计一种可快速展开的应急避难所,旨在解决当前应急物资在可靠性、便携性和部署速度上难以兼顾的“不可能三角”问题[20][21][30][31] - 三浦折纸应用于应急避难所的优势在于:单自由度设计使展开简单可靠;整体受力结构使其异常坚固;高压缩比使其折叠后体积小,便于运输和储存[32][33][34][35][36][37][38] - 该设计的灵感源于对自然灾害(如南加州山火烧毁超1.8万栋建筑、飓风海伦致201人遇难)的关切,迈尔斯希望用折纸技术来帮助更多人[28][29][30]
量子位编辑作者招聘
量子位· 2025-12-06 11:21
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号平台拥有超过240万订阅用户,全网用户超过700万,日均阅读量超过200万[12] - 公司在第三方数据平台(如新榜、清博)是AI及前沿科技行业的TOP1新媒体[12] 招聘岗位总览 - 公司开放三大方向的全职岗位招聘,工作地点位于北京中关村[2] - 招聘面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招面向应届毕业生并接受实习转正[6] - 应聘者需将简历发送至指定邮箱,邮件主题需注明应聘方向及姓名,并附上代表作品[11] AI产业方向岗位详情 - 岗位职责是关注AI基建层创新,包括芯片、AI Infra、云计算等领域的新进展与核心玩家动态[6] - 需要解读前沿论文、开源社区及技术大会(如Hot Chips、NeurIPS、MLSys)的报告[6] - 需参与核心采访,对话产业专家与技术大牛,并撰写AI云落地案例[7] - 任职要求包括对芯片、GPU、NPU、服务器、模型训练架构、云计算有基本理解[11] - 需要熟悉AI行业供应链与生态(如训练-推理、算力-成本、云-芯片关系),并能将复杂技术内容结构化表达[11] - 拥有技术背景、理工或CS/EE方向者优先[11] AI财经商业方向岗位详情 - 岗位职责是聚焦AI领域的创投、创业公司、上市公司、商业模式及产业链资本动向[11] - 需产出创投融资、招股书财报解析、公司战略分析等稿件[11] - 需要访谈对话投资人、创业者及产业分析人士[11] - 任职要求包括对数据敏感,对财报、股权结构、战略规划感兴趣[11] - 需要逻辑结构强,对商业叙事敏感,并热爱对话采访[11] AI产品方向岗位详情 - 岗位职责是关注AI在软件应用产品和硬件终端的落地进展[11] - 需撰写AI应用产品深度评测,并跟踪多终端新品发布(如手机、PC、XR、车机等)[11] - 需要对话访谈AI应用创业者、产品专家及终端技术专家[11] - 任职要求包括对智能硬件和AI终端趋势敏锐,是重度AI产品体验人士[11] - 需要熟悉各大终端厂商业态及体验方法论,并具备强逻辑、体验表达和结构化能力[11] 加入公司的潜在收益 - 员工可第一时间接触AI领域最新技术和产品,构建完整的AI认知体系[6] - 可将各种AI新工具应用于工作,提升效率与创造力[6] - 通过撰写独家原创内容,有机会建立个人知名度,成为AI领域意见领袖[6] - 可与AI领域大咖零距离接触,参与重要科技活动,拓展行业人脉与视野[6] - 应届新人可获得主编级编辑的一对一指导[6] - 团队氛围扁平、简单、开放,奉行多劳多得、能者上位的原则[6] - 提供行业TOP薪资待遇,以及五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6]
下周三!量子位的这件大事就要来了|MEET2026
量子位· 2025-12-06 11:21
大会核心信息 - MEET2026智能未来大会将于2025年12月10日在北京金茂万丽酒店举办,主题为“共生无界,智启未来”[24][37][39] - 大会将探讨以AI为代表的智能科技如何穿透产业、学科与场景的边界,成为驱动社会演进的核心动能[39] - 大会将发布《2025年度AI十大趋势报告》与《2025人工智能年度榜单》[35][39][47] 嘉宾阵容 - 大会累计邀请近三十位重量级嘉宾,涵盖学术界、产业界与前沿创业一线[17] - 学术界嘉宾包括清华大学智能产业研究院院长张亚勤、清华大学人工智能研究院常务副院长孙茂松、智源研究院院长王仲远、交大高金教授朱宁等[1][17][45] - 产业界阵容覆盖芯片、云、模型到终端的全栈力量,包括百度、高通、小米、蚂蚁、亚马逊云科技、谷歌云、昆仑万维、潞晨科技、PPIO、商汤、中关村科金等代表性企业[1][21][24][25][26][43][44] - 前沿创业新生力量包括卓世科技、太初元碁、RockAI、自变量机器人、光轮智能、云徙科技、灵心巧手等[28][42][44][45] 核心议题与议程亮点 - 议题内容涵盖大语言模型、多模态、具身智能、自动驾驶、云计算及具体应用等AI主流方向[3] - 设置“GenAI Talk”对话,文远知行创始人兼CEO韩旭将分享自动驾驶创业第二个八年的实战经验,探讨GenAI如何赋能自动驾驶及Robotaxi大规模商业化落地的奇点[8][11][12] - 设置“激辩Agent”前沿圆桌,汇聚小宿科技、联汇科技、蚂蚁百宝箱等平台方、技术方与应用方,探讨AI Agent革新千行百业的时间表、技术架构及落地挑战[13][16][45] - 上午议程聚焦宏观趋势与基础技术,包括“人工智能+”趋势、超级智能体、AI从数字世界迈向物理世界、混合AI、Agentic AI等议题[41] - 下午议程深入多模态、智能体与产业应用,涵盖AI技术突破、基础设施、算力生态、硬件创新、物理世界基础模型、具身智能平台等话题[43][44][45] 大会价值与产出 - 大会旨在提供最前瞻的观点,帮助从业者理解技术变化如何重塑技术路线、产品逻辑及创业机会[4][6] - 通过一线实践者的分享,勾勒从理论、平台、应用到终端的完整AI落地拼图,探寻AI从概念炒作走向实际影响的真实路径[33][34] - 发布的《2025年度AI十大趋势报告》将梳理年度AI代表进展并展望可预见的技术趋势,覆盖算法、数据、算力底座至产品解决方案及行业应用[35] - 发布的《2025人工智能年度榜单》将从企业、人物、产品/解决方案三大维度,筛选行业最具影响力、创新力与潜质的领军者代表[35][47]
智能体A2A落地华为新旗舰,鸿蒙开发者新机遇来了
量子位· 2025-12-06 11:21
核心观点 - 华为通过鸿蒙6操作系统及Mate X7等设备,首次实现了Agent to Agent智能体协作的商用落地,标志着手机交互形态正从“人找应用”向“服务找人”的“智能体化”革命演进,并有望定义下一代AI应用交互规则 [3][7][9] 鸿蒙6与A2A智能体协作的落地与体验 - 在HarmonyOS 6中,已有超过80款鸿蒙应用完成了智能体化改造,成为A2A协作的基础单元 [14] - 智能体中枢“小艺”进化为具备全局统筹能力的大脑,可作为主Agent调度第三方应用的子Agent,实现“一句话办事” [15][17] - A2A协作已渗透金融、娱乐、生活、出行等高频场景,例如:点名“深圳航空”后说“选个能看日落的座位”,其智能体可自动锁定“黄金机位”并值机;点名“叮咚买菜”问“秋天适合喝什么润肺汤”,智能体会推荐食谱并一键加购食材 [18] - 在折叠屏Mate X7上,A2A能力与分屏联动深度融合,例如:双指长按小红书攻略可召唤分屏导航,右侧地图自动定位并规划路线;长按外文段落可唤起分屏由小艺实时翻译 [22] - 对于尚未改造的GUI应用,系统通过“小艺帮帮忙”功能模拟用户操作进行兜底,确保生态体验统一 [24] 鸿蒙6的技术架构与开发者生态 - HarmonyOS 6将智能下沉至底层,与硬件深度融合,构建了允许智能体交互的服务互通环境 [25] - 以意图框架Intents Kit与统一通信协议为核心技术底座,将APP内部功能封装为系统可调用的“原子化意图”,重构了应用间连接方式,实现跨应用意图理解与指令分发 [26][27][28][29] - HMAF框架与全栈工具链极大简化了智能体开发流程,为开发者提供标准接口与AI控件,使传统APP可平滑进化为智能体 [31][32] - 开发者无需重构整个应用,利用DevEco Studio进行简单配置即可快速接入A2A协作网络,降低了接入门槛 [33][34] - 鸿蒙为全行业提供了智能体互联的基础设施,解决了“协议不通”和“接入困难”的行业难题 [36][37] A2A经济的战略意义与行业机遇 - A2A是移动互联网从“人找应用”迈向“服务找人”的必然进化,商业流量逻辑正从抢占屏幕入口变为抢占无形的“用户意图”入口 [39][40] - 谁能最快响应AI指令并通过A2A接口精准输出服务,谁就能掌握下一个时代的流量密码 [41] - HarmonyOS 5和6的设备数量已突破2700万台,并以平均每天超10万台的增速增长 [42] - 华为启动“天工计划”,未来将投入10亿元人民币,目标加速孵化超过1万个AI原生元服务、1千多种意图框架以及5千多个智能体,为生态开发者提供全方位支持 [45][46] - 鸿蒙构建的开放生态为开发者提供了抢占AI时代生态先机的战略窗口,越早加入越能抢占先机 [38][45]
《三体》“宇宙闪烁”成真!免佩戴裸眼3D屏登Nature
量子位· 2025-12-06 09:30
技术突破与核心特点 - 实现无需佩戴眼镜的裸眼3D显示,观看视角覆盖范围超过100度 [6] - 在超过100度的视角范围内,观察者移动时画面连续顺滑,无跳变或重影 [7] - 设备尺寸与普通24寸桌面显示器相当,有效3D成像面积达到0.1到0.2平方米,相比以往厘米级的全息技术,成像面积大了1000倍 [9] - 实现了真正的“全视差”显示,支持水平、垂直和径向(前后)三个维度的观看 [10] - 当观察者移动或靠近屏幕时,画面物体会呈现符合物理规律的几何透视变化 [11] - 具备“聚焦视差”功能,能模拟人眼景深效果,使眼睛对焦与大脑距离感知一致,解决了导致头晕的辐辏调节冲突问题 [12][13] - 在实现复杂效果的同时,保持了1920×1080的高清分辨率和超过50Hz的刷新率,支持实时动态内容 [15] 技术原理与架构 - 技术本质是一种深度融合计算光学与人工智能的新型显示架构 [17] - 提出动态空间-带宽积利用策略,通过主动控制光场来突破物理限制,解决了传统裸眼3D技术难以同时实现大屏幕和宽视角的矛盾 [17][18] - 核心思路是利用传感器实时锁定观察者眼球位置,将光学信息精准投射到双眼注视的范围内,而非重建整个空间光场 [19] - 建立了一套物理精确的双目几何建模系统,将双眼视为针孔相机,并计算出其在光场坐标系中的6D姿态矩阵(位置和朝向) [21][22] - 引入“眼球几何编码”关键技术,利用逆向透视变换原理,将视网膜上的目标图像反向投影回屏幕平面,形成标准化的平面扭曲图像 [25][26][27] - 硬件采用三层普通的TFT-LCD液晶面板平行堆叠结构,层间距约为3厘米,配合白光LED光源和正交偏振片,不含微透镜阵列等复杂光学元件 [30][32] - 核心光学调制与图像合成完全由一个轻量级的全卷积神经网络驱动,该网络采用类似U-Net的架构 [32][33] - AI模型接收几何编码后的归一化图像,执行逆向渲染任务,计算三层液晶面板上每个像素点所需的相位数值 [35] - 物理调制过程基于马吕斯定律,通过AI计算复杂的相位组合,控制光线穿过三层液晶面板(作为可编程相位延迟器)后的累积相位,从而精准控制到达视网膜的光强 [36][37][38][39] - 在AI训练中引入包含“互斥损失”的结构化光学损失函数,强制约束光线路径,使左眼信息在右眼视角下不可见,从而消除串扰并合成具有正确深度遮挡关系的立体光场 [41][42][43] 研发背景与团队 - 该技术由名为“EyeReal”的显示屏实现,相关研究成果最新发表于《自然》杂志 [2] - 该研究为中国团队出品,第一作者为26岁的复旦大学在读博士生马炜杰,由上海人工智能实验室、上海创智学院联合培养 [5][44] - 第一作者的研究兴趣包括计算机视觉与图形学、虚拟/扩展现实以及用于科学(光学/物理/医学)的人工智能 [45] - 论文导师为欧阳万里和钟翰森,二人同为论文通讯作者,欧阳万里同时是香港中文大学教授,钟翰森同时是上海创智学院全时导师,二人在上海人工智能实验室均有任职 [47][48] - 北京航空航天大学的Zhangrui Zhao和浙江大学博士生赵灿宇也参与了论文工作 [49] 潜在应用与成本优势 - 设备成本低廉,仅需一块NVIDIA GeForce RTX 4090显卡加上屏幕和游戏机传感器即可实现 [3]