商汤(00020)
icon
搜索文档
8点1氪:百度废除字母职级标签;Meta被曝准备撤销对Manus收购;张雪称曾拒绝了半个亿的商务合作
36氪· 2026-04-29 08:11
百度职级体系调整 - 百度发布全员信,对中管层以下职级体系进行大调整,将专业通道与管理通道全面打通,原有职级字母标签(T、P、E、Band、M)统一改为5级至12级的数字职级体系,新体系于2026年5月1日正式生效 [4] - 公司认为AI时代需要同时具备专业力和领导力的复合型人才,基于此判断决定打通职业发展通道 [4] 科技巨头动态 - Meta Platforms 据传正准备撤销对人工智能初创公司 Manus 的收购,Manus 的投资者包括 Benchmark 已收回投资,若 Meta 推进撤销,腾讯、HSG 和真格基金等亚洲前投资方计划配合 [4] - 苹果公司据传正将“Ultra”品牌扩展到 Apple Watch Ultra 之外,计划明年推出 MacBook Ultra 和 AirPods Ultra 等超高端新品,其中 MacBook Ultra 预计搭载 OLED 触控屏,售价显著高于现有 MacBook Pro [33] - 商汤科技正式发布并开源日日新 SenseNova U1 系列原生理解生成统一模型,该系列模型基于自研的 NEO-unify 架构,在单一模型架构上统一了多模态理解、推理与生成 [19] - 格力电器CMO表示,公司已具备做出“人形机器人”的能力,所有机器人零部件都可以实现自研自产,累计投入使用的自主研制工业机器人达2000余台,实现生产效率提升80% [21] 人工智能与科技公司融资 - DeepSeek(杭州深度求索公司)注册资本由1000万元增加至1500万元,增幅50%,其中梁文锋认缴资本由10万元增至510万元,持股占比由1%提高至34%,其作为实际控制人的最终受益股份达84.3% [16] - DeepSeek 官网将 deepseek-v4-pro 模型的2.5折优惠活动延长至今年5月31日,目前该模型输入价格(缓存命中)为每百万tokens 0.025元,输入价格(缓存未命中)为3元,输出价格为6元 [20] - 专注于焊接垂直场景的具身智能机器人公司“昇视唯盛”完成数千万元A+轮融资,由韩国现代、微光创投联合投资,资金将主要用于“具身大脑”研发、产品迭代及市场推广 [30][31] - 人工智能生成合成内容监管加强,“剪映”App、“猫箱”App及“即梦AI”网站因未有效落实人工智能生成合成内容标识规定,被网信部门依法采取约谈、责令改正、警告等处置处罚措施 [10] 汽车行业 - 比亚迪官方宣布,受全球存储硬件成本大幅上涨影响,旗下部分车型选装“天神之眼B”辅助驾驶激光版的价格将从9900元上调至12000元,调价于2026年5月1日生效 [8] - 比亚迪发布2026年一季度业绩报告,一季度营业收入1502.25亿元,同比下降11.82%;归属于上市公司股东的净利润40.85亿元,同比大幅下降55.38% [26] - 威马汽车旗下威马新能源汽车采购(上海)有限公司破产清算后,1.275亿元对外应收账款在淘宝阿里拍卖平台以100元起拍,最终经过332次竞拍,以93500元价格成交 [15] 消费与零售 - 泡泡玛特发布首款家电产品LABUBU图案冰箱,官方统一售价5999元,全球限量发售999台,4月28日在二手平台上价格已被炒至92300元,溢价约15倍,京东平台两款冰箱预约总量已达3.7万 [12] - 在2026伦敦马拉松中,肯尼亚选手萨巴斯蒂安·萨维以1小时59分30秒打破男子马拉松世界纪录,其所穿运动鞋官方发售价3999元,在购物平台上24小时内被炒至近20000元,且需等近一个月才能拿到货 [17] - 星巴克公布第二财季业绩,净营收95亿美元,同比增长8.4%;经营利润8.281亿美元,同比增长38%;同店销售增长6.2%,公司全年预计同店销售至少增加5% [26] 资本市场与IPO - 韩国上市公司总市值今年以来飙升超过45%,达到4.04万亿美元,超越英国(3.99万亿美元),成为全球第八大股市,2024年底时英国市值规模约为韩国的两倍 [17] - 思仪科技创业板IPO获上市委会议通过 [23] - 深圳市汇川技术股份有限公司向港交所提交上市申请书,联席保荐人为摩根士丹利、国泰君安国际、美银证券、中金公司 [24] - 格林美公告,公司已于4月27日向香港联交所更新递交了H股发行上市的申请 [22] 公司财报与业绩 - 东方甄选发布公告,依据2023年股份激励计划,向公司董事、高管及核心员工授出1930.14万股股份奖励,涉及302人,占总股本1.82%,其中执行董事兼CEO俞敏洪获授180万股,占比0.17% [7] - 影石创新发布2026年一季度业绩,营业收入24.81亿元,同比增长83.11%;归属于上市公司股东的净利润8462.02万元,同比下降52.02%,主要因战略研发投入增加、存储元器件涨价及市场竞争加剧 [25] - 宏昌电子发布2026年一季度业绩,营业收入9.89亿元,同比增长76.81%;归属于上市公司股东的净利润46.85万元,同比下降92.74%,主要因新厂投产成本支出大影响净利 [27] 行业与宏观政策 - 国务院关税税则委员会公告,自2026年5月1日至2028年4月30日,对同中国建交的20个不属于最不发达国家的非洲国家以特惠税率形式实施零关税,此前已对33个非洲最不发达国家100%税目产品实施零关税 [15] - 教育部发布《普通高等学校本科专业目录(2026年)》,共新增38种普通高校本科新专业,包括能源科学与工程、深地科学与工程、商业人工智能、数字金融等,支持哈尔滨工业大学、北京航空航天大学等9所高校增设具身智能新专业 [9] - 阿联酋宣布将自2026年5月1日起退出石油输出国组织(欧佩克)及“欧佩克+”,该决定基于对国家石油生产政策的全面评估及国家利益 [7] - 多家航空公司再度大幅上调5月航线燃油费,例如全日空航空自5月1日起将中国大陆到日本航段的燃油附加费由275元上调166元至441元,上调幅度超60% [11] 初创公司融资 - 药物递送企业“新劢德”宣布完成近3亿元B轮融资,由元禾原点领投,资金将用于肺部给药、鼻腔给药等先进药物递送技术平台建设 [28] - 数字科技文娱公司“星迹互动”完成数千万元天使轮融资,投资方包括正大集团等,资金将用于人员扩张、产能拉升及平台建设 [29] - 功能抗体设计平台公司“寻明生科”完成3500万美元A+轮融资,由红杉中国领投,资金将用于推动自研平台AuraIDE™建设及基座模型与智能体能力建设 [32]
腾讯研究院AI速递 20260429
腾讯研究院· 2026-04-29 07:28
生成式AI 一、微软痛失OpenAI独家 合作 ,七年绑定关系开始松动 1.OpenAI与微软更新合作协议,微软对OpenAI模型和产品的知识产权许可由独占变为非独占,有效期维持至2032 年; 2.新协议允许OpenAI在其他云平台向客户提供产品,亚马逊AWS将在数周内把OpenAI模型引入Bedrock; 3.微软仍是OpenAI主要云合作伙伴和重要股东,受消息影响微软股价盘前一度下跌约4%。 https://mp.weixin.qq.com/s/siSPjiPQknxdcnaqRCdT5g 二、OpenClaw发布v2026.4.25,主打AI智能体可观测性 1.OpenClaw发布新版本,口号"Less mystery,more machinery",聚焦让AI智能体不再是黑箱,覆盖模型调用、 Token消耗、工具循环等全链路; 2.全面接入OTEL可观测性框架,默认不暴露原始prompt,开发者可清晰定位每一次模型调用与成本结构; 3.一次性接入13个TTS语音提供商,重构插件冷启动机制改为查找表方案,启动更快、诊断路径更短。 1.小米开源罗福莉团队研发的MiMo-V2.5系列模型,采用MIT协议, ...
不卷参数卷架构,这个开源模型把图像理解和生成统一了
量子位· 2026-04-28 21:39
文章核心观点 商汤科技开源了全新的理解生成统一模型SenseNova U1,该模型在图文交错生成、信息图制作等复杂任务上表现出色,其创新的NEO-unify架构实现了文本与图像在同一表征空间的原生融合,在多项指标上达到开源模型领先水平,并提供了从8B到38B的不同规格版本供开发者使用 [3][25][111][126] 模型核心能力与特点 - **连续性图文创作**:模型能够像人类一样,在单次输出中自然地交叉生成文字和图片,实现“边思考边画草图”,解决了传统模型在语义保持和像素保真度之间的权衡难题 [32][33][35][36] - **高密度信息图生成**:模型擅长处理信息图、文字密集排版、图文交错等曾被公认是AI生图难题的任务,能够生成包含简历海报、操作教程、故事连环画、产品爆炸图等复杂排版的图像 [24][75][77][97] - **主体一致性**:在生成多步骤内容时,能够保持核心主体(如故事角色、食材)的形象高度一致,避免了传统多模型调用方案中角色走样的问题 [38][73][74] - **具备初步推理与物理常识**:模型在图像编辑等任务中展现出推理能力,例如能根据物理变化规律推导“一小时后的热茶”或“成熟香蕉”的状态,而非简单替换 [100][101][102][106][110] 技术架构与性能 - **统一架构NEO-unify**:模型采用创新的NEO-unify架构,摒弃了传统的视觉编码器与变分自编码器分离的模式,实现了“直接吃像素,直接吐像素”,让理解和生成在同一个网络中完成 [111][113][114] - **技术实现三步**:引入近似无损的视觉接口统一输入输出表示;使用Mixture-of-Transformer作为主干网络,让理解和生成共享底层;文本采用自回归,视觉采用像素流匹配,两套目标函数在同一框架内学习 [115][116][117] - **模型规格与性能**:提供两个规格,包括参数为8B的端侧可运行版本,以及总参数为38B的MoE架构版本,在多项图像理解与生成指标上登顶开源模型榜首 [25][126] - **推理速度**:配备自研推理栈,在H100/H200单节点上,生成一张2048×2048分辨率的图像,端到端耗时约9秒,响应速度逼近主流商用闭源模型 [27][126] 开源生态与可用性 - **模型完全开源**:SenseNova-U1的两个模型已在Hugging Face和GitHub等平台全网开源,可供开发者直接下载使用 [131] - **配套技能包**:同时开源了SenseNova-Skills技能包,将U1封装成可被Agent直接调用的工具,覆盖图像生成、PPT制作、Excel数据分析等87种版式和66种风格 [129][130][131] - **明确模型局限**:公司在README中明确列出了模型的当前局限,包括32K的上下文长度限制、复杂场景人物细节不稳定、长文字渲染偶有错误等,并标注将持续改进 [127][128]
原生理解生成统一:商汤开源SenseNova U1,用统一架构终结「缝合怪」多模态
机器之心· 2026-04-28 21:27
文章核心观点 - 商汤科技发布并全面开源了其原生理解生成统一模型系列 SenseNova U1 Lite,该模型通过创新的 NEO-Unify 架构,在较小的参数规模(8B)下实现了高效、连贯的图文理解与生成能力,尤其在信息图生成和连续性图文创作方面表现突出,为行业提供了一个可替代 OpenAI GPT Image 2 的高效、低门槛选择 [3][4][8][69][71] 模型发布与定位 - 商汤发布的是 SenseNova U1 系列的轻量版 SenseNova U1 Lite,包含 SenseNova-U1-8B-MoT 和 SenseNova-U1-A3B-MoT 两个版本 [10] - 该模型完全开源,代码托管于 GitHub,模型权重在 Hugging Face 提供下载,不受使用次数束缚 [4][12][69] - 模型定位为国产开源模型,旨在为国内用户提供一个更低门槛、更易体验的选择,以应对类似 GPT Image 2 等海外模型的使用门槛 [2][3] 技术架构与核心优势 - 模型采用名为 NEO-Unify 的原生多模态统一架构,将视觉和语言信息在同一个内部空间中进行协同计算,解决了传统多模态模型中理解与生成之间的断层问题 [8][58] - 该架构的优势在于信息路径更短、效率更高,减少了模块间信息转换的损耗,让小规模模型能释放更高的有效能力 [59][60][61] - 模型仅需 8B 参数,就能实现与许多商业闭源模型类似的效果,体现了架构带来的计算效率提升 [8][61] 性能表现与基准测试 - 在图像理解与生成基准测试中,SenseNova-U1-8B-MoT 在通用理解、空间理解等多个测试中取得领先成绩,甚至超过了 Qwen3VL-30B-A3B、Gemma4-26B-A4B 等更大规模模型 [11] - 在信息图生成(Infographics)的一项测试中,SenseNova U1 Lite 获得 39.8 的高分,领先于 Qwen-Image 等模型 [14] - 在文字渲染(Text Rendering)测试中,SenseNova U1 Lite 的成绩几乎全面领先,证明了其在视觉化文字上的精准度 [14] - 在视觉推理(VBVR (UMM))测试中,模型获得 60.5 的高分,超过对比模型如 Nano-Banana 的 49.6 分 [16] - 在基于人类意图的视觉修改(WISE)测试中,模型取得 69.0 的优异成绩,领先于 Qwen-Image 的 63.0 分 [16] - 在 GEdit-Bench 测试中得分为 7.47,在同量级开源模型中处于顶尖位置 [17] 实际应用与功能演示 - 模型实现了业内首个连续性的图文创作输出能力,能在同一套推理过程中让图像和文字同步生成,保证了逻辑连贯与风格统一 [9][21][24] - 能够高效生成复杂高密度信息图,将论文摘要、操作流程等高密度信息重新组织,以直观的视觉结构呈现 [34][39][54] - 实际演示案例包括:生成故事连环画、电影运镜教程图解、短发造型信息图、占星术海报、论文图解、武侠江湖禁忌图、柠檬用途指南、名著信息图、刺绣入门指南、城市明信片等,展示了其在多样化、高信息密度场景下的强大处理能力 [23][30][35][37][39][41][46][47][49][51] 效率与实用性 - SenseNova-U1-8B-MoT 在生成速度上表现突出,延迟大约只有 15 秒 / 2K 图,是所有对比模型中生成速度最快的一个,同时在平均得分上接近主流商业模型(约67分) [62] - 模型在低延迟条件下保持了较高的生成质量,体现出很强的单位时间产出能力,更接近实际生产中对快速、稳定、高质量出图的需求 [62] - 其小参数、高效率的特点,有助于开发者在资源受限的环境下享受高效的多模态能力 [70] 行业影响与开源意义 - 商汤此次全面开源在架构层面有实质创新、且跑通了理解-生成-统一路线的模型,意味着这套方法可供学术界审视、开发者社区打磨,并为产业伙伴提供直接可用的基础设施 [69] - 在行业普遍追求生成质量时,商汤押注于“统一”本身,其全面开源使得这条技术路径变得开放和可及 [71]