Workflow
视觉大模型
icon
搜索文档
前字节AI负责人潘欣加入美团负责多模态创新
36氪· 2025-12-10 15:11
公司核心人事变动 - 前字节跳动视觉大模型AI平台负责人潘欣近期已加入美团 [1] - 潘欣在谷歌大脑、百度、腾讯、字节跳动及闪极科技等公司拥有丰富的AI技术研发与平台构建经验 [1] - 入职美团后,潘欣负责多模态AI创新工作,并主导了LongCat App等多个相关应用的开发 [1] 公司AI战略与进展 - 2025年美团的关键词是外卖大战与AI [1] - 公司创始人王兴表示,美团在AI技术上的战略定位是积极进攻而非消极防御 [1] - 在2025年一季度电话会上,王兴首次披露了公司AI大模型LongCat(龙猫)的相关进展 [1]
OPPO Reno15系列发布:实况拼图功能行业首发,2999元起
凤凰网· 2025-11-18 11:20
产品发布与定价 - 公司于11月17日发布Reno15系列智能手机,包含Reno15和Reno15 Pro两款机型,起售价分别为2999元和3699元,将于11月21日全渠道开售 [1] - Reno15 Pro 12GB+256GB版本定价3699元,最高配16GB+1TB版本4799元;Reno15 12GB+256GB版本2999元,最高配16GB+1TB版本3999元 [2] - 官方透露入门款Reno15c将于下月发布 [2] 产品核心配置与性能 - 产品主打影像和实况功能,搭载由2亿像素主摄、5000万像素潜望长焦、5000万像素超广角及前置5000万像素超广角组成的四摄系统 [1] - Reno15 Pro搭载天玑8450芯片,支持超级HDR和120帧增强技术,配备1080P游戏实况和30秒回录功能 [2] - 内置大容量电池支持6小时直播,并提供80W快充和旁路供电设计 [2] 设计与工艺 - 系列首次采用全息光刻工艺,在机身背部呈现立体蝴蝶结纹理 [1] - 除“星光蝴蝶结”配色外,Reno15 Pro还提供蜜糖金、可露丽棕选项,Reno15则增加极光蓝配色 [1] - 机身支持IP66/IP68/IP69防水等级,Reno15 Pro配备1.15mm窄边框直屏 [1] 核心功能与软件 - “出圈实况拼图”是核心卖点,基于公司自研视觉大模型,用户可选择2-9张实况照片进行组合,系统自动分离主体并支持4K输出 [1] - 针对直播场景,配置前后防抖系统、三麦克风阵列降噪、AI直播高光切片等功能 [2] - 系列预装ColorOS 16,新增动态景深壁纸、AI实况壁纸、AI实景对话等功能,并实现与苹果设备的跨生态互联 [2]
字节Seed架构再调整 朱文佳转向吴永辉汇报
犀牛财经· 2025-10-21 10:22
管理层人事变动 - 字节大模型团队Seed负责人朱文佳的汇报对象由CEO梁汝波变更为现任Seed负责人吴永辉 [2] - 今年初字节从谷歌DeepMind挖来研究副总裁吴永辉担任大模型团队Seed基础研究负责人 [2] - 多名原向朱文佳汇报的算法和技术负责人转向吴永辉汇报 朱文佳一度转向负责模型应用 [2] 团队架构调整 - 字节Seed团队发生多次调整 大语言模型负责人乔木因出轨HRBP被辞退 [2] - 视觉大模型负责人杨建朝官宣休息 AiLab主任李航退休后又返聘 [2] - 字节Flow部门进行一轮组织架构重大调整 赵祺转岗至Spring产品部门 直接向朱俊Alex汇报 [2] - 豆包原有的PC和Mobile负责人改为向赵祺汇报 策略产品线的Thomas和陆游同样纳入其管理半径 [2]
马斯克:Grok将推出AI视频检测工具;加速进化发布可自主做家务机器人丨AIGC日报
创业邦· 2025-10-14 08:08
视觉与机器人模型技术进展 - 国内首个基于纯国产算力预训练的移动端视觉基座大模型“橘洲”发布V1.5端侧版,性能更强并实现从IOS到安卓生态的跨越 [2] - “橘洲”V1.0版本能在没有网络的情况下于IOS系统手机上实现1024×1024分辨率图像的秒级生成,具有成本低、质量高、速度快、轻量级、可离线特点 [2] - 新版本“橘洲”在参数量降低到1/50、训练速度提升5倍、生成速度提升7倍的基础上,经行业数据训练后即可成为垂类大模型 [2] - 加速进化推出升级款机器人Booster T1,其结合千诀类脑大模型开发,可以听懂模糊语言指令并全自主做家务 [2] AI工具应用与功能创新 - Perplexity联合创始人兼CEO宣称已告别PPT,仅通过AI工具完成投资者路演,其A轮融资后仅写备忘录并让投资者直接提问 [3] - 马斯克称Grok将推出AI视频检测工具,具备识别AI生成视频并追踪其网络来源的能力,以应对深度伪造内容 [3] - Grok的升级功能可直接在视频比特流中分析AI生成特征,识别出压缩或生成过程中留下的细微痕迹 [3]
字节视觉大模型负责人杨建朝宣布休息
快讯· 2025-07-17 18:18
人事变动 - 字节跳动豆包大模型视觉多模态生成方向负责人杨建朝宣布"暂时休息",相关工作已完成交接 [1] - 杨建朝的个人信息仍能在字节内部系统中查询到 [1] - 周畅(花名"时光")将接任杨建朝的工作,周畅所在架构为"多模态交互与世界模型"部门,汇报对象为吴永辉 [1] 变动原因 - 知情人士透露人事变动原因为"家庭因素" [1] - 此前有传言称杨建朝因难以兼顾北美与国内工作节奏,长期处于高强度压力下,身心俱疲 [1] - 另有说法称其为"提前退休" [1]
冰箱市场销售量额双增
经济日报· 2025-06-06 06:04
市场表现 - 一季度国内冰箱市场零售量996万台同比增长2.7% 零售额320多亿元同比增长3.8% [1] - 线上6000-8000元价格段冰箱零售额增长37.4% 8000-10000元价格段增长89.6% [1] - 线下8000-10000元价格段冰箱零售额增长16% 10000-15000元价格段增长21% [1] 政策与需求驱动 - 中央财政补贴政策对品质消费形成精准拉动 推动行业均价稳步提升 [1] - 消费品以旧换新政策实施带来广阔市场空间 换新消费占全年零售量80%-90% [2] - 消费者需求呈现多元化精细化趋势 从简单存储转向更复杂功能 [2] 产品与技术趋势 - 企业深耕保鲜科技 AI食材管理 嵌入式设计等创新技术赛道 [1] - 海尔推出首款接入DeepSeek的AI全空间保鲜冰箱 可生成个性化保鲜方案 [2] - 智能冰箱技术方向包括视觉大模型 食材自动识别 数据融合与场景创新 [3] - 未来3-5年智能交互 智能保鲜 AI多模态识别 算法大模型等将成技术深耕方向 [3] 市场结构变化 - 大容积冰箱是确定性发展趋势 同时300-400升小冰箱也有潜在发展机会 [2] - 小冰箱市场需要配备与高端产品相同的技术功能 实现"小而美"发展 [2] - 中高端市场对行业增长形成显著拉动作用 [1] 企业战略 - 部分企业现阶段以规模增长为核心目标 通过高性价比策略扩大市场份额 [3] - 行业需将创新根植于用户真实需求 在存量市场中开辟新增量 [4] - 企业需持续进行差异化创新 满足市场升级需求 [2]
击败Runway和快手可灵,生数科技Vidu Q1登顶成为最强视觉大模型
证券时报网· 2025-04-22 19:38
模型性能表现 - Vidu Q1在VBench-1.0和VBench-2.0测评中超越Runway Gen-3、OpenAI Sora及快手Kling1.x等国内外顶尖模型 位列文生视频赛道双榜单第一 [1] - 在表面真实性维度(美学质量/对象生成/场景生成/视频语义一致性)和内在真实性维度(物理规律/常识推理)均达到SOTA水平 [1] - 国内SuperCLUE图生视频榜单中 动漫风格与写实风格双赛道均获第一 [2] 技术特性升级 - 支持生成5秒1080P高清视频 实现电影级画质与复杂场景运镜能力 [2] - 新增首尾帧功能:通过两张图片自动生成中间镜头 支持推/拉/摇/移等专业镜头语言 [2][3] - 升级动画风格动态表现力 并新增AI音效生成功能 支持多音效叠加 [2] - 可精准呈现物理变化过程(例如水转冰晶的形态变化) 替代传统专业摄像需求 [3] 商业化应用与定价 - 支持直接生成适用于动漫/短剧/电商/品牌广告的商用视频 实现"即生成即商用" [3] - 定价具备竞争力:5秒1080P视频仅需1.34元 相当于每秒0.3元 为同行价格的十分之一 [3] - 全球同步上线 无需排队或内测申请 降低使用门槛 [3] 公司背景与融资 - 核心团队源自清华大学人工智能研究院 CEO唐家渝为清华计算机系本硕 首席科学家朱军任清华人工智能研究院副院长 [4] - 2023年4月发布中国首款长时长高一致性视频大模型Vidu 被称为"中国版Sora" [4] - 已完成多轮融资 投资方包括北京市人工智能产业投资基金/中关村科学城/启明创投/蚂蚁集团/BV百度风投等机构 [4]