Workflow
RedOne
icon
搜索文档
产业观察:【AI产业跟踪】字节开源AI Agent Coze
国泰海通证券· 2025-08-04 23:13
AI行业动态 - 上智院等联合发布星河启智科学智能开放平台,具备六大核心能力,支持多学科众研和干湿实验闭环[7] - 燧原科技AI算力部署规模达七万卡,推理卡"燧原 S60"支撑互联网客户及智算中心需求[30] AI应用资讯 - 商汤发布悟能具身智能平台,日日新V6.5多模态推理大模型跨模态推理精度超Gemini 2.5 Pro,性价比提升5倍[8] - 华为发布异腾智算平台AI-Box,搭载异腾400I Pro芯片,支持多模态大模型本地运行,适配工业质检等场景[9] - 腾讯发布具身智能开放平台Tairos,提供多模态感知、规划等模型及云服务工具,与硬件厂商合作推动行业落地[10] AI大模型资讯 - 阶跃Step 3模型总参数321B,激活参数38B,推理效率达DeepSeek-R1的300%,2025年预计收入近10亿[11] - 字节开源AI Agent Coze,GitHub星标超6000,支持可视化开发和一键分享至主流平台[14] - 智谱发布GLM-4.5融合大模型,总参355B,激活参32B,API价格低且生成速度快,获全球开源模型第一[17][22] - 京东云开源企业级全栈智能体JoyAgent,支持多智能体协同与并行处理,已应用于零售采销等场景[18] 科技前沿 - 后摩智能发布存算一体端边AI芯片M50,物理算力160TOPS,典型功耗仅10W,支持多模态大模型本地推理[32] - 钛动科技发布全球营销Agent Navos,将传统营销周期从数月缩至几天,提升人力资源效率数十倍[28]
AI进化速递丨小红书推出首个社交大模型
第一财经· 2025-08-01 20:50
小米浏览器接入豆包大模型 - 小米浏览器宣布接入豆包大模型以增强功能 [1] 小红书推出社交大模型 - 小红书宣布推出首个社交大模型"RedOne" [1][3] OpenAI启动挪威项目 - OpenAI即将启动"星际之门"挪威项目 [1][4] 马斯克推出Grok新功能 - 马斯克宣布将向Grok Heavy订阅用户推出Imagine和Valentine测试版 [1][4]
小红书宣布推出首个社交大模型“RedOne”
智通财经· 2025-08-01 09:56
社交平台小红书宣布推出首个社交大模型"RedOne",为一款面向SNS(社交网络服务)领域的定制化 LLM,旨在突破单一任务基线模型的性能樽颈,且构建全面覆盖SNS任务的基座模型。 相较于基础模型,RedOne在八个主要的SNS任务上平均提升14.02%,在SNS双语评测基准上提升 7.56%。同时,在在线测试中,相较于单任务微调的基线模型,RedOne将有害内容检测(Harmful Content Detection)中的曝光率降低11.23%,将浏览后搜索(Post-view Search)中的点击页面率提升14.95%。 ...
小红书提出首个社交大模型:八大社交任务平均提升14.02%
量子位· 2025-08-01 08:46
核心观点 - 小红书推出行业首个社交大模型RedOne,专为SNS领域定制,突破单一任务基线模型的性能瓶颈,构建全面覆盖SNS任务的基座模型 [1] - RedOne在8个主要SNS任务上平均提升14.02%,在SNS双语评测基准上提升7.56% [1] - 线上测试显示RedOne将有害内容检测曝光率降低11.23%,浏览后搜索点击页面率提升14.95% [1] - RedOne采用三阶段训练策略(CPT→SFT→PO),实现"懂社交、懂规则、懂用户"的目标 [5] 模型性能 - RedOne在通用任务中保持优异表现,部分任务超越基座模型Qwen2.5 [26] - 在SNS领域任务上,RedOne平均提升14.02%,双语评测提升7.56% [1] - 与基础模型对比,RedOne在QueryCorr任务上提升12.63%,MRC任务提升2.76% [27] - 基于RedOne的微调模型在所有数据集上均超过基于Qwen2.5的微调模型 [28] 训练框架 - 采用三阶段训练策略:继续预训练(CPT)、监督微调(SFT)、偏好优化(PO) [5] - CPT阶段构建超千亿tokens数据集,最终筛选出200亿tokens高质量数据 [9][11] - SFT阶段整合六项核心能力:内容理解、信息提取、语义匹配、用户行为建模、对话和角色模拟、翻译能力 [16] - PO阶段采用直接偏好优化(DPO)算法,构建主观和客观任务的偏好数据集 [20][21] 数据特点 - SNS数据具有高度非规范化、强上下文依赖、显著情绪化特征 [3] - 数据收集包括通用高质量数据和SNS领域数据,后者涵盖多种社交沟通模式 [8] - 数据筛选采用规则筛选和基于小型LLM的筛选,确保数据质量 [10] - 最终构建包含200亿tokens的高质量数据集 [11] 线上应用 - 有害内容检测中违规笔记曝光率降低11.23% [32] - 浏览后搜索用户点击页面率提升14.95% [32] - 案例研究显示RedOne能精准锁定用户需求关键词 [36] 技术优势 - 三阶段训练呈现"层层递进、相互增强"效果,通用性能几乎无损 [31] - 引入通用领域数据显著提升模型在OOD任务上的泛化能力 [35] - 模型规模增加时性能持续提升,表现巨大潜力 [26] 行业意义 - 首个全面覆盖SNS领域的定制化LLM [5] - 为后续专用垂域LLM落地提供参考 [37] - 助力社交媒体内容治理与高质量互动 [37]