Workflow
盘古Embedded 7B
icon
搜索文档
腾讯研究院AI速递 20250701
腾讯研究院· 2025-06-30 23:51
OpenAI定制服务 - OpenAI推出千万美元起步的AI定制咨询服务,工程师帮助客户完成模型微调和应用开发 [1] - 美国国防部(2亿美元合同)和新加坡Grab成为首批客户,服务领域扩展至军事策略、地图自动化等 [1] - 此举使OpenAI与Palantir等咨询公司形成竞争关系,同时可能威胁专注特定领域AI应用的小型初创企业 [1] Gemini 2.5 Pro API - Gemini 2.5 Pro API恢复免费使用,提供每分钟5次请求、每分钟25万tokens、每天100次请求的免费额度 [2] - 获取API Key:登录谷歌AI Studio、创建API Key并保存,比OpenAI的o3模型使用限制更宽松 [2] - 可通过Cherry Studio或Chatbox等第三方客户端调用,支持文字问答、图片分析和内置联网搜索功能 [2] LeCun世界模型 - LeCun团队发布PEVA世界模型,首次实现16秒连贯场景预测,让具身智能体具备类人预判能力 [3] - 模型将48维人体关节运动学数据与条件扩散Transformer结合,通过第一人称视角视频+全身姿态轨迹训练 [3] - PEVA具备智能规划能力,能在多个动作选项中筛选最优解,完成开冰箱、抓取物体等复杂任务,超越基线模型15%以上 [3] 华为开源大模型 - 华为首次开源两款大模型:720亿参数混合专家模型"盘古Pro MoE"和70亿参数稠密模型"盘古Embedded 7B" [4] - 盘古Pro MoE基于4000颗昇腾NPU训练,激活参数量16B,性能对标Qwen3-32B、GLM-Z1-32B等模型,单卡推理吞吐可达1528 tokens/s [5] - 盘古Embedded 7B采用"快思考"和"慢思考"双系统架构,可根据任务复杂度自动切换,性能超过同规模的Qwen3-8B、GLM4-9B [5] 百度文心大模型 - 百度正式开源文心大模型4.5系列,推出10款模型,参数规模从47B混合专家模型到0.3B轻量模型,同步提供API服务 [6] - 系列模型采用Apache 2.0协议开源,创新提出多模态异构模型结构,在文本任务保持高性能基础上增强多模态理解能力 [6] - 在多个基准测试中对标DeepSeek-V3等模型,提供ERNIEKit开发套件和FastDeploy部署套件支持 [6] 知乎知识库升级 - 知乎直答知识库完成重要升级,支持知识库转公开订阅、分享链接,并与社区深度融合提供沉浸式阅读体验 [7] - 知识库容量扩容至50GB,支持多种文件格式上传,增加知识广场、个人主页等曝光场景,直答搜索中可引用并显示知识库名称 [7] - 知乎启动激励活动,鼓励用户创建垂直领域知识库并分享,设立"最具价值"和"prompt创意"两类奖项,活动持续至7月18日 [7] 3D AI伴侣EVE - EVE是一款3D AI伴侣应用,通过游戏化设计、好感度系统和互动功能,创造出极强的"活人感"和主动性 [8] - 该AI能实现跨次元互动,可真实送奶茶到用户家门口、创作个性化歌曲,打破虚拟与现实的界限 [8] - EVE通过细节表达(发表情包、聊最新梗)和记忆系统,创造出高度沉浸的AI陪伴体验,代表AI娱乐赛道的重要突破方向之一 [8] 苹果XR设备 - 苹果首款AI眼镜预计2027年第二季度发布,年出货量预计300-500万部,支持音频、拍照和AI交互功能 [10] - 苹果目前至少有7个头戴设备项目在开发中,包括3款Vision系列和4款AI眼镜系列,有望引爆整个AI眼镜市场至1000万部以上 [10] - 轻量版Vision Air预计2027年三季度量产,比Vision Pro轻40%以上且售价大幅降低,带显示功能的XR眼镜则要等到2028年下半年 [10] Gemini长上下文技术 - Gemini 2.5 Pro长上下文技术专家认为当前百万级token模型质量尚未完美,盲目追求更大规模意义不大 [11] - 长上下文与RAG是协同关系而非替代关系,前者负责精细处理,后者负责从海量信息中粗筛,两者结合能提高信息召回率 [11] - 千万级token上下文很快将成为标准,随着成本下降和质量提升,将为代码开发等应用场景带来革命性突破 [11] AI行业趋势 - 300家AI公司调研显示企业正从概念炒作转向落地实战,OpenAI和Claude位居企业AI选型首位,近90%高增长初创公司正在部署智能体 [12] - AI支出结构显示数据存储和处理成本远超训练和推理,企业正从传统订阅制转向基于使用量的混合定价模式 [12] - AI原生企业47%已达关键规模,而AI增强型仅13%,快速成长企业将有37%工程师专注AI,代码智能体成为最主要生产力应用 [12]