Gemini嵌入模型

搜索文档
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-07-18 19:14
芯片与算力 - 英伟达H20 AI芯片销售成为芯片领域关注焦点 [2] - Meta部署Prometheus集群以提升算力能力 [2] 模型进展 - DeepMind推出MoR架构优化模型性能 [2] - OpenAI等公司采用CoT监控技术增强模型训练 [2] - 谷歌发布Gemini嵌入模型拓展多模态能力 [2] - UCSD和NYU联合开发MIRIX记忆系统提升模型记忆能力 [2] - Kimi推出K2模型聚焦垂直领域应用 [2] - xAI的Grok 4进入实测阶段 [2] - 微软研发Orbformer模型探索新型架构 [3] 应用创新 - 亚马逊推出AgentCore和Kiro IDE支持AI开发 [2][3] - Jackywine发布3D AI女友应用 [2] - 谷歌推出AI代打电话功能 [2] - Windsurf的Claude 4模型回归市场 [2] - CrePal开发视频创作Agent工具 [2] - 苹果增加CUDA支持优化AI计算 [2] - Mistral发布Voxtral语音模型 [2] - MiniMax布局Agent全栈开发 [2] - 昆仑万维推出AgentOrchestra框架 [2] - DeepMind开源Concordia软件库 [2] - ima推出学霸笔记AI学习工具 [2] - Grok上线AI智能伴侣功能 [2] - 秘塔AI推出DeepResearch工具 [2][3] - Perplexity发布AI Agent浏览器 [3] - 智源研究院升级RoboBrain 2.0 [3] - 美图推出AI影像Agent [3] - B站发布IndexTTS2语音合成技术 [3] - 拍我AI实现多关键帧生成功能 [3] - Higgsfield推出Soul ID身份识别系统 [3] 科技突破 - 他山科技研发触觉感知芯片 [3] - 多机构联合推出LabUtopia平台 [3] - 德克萨斯大学开发MedAgentGym医疗AI训练系统 [3] 行业观点 - John Jumper提出AI4Science科学应用前景 [3] - 英伟达关注中国供应链动态 [3] - Jason Wei探讨强化学习(RL)的边界问题 [3] - OpenAI分析AI对职场的影响 [3] - 《纽约客》讨论AI伴侣的社会影响 [3] - OpenAI强调结构化沟通在AI开发中的重要性 [3] - Perplexity阐述AI搜索战略 [3] - Karpathy提出AI氛围阅读概念 [3] - YC探讨AI时代生存策略 [3] - Kevin Lu分析互联网与AI的关键联系 [3] - METR指出AI编程的反直觉现象 [3] 资本动态 - Anthropic启动人才挽回计划 [3] - Meta收购PlayAI [3] - OpenAI收购Windsurf失败 [3] 行业事件 - Meta涉及人才挖角事件 [3] - Grok 4面临敏感问题处理挑战 [4] - OpenAI推迟开源模型计划 [4]
谷歌发布Gemini嵌入模型,拓展基础层NLP能力
海通国际证券· 2025-07-18 15:34
报告行业投资评级 未提及 报告的核心观点 - 谷歌发布Gemini嵌入模型是对OpenAI在语言底座层的反超尝试,建议关注其在核心产品的集成节奏及对云服务商间NLP能力差异化格局的影响 [3] - 嵌入层将成为AI工作流新价值高地,谷歌嵌入模型有望快速落地多产品层构建数据闭环,超低定价或引发嵌入API服务价格战 [5] 根据相关目录分别进行总结 事件 - 2025年7月15日谷歌发布首个文本嵌入模型Gemini - embedding - 001并开放API,该模型以68.37分刷新MTEB排行榜,领先OpenAI的58.93分,定价为每百万tokens 0.15美元,面向开发者和独立创作者开放 [1][12] 点评 - 模型性能大幅领先,在MTEB的9大类任务中全面领先,为嵌入应用带来性能增益,确立嵌入领域新标杆 [2][13] - 价格极致下探,百万tokens定价仅0.15美元,相比OpenAI嵌入模型便宜数倍,降低调用门槛,释放中小企业等生产力,是“平台式让利”行动 [2][14] - 强化Gemini模型矩阵,使Gemini拥有“理解 - 匹配 - 表达”能力,构建谷歌在AI工作流中的底层核心竞争力 [2][15] 战略意义 - 谷歌发布Gemini嵌入模型是从内容生成向语义理解全栈平台战略的关键一跃,嵌入模型在AI多模态 + 多Agent协同方向下重要性被重新定义 [3][16]
腾讯研究院AI速递 20250716
腾讯研究院· 2025-07-15 23:09
英伟达恢复对华销售H20 AI芯片 - 美国政府授予英伟达许可恢复向中国销售H20 AI芯片[1] - 政策转变源于黄仁勋与特朗普会面强调公司对美国就业和AI领先地位的支持[1] - 2025财年Q1收入达26044亿美元同比增262% 数据中心业务226亿美元为核心增长点[1] Meta超算集群建设规划 - 2026年投运1GW「Prometheus」AI集群 算力相当于核电站或百万人口城市用电量[2] - 2027年「Hyperion」计划扩容至5GW 占地面积对标曼哈顿 配套自建天然气电厂[2] - 算力规模远超OpenAI星际之门(300-500MW)和马斯克Colossus项目(250MW)[2] 马斯克Grok 4智能伴侣功能 - 推出动漫角色Ani(含NSFW模式)和卡通熊猫Rudy 具备3D动画与语音交互能力[3] - 中文发音仍显机械 交互动作待优化 功能处于早期阶段[3] - 新增提示词生成HTML5游戏功能 可自主整合3D模型与纹理[3] 亚马逊Kiro IDE工具发布 - 提供氛围编码与规划双模式 通过规约(Specs)和挂钩(Hooks)实现规格驱动开发[4] - 自动转化需求为技术设计图 文档代码同步 挂钩自动化检查流程[5] - Anthropic同步更新Claude Code支持Windows 可替换为Kimi K2模型[5] 谷歌Gemini嵌入模型突破 - MTEB评测68.37分超越OpenAI(5893分) 价格仅015美元/百万token[6] - 32层Transformer架构 采用MRL技术支持多维嵌入输出[6] - 两阶段训练(预微调+精调) 在检索/分类/聚类任务表现优异[6] 秘塔AI深度研究功能 - 可视化问题链展示搜索/思考/决策过程 支持互动网页与图表生成[7] - 用户可管理来源偏好(屏蔽/优先网站) 免费版每日100搜索额度(单次消耗20-30)[7] - 年费会员每日500次 研究质量对标OpenAI DeepResearch[7] UCSD&NYU多模态记忆系统 - MIRIX在ScreenshotVQA基准准确率比RAG高35% 内存占用减少999%[8] - 设计6类人记忆系统(核心/情景/语义等) 通过多智能体协作构建认知基础[8] - 已开源并发布Mac应用 支持文本/截图/对话日志多模态输入 SQLite本地存储[8] 微软Orbformer量子化学模型 - 解决多参考体系精度与效率矛盾 计算成本降低两个数量级[10] - 三模块架构: 原子核MPNN/动态轨道生成器/电子Transformer[10] - 键解离等测试达化学精度(1 kcal/mol) 实现分子间计算共享[10] OpenAI工程师谈编程趋势 - 未来程序员价值80-90%来自结构化沟通 代码仅占10-20%[12] - 规约(Specification)比代码更重要 可完整捕捉意图与价值观[12] - 模型规约实践案例: Markdown文档版本化管理 解决GPT-4o谄媚问题[12]