dots.vlm1

搜索文档
计算机行业周报:OpenAI发布GPT-5,AI创新不断加速-20250811
国元证券· 2025-08-11 11:45
[Table_Main] 行业研究|信息技术|软件与服务 证券研究报告 计算机行业周报 2025 年 08 月 11 日 [Table_Title] OpenAI 发布 GPT-5,AI 创新不断加速 ——计算机行业周报 [Table_Summary] 报告要点: 本周(2025.8.4-2025.8.8)市场回顾 投资观点 本周,OpenAI 发布新一代旗舰模型 GPT-5,拥有 GPT-5、GPT-5-mini、 GPT-5-nano 和 GPT-5-pro 四个版本,GPT-5 的输入、输出价格分别 为每百万 token 1.25 美元/10 美元。在多项基准测试中,GPT-5 超过 了 OpenAI o3、GPT-4o 等 OpenAI 最强大的模型,在数学、编码、视 觉感知和健康方面表现尤其出色。GPT-5 将非推理模型与推理模型融 为一体,支持"按需思考",即根据任务难度,自行判断是否进行思考, 并提供合适的回答。它还拥有 4 种"人格",分别为愤世嫉俗者、机器 人、倾听者和书呆子。OpenAI CEO Sam Altman 认为,GPT-5 已经 达到了博士级别的智能,与其对话就像是与一位在任何 ...
AI周报|OpenAI发布大模型GPT-5;谷歌推出可交互的世界模型Genie 3
第一财经· 2025-08-10 12:13
OpenAI发布GPT-5 OpenAI强调GPT-5的幻觉率下降,而且对人类的"阿谀奉承"减少了。 当地时间8月7日,OpenAI推出基础大模型更新,GPT-5面世了。OpenAI表示,这是公司迄今为止最智 能、最快、最有用的模型,有内置思维能力,可以将专家级智能交到每个人手中。这款模型在编程、数 学、写作、健康、视觉智能等领域有最先进的性能,且知道何时应该快速响应、何时应该思考更长时 间。目前GPT-5可供所有用户使用,但免费用户还需要等待几天时间才能使用完整的推理功能。 点评:OpenAI强调GPT-5的幻觉率下降,而且对人类的"阿谀奉承"减少了。从基准测试看,GPT-5在不少 基准测试中的得分超过o3和o4-mini,不过GPT-5的分数与前代模型的差距并没有很大。这款模型的能力 能否代表最先进的人工智能水平,还需要观察。该模型发布后,特斯拉CEO马斯克表示,Grok 4在 ARC-AGI基准测试中击败了GPT-5。 OpenAI推出两款开源模型 北京时间8月6日凌晨,OpenAI开源了gpt-oss-120b和gpt-oss-20b两个推理模型,这是OpenAI时隔六年再 次开源模型。其中gpt-o ...
OpenAI发布最强AI模型GPT-5;英特尔CEO发全员信:回应辞职要求;微信员工回应“改手机日期可恢复过期文件” | Q资讯
搜狐财经· 2025-08-10 10:43
OpenAI 发布其最强大 AI 模型 GPT-5 整理 | 梓毓 OpenAI 发布其最强大 AI 模型 GPT-5;英特尔 CEO 陈立武亲写员工信回应,暗示未来不会辞职;微软启动新裁员;"网易游戏崩了"冲上热搜;字节跳动 2026 校招启动;微信员工回应改手机日期恢复过期文件;OpenAI 发布开放权重人工智能模型…… 行业热点 北京时间 8 月 8 日凌晨,人工智能(AI)领先企业 OpenAI 正式发布备受瞩目的新一代人工智能模型 GPT-5。据介绍,GPT-5 有诸多亮点,包括根据需求 智能切换模型版本,可实现更低的幻觉率、更强的代码能力,且支持个性化设定等等。 OpenAI 称,GPT-5 在关键编码基准测试中处于行业领先水平(SOTA),在 SWE-bench Verified 测试中得分 74.9%,在 Aider polyglot 测试中得分 88%。 OpenAI 称,通过训练,使 GPT-5 成为真正的编码协作伙伴。它擅长生成高质量代码并处理诸如修复漏洞、修改代码以及解答复杂代码库相关问题等任 务。 该模型具备可控性和协作性——它能够以极高精度执行非常详细的指令,并在工具调用前及期间提 ...
特朗普:英特尔CEO必须立即辞职;GPT-5将免费提供给用户;宗馥莉公司投资10亿建新基地;微信重申不做“已读”功能丨邦早报
创业邦· 2025-08-08 08:08
AI模型与技术进展 - GPT-5正式发布,在文本、网页开发、视觉、高难度提示词、编程、数学、创意创作、长查询等领域均排名第一,Arena评分为1,481±11分,领先第二名Gemini 2.5 Pro(1,460分)[3][4] - GPT-5采用集成模型,无需手动切换模型,可自主决定深入思考时机,将免费向所有用户开放,并逐步向企业及教育用户推出[4] - 阿里通义千问发布小尺寸模型Qwen3-4B,在非推理领域超越GPT4.1-Nano,推理能力接近Qwen3-30B-A3B,已开源[18] - 小红书开源多模态大模型dots.vlm1,基于12亿参数视觉编码器和DeepSeek V3 LLM,视觉感知与推理达准SOTA水平[18] 企业动态与战略调整 - 宗馥莉旗下宏胜饮料投资10亿元建西安饮品新基地,新增多条产线生产纯净水、茶饮等,娃哈哈年初以来已关停18家分厂[5] - 盒马辟谣闭店传闻,称仅调整2%探索型业务门店,计划年内新开100家店,总门店数将超500家[11] - 广汽本田中方一把手换帅,高洪祥接替李进任执行副总经理,目前正交接[14] - 特斯拉解散Dojo超级计算机团队,约20名员工转至新公司DensityAI,剩余成员分配至其他项目[14] 自动驾驶与机器人 - 萝卜快跑无人网约车在重庆坠入施工沟槽,官方未回应事故原因[5] - 东风纳米06车型L2智能驾驶辅助被曝向右跑偏,公司称因端到端模型训练偏差,计划10月OTA更新优化[13][14] - 全球首家人形机器人4S店Robot Mall在北京开业,展示7大类50多款机器人,涵盖医疗、工业等场景,2.0版本预计11月推出[14] - 傅利叶发布全尺寸人形机器人GR-3,配备55个自由度,续航3小时,主打交互陪伴[16] 投融资与创业 - 陈天桥联手清华副教授代季峰筹备AI公司,聚焦商业决策、内容分发及老龄化服务,承诺半数利润分给团队[11] - 具身智能公司维他动力完成天使轮融资,首款伴随机器人年底上市[15] - 芝诺科技获数千万元Pre-A轮融资,专注合成生物学[15] - 灵心巧手完成数亿元天使轮融资,蚂蚁集团领投[15] 互联网与科技 - 微信官方重申不做"已读"功能,称避免增加社交压力[7] - 马斯克宣布Grok Imagine视频生成功能将免费向美国用户开放,未来几周持续优化[16] - 亚马逊广告报告显示2025年全球PC与主机游戏玩家达14.3亿,同比增长19%,日本PC/主机玩家增速为手游4倍[18] 行业数据与趋势 - 2025年中国电影总票房突破350亿元[19] - 美团揭露卖惨视频套路化现象,虚构故事引流私域卖课,已对违规账号固定证据并追责[11] - 本田4-6月净利润同比下滑50.2%至1966亿日元,受美国关税政策影响[15]
腾讯研究院AI速递 20250808
腾讯研究院· 2025-08-08 00:01
GPT-5系列模型 - OpenAI提前披露GPT-5四个版本:标准版gpt-5、轻量版gpt-5-mini、低延迟版gpt-5-nano和多模态复杂对话版gpt-5-chat [1] - 模型将分层开放:免费用户用基础版,Plus用户用更强推理版,Pro用户独享"研究级智能"的GPT-5 Pro [1] - 实测显示SimpleBench推理测试准确率达90%,需特定提示激活复杂思考,编程和视觉表现有提升但未达惊艳水平 [1] MiniMax语音模型 - 新一代Speech 2.5模型支持40种语言真人级生成,实现跨语种音色保留和口音复刻 [2] - 相比5月版本在多语种自然表达、音色复刻和语种覆盖三方面突破 [2] - 已被Vapi、Pipecat等海外平台及高途教育、喜马拉雅、网易等国内头部平台接入 [2] 小红书多模态模型 - 开源首个多模态大模型dots.vlm1,基于12亿参数NaViT视觉编码器和DeepSeek V3构建 [3] - 视觉理解能力接近Gemini 2.5 Pro和Seed-VL1.5 Thinking,能解数独、破解高考数学题等 [3] - 两个月内连续开源dots.llm1、dots.ocr、dots.vlm1三款模型,反映技术自研力度加大 [3] 面壁小钢多模态模型 - MiniCPM-V 4.0仅用4B参数在OpenCompass等榜单取得SOTA成绩,支持手机端稳定运行 [4] - 显存占用仅3.33GB,256并发下吞吐量达13856 tokens/s,远超Qwen2.5-VL和Gemma 3 [4] - 开源推理部署工具MiniCPM-V CookBook便于开发者简易部署 [4] 通义千问新模型 - 发布Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两款小尺寸模型,支持256K上下文 [5][6] - Qwen3-4B-Thinking在AIME25测评得81.3分,Agent能力超越Qwen3-30B-Thinking [6] - Qwen3-4B-Instruct全面超越GPT-4.1-nano,性能接近Qwen3-30B-A3B [6] 大模型对抗赛 - OpenAI的o3以4比0完胜o4-mini,展现100%准确率 [7] - Grok 4与Gemini 2.5 Pro常规赛2比2平,加赛逼和对手晋级 [7] - 决赛由Grok 4对阵o3,国际象棋冠军Magnus Carlsen等将解说 [7] Gemini教育功能 - 推出"引导式学习"模式,通过问题分解、视觉辅助和互动测验构建知识 [8] - 为美日等国大学生提供一年免费AI Pro计划(价值200美元) [8] - 承诺三年内向美国教育投入10亿美元 [8] 具身智能技术 - Skild AI推出端到端视觉感知控制方案,实现机器人稳定爬楼梯和复杂障碍通过 [9] - 采用纯视觉输入方法,通过单一神经网络实现"本能级"动作控制 [9] - 优势在于连贯运动切换和环境适应能力,可实时调整动作应对地形 [9] 理想汽车智驾 - 推出国内首个量产VLA模型,在视觉和行为间加入语言环节使决策更拟人 [10][11] - 系统每天通过"世界模型仿真系统"行驶30万公里迭代,4B模型实现10Hz帧率 [11] - 预计辅助驾驶明年达1000MPI里程碑 [11] AI应用平台趋势 - a16z认为AI应用平台将走向专业化而非赢者通吃,形成互补共存 [12] - 市场分化为原型制作、个人软件和生产级应用三类,70%用户仅活跃于单一平台 [12] - 未来三至五年每类别将出现2-3家主导企业 [12]