小熊跑的快

搜索文档
 DeepSeek 偷偷发布了v3.1
 小熊跑的快· 2025-08-21 18:16
 核心性能突破 - 上下文窗口扩展至128K tokens,较上一代64K实现翻倍提升,可处理约10万-13万汉字,相当于两本200页小说或400页书籍的文本量 [1] - 通过Transformer架构的内存管理优化,改进注意力机制计算效率与上下文状态追踪能力,解决上下文丢失与响应碎片化问题 [1] - 线上模型版本与开源版本保持一致的128K上下文能力,确保企业级用户与开发者获得同等长文本处理性能 [1]   场景验证与应用 - 在企业级应用中显著提升法律合同审查、学术论文综述等场景效率,可一次性输入400页合同或约10万字博士论文并保持逻辑连贯性与细节准确性 [2] - 在开发者场景中支持大型代码库依赖分析、技术文档解析及检索增强生成任务,解决旧版偶发的死循环输出或信息割裂问题 [2] - 处理接近上下文极限(约9%,即10万字级)输入时仍保持输出速度与准确性,支持持续数小时长对话场景,为智能客服等交互系统提供技术支撑 [2]   编程能力突破 - 在Aider Polyglot多语言编程基准测试中以71.6%得分超越Claude Opus 4,成为开源模型中表现最佳的非推理模型之一,且推理速度更快 [4] - SWE代码修复测试与Terminal-Bench终端任务表现显著提升,Python与Bash代码生成准确率达60%,较V3版本提升数个百分点 [4] - 支持复杂工程化开发,包括使用p5.js编写含重力与碰撞检测的交互程序、Three.js构建三层粒子星系系统,以及全栈开发中一次性生成800行无错误代码 [5][6]   成本优势与市场影响 - 完成典型编程任务平均成本仅1.01美元,为闭源模型的1/68,对中小企业开发流程具有颠覆性意义 [7] - "开源模型+高性能+低成本"组合打破编程工具市场现有格局,推动开发模式向本地化、高效率、低门槛方向演进 [7]   智能体能力增强 - 通过后训练优化提升工具使用与函数调用能力,支持代码编写、命令行操作及网络搜索整合实时信息,实现从顾问向工程师的角色升级 [8] - 原生支持Anthropic API格式,允许开发者直接复用Claude Code框架工具调用逻辑,降低生态迁移成本 [9] - Strict Mode函数调用在金融数据接口场景中格式准确率达99%,杜绝参数类型错误或字段缺失导致的调用失败 [10]   开发效率优化 - 工具调用模板库减少80%的Prompt工程工作量,平均接入时间从2天缩短至1天,效率提升50% [11] - 通过搜索Token与思考Token支持内部推理步骤拆分,使智能体自主规划工具调用顺序,减少人工干预环节 [12]   编程与搜索智能体 - 企业用户报告典型编程任务成本约1美元,远低于闭源竞品近70美元水平,且在创意开发中可复现Chrome断网小恐龙游戏核心功能 [14] - 搜索智能体在browsecomp复杂搜索测试与HLE多学科专家级难题测试中大幅领先前代版本,强化多步推理与跨领域知识整合能力 [14] - 在企业DevOps流程中自动化生成部署脚本,端到端任务成本仅为使用Claude-3.5的1/30,代码调试场景成本为传统专有系统的1/60 [15]   API定价与成本效率 - API输入价格调整为缓存命中时0.5元/百万tokens、未命中时4元/百万tokens(此前V3为2元/百万tokens),输出价格为12元/百万tokens(此前V3为8元/百万tokens) [16] - Token效率提升20%-50%且推理速度达60 TPS,有效抵消价格调整影响,整体性价比保持行业领先 [17]
 intel 大涨 台积电跌
 小熊跑的快· 2025-08-20 09:49
 美股市场表现 - 美股走势呈现两极分化态势 [1]   芯片行业动态 - 在台流片的芯片股平均下跌3% [3]   美国贸易政策影响 - 特朗普政府推动制造业回流及自主可控战略 [4] - 扩大对钢铁和铝衍生产品进口征收50%关税 新增数百种产品至加征清单 [4]
 十年新高?
 小熊跑的快· 2025-08-18 11:28
 上证指数市场表现 - 指数今开3712.50 较昨收3696.77上涨0.42% 最高触及3738.59 最低下探3702.38 [1] - 成交额达6917.87亿 成交量4.76亿手 均线系统呈多头排列(EXPMA15:3526.21↑ EXPMA50:3354.01↑) [1] - 年内累计涨幅11.53% 近20日涨幅5.01% 市盈率16.0倍 市净率1.47倍 [1]   科技板块动态 - 科技龙头股表现强势 推动市场创阶段性新高 [3] - 板块热度集中于科技领域 成为近期市场主要驱动因素 [3]
 为啥大屁股 这么强?
 小熊跑的快· 2025-08-17 16:23
 市场趋势分析 - 当前市场环境下大市值股票表现强劲 被认为是正常现象 [1] - 具备良好业绩的公司成为稀缺品种 受到市场追捧 [1] - 大市值公司更容易融入全球产业链 相比小市值公司更具优势 [1]   业绩稀缺性 - 能够实现业绩大幅增长的公司资产 是当前市场最稀缺的资源 [1] - 真正通过调研和研究发现 业绩优秀的公司具有极高价值 [1] - 大市值公司更容易释放利润 这一特点在当前市场尤为突出 [1]
 液冷 还能说啥?
 小熊跑的快· 2025-08-15 12:08
 液冷技术趋势 - 英伟达GB200 NVL72采用冷板式液冷 液冷服务器比风冷版性能高25% 功耗降低30% [1] - TPU芯片液冷比例将大幅上升 预计超过65% 因v7单卡算力达4614tflops 较v6的1836tflops提升2.5倍 单芯片内存提升4.5倍 [1] - 微软宣布所有Azure区域数据中心均支持液冷技术 提升设备灵活性和可替代性 [3]   芯片与服务器市场动态 - 英伟达2024年预计出货近3万台GB200 近1万台GB300 以及超200万张B200单卡 [5] - 2025年GB300出货预期上调至10万台 机柜将全部采用液冷方案 并可能引入国产供应链以降低成本 [5] - MI355X液冷方案可扩展至128卡(2U-5U机架) 而MI350仅支持64卡扩展 [5]   行业资本开支与产能 - 微软过去12个月新增数据中心容量超2吉瓦 行业正朝吉瓦级和多吉瓦级数据中心发展 [4] - 液冷设备在机柜中的价值量已超过电源 成为除芯片外的第一梯队组件 [6]   供应链变化 - 国产液冷设备厂商自2023年7月开始进入国际供应链 部分企业已获得实质性订单 [6] - TPU芯片因单价仅为B200的1/4 可能优先选择性价比更高的国产液冷解决方案 [1]
 从AI到券商到药….
 小熊跑的快· 2025-08-13 14:14
 市场表现   - 市场创下新高 [1]     腾讯财报展望   - 腾讯即将发布财报 二季度capex存在不确定性 因缺少h20 [2]   - 后续季度capex问题可能已解决 展望向好 [2]     阿里云业务   - 阿里云收入与capex表现亮眼 海外投资力度大 [3]   - 海外出口链公司业绩强劲支撑 [3]     AI基建机会   - 国内 东南亚 中东地区AI基建存在潜在增长机会 [4]   - CPO技术受lumentum持续出货推动 涉及共封装光学与超高功率激光器 [4]   - 3.2T液冷方案随CPO技术发展持续推进 [4]     芯片与液冷技术   - 新芯片共封技术下 液冷成为唯一选择 需求趋向更精细化 [5]
 定期更新
 小熊跑的快· 2025-08-11 16:26
 推理算力需求 - A10 T4 L4等推理算力硬件价格表现良好 需求得到进一步验证 [1]   英伟达业务动态 - 彭博一致预期英伟达本季度营收455亿美元 下季度指引525亿美元 [4] - H20和AMD MI308芯片可能恢复对华出口 需缴纳15%收入给美国政府 [4] - 2024年预计出货3万台GB200和1万台GB300服务器 外加200万张B200单卡 [4] - 2025年GB300出货预期上调至10万台 三季度进入组装旺季 [4] - GB200/300采用液冷方案 性能比风冷版提升25% 功耗降低30% [4] - 液冷服务器将带动散热和电源系统升级 144卡/256卡超大机柜成为趋势 [4]   AMD技术进展 - MI355X液冷方案支持128卡扩展 MI350仅支持64卡 [4] - AMD单瓦算力贡献显著低于英伟达 因此建议客户配套液冷方案 [4]   TPU发展前景 - 2025年TPU液冷比例预计超过65% [5] - v7系列TPU算力达4614TFLOPs 较v6提升2.5倍 [5] - 单芯片内存容量提升4.5倍 [5] - TPU单价仅为B200的1/4 可能采用国产液冷方案降低成本 [5]   技术演进逻辑 - 行业技术发展遵循经济学和物理学的基本规律 [6]
 gpt5
 小熊跑的快· 2025-08-08 06:41
 GPT-5核心升级   - 新一代AI系统在智力层面实现重大飞跃,在编码、数学、写作、健康、视觉感知等领域达到最先进性能 [1]   - 采用统一系统架构,能动态调整响应速度与思考深度以提供专家级答案 [1]   - 模型架构未出现代际突破,验证ASIC硬件路径正确性,利好推理成本下降 [1]     技术架构创新   - 引入三级模型体系:基础智能模型处理常规问题,GPT-5思维模块解决复杂问题,实时路由器动态分配任务 [2]   - 路由器通过用户切换行为、响应偏好等真实信号持续优化,未来计划整合为单一模型 [2]   - 达到使用限制后自动切换至GPT-5 mini模型维持服务 [2]     核心能力提升    编码性能   - 复杂前端生成与大型代码库调试能力显著提升,单提示即可生成响应式网站/应用/游戏 [3]   - 设计审美优化,对排版、间距等视觉元素理解更精准 [3]     健康应用   - HealthBench评估得分显著超越前代,在真实医疗场景中表现更可靠 [4]   - 新增主动风险提示功能,能根据用户背景知识提供个性化健康建议 [4]   - 强调AI作为医疗辅助工具定位,不替代专业医疗人员 [4]     多模态与事实性   - 视觉/视频/空间推理能力全面提升,图表解析准确率大幅提高 [11]   - 启用网络搜索时,事实错误率较GPT-4o降低45%,思考模式下比OpenAI o3降低80% [11]   - LongFact和FActScore基准测试显示"GPT-5思维"幻觉率下降6倍 [11]     响应诚实度   - 对无法完成任务的情境识别准确率从o3的86.7%提升至91% [13]   - 在真实对话场景中欺骗率从4.8%降至2.1% [13]     商业化部署   - 即时向Plus/Pro/Team/Free用户开放,企业/教育版一周内上线 [14]   - Pro用户可无限制访问GPT-5 Pro版本,团队用户可设为默认工作模型 [14]   - 免费用户达到限额后自动降级至GPT-5 mini模型 [14]
 今晚GPT5?
 小熊跑的快· 2025-08-07 17:02
 OpenAI直播预告 - OpenAI将于今晚凌晨一点进行直播活动[1] - 直播内容可能涉及RL强化学习技术的最新进展[1] - 行业预期直播将展示强化学习方向的突破性成果[1]   技术发展方向 - 强化学习技术有望实现极致性能突破[1] - 技术突破将推动推理算力需求增长[1] - 推理应用领域可能迎来重大发展机遇[1]   产业链影响 - 推理算力需求增长将利好ASIC芯片市场[1] - 各类推理芯片厂商将迎来发展机会[1] - 行业已为推理芯片需求增长做好准备[1]
 AI巨头财报总结及论恒生科技
 小熊跑的快· 2025-08-06 10:30
 科技巨头资本开支与AI投资 - Google资本开支从750亿提升至850亿美金,超出市场预期 [1] - 微软季度资本开支242亿美金,环比增加30亿,下季度指引300亿,2026财年预计1200亿美金,比市场预期高200亿 [1] - Meta将2024年资本开支下限从640亿提升至660亿美金,上限维持720亿 [1] - 亚马逊云业务增速17%不及预期,但资本开支从1000亿增至1100-1200亿美金 [1]   云业务与AI应用表现 - Google云增速32%,TPU需求旺盛,10亿美金以上订单上半年已达去年全年水平 [3] - 微软云增速39%,Copilot带动M365部门收入增长3%,单季度贡献约10亿美金 [3] - Meta AI推动广告展示量增加11%,广告单价上涨9% [3] - 亚马逊云业务增速17%低于同行 [3]   国内AI市场与指数表现 - 恒生科技指数ETF(513180)涨幅2.6%,落后纳斯达克指数 [3] - 恒生互联网ETF(513330)涨幅5.26%,表现优于硬件半导体 [5] - 国内大模型代表企业如快手表现良好,阿里云下季度资本开支预计改善 [7]   全球AI应用排行榜 - 国内MAU增速前三:星会(22.38%)、腾讯元宝(9.25%)、豆包(5.46%) [8] - 全球MAU前三:ChatGPT(6.14%增长)、夸克(-0.37%)、百度网盘(0.05%) [10] - 全球增速突出应用:Grok(41.16%)、Perplexity(29.11%)、Cici(10.62%) [10]   行业展望 - 英伟达、博通8月底财报预期向好 [11] - 国内阿里、字节AI调用数据强劲,资本开支有望回暖 [11] - 外资对国内科技资产配置意愿增强 [11]










