Workflow
小熊跑的快
icon
搜索文档
AI 硬件?
小熊跑的快· 2026-01-28 10:23
国内AI大模型发展态势 - 行业呈现出技术突破与商业落地并驾齐驱的蓬勃景象,各大厂商正从单纯的参数竞赛转向对实际价值创造的激烈角逐 [1] 通用大模型进展 - 阿里巴巴于2026年1月发布旗舰推理模型Qwen3-Max-Thinking,总参数量超过万亿,采用“测试时扩展”机制,在“人类最后的测试”中得分高达58.3,超越GPT-5.2-Thinking和Gemini 3 Pro [3] - 百度于2025年12月发布原生全模态大模型文心大模型5.0,采用超稀疏混合专家架构,参数规模超过2.4万亿,在LMArena文本榜上以1451分的成绩登顶中国第一 [3] - 字节跳动豆包大模型在2025年12月发布1.8版本,优化多模态Agent场景,其日均tokens调用量已超过50万亿 [3] 垂直模型与应用落地 - 百度文心大模型5.0已在教育领域落地,例如与出版社合作推出“AI绘本”智能体 [5] - 科大讯飞星火大模型在语音转写、会议纪要生成等办公场景保持领先,并在医疗和政务领域斩获大额订单 [5] - 腾讯混元大模型在3D生成方面取得突破,其开源的混元世界模型1.1版本能够实现秒级的3D世界创造 [5] - 百川智能于2026年1月全面开放医疗大模型M3 Plus的API,该模型在OpenAI发布的HealthBench评测中以65.1分的综合成绩位列全球第一,并在HealthBench Hard上以44.4分夺冠,首次全面超越GPT-5.2 [5] - 应用场景从“炫技”演示转向解决真实产业痛点,商业化落地进程显著提速,尤其是在教育、医疗、工业等垂直领域 [6] AI硬件与芯片行业 - 壁仞科技作为港股GPU第一股,已交付BR106、BR110等芯片超1.2万片,截至2025年12月持有未完成订单8.22亿元,框架协议金额达12.41亿元 [8] - 百度昆仑芯已向港交所递交上市申请,其第三代训练卡出货超4万片,下一代P900芯片性能预计为三代的两倍 [8] - 阿里平头哥计划单拆上市,其他如摩尔线程、沐曦集成电路、燧原科技、天数智芯等公司也准备IPO [9] - 政策支持AI硬件方向,相关板块走势不错,例如科创半导体ETF(588170)近期涨幅约40% [10][11][13]
光登
小熊跑的快· 2026-01-27 10:51
行业认知与市场定位转变 - 光模块行业在资本市场中的角色发生根本性变化 从普通成长板块转变为类似银行保险的避险资产 [1] - 市场对光模块行业的认知出现重大转向 投资者情绪表现为“喜极而泣” [1]
qwen -max-thinking
小熊跑的快· 2026-01-27 08:22
核心观点 - Qwen3-Max-Thinking模型通过自适应工具调用和测试时扩展等核心技术,实现了推理性能的显著飞跃,并在多项基准测试中刷新最佳纪录,特别是在启用工具的评测中获得58.3分,超越主要竞争对手[1] 技术特点与创新 - **自适应工具调用能力**:模型能像专业人士一样,在对话中自主判断并调用搜索引擎、代码解释器或记忆模块等功能,形成“思考-行动-验证”闭环,降低产生虚假信息的概率[1] - **测试时扩展技术**:通过“经验提取”机制,在多轮迭代推理中从过往思考过程提炼关键洞见,避免重复推导,将计算资源集中在解决不确定性上,从而在相同计算成本下大幅提升推理性[1] - **模型架构与规模**:模型总参数量超过一万亿,采用MOE架构,活跃参数猜测只有几百亿个,并经过大规模强化学习后训练,为强大的推理和知识整合能力奠定基础[2] 性能表现 - 在启用工具的“人类最后的考试”评测中,取得58.3的高分,大幅超越GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分[1] - 在科学知识、数学推理和代码编程等多项国际公认的基准测试中展现了强大实力,刷新了最佳纪录[1][4] - 在“智能体深度规划”和“高等教育STEM难题”等部分细分项目上仍有提升空间[1] 应用与能力 - **强大的智能体能力**:模型经过专门设计的训练流程,原生具备强大的智能体能力,能够自主完成复杂的任务流程,而不仅仅是生成文本[2] - **功能与开发**:模型功能丰富,且支持二次开发[2] 定价与成本分析 - **定价结构**:输入长度在32K Token以内时,输入价格为0.0032元/千Token,输出价格为0.0128元/千Token;长度在32K至128K之间,输入价格为0.0064元/千Token,输出价格为0.0256元/千Token;长度在128K至256K之间,输入价格为0.0096元/千Token,输出价格为0.0384元/千Token[3] - **成本换算与对比**:换算为百万Token计价,Qwen模型的输入成本约为3.2元/百万Token,输出成本约为12.8元/百万Token;对比来看,DeepSeek-V3的输入成本约为1.4元/百万Token,输出成本约为21元/百万Token;OpenAI的GPT-4o mini输入成本约为10.5元/百万Token,输出成本约为4.2元/百万Token;分析认为Qwen此版本定价不算太便宜[5]
AI数据继续上攻
小熊跑的快· 2026-01-26 07:07
行业模型调用量周度数据 - 统计周期内,行业主要大语言模型总调用量达到6.17万亿次,周度调用量增长1.57万亿次,环比增速显著 [2] - 在主要模型中,ChatGPT移动端数据环比上行明显,显示其用户活跃度或使用频率在提升 [4] - 第三方平台OpenRouter的调用数据继续创下新高,表明通过聚合平台分发模型的需求持续旺盛 [4] 主要模型市场份额与排名 - “Others”类别的模型合计调用量最高,达到2.84万亿次,占据显著市场份额 [2] - 国产模型MiMo-V2-Flash本周调用量达4620亿次,排名冲至行业第二,表现突出 [2][4] - 头部模型竞争激烈,Anthropic的Claude Sonnet 4.5以6110亿次调用量位居榜首,OpenAI的Claude Opus 4.5以3150亿次调用量位列第五 [2] - 谷歌系模型表现强劲,Gemini 3 Flash Preview、Gemini 2.5 Flash及Lite版合计调用量接近1万亿次 [2] - 其他重要参与者包括DeepSeek V3.2(3070亿次)、xAI的Grok Code Fast 1(4480亿次)与Grok 4.1 Fast(2240亿次) [2]
又听了一脑子太空光伏
小熊跑的快· 2026-01-25 16:14
太空光伏概念引发市场高度关注 - 周末市场讨论热点高度集中于太空光伏概念 其热度使其他地面能源项目相形见绌 [1] - 有观点将太空光伏的潜力与地面项目对比 认为OpenAI提出的5年30吉瓦目标在太空光伏面前微不足道 [1] 人工智能发展面临能源瓶颈 - 人工智能的快速发展消耗了巨大的电力资源 引发了行业对能源供应的担忧 [3] - 电力消耗问题被描述为“电烧干了” 凸显了当前AI算力增长与能源基础设施之间的紧张关系 [3]
今年涨价逻辑
小熊跑的快· 2026-01-24 12:01
通胀与涨价逻辑 - 当前通胀逻辑在多个领域普遍存在 [1] - 存储、CPU、云租赁等个别品类已出现价格上涨 [1] - 稀缺的IDC(互联网数据中心)资源也开始涨价 [1] - 贵金属(如黄金、白银)的涨价趋势已无需赘述 [1] - 预计到2026年,涨价现象将无处不在 [1]
阿里芯片谋求ipo
小熊跑的快· 2026-01-23 07:43
阿里云与芯片业务战略调整 - 阿里云业务未如市场预期进行分拆 [1] - 阿里旗下芯片公司“平头哥”将准备独立分拆并进行IPO [1] 平头哥芯片技术进展与对标 - 公司自研芯片为PPU 已发展至1.7代 [1] - 芯片技术性能对标英伟达H100 [1] 自研芯片的规模与市场地位 - 预计今明两年国内一半的AI芯片需求将使用自研芯片 数量达大几十万颗 [2] - 自研芯片用量规模与国内领先的华为公司比肩 [2] 芯片集群互联与基础设施 - 公司芯片互通性良好 采用“磐久”服务器 [2] - 支持64卡集群 并向128卡集群进发 [2] - 超结点互联采用UAlink技术 [2] 公司AI算力需求与芯片应用 - 阿里去年10月单日tokens调用量超过60万亿 [2] - 同期11月 字节跳动单日tokens调用量为40万亿 [2] - 公司预计全球tokens调用量未来还将增长100倍 [2] - 公司自研芯片在AI推理任务中应用较多 [2] 业务战略的演变与行业对标 - 公司曾紧密跟踪谷歌TPU外售的商业化路径 [3] - 公司最终选择将芯片业务独立分拆上市 而非直接对外销售芯片 [3]
Cowork很重要
小熊跑的快· 2026-01-22 16:33
Anthropic新产品Cowork的核心特点 - Cowork是Anthropic公司推出的新产品 本质上是一款面向非开发员的AI编程工具 其大部分功能由Claude Code自行构建 使得AI既是产品本身 也是开发流程的关键组成部分[3][4] - 该产品面向普通人 用户无需懂编程 编程执行已内嵌到工作流中 用户只需授予Claude访问计算机文件夹的权限并分配任务 AI便会自主规划执行并汇报进度[4] - 该产品将编程能力变得像英语或电力一样普及 用户无需掌握发电技术 只需会使用即可 这降低了技术使用门槛[4] Cowork的技术路径与市场影响 - 专家预测未来几个月Cowork将引发市场热潮 其核心技术是虚拟化 涉及将本地CPU和文件虚拟化 云端则使用沙箱虚拟化技术[5] - 虚拟化技术本身并非稀缺资源 它是云计算的基础 许多数据中心运营商都具备相关技术基础 因此市场对该技术的快速反应存在令人不解之处[5] - 国内大模型领域可借鉴其发展路径 探索手机端操作系统 虚拟机以及云与终端AI结合的模式 以实现个性化体验[2] 产品市场现状与讨论 - Cowork面世三天后 在国内的讨论热度不高[3] - 有市场参与者已通过跨洋电话会议了解到该产品及其技术 并迅速做出反应[5]
intel和amd
小熊跑的快· 2026-01-22 09:11
AMD x86处理器市场份额表现 - 2025年第三季度,AMD在x86 CPU总市场份额达到25.6%,环比增长1.4个百分点,同比增长1.6个百分点,首次突破25% [1] - 在细分市场中,台式机份额为33.6%,环比增长1.4个百分点,同比增长5.2个百分点,首次超过三分之一;服务器份额为27.8%,环比微增;移动份额为21.9%,环比增长1.3个百分点 [1] - 若计入嵌入式、物联网及主机系统级芯片,AMD x86整体份额达到30.9%,同比大幅增长5.9个百分点 [2] 市场份额增长趋势 - 2025年前三个季度,AMD x86总份额呈现持续攀升态势,从第一季度的24%增长至第二季度的24.2%,再到第三季度的25.6% [2] - 台式机市场份额增长轨迹同样显著,从第一季度的30%增长至第二季度的32.2%,再到第三季度的33.6% [2] 数据中心业务表现 - 2025年第三季度,AMD在服务器CPU的出货量份额为27.8%,并呈现逐季微增趋势 [3] - 在收入份额方面,2025年第二季度达到41%,环比增长1.5个百分点,这主要得益于高端EPYC处理器占比提升,其单颗价值更高 [3] - 市场预期,到2025年底,AMD服务器CPU出货量份额有望接近30%,收入份额可能冲击45% [3] - 去年,AMD在中国区的数据中心业务实现了翻倍增长 [1] 区域市场分布 - AMD的市场区域分布较为集中,中国区和美国区各占约30%,其余部分来自中东和欧洲市场 [1] 竞争格局与行业观察 - 在x86处理器市场,AMD的总份额为25.6%,而英特尔占据74.4%的份额 [3] - 在细分市场,台式机领域AMD占33.6%,英特尔占66.4%;服务器领域AMD占27.8%,英特尔占72.2%;移动领域AMD占21.9%,英特尔占78.1% [3] - 尽管从存量市场看英特尔份额更多,但AMD在市场份额扩张上表现出了强劲的进攻态势 [3] - 行业内有观察指出,亚马逊云科技的自研AI训练芯片Trainium主要适配的是AMD的CPU,而非其自研的CPU,这被视为对AMD处理器性能的一种认可 [3]
神弃之地
小熊跑的快· 2026-01-21 10:59
文章核心观点 - 文章描绘了一个象征性的场景,其中“光”被赋予了终极意义,代表希望、救赎与新时代的降临 [1] - 关键人物科林·伊利亚特在“光”中身体蒸发,但展现出欣慰与向往,标志着一个旧时代的终结与一个充满光明的黎明的开始 [1] - 最终以“赞美愚者!”作结,暗示了这场变革与某个特定存在或信念的关联 [1] 场景与象征 - 场景描绘了“缝隙”扩大后,一片“泛着金芒的大海”显现,构成了强烈的视觉意象,象征着封锁被打破与新世界的展现 [1] - “黄昏的巨人,倒在了黎明之前”一句,运用对比象征旧日统治或旧秩序的衰落,为光的到来铺平道路 [1] - “光就是一切的意义”直接点明了文章的核心主题,将“光”提升为哲学层面的终极答案与追求 [1] 人物与情感 - 人物科林·伊利亚特在温暖的光中身体“蒸发”,此过程被描述为沐浴与升华,而非痛苦的消亡 [1] - 科林·伊利亚特在最终时刻露出了“不含丝毫阴霾的笑容”和“隐隐约约的向往”,情感基调是释然、满足与对未来的期待 [1] - 观察者戴里克与科林·伊利亚特共同见证了“泛着金芒的大海”,强调了这一景象的共享性与震撼力 [1]