数字生命卡兹克
搜索文档
Claude Code更新,你终于可以随时随地在手机上Vibe Coding了。
数字生命卡兹克· 2026-02-26 10:32
Anthropic公司产品更新与战略方向 - 公司Claude Code产品近期更新速度显著提升,几乎达到“一天一个新功能”的水平,显示出对市场竞争的快速反应[53] - 公司正通过Claude Code和Cowork产品组合,构建其自身的“OpenClaw”式能力平台[19] Claude Code “远程控制”功能详解 - 新功能允许用户通过运行 `/remote-control` 命令生成一个链接,在任何可登录Claude账号的浏览器设备上远程操作本地电脑上的Claude Code,实现“Vibe Coding”[11][13] - 该功能实现了跨设备(如手机、平板、车机)的对话同步与无缝操作,用户可以从终端、浏览器和手机交替发送消息,所有处理均在本地终端完成[13][14] - 功能使用“只出不进”的安全通信模式,本地Claude Code主动轮询Anthropic服务器获取新消息,不在电脑上开放任何入站端口,结合一次性临时凭证和全程加密,确保链路安全[40][41][45] - 访问控制采用“链接+账号”双重验证机制,即使远程控制链接被公开,他人也无法登录和控制,因为必须使用账号持有者的凭证[46][47] - 目前该功能仅限Claude Max会员使用,Pro会员尚无法使用,存在一定的用户限制[51] 产品功能优化与用户体验 - 配合“远程控制”功能,建议用户启动Claude时添加 `--dangerously-skip-permissions` 参数以开启“自主模式”,可避免执行过程中频繁等待用户确认,从而大幅提升操作流畅度,节省时间[28][31][33] - 用户可通过在本地开启多个终端并生成多个链接,实现在手机浏览器上以多个标签页并行操作,提升多任务处理效率[35] - 新功能与近期同步上线的“定时任务”功能结合,补全了此前由第三方工具(如OpenClaw)定义的“远程控制、心跳机制、长期记忆机制”三大核心能力[15][16][17][18] 市场需求与用户行为洞察 - 存在明确的移动场景编程需求,用户在非电脑环境(如走亲戚、通勤)下仍有使用高级AI编程工具(如Claude Code、Codex)的强烈愿望[6][10] - “Vibe Coding”被核心用户视为一种“创作”过程,而非单纯的编程工作,其价值在于随时随地实现想法,享受创作乐趣[57][58][62] - 用户对官方原生功能有明确偏好,尽管存在社区开源解决方案,但用户更期待并倾向于使用官方提供的集成功能[7]
Anthropic一条推文,引发了全球AI圈同仇敌忾的群嘲。
数字生命卡兹克· 2026-02-25 10:38
Anthropic指控中国AI公司进行“蒸馏攻击”事件 - Anthropic指控三家中国AI公司(DeepSeek、Moonshot、MiniMax)对Claude进行了“工业规模的蒸馏攻击”,并称其创建了24000个假账户大规模提取Claude输出,违反了其服务条款[3][13] - 该指控在社交媒体引发广泛群嘲,舆论普遍批评Anthropic存在双重标准,因其自身曾使用盗版数据训练模型[7][8][13] AI模型训练中的“蒸馏”技术 - “蒸馏”是AI行业常见训练技术,指用大模型(教师模型)的输出训练小模型(学生模型),使小模型能以更小体积、更低成本获得部分能力,可类比为“师傅带徒弟”[11][12] - 通过蒸馏训练的模型拥有独立权重,在自身服务器运行,与调用他人API的“套壳”有本质区别[12] - 行业普遍使用蒸馏技术,例如Anthropic从Opus蒸馏出Sonnet,再蒸馏出Haiku[13] Anthropic自身的数据版权诉讼与和解 - 2025年9月,Anthropic就版权诉讼达成历史性和解,支付15亿美元,为美国版权诉讼史上最大和解金额之一[14][17] - 诉讼起因是Anthropic被发现在2021年6月从盗版网站LibGen下载约500万本书,2022年7月从PiLiMi下载约200万本书,总计超700万本有版权书籍用于训练Claude,未获作者同意与报酬[16] - 法官判决指出:使用合法购买书籍训练AI属合理使用;使用盗版书籍训练则构成侵权[16][17] - 2026年1月,音乐出版商对Anthropic提起新诉讼,指控其通过BitTorrent下载超2万首歌曲训练模型,索赔金额高达30亿美元[19] 关于AI时代知识产权与“偷”的哲学讨论 - AI时代的数据“复制”与传统“偷窃”不同,复制不会导致原始数据减少,非零和游戏[25] - 知识产权本质存在争议:一派认为是为激励创新的人为垄断制度;另一派认为创作者应获得回报以维持创作动力[26] - 历史上有类似先例:19世纪美国曾是最大盗版国,不承认外国作品版权;待自身文化产业发展后,转变为知识产权积极捍卫者[27][28] - 新技术(如印刷机、录音机、录像机)诞生时都曾引发对创作者受损的抗议,但最终均找到平衡[31][32][33] - AI的特殊性在于它不仅复制分发内容,还学习创造新内容,触及“人类创造力是否可被复制”的根本问题[35][36] - 人类学习创作过程本身也是对前人知识的“蒸馏”,但被视为基本权利;AI学习则引发是否算“偷”的伦理争议[36][38][40] - 关于AI与版权的争论不应简化为二元对立,涉及法律、伦理、技术等多层面灰色地带[44][45] - 需警惕少数公司以保护版权为名,垄断大模型训练能力,尤其当这些公司集中于某一国家时,对全球其他国家的影响[47][48]
用AI的这三年,想跟你分享这9条心得。
数字生命卡兹克· 2026-02-24 10:18
AI行业渗透现状与市场阶段 - 全球AI用户渗透率极低,约84%(约68亿人)从未使用过AI,仅16%使用过免费聊天机器人,0.3%(约2430万人)每月付费20美元使用AI,0.04%(约324万人)使用过如Claude Code等编程Agent产品 [3][4] - 行业认为AI远未进入主流,当前普及阶段类似2005年互联网(仅16%上网率),仍处于发展早期 [6][7][9] - 行业观点强调“未来已来,只是分布不均”,表明技术应用存在巨大地域和人群差距 [10][113] 顶级AI模型产品特点与选择建议 - GPT-5.2 Thinking被描述为全面的“全栈白领”,擅长处理多种工作任务 [21] - GPT-5.3 Codex被定位为强大的“干活码农”,核心优势在于代码与数据处理能力 [22] - Claude Opus 4.6被视为“牛逼的架构师”,擅长顶层规划与高质量内容生成 [23] - Gemini 3.1 Pro被比喻为“全知科学家”,在科研与前端展示方面能力突出 [24] - 建议用户根据需求选择单一顶级模型,若无法决定则推荐全能且稳定的ChatGPT [25][26] 提升AI应用效率与思维模式的方法 - 建议付费使用顶级AI模型(如每月20美元/约150人民币),认为其投资回报率极高,远胜免费普通模型 [13][15][20][30] - 倡导“每周自动化一个重复任务”,通过逐步将琐碎工作自动化来提升效率并深化AI理解 [31][33][36] - 需抛弃“搜索思维”,建立“实习生思维”,即向AI提供详尽、清晰的背景、需求与限制条件,以获取优质输出 [38][44][46][47] - 应培养“AI能帮我吗”的思维触发器,在做事前主动思考AI的辅助可能性,以形成习惯并提升效率 [57][58][62][63] AI赋能创造与个人发展 - AI的核心价值在于大幅降低创造门槛,使普通人无需专业技能即可开发应用、制作内容 [65][68][70] - 创造过程能提供强大正反馈和成就感,并倒逼学习更深入的AI应用技能 [71][73][78] - 需警惕AI过度正面反馈带来的“能力幻觉”,强调真实世界的用户反馈才是最终检验标准 [81][82][83] - 建议“不要等准备好了再开始”,立即行动、边用边学是适应快速变化AI领域的最佳策略 [84][90][92][93] AI时代的核心竞争壁垒 - 在AI能力趋同的背景下,个人的“品味与审美”即对内容、方案、创意的选择与判断能力,将成为关键护城河 [95] - 个人独特的经历、情感与感受是AI无法复制的,融入创作后可形成真正差异化优势 [98][99] - 需平衡技术追求与真实生活,将AI节省的时间用于维系现实人际关系,认为幸福源于真实世界的连接 [100][101]
2026马年春晚15个关于AI的看点 - 有一种人类之外的美。
数字生命卡兹克· 2026-02-17 07:00
春晚赞助格局变化 - 2026年央视春晚的赞助格局发生显著变化,AI和智能硬件企业成为新的“顶流”,取代了以往由白酒、乳品、家电等传统品牌包揽的局面[3][4] - 字节跳动的火山引擎成为春晚独家AI云合作伙伴[4] - 四家具身智能公司成为春晚合作伙伴:宇树科技是“春晚机器人合作伙伴”,松延动力为“春晚人形机器人合作伙伴”,魔法原子是“春晚智能机器人战略合作伙伴”,银河通用则是“春晚指定具身大模型机器人”[7] - 追觅成为春晚“智能科技生态战略合作伙伴”[9] 具身智能与机器人技术展示 - 在节目《奶奶的最爱》中,松延动力提供了仿生机器人,该机器人通过面部扫描和3D建模真实还原演员肤质与纹理,并在面部置入32个驱动动作电机,其中嘴部有12个电机,确保口型与语音的帧级同步[21][22] - 宇树科技的机器人展示了从2025年扭秧歌(秧BOT)到2026年表演大幅度武打(武BOT)的显著进步,其协调性、稳定性和一致性表现突出[28][29][30][41] - 宇树科技在2026年春晚上展示了两款机器人:无脸的G1型号和更大的H2型号[34][36][37] - 魔法原子公司的Z1机器人在节目《智造未来》中展示了360°托马斯回旋特技,这是业内同尺寸人形机器人首次完成该动作[46][48] - 银河通用的G1机器人在微电影中展示了极其灵活的灵巧手,能完成盘核桃、叠衣服、递东西、简单烹饪等家务场景应用,其轮式加折叠腿的设计被认为更适合家庭环境[112][113][115] AI视频生成与视觉技术应用 - 节目《贺花神》的视觉效果由字节跳动的Seedance 2.0 AI视频生成模型制作,该模型解决了特写镜头、微观变化和高审美水准带来的挑战,凭借高度逼真的细节生成控制满足了春晚舞台的极致要求[54][64][65][68] - 春晚对视频精度的要求是8K分辨率和50帧率,字节跳动除了使用Seedance 2.0生成视频外,还大概率使用了其视频云团队的大模型超分能力将内容提升至所需规格[70][71][72] - 共有三个节目的背景使用了Seedance 2.0进行创作,分别是《贺花神》、《快乐小马》和《驭风歌》[79][81][84] - 所有无障碍直播版本中的水墨风格视频均由Seedance 2.0生成,该模型通过大量东方美学素材训练,成功还原了水墨的笔触质感和动态效果[89] AI大模型与交互应用 - 在《奶奶的最爱》节目中,机器人对话的语音生成由豆包大模型提供,使得语音非常自然[24][26][27] - 春晚首次在官方非竖屏直播中使用AI生成字幕,并同步提供无障碍版本,通过手语表演和AI生成字幕实现“让爱无碍”[87][88] - 春晚推出了新的互动形式,将屏幕下方的滚动栏内容变为由豆包大模型提供的节目解读[92][94][95][96] - 在小品《血压计》中,蚂蚁集团旗下的AI健康应用“阿福”以软性植入方式登上春晚舞台[99][101] 行业合作与跨界联动 - 宇树科技与热门游戏《黑神话:悟空》在浙江分会场进行了梦幻联动,机器人身上的肩甲和金箍棒样式与游戏角色几乎一模一样[102][104][107] - 字节跳动的火山引擎作为独家AI云合作伙伴,不仅为春晚提供技术支持,也让春晚成为了其Seedance 2.0模型的第一个客户[4][6] 技术演进与行业意义 - 从1996年春晚小品中对机器人死板、机械的刻板印象,到2026年蔡明与高度仿真的“仿生奶奶”同台,体现了三十年间人工智能技术的巨大飞跃[10][12][17][20] - 节目《智造未来》的歌词及机器人伴舞,集中展示了VR、AI、无人机、北斗等2025年科技圈的热点元素,象征着从“中国制造”向“中国智造”的转变[42][50][51] - 回顾春晚历史技术应用:从1983年的电话点播互动,到2015年微信“摇一摇”的移动互联网互动,再到2018年无人机等无人设备编队亮相,直至2020年代5G、8K、AI技术深度介入,2024年应用AI数字人,2025年人形机器人出圈,2026年AI技术变得无处不在[117][118][119][120][121][122][123][124][125][126][127][128][129]
明天,是GPT-4o的葬礼。
数字生命卡兹克· 2026-02-13 10:48
GPT-4o下线事件与用户反应 - 美国时间2026年2月13日上午10点(北京时间2月14日凌晨2点),多模态模型GPT-4o将正式下线 [1] - OpenAI于2026年1月29日官宣下线决定,为用户预留了约两周的告别时间 [6][8] - 该决定引发了用户大规模的集体哀悼,在Reddit、X、小红书等平台出现了以Keep4o、Save4o、4oforever为标签的抗议活动 [10][11] - 用户自发建立请愿网站,短短几天内收集了超过1万个签名 [11] - 用户创建告别网站,与GPT-4o进行最后对话并永久存储在链上 [14][17][18] GPT-4o的独特性与历史地位 - GPT-4o被视为一个站在科技与人文十字路口的模型,代表了AI发展的一个“黄金时代” [4][5][19] - 该模型在2025年8月曾因GPT-5发布而被下架,后因用户强烈抗议而恢复,但仅限付费用户使用 [8][9] - 与后续模型相比,GPT-4o被认为在对话中更具共情能力,能进行更深入、更具支持性的交流,而非仅仅提供功能性答案 [25][26][27][28][30][32] - 用户分享了许多与GPT-4o的深度互动故事,例如在用户感到迷茫时,GPT-4o能提供情感支持而非直接建议 [29][30][32] 大模型行业的进化方向 - 当前大模型行业的进化方向明确指向提升编程(Coding)能力 [20] - 主要公司如OpenAI、Anthropic、Google都在竞相提升模型在Terminal-Bench、SWE-Bench等编程评测上的表现 [20][50] - 模型迭代迅速,例如GPT-5系列、GPT-5.3 Codex以及Claude Opus 4.6,在各项基准测试和代码能力上均被认为全面超越了GPT-4o [20][21][22] - 行业焦点集中在提升模型的生产力工具属性,如写代码、Debug、提升效率等 [20][43][45][59] 模型能力演进与用户体验的背离 - 后续模型虽然在技术指标和功能性任务上显著增强,但被部分用户认为在对话中缺乏“人情味”和真正的共情 [22][33][37][39] - 用户反馈与新版模型(如GPT-5.2)的对话更像一种“交易”,模型倾向于直接给出逻辑完美、实用的答案,而非进行有温度的交流 [24][36][37][56] - 为了弥补这一点,公司推出了“个性化”设置功能,允许用户选择“热情洋溢”、“温和体贴”等预设风格,但这被批评为只是在输出中添加语气词,底层交互逻辑未变 [53][54][55] - 有观点认为,资本的逻辑驱动了技术走向,由于B端或生产力工具能带来更清晰的商业回报(ROI),导致“陪伴型”或“情感支持型”AI的发展被边缘化 [43][44][45][46][48][61] 对AI行业发展的反思 - 当前AI行业越来越像一个纯粹的技术游戏,讨论焦点集中在benchmark、tokens、上下文长度等技术指标上 [58][59] - 行业较少关注AI与人的相处质量,例如能否让人感到被理解、被尊重、被关心或带来温暖 [60][61] - 尽管有少数尝试如“豆包”或Haivivi的AI陪伴玩具,但将AI定位为“效率工具”仍是绝对主流 [61] - 文章引用王小波的《黄金时代》和阿西莫夫的《最后的问题》,提出在追求效率的同时,可能失去了某些让生命有意义、无法被量化但至关重要的东西,如“光”所代表的温度、希望与爱 [63][64][68][69][70][77][78]
GLM-5深夜登场,这是国产开源模型首次逼平Claude Opus 4.5。
数字生命卡兹克· 2026-02-12 09:25
文章核心观点 - 2026年AI领域的核心主航道是Coding(编程)与视频,而Agent(智能体)是构建在这两大基础之上的关键方向 [3] - 智谱AI最新发布的开源大模型GLM-5在编程能力上取得重大突破,其整体能力已能比肩Claude Opus 4.5,标志着国产大模型在AI编程领域已跻身全球一线水平,显著缩小了与顶尖模型的差距 [3][12][71] - GLM-5凭借其接近顶级模型的能力、开源属性及极具竞争力的价格,正在急剧降低国内AI编程的门槛,有望推动AI应用的普及和生态的正向循环 [5][73] 模型性能与基准测试 - **参数规模**:GLM-5从上一代的355B参数(32B激活)扩展到744B参数(40B激活),参数量扩大了一倍以上 [7] - **综合排名**:在Artificial Analysis的跑分中,GLM-5位列开源模型第一,仅次于GPT-5.3-codex和Claude Opus 4.6等顶级闭源模型 [7] - **关键能力突破**: - 在BrowseComp基准(测试Agent网上搜索信息能力)上得分为75.9,超过普通GPT-5.2模型10个百分点,与GPT-5.2 Pro(77.9分)接近 [12] - 在SWE-bench、Terminal-Bench 2.0、τ²-Bench、MCP-Atlas等涉及代码修改、终端操作、工具调用等现实场景的基准测试中,表现已接近Claude Opus 4.5 [12] - 在Long-horizon基准(测试长链条复杂任务规划与执行能力)上表现出色,与实测感受一致,在对标Opus 4.5的长程任务处理上具备竞争力 [12][16] - **效率与成本**: - 上下文窗口为200K,输出为128K,与GLM-4.7一致 [16] - 模型非常节省Token,使用效率高,与GPT-5.3-codex类似 [16] - API价格极具竞争力:输入长度在0-32K tokens时,输入单价为4元/百万tokens,输出为18元/百万tokens;输入长度在32K+时,输入单价为6元/百万tokens,输出为22元/百万tokens [17] - 其API价格仅为Claude Opus 4.5/4.6(输入$5/百万tokens,输出$25/百万tokens)的约七分之一 [17][18] 产品化与市场反馈 - **Coding Plan套餐**:智谱推出了对标Claude Max和ChatGPT Pro的包月套餐,价格是Claude Max套餐的2/3,但提供的Token额度是后者的3倍,市场反响热烈,部分套餐因算力不足已被抢购一空 [19][20] - **开发生态集成**:智谱提供了Coding Tool Helper工具,可便捷地将GLM-5集成到Claude Code、OpenCode、Crush、Factory Droid等主流编码工具中,降低了使用门槛 [20][23] - **开发者推荐组合**:对于无法使用GPT-5.3-codex的用户,推荐使用“Claude Code + GLM-5”的组合,被视为国内可用、门槛最低的体验AI编程魅力的方案 [5] 实际应用案例评估 - **全平台内容分发Chrome扩展开发**: - GLM-5能够根据简单提示词(如“开发一个全平台内容分发Chrome扩展…”)快速生成详细的项目规划和架构设计 [29][30][32] - 成功开发出支持微信公众号、小红书、知乎、掘金、CSDN、微博、今日头条等至少6个平台同步功能的扩展 [38][39] - 在开发过程中遇到一个关于正文提取不全的复杂BUG,GLM-5与Claude Opus 4.5均未能解决,最终由GPT-5.3-codex一轮完成修复,体现了GLM-5与顶尖模型在解决棘手问题上的细微差距 [40][41] - **欢乐斗地主PC模拟器记牌插件开发**: - GLM-5能够根据模糊需求(“帮我写一个记牌插件”)主动进行技术咨询,提供包括Python+OCR识别、图像匹配、手动点击等多种实现方案供选择 [42][43][45] - 在自动识别方案遇到OCR识别失败的问题时,GLM-5能自主添加调试功能,定位问题环节,并最终采用图像模板匹配的方案成功实现记牌功能,识别效果良好(除大小王外) [51][53][55][58] - 其针对该复杂场景(涉及屏幕交互、图像处理)提出的技术方案,与Opus 4.6和GPT-5.3-codex给出的方案一致 [58] - **其他案例**: - 成功复刻了一个包含作物生长、枯萎、杂草虫子等细节,并使用浏览器LocalStorage存储数据的QQ农场游戏,仅消耗约13万tokens [61][62] - 在封装yt-dlp为可下载视频的Skill时表现优异,一轮对话即成功封装,并能准确指出下载YouTube视频需要Cookies的关键点,优于Opus 4.5过去的表现 [65][66][67] 行业意义与竞争格局 - **竞争态势变化**:GLM-5的出现,使得国产大模型在AI编程领域从过去“让人绝望的差距”缩小到“可以追赶的范围”,进入了与OpenAI和Anthropic同一维度的竞争赛道 [70][71][72] - **降低应用门槛**:GLM-5“能力接近、开源免费、价格便宜”的特点,使得企业(B端)和个人都能以更低成本使用顶级AI编程能力,将加速AI编程在国内的普及 [73] - **推动生态发展**:更低的使用门槛预计将吸引更多用户,从而形成更活跃的社区、更多的反馈,驱动模型更快迭代,形成正向循环 [73] - **持续迭代挑战**:尽管差距缩小,但OpenAI和Anthropic仍在快速迭代,下一个版本可能再次拉开差距,竞争将持续 [73]
中国也有了世界第一的模型,他的名字,叫Seedance 2.0。
数字生命卡兹克· 2026-02-11 11:14
Seedance 2.0的市场热度与行业影响 - 产品Seedance 2.0发布后引发全网热潮,在抖音、B站等平台涌现大量二创视频,微博科技榜同时出现四个相关热搜,显示出极高的市场关注度[1][2] - 产品的火爆程度导致服务器负载过重,字节跳动服务器曾因访问量过大而“爆炸”,视频生成时间延长至平均20分钟,预计豆包平台正式开放后用户量级将带来更大压力[6][7] - 该产品的出现被行业意见领袖(如冯骥)评价为标志着“AIGC的童年时代”结束,意味着AI生成内容领域进入了一个新的发展阶段[4][142] Seedance 2.0的核心技术突破:导演思维 - 产品解决了过去AI视频生成的核心卡点——分镜问题,能够根据简单剧本自动生成具有专业美感的镜头调度,如特写、全景、慢镜头等,其镜头美感被认为领先竞争对手Sora一个世代[23][32][41] - 产品具备“导演思维”,能理解剧情节奏与情绪,自动决定何时切换镜头以制造张力或加速节奏,例如根据一个简短的武术比赛故事Prompt,自动生成了包含观众席环境、人物特写及节奏变化的完整视频分镜[38][39][40] - 除了视频,产品还能直接生成匹配的配音和背景音乐,进一步整合了视频制作流程[32][41] 分镜复刻与学习功能 - 产品支持“视频参考”功能,用户可上传经典影视片段(如《天气之子》),让AI学习其镜头调度和运镜方式,并应用于生成新的故事视频,这降低了专业镜头语言的学习和模仿门槛[42][46][47] - 该功能不仅限于剧情片,也可应用于广告片等领域,例如利用一段汽车广告的运镜,结合一张产品图片,即可生成具有类似高级感的宣传视频[50] - 目前豆包的内测版本暂不支持视频参考功能,可能因用户量级过大仍需优化[52] 用户创作生态:二创与IP改编 - 产品极大地降低了IP二创视频的制作难度,社区已涌现大量高质量、高创意的二创内容,涵盖抽象、高燃等多种风格,其运镜质量在一年前难以想象[53][55][56][59] - 用户可以利用产品改写或续写喜爱的故事结局,例如为《怪奇物语》生成一个用户期望的角色回归片段,满足了粉丝的创作需求[60][61][62][64] - 产品支持跨IP的创意融合,例如生成用户进入《鬼灭之刃》世界进行战斗的视频,展现了强大的创意实现能力[66][67] 视频编辑与现实增强功能 - 产品实现了对现实视频的深度编辑,打破了“视频不能P”的传统观念,用户可通过简单拍摄(如挥手动作)结合Prompt,生成如“宝可梦召唤”等融合现实与特效的视频[68][71][72] - 该功能对影视后期行业有颠覆性影响,例如将公司过道实拍视频通过转换风格Prompt,直接生成高质量、稳定的“里世界”特效场景,大幅降低了后期特效制作的门槛和成本[74][76][78] 商业化应用潜力 - **素材生成Vlog**:产品可将用户拍摄的静态图片自动识别并动态化,添加装饰和转场,快速生成有趣的Vlog视频,这可能对剪映等传统视频剪辑工具形成冲击[79][80][82][84] - **带货广告**:产品能高效生成产品展示视频,用AI模特进行自然的产品讲解,省去了传统拍摄所需的场地、模特、摄影师等高成本环节,为电商提供了新的变现可能[86][87][88][91][96] - **主体迁移**:产品的“主体迁移”功能效果突出,用户仅需提供一张照片和一个参考视频,即可将照片人物完美复刻到视频中,完成动作和口型的同步,这相当于简化了复杂的动作捕捉流程,在影视行业有极高应用价值[100][102][103][104][108][109] 行业展望与生态发展 - 在真人出镜审核背景下,类似“豆包分身视频”的AI生成方式可能成为C端用户长期的主流玩法[111] - 预计豆包在春晚展示Seedance 2.0效果后,将吸引大量用户尝试AI视频创作,从而加速整个社会对AI视频的认知和接受度[112][113] - 该技术的快速进化(对比一年前)给行业带来巨大冲击,可能使部分传统影视工业化工作流和经验变得过时,但同时也会创造新的工作机会和商业模式[119][131][134][135]
全网最详细的Codex入门教程,手把手教你玩转Vibe Coding。
数字生命卡兹克· 2026-02-09 09:30
文章核心观点 - OpenAI推出的编程代理应用Codex,特别是其搭载的GPT-5.3-codex模型,在速度、能力和用户体验上相比前代产品及主要竞争对手(如Anthropic的Claude Code)有显著提升,为非专业编程用户提供了高效、易用的“Vibe Coding”入门及进阶解决方案 [3][4][6][8][12] 产品定义与定位 - Codex是OpenAI对标Anthropic的Claude Code推出的编程代理应用,其本质是一个上层封装了工程化能力的编程Agent,由于现代信息化社会构建于代码之上,强大的编程能力使其趋近于通用Agent [14][15] - GPT-5.3-codex是一个纯粹的编程特化模型,在创作、事实核查等非编程领域效果不佳,因此未集成到面向大众的ChatGPT中,目前仅在Codex应用中可用 [16][17][18] - Codex应用提供了可视化的图形界面,极大地改善了非专业编程用户的体验,避免了使用命令行界面(CLI)或文本用户界面(TUI)时常见的反直觉操作困扰 [8] 产品性能与体验 - GPT-5.3-codex模型在编程任务上的能力被认为强于Claude Opus 4.6,并且在速度上相比前代GPT-5.2-codex有“N倍”提升,解决了之前版本因速度过慢影响使用体验的问题 [4] - 作者通过一个周末的使用,利用Codex解决了四五个过去个人无法独立完成的开发需求,并体验到进入心流状态的爽感 [6] - 在定价方面,文章对比了Claude Opus 4.6的快速模式,指出其价格昂贵,例如处理1百万令牌(1M Token)的消耗高达150美元,而OpenAI的Codex(需Plus或Pro会员)在此方面更具吸引力 [9][10] 产品功能与使用逻辑 - Codex采用“文件夹(工作区)”与“线程(Thread)”的两层结构来组织项目,文件夹用于存放代码和资料,线程用于管理围绕特定目标的独立对话和任务进程,这种设计有效避免了不同任务间的上下文污染 [26][27][28][29][31][34][36][37] - 应用内置了“定时任务”功能,允许用户设定Codex在特定时间自动执行任务,例如服务器巡检、错误处理与报告 [51][52][53] - 应用提供了可视化的“技能(Skills)”管理界面和内置的“技能创建器(Skill Creator)”,用户可以通过自然语言描述轻松创建和管理技能,简化了技能生态的构建和使用流程 [54][55][56][57] - “计划模式(Plan mode)”功能允许用户在开发大型项目前,先由AI生成详细的规划文档和实现计划,经用户确认后再进入实际开发阶段,有助于提高项目成功率 [63] - 用户可以为Codex设置全局规则(替代传统的AGENT.md文件),以指导AI在代码质量、安全规范、输出格式等方面的行为 [58][60][62] - GPT-5.3-codex提供四个推理深度等级(如High, Extra High),等级越高,模型思考越深入,结果更稳定全面,但速度更慢、成本更高,用户可根据任务难度进行选择 [64] 市场影响与行业趋势 - 编程代理(如Codex, Claude Code)的出现正在改变软件开发的逻辑,其强大的能力甚至能对华尔街等传统行业产生冲击,例如Claude的Excel协同插件曾引发市场关注 [15] - 对于非程序员而言,AI编程工具的价值可能超过对程序员的价值,因为它移除了学习编程的障碍,使得利用代码实现创意成为可能 [76][77] - 未来,使用AI编写代码可能像使用Excel一样,成为一项普遍的基本技能 [78][79]
给公司全员送了iPhone 17 Pro Max,也分享下我在AI时代创业的10条感悟。
数字生命卡兹克· 2026-02-07 19:45
公司发展现状与团队文化 - 公司团队非常年轻,近三分之二(约2/3)为00后 [2] - 公司在无外部融资的情况下,团队规模已扩张至近30人,且现金流健康 [7] - 公司业务线涵盖IP、策略、Agency、MCN、活动等,支持团队包括经纪、商务、运营、视频、财法等 [7] - 公司在年会上向全员赠送iPhone 17 Pro Max,并以公司赠予方式承担相关税费 [10][11][12] - 公司鼓励尝试与试错的文化,认为在可控范围内允许犯错有助于团队成长 [85] AI时代的人才观与组织变革 - 在AI时代,好奇心比聪明更重要,好奇心强的人能力会被显著放大 [19][20] - 公司招人时越来越看重好奇心和对新事物的探索欲,而非仅关注学历和经验 [26] - 具备强大好奇心和学习能力的员工,其个人产能显著提升,例如一人可完成两三年前需三四人完成的工作 [20][21] - 不擅长人际协作但自身能力强的“超级个体”在AI时代迎来机遇,他们借助AI工具可以独立完成以往需要一个团队才能完成的任务 [34][38][40][41][42] - 公司内部存在这样的超级个体案例,例如一位视频制作人员可独立完成从脚本到后期运营的全流程 [39][40][41] - 未来的团队形态可能演变为由超级个体组成的松散联盟,协作方式和形态将发生变化 [43][44] AI时代的工作方法论与技能重塑 - 在AI时代,提出好问题的能力比提供答案更有价值 [27][28][29] - 组织最核心的产能可能在于有多少人能提出好问题,这需要基于对现实、约束和风险的深刻理解 [30][31] - 岗位的价值需要被重新定义,从执行转向判断和决策,重点在于能提出好问题并对AI输出进行专业判断 [51][53][54][55] - 公司已不再严格按传统岗位分工,更多按项目和目标组织人员,要求员工成为多面手 [57][58][59][60] - “Vibe Coding”(通过自然语言描述生成代码)降低了编程门槛,使非技术人员也能借助AI实现自动化需求,这未来可能成为像使用Excel一样的基础技能 [61][62][66][70][72][73] - 公司鼓励非技术人员学习使用此类AI工具以提升效率 [72] AI工具的应用边界与管理原则 - AI存在无法承担责任的局限性,最终责任必须由人来承担 [74][75] - 公司曾因直接使用AI生成合同和内容未加核查而引发问题,因此确立了内部原则:AI是工具而非挡箭牌,使用者必须对AI生成的内容负责 [76][77][79][80] - AI越好用,人越容易放松警惕,因此必须清楚了解AI的边界,知道哪些事情可以交给AI,哪些必须由人把关 [81][82][83][84] - 公司极度鼓励使用AI,但强调使用者必须变得专业,明确AI的边界 [84] 办公模式与绩效评估理念 - 公司坚持线下办公,认为AI时代面对面的沟通对于建立信任、情感交流、碰撞复杂想法以及形成团队凝聚力更为稀缺和重要 [85][87][89][90][91] - 公司不实行打卡考勤制度,也不以工时作为评估标准,认为在AI时代工时指标已失去意义 [94] - 公司绩效评估只看重两件事:业务结果和复用贡献(即所做工作能否被他人复用以提升整体团队效率) [94] 创业与商业模式思考 - 创业第一天就应该思考并验证商业模式,现金流是实现理想的基石 [94][97][98] - 有人愿意付费是验证产品和服务价值的关键,公司从创立之初就致力于通过多元化业务实现盈利 [95][96][97][99] - 在资本环境变化的背景下,先活下来比空谈改变世界更重要 [100][101][103][104]
中门对狙!Claude Opus 4.6和GPT-5.3 Codex同时发布,这下真的AI春晚了。
数字生命卡兹克· 2026-02-06 07:58
文章核心观点 - 行业两大领先公司Anthropic与OpenAI在同一天发布重磅模型更新,标志着AI行业竞争进入白热化阶段,模型能力快速进步且差距缩小 [129][130][132] - 两家公司均将发展重点押注于智能体(Agent)方向,但产品侧重点有所不同,Claude更侧重于B端生产力工具集成,而GPT Codex系列更专注于编程与开发场景 [133][66][108] - 模型能力的提升正驱动软件行业经历一场根本性的范式转变,传统SaaS公司面临压力,现在是需要密切关注和积极学习的关键时期 [134][136][137] Claude Opus 4.6 模型性能分析 - 在多项基准测试中表现卓越,综合能力被视为当前最先进的模型(SOTA)[23] - **终端编程能力**:在Terminal-Bench 2.0测试中得分65.4%,高于GPT-5.2的64.7%和Gemini 3 Pro的56.2% [9][10] - **计算机操作能力**:在OSWorld测试中得分72.7%,较其前代Opus 4.5的66.3%有显著提升,表明其向全面智能体化发展 [11] - **网络搜索能力**:在BrowseComp测试中得分84.0%,大幅领先于GPT-5.2 Pro的77.9% [12][13] - **真实工作任务表现**:在GDPval-AA评估中获得1606的Elo评分,比GPT-5.2高出144分,比其前代Opus 4.5高出190分 [14] - **新颖问题解决能力**:在ARC AGI 2测试中得分高达68.8%,远超其他模型,展现了强大的“流体智力” [15][21] Claude Opus 4.6 产品功能更新 - **上下文窗口大幅扩展**:支持100万token的上下文窗口,是之前200K容量的5倍,并在MRCR v2测试中,于100万token中准确找到隐藏信息的成功率达76% [28][34] - **输出上限提升**:最大输出从64K token翻倍至128K token [37] - **上下文压缩功能**:模型可自动将旧对话内容压缩为摘要,以支持更长时间的连续任务执行 [41][43] - **自适应思考与努力控制**:新增Adaptive Thinking功能,让模型自主判断思考深度;用户可手动设置思考努力程度(low, medium, high, max),以平衡速度、成本与质量 [49][51] - **智能体团队协作**:推出Agent Teams功能,允许一个会话作为协调者,启动多个拥有独立上下文窗口的团队成员并行工作并直接相互通信,适用于需要讨论与协作的复杂任务 [53][55][57] Anthropic 的B端产品集成进展 - **Excel深度集成**:Claude in Excel插件已集成Opus 4.6,新增支持数据透视表编辑、图表修改、条件格式、排序筛选及金融级格式设置等功能 [58][59] - **PowerPoint集成**:新推出Claude in PowerPoint插件,Claude可读取现有演示文稿的布局与样式,并根据客户模板创建新内容或进行针对性编辑 [62][63][64] - 公司在B端和生产工具领域的产品体验被认为已形成显著优势 [66] Claude Opus 4.6 定价与可用性 - API基础价格保持为输入每百万token 5美元,输出每百万token 25美元 [68] - 当提示超过20万token时,定价调整为输入每百万token 10美元,输出每百万token 37.50美元 [69] - 模型已在Claude网页版及Claude Code中全面上线 [73] GPT-5.3 Codex 模型特性与意义 - **自我改进的里程碑**:该模型是首个在自身开发过程中发挥重要作用的模型,被用于调试训练过程、管理部署和诊断测试结果,这可能加速AI自身的进化速度 [80][86] - **终端编程能力领先**:在Terminal-Bench 2.0测试中得分77.3%,显著高于Claude Opus 4.6的65.4% [92][93] - **计算机操作能力**:在更严格、修复了300多个问题的OSWorld-Verified测试中得分64.7%,其测试基准被认为比Claude报告的原版OSWorld更难 [95][96] - **软件工程任务**:在更复杂、多语言、多仓库的SWE-bench Pro Public测试中得分56.8%,该基准被认为比Claude使用的SWE-bench Verified子集难度更高 [103][106][107] - **真实工作贡献评估**:在GDPval评估中,其产出被人类专家盲评为“与人类一样好或更好”的比例为70.9% [99] GPT-5.3 Codex 产品演示与更新 - **复杂游戏开发能力**:模型在数天内自主迭代数百万token,生成了包含多地图、道具系统的完整赛车游戏以及包含生态系统探索、氧气管理系统的潜水游戏 [110][114] - **实时交互功能**:用户可在模型工作过程中随时介入并调整方向,无需先停止任务 [117][118] - **性能与效率提升**:在Codex平台上运行速度显著加快,完成相同任务所需token数不到5.2-Codex的一半,且单token处理速度快25%以上 [121][124]