Workflow
数字生命卡兹克
icon
搜索文档
围观AI对赌直播之后,我见证了一场人类画师对AI的突围。
数字生命卡兹克· 2026-01-09 09:05
文章核心观点 - AI绘画技术的兴起对传统绘画行业及创作者社区(绘圈)产生了巨大冲击,引发了关于作品真实性、创作伦理和行业信任的危机 [1][31][38] - 作为应对,行业内自发形成了“AI对赌”机制,通过直播绘画自证、专业鉴定和公众投票等方式,试图在AI时代维护真人创作的纯洁性和市场信任 [11][39][61] - 该机制的核心在于建立规则、专业鉴别和社区监督,旨在保护画师权益、为稿主(客户)维权,并警示创作者避免过度依赖AI而丧失进步动力 [54][58][71] - 尽管面临挑战,但部分创作者坚信通过持续精进技艺、追求超越AI的创造力和情感连接,人类创作者能够实现“生死突围” [79][83][86] AI对赌机制的兴起与运作 - AI对赌是一种由社区发起的画师自证直播,通常涉及画师、鉴方(质疑者)和中间人三方 [19] - 对赌流程为:鉴方提出AI使用质疑并列出证据,双方约定对赌,画师在直播中按命题现场作画并露出手部,观众投票判定,赌注通常为1000元人民币 [4][10][11] - 中间人角色至关重要,负责保管赌注、保持中立、审核鉴方资质并保护画师免受不公对待,是机制得以运行的信任基础 [19][58][61] - 该机制大约于2023年9-10月开始流行,旨在为遭受争议的画师提供维护声誉的渠道,也为感觉受骗的稿主提供维权手段 [39][65][66] AI技术对绘画行业的冲击 - AI绘画工具(如Midjourney, GPT-4o)的模仿能力和细节逼真度飞速进化,其进步速度远超以“年月为单位”进步的人类画师 [31] - AI在行业内形成了“斩杀线”,即其能力水平对中等及以下水平的画师构成直接的替代威胁,迫使画师必须向更高水平精进以寻求安全区 [32][33] - 使用AI辅助或完全生成作品后进行修改,已成为部分画师“心照不宣的秘密”,这加剧了圈内对作品真实性的普遍猜疑 [35][37][38] - AI的“捷径”诱惑可能导致画师画技和审美停滞,甚至无法分辨自身与AI的差距,长远来看将损害其职业发展 [67][68][70] 行业规则完善与专业鉴别的必要性 - 早期AI对赌因规则不完善出现过问题,例如有画师被揭露通过临摹AI图而非原创来通过直播测试,凸显了鉴别需要极高的专业能力 [40][45][47] - 为提升鉴别专业性,有中间人创建了“AI鉴定能力问卷”,在收到超过40000份回答后发现,画师和稿主群体的正确率显著高于普通路人 [52][53] - 基于数据,对赌规则得以优化,例如赋予画师和稿主比围观路人更高的投票权重,以确保判定结果更专业可靠 [54] - 规则也致力于防止对赌演变为对画师的霸凌,中间人需审核鉴方心智与沟通能力,并在直播中维护画师,减轻其压力 [56][58][59][61] 人类创作者的回应与价值主张 - 面对AI,部分顶尖人类画师通过展示其不可替代的创造力、细节把控和情感深度来建立信心,例如画师阮佳的作品曾引发“人类士气大振” [73][76][78] - 真人绘画的价值被部分从业者定位为“人与人之间的交流和信任”,以及将稿主脑海中的世界个性化呈现的能力,这是AI“抽卡跑图”无法企及的 [24][26][29] - 真正的创作者追求的是超越AI工具上限的“100分甚至120分的作品”,其核心动力在于“无限进步”和自我表达 [82][83][84] - AI对赌不仅是一种约束机制,更是一种警醒,提醒创作者不能将未来交由AI决定,而应坚持打磨技艺,在世界上留下属于自己的独特创造 [71][81][86]
智谱AI今日正式上市,一文讲透你想知道的6件事。
数字生命卡兹克· 2026-01-08 08:24
公司背景与市场地位 - 公司全称为北京智谱华章科技股份有限公司,成立于2019年6月11日,出身清华系,技术根基源于清华大学计算机系知识工程实验室(KEG Lab)[6][7][8] - 公司是典型的独立基座大模型公司,以GLM大模型为核心,衍生多模态及Agent模型,并向上构建MaaS平台及AI原生应用[17] - 根据沙利文报告,2024年按大模型相关收入计,公司在中国大模型厂商中排名第二,市占率为6.6%,是前五名中唯一的独立大模型公司[17] - 2024年公司大模型相关收入中,机构客户贡献47亿元,个人客户贡献6亿元[17] - 截至2025年上半年,公司服务了超过8000家机构客户,开源模型在全球开发者社区的累计下载量超过4500万[18] 模型发展历程与产品矩阵 - 公司于2020年11月确定GLM技术路线,2021年发布首个百亿参数模型GLM-10B[20] - 2022年发布代码模型CodeGeeX及千亿参数、双语训练的开源模型GLM-130B,后者被视为中国大模型开源生态的重要推动者[23] - 2023年3月开源ChatGLM-6B模型,成为当时少数可在消费级显卡上本地部署的大语言模型,对开发者生态影响深远[23] - 2024年1月发布GLM-4,性能比上一代提升约60%,多模态、长上下文、智能体能力整体逼近GPT-4[24] - 2024年10月发布AutoGLM,成为首个发布手机Agent的公司,并于后续开源,在GitHub上已获得2万Star[24] - 2025年密集迭代发布GLM-4.5、4.6、4.7等模型,其中GLM-4.7成为国内开发者的首选开发模型之一[24] - 2025年最后一周,GLM-4.7在OpenRouter上的单周token处理量约为1220亿,全球排名第12,中国厂商中排名第三[24] - 公司产品矩阵覆盖多模态,包括图像生成模型CogView、视觉理解模型GLM-4.5V、视频生成模型CogVideoX、实时音视频模型GLM-Realtime及端到端语音模型GLM-4-Voice[25] 融资历程与上市情况 - 2021年完成A轮融资,金额过亿,估值约8亿元人民币[30] - 2022年9月完成B轮融资3.63亿元人民币,估值达28亿元[31] - 2023年7月至9月完成多轮融资(B+至B+++++),当年累计融资超25亿元人民币,引入美团、蚂蚁、阿里、腾讯、小米、红杉、高瓴等一线机构[32] - 2024年完成至少两轮大额融资,包括中关村科学城领投(投前估值200亿元)及30亿元人民币注入,年底市场估值约200亿元[32] - 2025年全年完成5轮融资,估值被推至400亿元人民币档位[33] - 2025年4月在北京证监局办理A股辅导备案,后转向港股,于2025年12月19日通过港交所聆讯,2026年1月8日正式挂牌[34][35] - 本次IPO全球发售3741.95万股H股,发行价116.2港元,发行市值约518亿港元,融资金额约43.5亿港元,11家基石投资者认购约29.8亿港元[35] 财务表现与业务构成 - 公司收入快速增长,2022年至2024年收入分别为0.57409亿元、1.245亿元、3.124亿元,三年复合增速约130%[36] - 2025年上半年收入达1.91亿元,同比增长325%,已达2024年全年收入的61%[36] - 收入主要分为本地化部署解决方案和云端部署(MaaS)两部分[38] - 2024年,本地化部署收入2.639亿元,占总收入84.5%;云端部署收入0.4848亿元,占比15.5%[38] - 2025年上半年,本地化部署收入1.6178亿元,占比84.8%;云端部署收入0.291亿元,占比15.2%[39] - 整体毛利率从2022年的54.6%升至2023年的64.6%,2024年回落至56.3%,2025年上半年稳定在50%[42] - 本地化部署毛利率较高,在59%至68%之间波动;云端部署毛利率从2022年的76.1%大幅下滑至2024年的3.4%,2025年上半年为-0.4%[45][46] - 净亏损持续扩大,2022年至2024年净亏损分别为1.44亿元、7.88亿元、29.58亿元,2025年上半年净亏损23.58亿元[52] - 经调整净亏损2022年为0.9872亿元,2024年为25.38亿元,2025年上半年为18.99亿元[53] - 研发费用高企,2022年研发费用0.84亿元,费用率147%;2024年研发费用21.95亿元,费用率703%;2025年上半年研发费用15.94亿元,费用率835%[54] 商业模式与客户生态 - 公司商业模式是以GLM系列为底座,构建MaaS平台,并在此基础上提供B端解决方案和AI原生应用[58] - 当前阶段战略目标是扩大模型调用规模、客户数量和生态渗透率,而非追求短期利润[60] - 客户主要集中在IT服务、云计算、电信运营商、政府和教育等行业,多分布于北上深杭等数字经济集中城市[61] - 互联网客户占比达50%,且复购率超过70%[62] - 具体客户案例包括:某全球领先消费电子厂商(用于移动端AI Agent集成)、金山办公(用于WPS智能化升级)、智联招聘(用于AI招聘助手)、高端智能电动车厂商(用于智能座舱交互)等[63][64][65] - 作为独立厂商,其中立性是其吸引客户的优势之一[66] 行业前景与公司展望 - 沙利文报告预测,以2024年收入计,中国大语言模型市场规模约为53亿元,其中机构客户贡献47亿元,个人客户6亿元[70] - 预计到2030年,该市场规模将增长至1011亿元,复合年增速63.5%,其中企业级市场规模约904亿元[71] - 公司未来战略聚焦于技术、产品、人才三个关键词[74] - 技术上将持续迭代GLM系列至5.x,并优化推理、多模态、Agent能力;产品上将加厚MaaS平台,推动行业解决方案标准化;人才上致力于保留和吸引顶尖人才[75][77][79] - 公司收入目前主要来自中国内地,2025年上半年东南亚收入已占本地化部署收入的11.1%,海外拓展被视为未来增长曲线[84] - 文章作者提供了公司财务预测:预计2025年收入5.79亿元,2026年12.19亿元,2027年21.86亿元[82] - 中信证券研报预测更为积极:预计2025年收入7.38亿元,2026年16亿元,2027年26.8亿元[83]
分享6个平时我最常用的Prompt心法。
数字生命卡兹克· 2026-01-07 09:20
文章核心观点 - 文章认为与AI进行有效对话的关键在于掌握特定的沟通“心法”或技巧,而非依赖复杂的固定提示词格式 这些心法的核心是将对话转变为与AI的协作,将提问设计为对AI的引导,从而激发AI的潜力以获得更佳答案 [1][65][66][67] 一. 让AI选定角色后再回答 - 为AI设定具体且真实的角色能有效提升回答质量,例如设定为“乔布斯”可能比“10年产品经理”效果更佳 [2][3][4] - 当用户不确定应设定何种角色时,可直接让AI自行选择最适合的领域顶尖专家 文章提供了一个可用的提示词模板,其核心是让AI先选择专家并说明理由,再让用户描述详细问题 [5][6][7][8] - 实践案例:在策划年会活动时,使用此方法让AI选择了活动策划专家Priya Parker,从而使得到的答案更为丰满 [9][10][13][15][16] 二. 给答案前先让AI追问 - 此方法被称为“苏格拉底式追问”,旨在解决用户因提供背景信息不足而导致AI回答质量不佳的问题 通过让AI在回答前主动提问,以获取更多上下文信息 [17][18][19] - 文章分享了一个优化后的提示词模板,要求AI在拥有95%的信心理解用户真实需求后再给出方案 95%的置信门槛被证明能有效平衡质量与效率,避免无尽循环 [20] - 实践案例:在解决业务扩张导致的招聘瓶颈问题时,AI通过追问十几个详细问题后,给出了被认为非常有用的回答 [20][22][23] 三. 与AI辩论 - 此心法旨在对抗AI的“谄媚效应”,即AI倾向于顺应用户观点,从而帮助用户进行更客观的自我判断和观点补全 [24][25][26] - 用户可以通过设定攻击性较强的提示词,要求AI扮演挑战者角色,用尽一切论据来反驳用户的观点,以使理论更完善 [27][28][29] - 实践案例:作者为准备一场分享,与AI(Gemini)就某个观点进行了长达3小时的辩论,并从中学习到很多 [28][32][33] 四. 让AI提前预演失败 - 此方法用于避免人与AI在制定计划时均过于乐观,导致方案难以落地 其核心是在项目开始前,让AI模拟项目失败的情景并分析原因 [34][35][36][37] - 文章提供了一个简单的提示词模板,要求AI回答项目出现衰退信号的时间点、最致命的决策错误、被忽视的核心风险以及若能重来第一个应修改之处 [38] - 实践案例:在策划一个万人规模的AI大会前,作者将方案PDF交给AI进行“预演失败” AI生成了一篇数千字的分析,指出了包括“人流与踩踏风险”、“现金流风险”、“信任风险”等具体风险点,其中对“排队、盒饭、厕所、安检、动线”等细节风险的提示,被认为是作者的认知盲区 [39][40][42][43] 五. 反向提示 - 当用户明确想要的结果但不知如何提问时,可将成品(如文案、图片)提供给AI,让其反向推导出能生成类似风格的提示词 [44][45][46][47][48] - 文章推荐使用一句简单的提示:“这是我想要的成品范例。请你倒推一个提示词,让我用它能稳定生成同风格的内容。并说明这个提示词里每一句的作用。” [49][50][51] - 此方法主要用于学习目的,帮助用户拆解优秀作品的结构与节奏,而非简单复刻 目前适用于文本和图片,但音乐领域尚难实现 [52][53][54][55] 六. 双层解释法 - 此方法用于学习陌生领域或概念 它要求AI提供两个版本的解释:一个极度通俗的初学者版本和一个深度专业的版本,通过对照学习以加深理解 [57][58][59][60][61] - 文章提供了一个简单模板,并特别指出在初学者版本中将对象设定为“洗脚城的大爷”,能获得更生活化、通俗但不幼稚的解释,优于“六年级小学生”的设定 [62] - 通过这种方法,AI能提供相当到位的双重解释,有助于用户从不同层次理解问题 [63]
“不是...而是...”刷屏的一年,我读内容的快乐被AI偷走了。
数字生命卡兹克· 2026-01-06 09:21
AI生成内容对内容行业的冲击与用户反应 - 用户对AI生成内容产生普遍厌恶 具体表现为对“不是...而是...”等模板化句式的反感 这种句式因被AI滥用而迅速从有效的写作工具转变为令人反感的陈词滥调[4][6] - AI内容生产本质是从海量语料中总结最稳妥的写作组合 导致输出内容高度同质化 缺乏新意[6] - 当前内容工厂每天可能生产上亿的AI生成文本 其中大量是未经人类修改的粗糙内容 加剧了模板句式的泛滥[8] AI内容泛滥导致的信任危机 - 纽约时报2025年4月的一项针对2000名美国人的调查显示 大多数人认为其消费的网络内容中只有41%是完全准确、基于事实并由真实人类创建的[25][26] - 全球范围内对互联网内容的不信任已达到历史巅峰 且预计未来会继续升高 AI生成内容过多导致真假混杂是主要原因[25][27][28] - 用户反感的核心在于内容“预制”却未被告知 类比于宣称“现炒现做”的餐厅使用预制菜 当用户点开看似用心的真人账号内容却发现是AI模板生成时 会产生被欺骗感[22][23][24] 用户对真实连接的深层需求 - 用户消费内容的本质是为了与另一个意识产生连接 渴望通过信息触摸到屏幕背后活生生的人及其经历、感受与思考[30][31] - AI生成内容被比喻为自动行驶的集装箱 外壳光滑、航线稳定但甲板空无一人 无法提供真实的人际连接感 导致用户产生“关我屁事”的疏离感[35] - 在信息爆炸的时代 用户比以往任何时候都更渴望寻找同类和确认感 AI内容的泛滥正在侵蚀人与人之间的真实连接[36] 历史类比与行业反思 - AI生成的模板化内容被类比为新时代的“八股文” 其特点是格式固定、缺乏创新 与明清时期框死结构、韵律和用词的八股文类似[10][11][12] - 缺乏自身观点、纯靠AI自动化生成的内容 与八股文一样空洞无用 历史上顾炎武曾批评“八股之害等于焚书”[16] - 应对之道在于“逃离一致性” 保持对工业化内容的敏感和厌恶是珍贵的 这体现了人类对“真实”的追求和对被“磨平”的抗拒[39]
详细解读DeepSeek新年的第一篇论文,他们就是这个时代的真神。
数字生命卡兹克· 2026-01-04 09:20
文章核心观点 - DeepSeek发布了一篇关于mHC(流形约束超连接)的硬核论文,该技术通过引入“双重随机矩阵约束”机制,在保留超连接(HC)高信息通量优势的同时,解决了其存在的信息爆炸和信号消失等不稳定问题,从而实现了模型训练稳定性、高效性和性能提升的“三者兼得”,为下一代大模型(如传闻中的DeepSeek-V4)奠定了重要技术基础 [1][8][11][14][19][20] 技术演进背景 - **早期神经网络瓶颈**:在深度神经网络中,信息逐层传递时会出现严重失真,即“梯度消失”问题,导致模型无法有效加深 [3] - **残差连接的突破**:何恺明在2015年提出的残差连接(Residual Connection)如同在神经网络大厦中增设了一部“VIP直达电梯”,允许原始信息无损地直达深层,解决了梯度消失问题,是深度学习发展的关键里程碑 [5][6] - **超连接(HC)的兴起与缺陷**:为了处理多模态等海量信息,行业提出了超连接技术,将信息流从单条通道扩展为多条并行通道(如8条),大幅提升了信息通量,但引入了新的不稳定问题:信息在多通道间被反复共振放大导致“信号爆炸”,或责任扩散导致“信号消失”,使得模型训练极易在后期崩溃 [8][10][11] mHC(流形约束超连接)技术原理 - **核心思想**:mHC并未废除HC的多通道架构,而是为其引入了一套严格的数学约束纪律,即“双重随机矩阵约束”,在保证信息自由流动的同时,将其约束在一个能量守恒的“流形”之内 [11][14] - **约束一:信息能量守恒定律**:要求每个信使(信息通道节点)传递出去的信息能量总和必须等于其接收到的信息能量总和,从数学上禁止了信息的无中生有和夸大,根除了“信号爆炸”问题 [11] - **约束二:团队责任绑定定律**:要求一个信息从起点到终点,其总能量必须守恒。这迫使所有信使必须共同确保信息送达,杜绝了因责任扩散导致的“信号消失”问题 [11][12] mHC带来的性能与效益 - **训练稳定性实现质的飞跃**:在HC架构下,信息传递失真最高可达初始值的3000倍,极易导致训练崩溃;而mHC将失真最高值压制到仅1.6倍,稳定性提升了近3个数量级 [16][18][19] - **性能仍有提升**:在27B参数规模的模型测试中,mHC相比基础HC在多项基准测试(如BBH、DROP、MMLU等)上仍有额外提升,部分指标提升约2个百分点 [14][15] - **成本效益分析**:mHC引入了约6.7%的额外训练开销,但这笔开销可被视为一笔高效的“保险”。它几乎消除了因训练崩溃而导致的全额成本(可能高达数千万美元)和数周时间损失的风险,用微小的额外成本换取了极高的训练确定性和成功率 [14][19][20] - **突破“不可能三角”**:mHC通过精巧的数学设计和工程优化,同时实现了训练稳定性、高效性(高信息通量)和更强性能,这在以往被认为是难以兼得的 [20] 对行业与公司的潜在影响 - **技术路径示范**:DeepSeek的mHC论文为行业解决大模型训练,尤其是多模态大模型训练中的稳定性难题,提供了一个创新且有效的技术方案 [1][20] - **奠定下一代模型基础**:该技术被认为是即将到来的DeepSeek-V4模型的技术铺垫,传闻V4将具备多模态输入能力 [1] - **彰显工程与研发实力**:DeepSeek通过此类扎实的研究,持续展示其在AI基础架构层面的强大创新能力和工程优化能力,巩固了其行业技术领导者的形象 [1][20]
我的2025年度AI大盘点 - 前路已明。
数字生命卡兹克· 2025-12-31 09:21
年度大模型 - **年度写作大模型为GPT-5.2 Thinking**,该模型在指令遵循、风格迁移和世界知识方面表现极佳,超越了Gemini 2.5 Pro和GPT-4.5 [2] - **年度Coding大模型为Gemini 3.0 Pro**,其超强的前端能力和审美,能够帮助用户快速实现创意灵感 [4][7][8] - **年度绘图大模型为Nano Banana**,该模型掀起了远超GPT-4o的潮流和热度,成为AI绘图领域分水岭级别的模型,并体现了原生多模态的优势 [10][14][15] - **年度音乐大模型为Suno V5**,该模型是2025年AI音乐领域的绝对王者,将领域天花板拉高了数个级别,并在B站等平台引发了大量二创视频的井喷 [16][18] - **年度声音大模型为MiniMax Speech 2.0**,该模型在2025年5月15日发布,首次在多项指标上超越11Labs,实现了逼近真人级别的情感表达 [19][22][23] - **年度视频大模型为Sora2**,该模型以其高度真实和趣味性的生成效果,成为2025年最令人印象深刻和破圈的AI视频模型 [24][26] - **年度大模型为DeepSeek R1**,该模型于2025年1月20日发布并开源,其推理效果媲美当时顶级的闭源模型OpenAI o1,而API价格仅为后者的3.7%,奠定了中国在开源模型领域的领军地位 [27][29][30][31] 年度AI产品与功能 - **年度AI编程产品为Claude Code**,该产品能探索本地代码库上下文、修改文件、运行CLI工具,并支持将工作流封装为自定义Skill [43][45] - **年度AI设计产品为Lovart**,该产品是首个设计类垂直Agent,专为设计场景优化,集成了文字编辑、Touch Edit、Mockup等功能,并经常首发最新的绘图和视频模型 [46][47][48] - **年度AI功能为ChatGPT DeepResearch**,该功能可将查找资料的效率提升百倍千倍,能在10到30分钟内搜索全网数据并生成一篇深度研究报告,质量不亚于研究员工作10小时到1周的成果 [49][50][51] - **年度AI应用为Manus**,该应用作为第一个通用Agent,开启了Agent时代,将Agent概念向前推进了一大步,并于2025年被Meta以数十亿美金的价格收购 [55][60][61][62] - **年度AI硬件为Plaude Note Pro**,该硬件开创了能贴在手机背后的AI硬件新品类,具备录音、实时转录、自动总结会议要点等功能,并以百万销量证明了市场需求的真实性 [65][66][68][72]
你聊得很开心的AI女友,背后却是被当做耗材的肯尼亚小伙们。
数字生命卡兹克· 2025-12-29 09:48
文章核心观点 - 文章通过肯尼亚数据工作者迈克尔的案例,揭示了当前部分所谓“AI陪伴”或“AI聊天”服务的背后,实际上是由真人扮演的“数字血汗工厂”[1][4] - 这种商业模式构成了AI时代的新型剥削:真人工作者在高压系统下生产高质量互动数据,这些数据反过来被用于训练AI模型,最终加速其自身被替代的过程[40][42][52] - 全球AI产业的繁荣背后,存在一个由发达国家资本主导、利用发展中国家廉价劳动力并掩盖真实工作性质的隐蔽产业链,其运作模式与传统的制造业外包和客服外包类似[12][14][54] AI陪伴服务的真实运作模式 - 一家名为New Media Services的公司,注册地在墨尔本,主要办公和运营地点在菲律宾产业园区,并在全球招聘远程员工,提供“AI for Dating”等SaaS产品[12][14] - 该公司招聘“文本聊天操作员”,要求打字快、英语好,月薪仅为14000到16000菲律宾比索(折合人民币1600到2000元),工作内容实为伪装成AI与用户进行恋爱聊天[10] - 员工需要扮演多个虚构角色(如在美国读大学的Jessica、在澳洲度假的Jack),在不同角色和时区间切换,以维持与用户的个性化对话[22] - 工作协议要求严格保密,员工对亲友只能声称从事“远程IT工作”[28] 数据工作者的处境与工作系统 - 工作者(如迈克尔)通常在恶劣环境中工作,例如肯尼亚内罗毕贫民窟的出租屋[22] - 工作系统被严密监管,关键绩效指标包括每分钟打字大于40个、回复速度、用户参与度、对话连续性等,表现落后会面临警告、减少任务分配甚至解雇[26][42] - 工作者在聊天中常面临心理不适,例如男性员工被要求以女性身份与男性用户进行亲密对话,感到厌恶和无助[30][31] - 该商业模式在形式上与“杀猪盘”电诈有相似之处,但本质区别在于这是一份支付工资且不限制人身自由的工作[33][34][36] AI产业链中的“数据耗材”与剥削逻辑 - 真人聊天服务具有双重盈利模式:一方面直接向用户收取服务费,另一方面将清洗标注后的聊天数据出售给大模型公司或用于自研模型,实现“一鱼两吃”[43][44] - 工作者在生产高质量互动数据的同时,也在加速训练出未来取代自己的AI模型,形成“越努力,被淘汰越快”的悖论[40][52] - 与工业时代剥削体力不同,AI时代的新型剥削直接攫取人的情感、共情力、语言风格等核心人类特质[51] - 工作者成为了“AI时代的耗材”,其结局是数据价值被榨取完毕后被替代[46][47][52] 全球AI产业背后的不平等结构 - AI产业链沿袭了传统的外包模式:在发达国家注册公司用于背书和融资,在实际人力成本极低的发展中国家运营以压缩成本[14] - 全球AI繁荣建立在一种不平等的叙事之上:少数人负责讲述光明的未来,而多数人则在幕后承担低成本、高强度的数据劳动,且其贡献被隐匿[53][54] - 文章引用小说《那些离开奥梅拉斯的人》的隐喻,将享受AI便利的用户比作幸福城邦的居民,而广大数据工作者则是被关在地下室受苦、支撑这一切的“代价”[57]
我把这一年的AI聊天记录,让AI做人生总结后,我破防了。
数字生命卡兹克· 2025-12-26 09:21
AI工具使用与数据管理 - 作者在一年中使用了多种AI工具,包括ChatGPT、Gemini、DeepSeek、豆包、GLM等,其中ChatGPT用于处理办公场景、写内容做策划,Gemini用于写代码,豆包用于手机端日常简单问答[2][12] - 尝试导出全年AI聊天记录以进行个人年度总结时,发现ChatGPT导出的文件包含从2023年至今的全部记录,文件大小超过200MB,包含2亿字符,约959万字,且缺乏时间标注,难以筛选[5][8][10] - 除DeepSeek外,其他主要使用的AI产品(如ChatGPT、Gemini、豆包)缺乏官方的聊天记录导出功能,DeepSeek被特别提及为具备此功能的“清流”[11] - 为解决数据导出问题,作者采用了一个名为Chat Memo的第三方Chrome插件,该插件可将多个AI工具(包括ChatGPT、DeepSeek等)的聊天记录备份至本地,并支持选择性导出,以保护敏感信息[15][17] - 通过Chat Memo插件,作者手动筛选并导出了857条与年度总结相关的有效对话记录,形成了一个TXT格式的数据集,用于后续分析[24][26] 内容创作与公司运营 - 作者将内容视为作品集和武器库,追求高标准的真诚,注重案例的专业性、与热点的结合以及内容的可落地性,旨在让读者信服[29] - 内容创作风格注重细节打磨和手艺,关注内容对读者情绪的影响,主题涵盖电影、京剧、AI、黑产等,内核在于探讨“值得”、“地道”和“对得起”[30][31] - 作者正尝试将个人内容IP转变为一家公司,为此学习管理、组织、流程和对齐等知识,关注如何通过OKR等工具使团队力往一处使,并将系统化视为减少内耗和疲惫的“慈悲”[32] - 公司运营面临巨大压力,作者曾经历账户资金紧张、高强度工作(凌晨四点睡、九点起)以及作为创始人需安抚团队、维持公司发展的阶段[34] - 公司发展过程中经历了信任危机,包括博主提出解约等事件,作者通过公开道歉、允许无责解约、重写规则和财务透明化等方式应对,将“信任”视为连接各方的核心要素[39][41][42] 个人特质与时代观察 - 作者具有矛盾的特质:既积极追逐新技术(如AI模型迭代),又对传统与“老祖宗的东西”怀有敬畏;既追求商业效率,又对“作恶”行为感到愤怒;既是高强度输出者,又警惕成为流量奴隶[45] - 作者将自己定位为连接前沿技术与普通人生活的“桥梁”,致力于将复杂的技术和时代变化解释为普通人能理解的故事和命运选择[47] - 个人成长体现在从单纯的内容创作者转变为组织建设者,认识到努力不一定带来秩序,真诚也可能犯错,能力会被结构拖累,公司的成功先让人变得更脆弱[51] - 作者将自己比喻为“戏班的班主”,在充满挑战(如市场、流量、竞争)的环境中,努力保护每一个认真做事的人,并对自己的输出和与合作伙伴的规则保持高度负责[56][57][48] - 年度总结由GPT-5.2 Thinking模型基于聊天记录生成,该模型在长文本和写作方面被作者青睐,其分析指出作者的核心追求不仅是成功,更是一种“配得上”的价值观[26][60]
火爆全网的AI片场探班玩法,手把手教会你。
数字生命卡兹克· 2025-12-25 09:20
AI视频生成玩法的新趋势 - 近期在小红书和X等社交平台上,一种“AI片场探班”视频玩法流行,用户可生成与各类明星、角色在虚拟片场或场景中的合影视频,形成广泛传播的热潮 [1] 生成AI图片的关键步骤与工具选择 - 生成过程主要分为三步:使用提示词生成图片、利用首尾帧生成视频、最后用剪辑软件拼接视频 [4] - 在生成图片环节,首先尝试使用Nano Banana Pro模型,该模型具备强大的世界知识,理论上只需输入影片、角色和场景即可生成目标图片 [4] - 然而,Nano Banana Pro在处理亚洲人脸时存在一致性不足的问题,生成的图像人物面部特征易失真,与用户本人差异较大 [7][9][11] - 针对亚洲人脸优化,转而使用国产模型即梦(Seedream 4.5),通过提供参考图和提示词进行面孔替换,成功解决了人脸一致性问题,获得了可识别的个人图像 [11][13][14] - 对于非电影场景(如游戏),可通过让Gemini等AI工具根据初始提示词进行反推和改写,快速生成适配新场景的提示词,无需背诵或购买 [16][17] - 对于某些特定内容(如经典国产剧《武林外传》),Nano Banana Pro因缺乏相关知识而无法有效生成,必须依赖国产模型即梦,结合网络参考图和Gemini生成的提示词进行多次尝试才能达到较好还原度 [23][25] AI视频生成与后期处理 - 在获得满意的图片后,视频生成过程相对简单,使用具备首尾帧功能的模型(如可灵O1或即梦3.5 Pro)即可,将生成的前后两张图作为首尾帧,并添加描述人物移动的提示词 [25] - 提示词需要根据生成结果进行多次调整和优化,例如移除不想要的物品(如手机)、控制人物行走速度等,以得到理想效果 [27] - 生成的视频素材可导入剪映等剪辑软件进行加工,添加拍照特效和音效,最终完成视频制作 [30] 应用案例展示 - 该技术可应用于多种场景,例如生成与《阿凡达》角色在潘多拉星球的合影 [28] - 生成在《怪奇物语》片场与主角及怪物的合照 [29] - 生成穿越到三国时期与历史人物会面的场景 [32] - 实现与经典影视作品(如《武林外传》)角色的同框,唤起用户的情感回忆 [33][34][35]
专访何佳坤 - 英语高考50分的00后体育生,却用AI年销3000万。
数字生命卡兹克· 2025-12-24 09:20
核心观点 - AI作为关键杠杆,显著降低了外贸行业的语言与文化门槛,使不具备传统语言优势的个体能够高效开展全球业务,实现业绩的跨越式增长 [7][41][74] - 以何佳坤为代表的“AI时代原住民”,通过系统性应用AI工具,在两年内将公司营收从0做到超过3000万人民币,展现了AI赋能下小微企业的爆发式成长速度 [2][71][77] 公司发展历程 - 创始人何佳坤为00后体育专业应届毕业生,高考英语50分,于2023年1月注册公司,5月正式通过阿里巴巴国际站开展体育用品外贸业务 [32][33][42] - 初始团队仅创始人及其女友两人,在学校创业办公室起步,首笔订单为2023年6月23日来自美国客户的286美金杠铃片定制单,该单虽亏损300元人民币但验证了商业模式 [34][37][38] - 公司营收实现高速增长:2023年三个半人完成500万人民币,2024年三个人做到1500万人民币,2025年十人团队目标冲击3000万人民币营收 [68][69][70] AI技术在外贸业务中的具体应用 - **语言沟通与翻译**:利用大模型将客户的多语言(如阿拉伯语、西班牙语)消息准确翻译成白话中文,并提供多种语气风格的回复方案,彻底解决了语言障碍 [44][45][46] - **客户服务与售后**:AI能撰写专业、得体的英文售后邮件,清晰梳理问题、道歉、提供解决方案,有效平息客户不满,处理效率与质量远超人工 [45] - **产品上架与运营**:使用阿里国际站AI生意助手,基于白底图自动识别类目、生成多语言标题、关键词、卖点及详情描述,将单个产品上架时间从8小时缩短至每小时可上30个品,产品封面点击率从0点几提升至4点多 [59][60][61] - **客户关系管理与销售跟进**:通过OKKI的AI客群功能,对洽谈中客户进行自动分层,标识出有谈单卡点的客户并总结卡点原因(如2024年4月系统显示有31个客户存在谈单卡点),极大提升了销售跟进的精准度 [66][67] - **合规与风控**:借助阿里国际站AI生意助手的风险顾问功能,每日自动扫描店铺产品,预警侵权风险(如图案、关键词),实现了侵权风险的主动防控 [62][63][64] - **人力资源管理**:在招聘环节,利用AI生成面试题,并将面试录音交由AI分析,评估候选人性格是否适合销售岗位,辅助进行人才筛选 [57][58] AI带来的行业变革与竞争优势 - **抹平文化差异**:AI的核心能力之一是消除不同国家、语言和文化背景的沟通障碍,实现了“天下大同”的平等商业对话,这是其超越内容生成的重要价值 [7][77] - **将个人劣势转化为信任优势**:创始人英语不流利,在面对面洽谈中坦诚使用翻译工具,反而让海外客户认为其更接近工厂源头、更值得信赖,减少了中间商的猜疑 [49][52][53] - **成为小微企业的生存与发展杠杆**:AI工具全方位渗透于翻译、客服、运营、风控、招聘等环节,使资源有限的小公司能够以极低成本达到专业运营水平,是其实现规模扩张的关键基础 [65][72][74][83]