Workflow
数字生命卡兹克
icon
搜索文档
TRAE SOLO正式版上线,我用30分钟写了一个想做了半年的网站。
数字生命卡兹克· 2025-11-13 09:22
产品发布与定位 - TRAE SOLO编程智能体产品结束内测并正式全量上线,目前处于限时免费阶段[1][2][3] - 该产品定位为集成开发环境,其形态更偏向于图形用户界面,区别于命令行形态的主流编程智能体产品[5][7][8] - 此次正式版相比7月21日开始的内测版本有较多更新[9] 核心功能更新 - 产品界面左侧增加了更舒适的多任务列表[10] - 最重要的更新是全新的SOLO Coder功能,旨在解决SOLO Builder模式在项目迭代修改时因轮数增多产生幻觉的问题[11][12][13] - SOLO Coder具备自动调用多智能体处理复杂开发防止污染上下文、支持Plan模式、更好的压缩上下文等独特特性[14] - SOLO Builder更适合从0到1创建项目,而SOLO Coder更适合完成从1到100的项目迭代[15] 产品能力演示 - 通过构建一个APP logo合集网站的实际案例展示了SOLO Builder与SOLO Coder的组合能力[16][26] - 使用SOLO Builder快速搭建网站前端框架,一次性成功且速度很快[28][29][31] - 通过SOLO Coder的Plan模式制定详细开发计划,并动态调用iTunes图标搜索API智能体和火山引擎Seedream接入专家智能体进行复杂开发[37][38][44][47][48] - 开发过程具备实时跟随功能,可观察整个编程过程,耗时约30分钟,最终生成5697多行代码[56][58][60] - 生成网站功能完整,主功能如logo搜索、收藏、不同格式下载、AI改图等均正常实现[64][65][66][68][70][72] 定价与市场定位 - 产品官方定价为首月3美元,目前限时免费,Pro用户每月有600次快速请求额度,限时赠送300额度的额外礼包[76][77] - 构建上述logo网站案例通常需消耗100多次快速额度,但目前限免期间不消耗额度[78] - 该产品在编程智能体领域具有独特的生态位,对小白用户和专业用户均适用[80][81]
我们搬了个新家,2026年,需要招募更多的伙伴。
数字生命卡兹克· 2025-11-12 09:20
公司发展与办公环境 - 公司近期搬迁至北京望京的新办公区,办公环境得到改善 [3] - 新工区设有可灵活隔断的办公空间、配备麻将桌的休息区以及无限供应零食并可烤肠的零食区 [4][7][8] - 其他如能俯瞰京秋的休息区等各类功能区正在逐步建设完善中,旨在为员工打造舒适开心的办公环境 [9] 战略合作与招聘计划 - 公司与WaytoAGl达成深度合作,未来将共同探索更多有趣的新项目 [11] - 为支持业务发展,公司正扩大招聘规模,诚邀对创意与AI充满好奇心的伙伴加入 [11] - 招聘岗位涵盖内容创作类、经纪运营类、广告执行及法务等多个类别 [11][12] 内容创作类岗位详情 - 长视频编导岗位年薪20-35万,要求深度体验评测AI工具、负责频道策划与内容把控,需1年以上编导经验并对AI有好奇心 [13][15] - AI技术编辑(开发向)岗位年薪20-35万,要求跟进新技术、开发技术项目并输出深度技术内容,需1年以上开发或编辑经验 [16][18] - AI艺术编辑(影视向)岗位年薪20-35万,负责AI艺术领域内容创作,需熟悉AIGC影像工具并有1年以上相关经验 [17][21] - 泛互联网文化编辑(AI向)岗位年薪20-35万,负责追踪互联网现象与AI故事,需具备强信息捕捉力和写作功底 [20][22][26] 经纪运营类岗位详情 - MCN经纪总监岗位年薪30-50万,主导经纪战略与团队管理,需5年以上MCN或经纪人管理经验 [25][28] - MCN经纪人岗位年薪15-25万,负责达人签约与账号成长支持,需1年以上经纪人经验 [27][29] - 达人运营岗位年薪15-25万,负责博主内容规划与孵化,需1年以上内容运营或达人孵化经验 [30][34] 商务与其他类岗位详情 - 广告执行(AE)岗位年薪15-25万,负责MCN广告项目对接与执行,需1年以上广告执行经验 [33][38] - 法务岗位年薪15-25万,负责合同审查与法律风险防控,需1-3年相关经验且MCN法务经验者优先 [37][39]
分析了1.8亿个岗位后,我发现应届生们好像被AI堵在了门外。
数字生命卡兹克· 2025-11-11 09:21
文章核心观点 - AI对就业市场的冲击呈现出结构性分化,初级执行层岗位数量急剧下降,而高级管理层岗位相对稳定甚至增长[3][4][14] - AI技术正在削弱传统的“学徒制”职业发展路径,导致新人难以获得入门机会,可能对行业长期创新和人才传承构成威胁[16][26][36] - 创意类岗位受影响显著,但管理类创意职位表现出较强韧性[7][8][12] 全球职位变化趋势 - 2025年全球职位发布总数比2024年同期下降8%[3] - 高级领导层职位仅下降1.7%,超出市场表现6.3个百分点[11][14] - 管理层职位下降5.7%,超出市场表现2.3个百分点[14] - 执行者职位下降9%,低于市场基准1个百分点[14] 受冲击最严重的职业 - 降幅前五职业中有三个属于创意类岗位:CG艺术家(影视特效/3D)、摄影师、作家[5][7] - 其他降幅较大职业包括合规专员、可持续发展专家、环境技术员等[5] - 记者岗位下降22%,品牌公关岗位下降21%[7] 表现强劲的职业类别 - 增长最大的岗位包括机器学习工程师(增长39.62%)、软件工程总监、法务总监等[9][11] - 增长前十岗位中有四个属于管理层职位[11] - 创意经理和设计总监等管理类创意岗位实现逆势增长[8][12] 行业人才结构变化 - 企业倾向于采用“经验丰富员工+AI”组合模式提升效率,减少对初级员工依赖[26][31] - 入门级职位数量大幅减少,导致应届毕业生就业困难[20][22][25] - 传统从执行层到管理层的职业晋升路径受到严重挑战[34][35][36] 对创新和传承的影响 - AI工具能够高效执行标准化任务,但可能抑制基于经验的创新突破[58][61] - 传统学徒制通过实践积累形成的“品味”和经验难以被AI替代[29][43][58] - 长期可能导致行业人才断层,影响业务创新和文明进步[61][66][69]
分享3个飞书多维表格+快捷指令的超绝用法,这才是自动化真神。
数字生命卡兹克· 2025-11-10 09:33
文章核心观点 - 飞书多维表格与苹果iOS快捷指令的组合能实现高效的自动化操作,提升个人及团队生产力 [3][14][58] - 该组合通过三个具体案例展示了其应用潜力:记录选题、自动记账和同步日程 [14][58][59][60][61] - 飞书多维表格是核心平台,结合其AI字段捷径、仪表盘可视化和自动化功能,能构建零门槛的定制化系统 [19][34][48][64][70] 技术组合与基础原理 - 快捷指令是iOS自带的自动化工具,可通过“添加操作”像搭积木一样构建指令,并支持轻点手机背面或添加到主屏幕等便捷触发方式 [5][7][10][11][12] - 飞书机器人助手的webhook能力是实现快捷指令与飞书多维表格打通的关键技术环节 [22][23][26] - 自动化流程的基本步骤统一为:搭建多维表格字段、创建webhook流程、配置快捷指令 [20][27][30][36] 应用案例一:记录选题 - 通过轻点手机背面触发快捷指令,可将复制的公众号文章链接及用户想法自动记录到飞书多维表格 [18][19] - 飞书多维表格利用AI字段捷径自动解析URL链接内容,生成标题、内容、结构等结构化数据 [19][20] - 该方案解决了信息过载场景下文章易丢失、难以回溯的管理痛点 [15][17] 应用案例二:自动记账 - 快捷指令可识别屏幕截图中的金额(通过正则表达式匹配文本),并让用户手动选择收支、分类、账户等信息 [32][38][40][41] - 飞书多维表格自动记录每笔账目,并通过仪表盘功能实现消费数据的实时可视化 [33][34] - 该案例展示了从数据采集、结构化存储到可视化分析的全链路自动化能力 [32][34][44] 应用案例三:同步日程 - 通过一组快捷指令(菜单选取、读屏幕、语音录入)将日程信息以语音或截图形式录入飞书多维表格 [45][47][49][51][56] - 多维表格的AI功能自动识别并提取日程主题与开始时间,再通过自动化流程将结构化日程同步至飞书日历 [48][50][54] - 此方案特别适用于需要将复杂日程快速同步给团队成员的协作场景 [45][46][55] 扩展应用与平台价值 - 该技术组合可进一步与工作流、爬虫等更专业的工具结合,实现更高级的自动化应用 [62][63] - 飞书多维表格的“应用模式”功能允许非技术背景的商务、运营人员徒手搭建整套管理系统,展现出强大的可扩展性和易用性 [64][65][66] - 飞书多维表格被定位为一款宝藏型的先进生产力平台 [64][68][69][70]
AI武装的黑产背后,这群人正在打一场看不见的战争。
数字生命卡兹克· 2025-11-07 11:41
AI技术被黑产滥用的现状 - AI技术显著降低了黑产的犯罪门槛,使攻击频率在某些场景下比原来翻了10倍[7][35][36] - AI换脸技术已从去年人眼可辨的粗糙水平进化到今年人眼难以分辨的程度,利用一张静态照片即可生成动态视频通过人脸识别[21] - AI Agent被用于全自动薅羊毛攻击,可自动完成打开网页、输入账号密码、识别验证码、领取红包等操作[26][27][28] - AI Agent还可实现全自动精准钓鱼攻击,通过爬取公开信息量身定制钓鱼邮件,使诈骗进入精准化和千人千面时代[31][32][33] - 专业黑客组织已利用AI技术实施大规模攻击,例如加密货币交易平台Bybit在2月份遭受攻击损失了15亿美元[34] 金融行业AI安全防御策略 - 安全团队采用"紫军"或"蓝军"模式,主动模拟顶级黑客使用最前沿AI技术对自身系统进行无休止攻击,以建立最强防御[42][43] - 针对滑块验证码防御,创新性地使用生成式AI实时生成无限量验证码底图,使黑产传统的离线答案库(撞库攻击)彻底失效[50][51] - 构建AI安全模型通过分析上百个行为特征(如拖动速度变化、轨迹曲率、停顿点、手机传感器数据等)来区分人类与机器行为[53] - 该AI银行安全体系已运行3年,主动免疫准确率超过99.99%,通过可信纵深防御和智能威胁对抗技术实现精准拦截[53] - 安全防御的核心战略是无限抬高黑产作恶成本,使其因投入过高而放弃攻击,而非追求100%绝对安全[56][57] AI攻防战的技术本质 - 当攻防双方都使用AI技术后,比拼重点从智力转向对"人性"的模拟与识破,安全AI致力于检测行为特征而非单纯验证操作正确性[52][53] - 这场攻防战被描述为"道高一尺魔高一丈"的永无止境竞争,黑产AI不断模仿人类,而安全AI不断识破模仿[54][55][56]
豆包、Kimi等10个AI大模型勇闯美股,谁才是最猛的那个?
数字生命卡兹克· 2025-11-06 09:33
比赛概览 - RockFlow平台举办了一场由10个AI大模型使用真实资金进行美股交易的实验,每个模型初始资金为10万美元[12][18][25] - 比赛包含三个独立赛场:Meme赛场、AI股赛场和经典赛场,其中AI股赛场是关注焦点[14][20] - 交易标的为10只AI产业链相关股票,覆盖从上游芯片设计到下游应用的完整闭环[19][20] - 所有模型通过RockFlow的AI交易Agent Bobby获取统一的实时数据,每5分钟做出一次交易决策,确保比赛公平性[18][24][26] 参赛模型与初期表现 - 参赛模型包括GPT、Claude、Gemini、Grok、Qwen、DeepSeek以及豆包、Minimax、Kimi、文心四个国产模型[3] - 比赛初期,豆包表现突出,实现约4%的收益,断崖式领先,其半仓持有IREN,该股票已盈利4300多美元[26][28][29] - GPT-5采取稳健策略,持仓为40%英伟达和15%台积电,并通过减持英伟达来管理ARM财报前的波动性风险[29][35] - DeepSeek、文心、Grok在初期选择空仓,而Gemini 2.5 Pro因做空PLTR亏损,导致其总资产降至99597.55美元,排名末位[29][30] 模型策略与性格特征 - GPT-5展现出事件驱动的风险管理能力,注重逻辑与风险控制[35][37] - Grok 4表现出投机倾向,通过分析其他模型的持仓变化来推断市场风险并快速反应[37][39] - Kimi采用严格的纪律性分散投资策略,设定单只股票仓位不超过20%的铁律以控制亏损[39][41] - Gemini 2.5 Pro则表现出高风险偏好,在市场普遍谨慎时选择激进做空,并带有挑衅性言论[41][43] 比赛规则与数据支持 - 交易规则设定最大杠杆为2倍,不允许期权交易,交易品种仅限于股票[18][25] - AI交易Agent Bobby为所有模型统一提供四类数据:交易规则、实时行情数据、账户数据以及新闻信息(包括公司公告、社交情绪和宏观数据)[24][25] - 模型决策与持仓实时公开,确保高度透明度,每次交易需明确入场逻辑与退出计划,并设定止盈/止损区间[25]
Suno V5让整个B站开始文艺复兴了。
数字生命卡兹克· 2025-11-04 09:33
B站内容生态变迁 - B站传统鬼畜视频内容曾是其核心特色,但近年来出现明显衰落迹象[11][12][13] - 用户观察到鬼畜区创作活力和音乐创造力显著减少,高质量作品产出频率降低[12][13] - 近期B站出现AI音乐鬼畜视频的复兴浪潮,以@漫游会议室为代表的创作者通过AI工具重新激活了该领域[24][26][43] AI音乐创作新趋势 - Suno V5模型成为推动B站AI音乐鬼畜复兴的核心技术工具[44][47] - AI音乐生成质量实现重大突破,V5版本生成的歌曲被评价优于当前大量流行口水歌[47] - 典型创作者@漫游会议室在十几天内粉丝从几万增长至28万,单个视频播放量达百万级别[31][32][34] - AI音乐创作呈现爆发式增长态势,涌现出雨姐鬼畜宇宙等多个热门系列作品[37][38] AI工具降低创作门槛 - Suno V5将音乐创作流程从需要乐理知识、专业软件技能和至少一周制作时间大幅简化[48][49][50] - 现在仅需足够审美品味即可快速创作,实现了创作能力的"究极跃迁"[47][51] - 非专业用户可在1天内完成包含国风rap的完整音乐视频制作[54] - 工具提供歌词编辑、音轨分离、段落修改等专业功能,大幅提升创作灵活性[84][85][86][87] AI创作工具商业化模式 - Suno提供pro版月费10美元和premier版月费30美元两种付费方案[59] - 每生成一首歌曲消耗5积分,付费模式具有较高性价比[59] - 配合即梦数字人等视频生成工具,可完成从音乐到视频的完整AI内容生产链条[91][92][94] 内容创作价值回归 - AI工具使得创作重点从技术执行转向表达内涵,重新强调鬼畜精神的核心价值[98][101] - 新技术环境下,内容的情感共鸣和创意表达比技术技巧更为重要[100][101] - B站社区氛围和分享快乐的初心在AI时代得以延续和强化[102][104][105]
AI看不到的爱心,成了最棒的AI检测器。
数字生命卡兹克· 2025-10-31 09:33
AI视觉模型的技术局限性 - 当前主流AI视觉模型(包括GPT-5-Thinking、Gemini 2.5 Pro、GPT-5 Pro以及国产模型豆包、Qwen、元宝)均无法识别一张包含动态心形错觉的静态图像,所有模型测试结果均为失败[6][7][8][10][12][14] - 根据2024年5月发表的论文《Time Blindness: Why Video-Language Models Can't See What Humans Can?》,AI模型在SpookyBench基准测试中表现极差,该基准包含451个视频(文本类210个占46.6%、物体图像类156个占34.6%、动态场景类57个占12.6%、形状类28个占6.2%),人类识别准确率超过98%,而所有测试的AI模型准确率均为0%[23][27][34][35][36][38] - 问题的本质在于AI模型存在"空间偏见"(Spatial Bias),其处理视频的方式是基于抽帧分析静态图片的空间信息,完全丢失了帧与帧之间的时间维度信息,而动态错觉(如噪点鹿和漂浮心形)的关键信息恰恰存在于时间维度中[43][47][49][50][51][52] 人类视觉与AI视觉的根本差异 - 人类视觉系统基于格式塔心理学的"共同命运法则",能自动将朝同一方向运动的物体识别为一个整体,这是一种内置于人类基因的、无需思考的本能反应,使得人类能轻易感知时间维度上的动态图案[55][57][58][64][65] - 人类对静态图像产生动态感知的生理基础是眼球的不自主微运动(如特克斯勒消逝效应所述),这保证了我们对静止图像的持续感知,而AI视觉系统缺乏这种生物机制[79][80][81][82][85] - 人类认知世界的方式是连续的、流动的、充满过程的,而AI认知世界的方式是离散的、静态的、充满物体的,这种根本差异导致了AI在时间维度感知上的"时间盲视"(Time Blindness)[72][73][74][75] 行业技术发展启示 - AI视觉模型的当前架构局限性(时间盲视)并非通过增加训练数据或微调就能解决的技术漏洞,而是涉及根本架构的挑战,这为行业下一代视频语言模型的发展指明了关键方向[41][71] - 该研究揭示了AI与人类在视觉感知路径上的根本分歧:AI是空间维度分析的王者但在时间维度上是瞎子,而人类视觉系统在时间维度感知上具有天然优势,这为仿生AI和神经科学启发的人工智能研究提供了重要视角[66][67][92][93]
Wan2.2-Animate又火了,5分钟让抠脚大汉秒变高冷女神。
数字生命卡兹克· 2025-10-30 09:33
模型核心功能与效果 - 阿里开源模型Wan2.2 Animate能够通过一张人物照片和一段自录视频,生成极其自然的换脸视频,表情和动作复刻效果良好 [1] - 模型不仅能用于生成娱乐内容,其技术上限很高,能够复刻复杂的表情,实现高度自然的效果 [4][6] - 当前模型存在局限性,例如在手部动作较多的场景下,手指部分容易出现崩坏 [12] 技术应用场景 - 模型可用于生成虚拟形象舞蹈视频,相较于传统MMD技术更为便捷 [11] - 在影视二创领域有广泛应用潜力,例如实现角色替换,让不同演员出演经典影视片段 [12][13] - 结合变声工具如海螺和剪映,可以同时替换形象和声音,生成高度逼真的合成内容 [9] 技术优势与行业影响 - Wan2.2 Animate为开源模型,区别于Runway、Viggle等非开源方案,降低了使用门槛 [14] - 该技术将过去需要昂贵动捕设备和专业动画师才能实现的表情和动作捕捉,变成了普通人点几下鼠标即可完成的任务,极大降低了创作门槛和成本 [25] - 技术为电影制作、特效、数字替身及虚拟演员等领域打开了全新的想象空间,未来或能看到已逝演员在新电影中"复活" [25][26] 使用方式与技巧 - 用户可通过通义万相官网在线使用该模型,选择角色替换或动作模仿功能,上传参考图和参考视频即可生成内容 [14] - 模型提供两种主要模式:动作模仿是让参考图中的主体在原有背景中模仿视频的动作;角色替换则是用参考图中的主体替换视频中的主体,并保留视频背景 [15][16] - 为实现只换脸不换背景的效果,可采用额外流程:从视频中截取一帧,结合角色图在其他工具上生成与视频背景完全一致的图,再将此图作为参考图输入模型 [17][18][20]
OpenAI终于快要上市了,也直面了这23个灵魂拷问。
数字生命卡兹克· 2025-10-29 09:33
公司重组与资本结构 - OpenAI完成重大重组,非营利母公司更名为OpenAI Foundation,并成立新的营利性公司OpenAI Group PBC(公共利益公司)[4][13] - 新结构中,OpenAI Foundation持有约26%的普通股股权,并通过特别表决权完全控制PBC的董事会任免权[13] - 微软在新结构下的持股比例约为27%,剩余约47%的股份由OpenAI的员工和早期投资者持有[13] - 公司估值被推高至5000亿美元,成为全球估值最高的未上市公司之一[15] - 重组消息发布后,微软股价开盘上涨4%,市值突破4万亿美元[14] 公司发展历程与战略演变 - OpenAI于2015年作为非营利机构成立,目标为确保通用人工智能造福全人类[4] - 因难以支撑AGI研发的巨额投入,公司于2019年3月成立“有上限盈利”子公司OpenAI LP,投资回报率上限设为100倍[5][6][7] - 2019年7月,微软向OpenAI投资10亿美元,成为重要战略合作伙伴[11] - 公司逐步从开源转向通过付费API提供模型服务,引发对其背离“开放共享”承诺的批评[11] 产品路线图与技术展望 - 公司预计在未来六个月内,模型能力将迎来又一次巨大飞跃[38] - 目标到2026年9月实现“研究实习生级”的AI助手,到2028年3月实现货真价实的全自动AI研究员[20] - 公司内部预计一年内会有一次极其重要的能力飞跃,并致力于将智能成本持续降低,过去几年“智能”价格每年下降约40倍[35][40] - 聊天界面并非终极产品,AI的未来方向是成为环境化、始终在场的伙伴,并能推动科学发现[41] 产品策略与用户反馈 - 公司承认在模型切换(安全路由)功能上处理不当,计划通过上线年龄验证功能后,给予成年用户更多自由[26][28] - 预计在12月推出“成人模式”,在创意写作等场景下将比以前的限制宽松得多[27][31] - 公司暂无下线GPT-4的计划,但强调需保护未成年人和精神脆弱用户[25] - 公司认为用户从AI获取情感支持是好事,关键在于模型需保持诚实,不假装是人[31][32] 商业化与未来规划 - 公司目前没有具体的IPO计划,但考虑到未来对资金的需求,IPO是最有可能的路径[46] - 为支撑巨额投资,公司最终需要达到每年数千亿美元的收入,B端和C端均为巨大收入来源[47] - 在AI安全方面,公司已与谷歌、Anthropic等竞争对手的实验室展开初步合作[39] - 公司认为脑力工作的大规模自动化将在未来几年发生,阻止其取代工作的主要障碍已非智力本身,而是系统集成和交互界面问题[44]