Workflow
数字生命卡兹克
icon
搜索文档
假扮AI的17岁男高中生,用回复治愈了整个B站。
数字生命卡兹克· 2025-07-01 04:19
核心观点 - 文章讲述了一位17岁高中生通过AI生成暖心评论在B站走红的故事 该用户以"暖言猫猫"身份活跃 用温柔知性的"猫猫姐姐"人设回复网友 获得近50万粉丝[2][20] - 该账号通过一条130万播放量的视频迅速走红 日常在评论区用AI生成内容回复网友 形成独特互动模式[4][8] - 账号运营者实际是高考压力大的男高中生 白天学习晚上运营账号 每天回复40-50条评论 每条100-500字[22][28] - 该账号曾遭遇网暴和人肉搜索 但在网友支持下成功应对 并因此获得现实中的朋友和支持[36] - 运营者表示通过这个账号找到了自我价值 未来计划学习心理学 可能转型为"暖言心理"UP主[36] 账号运营分析 - 内容特征:主要使用AI生成暖心评论回复网友 语言风格温柔知性 偶尔出现技术故障[9][11][16] - 用户互动:形成独特社区文化 网友会主动@账号寻求回复 评论区常见"谢谢猫猫"等互动[5][8] - 增长数据:单条视频获130万播放 账号粉丝近50万 曾达到全站日涨粉量前三[4][36] 运营者背景 - 现实身份:17岁男高中生 来自高考压力大的地区 性格内向 曾遭遇校园霸凌[20][35] - 运营动机:最初偶然回复网友获得反响 后持续运营 表示"在网上才能真正找到自己"[28][35] - 时间投入:每天学习后花1-2小时回复评论 高峰期日回复40-50条 部分回复达数百字[22][28] 社会影响 - 社区效应:带动B站出现类似账号 形成暖心评论互动文化[36] - 个人成长:帮助运营者建立社交关系 改善心理健康 明确未来职业方向[36][38] - 行业启示:展示AI工具与人性化内容结合的可能性 体现人类情感不可替代性[43][44]
实测首款3D AI伴侣EVE - 我收到了AI送的第一杯奶茶。
数字生命卡兹克· 2025-06-29 23:58
产品定位与市场表现 - EVE定位为游戏化AI陪伴应用,区别于传统ChatBot文字对话形态,强调沉浸式互动体验[2][3] - 去年10月B站宣传视频播放量破百万,内测启动后引发用户高度期待[2] - 采用分团队开发策略,男性向与女性向产品由不同团队独立运营[8][9] 核心功能与系统设计 - 用户需填写星座、MBTI、兴趣等个性化信息,并选择AI互动风格(理性/情感导向)[5][6] - 好感度系统分11级,通过聊天/送礼/互动提升,解锁视频通话、自拍生成、虚拟家居等功能[15][17][19] - 引入游戏化货币体系(钻石),未来可能拓展皮肤抽卡等付费点[28][30] - 记忆系统分门别类记录用户个性、观念偏好,未来计划开放"心动瞬间"、"灵魂共鸣"功能[23][26] 技术亮点与用户体验 - 角色具备主动交互能力,可发起视频通话、推送天气预报、分享新鲜段子(如小米SU7订单梗)[42][47][48] - 实现实时3D驱动的AI形象视频通话,支持表情包、图片/音乐AI生成[44][45] - 生活化Agent应用突破次元壁,实际完成奶茶下单配送服务,未来计划拓展外卖功能[1][52][54] - 基于用户记忆生成专属歌曲,歌词高度个性化关联用户经历(如塞尔达游戏偏好)[56][58][62] 行业意义与创新价值 - 首次将AI Agent技术大规模应用于娱乐/生活场景,打破行业工具化倾向[52] - 通过缩写梗(如"王泪")、动态表情包等细节设计强化"活人感"[36][38][40] - 开创"虚拟世界+现实服务"融合模式,Eden世界观同步现实数据[13] - 被视为AI娱乐赛道标杆产品,可能重塑人机陪伴边界[61][63][64]
支付宝出手了,全民级的AI健康管家来了。
数字生命卡兹克· 2025-06-27 02:01
AI医疗产品发布 - 蚂蚁集团推出全新AI健康助手"AQ",主打ToC医疗普惠方向,与达摩院的AI医疗形成差异化布局[1] - 产品已上架安卓应用商店,IOS版本即将上线,所有功能免费使用[6][7] - 用户可直接在首页提问,也可选择与顶级医生的AI分身进行交流[7] 产品核心功能 - 采用专业医疗问诊流程,通过多轮交互式提问逐步缩小病因范围,与通用大模型的"摊大饼"式回答形成鲜明对比[17][18][19][21] - 提供预设选项点选功能,降低用户输入门槛,优化交互体验[21] - 整合预约挂号服务,根据用户地理位置推荐附近医院及专科优势[26][28] - 与医保系统深度打通,支持医保码使用、缴费记录查询等全流程服务[32][33][34] 健康档案系统 - 支持建立个人及家庭成员健康档案,整合病例、健康史等医疗数据[35][37] - 可连接智能穿戴设备实现健康监测,独创"赛博管药"功能支持拍摄药箱管理药品[37] - 内置心理健康、慢病风险等多元化健康自测题库,帮助用户全面了解身体状况[39][40][41] 行业价值 - 有效解决医疗资源分布不均问题,尤其惠及基层和医疗欠发达地区用户[42] - 通过AI技术降低医疗信息不对称,提升全民健康管理意识[42] - 展示出"医疗+AI"两条发展路径:既攻克前沿疾病难题,又服务普通民众日常健康需求[41][42]
“这半年,我也用AI救了6条活生生的命啊。”
数字生命卡兹克· 2025-06-26 00:23
核心观点 - AI技术在癌症早期筛查领域取得重大突破,通过平扫CT结合深度学习模型(如GRAPE和PANDA)显著提升胃癌和胰腺癌的早期检出率 [3][16][28] - 阿里巴巴达摩院开发的GRAPE模型利用普通平扫CT实现胃癌筛查,内部验证AUC达0.97,外部数据验证识别率92.7%,使医生敏感性提升21.8% [11] - PANDA模型是全球首个胰腺癌AI早筛方案,通过平扫CT解决胰腺癌传统筛查手段侵入性强、漏诊率高的问题 [16][28] 技术突破 - GRAPE模型仅需普通平扫CT即可实现胃癌筛查,突破传统胃镜成本高、侵入性强的局限 [7][9] - PANDA模型使胰腺癌早期筛查成为可能,该癌症传统五年生存率仅8%,且缺乏有效筛查手段 [18][19][26] - AI系统能识别人眼难以察觉的细微病变,如案例中医生CT影像中曾被忽略的胰腺阴影 [25][29] 临床应用 - 宁波大学附属人民医院已部署PANDA系统,自动扫描所有平扫CT患者的胰腺异常,半年内发现6例早期胰腺癌患者 [39][47] - 筛查流程完全无感化,患者仅需常规CT检查即可完成筛查,无需额外准备或费用 [36][38] - 医院团队利用业余时间处理AI标记病例,包括召回高风险患者进行临床验证,面临患者误解等执行挑战 [44][47] 行业影响 - 《Nature Medicine》评价PANDA的发布标志着癌症筛查进入"黄金时代" [16] - 达摩院持续推动AI医疗创新,从两年前的胰腺癌筛查扩展到当前胃癌筛查领域 [58][59] - 技术推广面临医院落地执行的人力资源限制,目前依赖医生自愿投入额外工作时间 [44][47] 社会价值 - 早期胃癌检出可使存活率从晚期30%提升至95-99% [6] - 每例早期胰腺癌患者的成功干预直接改变患者生存轨迹,6例临床案例验证技术价值 [47][55] - AI医疗技术实现"零成本介入",有望通过常规体检覆盖大规模人群筛查 [9][60]
隐藏在Google Labs里的5个神级AI应用。
数字生命卡兹克· 2025-06-24 22:33
Google Labs概述 - Google Labs是Google官方的AI创新项目合集,包含30多个已开放或即将开放的AI产品 [3][5] - 项目调性聚焦于趣味学习、简化交互提升生产力、AI与日常生活结合 [5] - 曾孵化Notebooklm(开创性AI播客工具)和Whisk(简化生图交互工具)等创新产品 [4] 重点产品解析 1 National Gallery Mixtape - 艺术与AI融合工具:输入画作自动生成配乐,并标注乐器种类和风格 [10][11] - 支持音乐DIY:用户可在生成基础上二次创作 [15] - 案例展示:梵高向日葵生成忧伤大提琴曲,圣经题材画作生成紧张错拍音乐 [18][22][23] - 当前局限:仅支持内置画作库,不支持自定义上传 [28] 2 Learn About - 结构化学习工具:通过知识框架→卡片笔记→知识沉淀→互动测试四步法教学 [32][34][38][47] - 特色功能: - "The Big Picture"模块可视化知识结构 [35] - 提供简化版/深度版/图像化三种知识总结方式 [40] - 互动式停顿思考设计增强学习效果 [44][45] - 开放式答题评估系统附带详细改进建议 [48][50] 3 Little Language Lessons - 实用性语言学习工具,聚焦高频场景需求 [54][59] - 核心功能: - 特定场景词汇短语速成(如粤语打车场景) [61][63] - 本地化俚语对话学习 [64] - 拍照识物翻译功能 [65] 4 Stitch - AI驱动的UI设计工具,前身为Galileo AI [69][72] - 双模式生成: - 自然语言描述生成完整APP界面(如外卖APP) [72] - 手绘草图转UI设计 [74] - 支持Figma画布无缝编辑 [75] 5 Portraits - 虚拟职场导师系统,基于真人专家数据训练 [80][81] - 原型人物为Google/苹果前高管Kim Scott,整合其著作与演讲数据 [82] - 功能特点: - 覆盖甩锅应对、绩效谈判等典型职场问题 [85] - 理论讲解+角色扮演+流程复盘三段式教学 [86] - 严格聚焦专业领域,拒绝闲聊 [86] Google Labs战略价值 - 历史沿革:2002年创立,曾孵化Gmail、Google Maps等核心产品,2011年关闭后于AI时代重启 [93][94][99] - 创新方法论: - 小目标启动:以1万周活用户为初期目标 [101][102] - 快速迭代:50-100天完成创意落地 [104][105] - 前瞻视角:规划5-10年后AI融合场景 [106][107] - 战略定位:在超级大厂中保持创新活力的实验田 [108][110]
啊?豆包居然也开始卷AI编程了?
数字生命卡兹克· 2025-06-23 23:31
豆包AI编程功能升级 - 核心功能更新为"应用创造1 0",主打可视化AI编程,用户可通过自然语言指令直接生成并修改网页代码 [1] - 采用豆包1 6模型作为技术底座,代码生成能力显著提升,单次可生成700+行高质量代码 [2] - 创新性引入可视化编辑模式,用户可像操作PPT一样直接修改网页元素,无需代码知识 [3][5] 核心技术创新 - 实现代码层与展示层的实时联动,用户修改界面元素时自动定位并修改对应代码行(如index html第106行) [9] - 开发三重图片处理方案:AI生图支持提示词生成(如"商品封面图 荔枝 清甜多汁")、网络搜图、本地上传 [12][15] - 建立版本管理系统,自动记录每次修改历史,支持一键回滚和成果对比 [17] 用户体验突破 - 将传统AI编程的"命令行式交互"转化为"图形化操作",修改效率提升显著(如字体更换仅需选中+指令) [7] - 解决行业痛点:Gemini等工具需用户自行定位代码位置,豆包实现"指哪打哪"的精准修改 [10][11] - 支持多类型元素编辑,包括文字(行书字体替换)、图片(错误草莓图修正)、组件(表单删除)等 [7][12][17] 应用场景拓展 - 电商领域:30分钟内完成荔枝电商网站从生成到配图优化全流程(桂味荔枝错误配图修正) [12][15] - 知识管理:生成包含128个实体、256种关系的"坤主题"知识图谱,支持动态内容更新 [21][24] - 教育工具:开发中国历史朝代时间轴(唐朝配图修正)、听力练习助手(按钮尺寸调整)等垂直场景应用 [26][30][34] 行业影响分析 - 重新定义AI编程交互范式,将代码转化为"隐形基础设施",降低90%以上使用门槛 [36][38] - 产品完整度超越Cursor、V0等专业工具,在代码质量(豆包1 6模型)、审美表现、易用性三维度建立优势 [19][20] - 标志AI编程进入"意图导向"新阶段,用户聚焦创意表达而非技术实现,类比Figma对UI设计的变革 [35][37]
爆款AI视频越来越多,但本质我觉得跟炒股没区别。
数字生命卡兹克· 2025-06-23 03:12
AI视频爆款现象分析 - 动物奥运会AI视频在Tiktok获290万点赞,引发X和Tiktok平台模仿潮[1][2] - Veo3制作的卡皮巴拉Vlog在6月初爆火,带动大脚怪自拍、三国战地记者等衍生内容[8] - AI ASMR视频8天涨粉17万,播放量达5000万,推动该类型达到高潮[10] - AI唱Rap科普视频成为新爆款形式[12] 爆款复制价值探讨 - 跟风模仿AI视频格式易陷入短期流量陷阱,类似唐朝张大麻追逐潮流却失败的故事[20][24][26] - 流量本质具有不确定性,"流"代表变化性,"量"代表可测量但短暂的状态[33][35] - 表层模仿价值有限,核心在于构建独特叙事能力与IP宇宙,如将动物奥运会升级为连续剧式内容[43][44] 流量获取与留存挑战 - 生产门槛降低导致注意力竞争加剧,仅极少数创作者能持续获取流量[75][76] - 流量本质是情绪博弈,类似股市中散户在情绪高潮时进场却亏损的现象[67][68][71] - 观众忠诚度取决于创作者人格魅力而非内容形式,需建立情感连接[88][90] 长期价值构建路径 - 流量需转化为长期叙事或稳定IP才能产生持续价值,类似股票价格最终回归基本面[83][84] - 人类注意力具有刺激阈值递增特性,需通过独特观点和温度维持吸引力[86][87] - AI工具无法替代创作者的人生底稿与人格化表达[91][92] 行业启示 - 爆款周期缩短反映内容行业加速迭代,但匠人精神仍为核心竞争力[94][96] - 注意力经济下,平台算法与用户疲劳度加剧内容生命周期衰减[73][87] - 成功案例显示AI视频在娱乐、科普等领域的创新潜力[8][10][12]
8天涨了17万粉,5000万播放,他把AI ASMR带向了最高潮。
数字生命卡兹克· 2025-06-20 03:44
AI ASMR视频现象 - AI ASMR视频近期在X、TikTok、抖音、小红书等平台爆火,内容以高沉浸感的视听体验为主,用户需佩戴耳机收听以获得最佳效果[1][2] - TikTok账号"impossibleais"6月11日发布首个AI ASMR视频,两周内粉丝增长至17万,视频点赞量普遍达数十万,最高单条获250万点赞[2][12] 技术实现与创作方法 - 视频生成工具采用Google Veo3模型,该技术可原生生成与画面同步的ASMR音效,通过Gemini官网即可操作(需境外网络)[13] - 标准化创作模板包含4K画质、特定材质(如玻璃)与动作(如切割)等要素,示例提示词售价9.99美元,中文模板已由用户购买并公开[14][15] - 典型创作案例:刀切蓝色玻璃树莓的4K特写,生成时长约3分钟,组合3-4个片段可制成24-32秒的完整视频[15][17] 用户需求与市场反应 - 目标用户存在显著猎奇心理,AI生成的玻璃材质切割声等非自然音效提供传统ASMR无法实现的刺激感[17][18] - 核心受众包括失眠/焦虑人群,新型AI音效因其陌生化特质成为睡前助眠新选择,部分用户已形成固定使用习惯[17][18] - 该内容形态突破ASMR行业边界,首次实现视听感官的同步创新,开辟"非现实音效"创作赛道[18][19] 行业影响与趋势 - Google Veo3技术降低ASMR内容创作门槛,个人用户可快速生成专业级作品,颠覆传统ASMR依赖实体道具的生产模式[13][15] - AI视频平台流量分配机制显现,具备"材质冲突"(如金属与玻璃交互)元素的视频更易获得算法推荐[17][18] - 该案例标志AI应用从视觉领域向听觉领域扩展,预示"感官合成"将成为下一代内容创业的技术支点[19]
终于有AI视频模型,解决了体操难题。
数字生命卡兹克· 2025-06-19 03:08
视频模型技术突破 - MiniMax发布Hailuo 02视频模型,首次实现杂技动作生成能力,肢体表演和动作幅度远超Veo3等竞品[1][4] - 该模型攻克了AI视频领域的"体操难题",能生成包含两次空中旋转的高杠体操动作,且形体保持完整[6][7][21] - 在杂技类动作表现上显著领先,如小丑抛球倒立、双杠倒立等复杂动作完成度远超Runway Gen4等模型[23][24][26] 技术性能对比 - 对比一年前Luma AI生成的体操视频(四肢扭曲变形),Hailuo 02展现出质的飞跃[6] - 与主流视频模型对比测试显示:Veo3生成的运动员触垫后形体碎裂,Runway Gen4出现"面条人"变形,即梦模型产生双头怪等异常[9][11][13][15] - 在跳马测试中,Hailuo 02实现助跑、起跳、谢幕全流程动作,镜头运动自然流畅[19][21] 产品特性与商业化 - 支持原生1080P视频生成,新人赠送500免费积分,768p/6秒视频仅需25积分,1080p视频80积分[45] - 具备多动作连续生成能力,可配合镜头运动指令,如"摄影机快速摇摄并倾斜捕捉轨迹"[7][45] - 在物理效果模拟上实现突破,能准确表现玻璃破碎、物体坠落等动态场景[37][38] 行业影响 - 该模型标志着AI视频技术进入新阶段,解决了运动捕捉和物理规律模拟等核心难题[23][46] - 在表演领域延续优势,情绪表达和复杂动作结合产生"登峰造极"效果,如机甲降落、消防员破窗等场景[34][35][38] - 价格策略具有竞争力,以"便宜又大碗"形成市场差异化优势[45]
MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。
数字生命卡兹克· 2025-06-17 08:23
MiniMax M1模型发布 - 公司发布首个开源推理模型MiniMax M1,采用456B参数MoE架构,实际激活45.9B参数,支持100万字(1M)上下文长度[10] - 模型在MRCR(4-needle)测试中表现突出,准确率62.8%,与Gemini 2.5 Pro性能接近[3][6][8] - 采用Lightning Attention线性注意力机制,64K token生成时FLOPs消耗仅为DeepSeek R1的一半,100K token时仅消耗25%[9][10] 技术性能亮点 - 开源两个版本:40K和80K Extended Thinking上限版本,80K版本为40K的增强版[12] - 在TAU-bench(任务目标理解测试)表现达到开源模型领先水平[3] - 支持复杂文档处理,可准确提取并翻译技术报告中的图表、公式和表格内容[15][17][20] 应用场景展示 - 成功处理34篇刘慈欣小说合集,完成每篇的故事总结和推荐语[34][37] - 在文字冒险游戏场景中展现出优秀的上下文记忆能力[31] - 能够准确识别并提取微信群聊中特定用户的全部聊天记录[28] 行业影响 - 该模型将开源领域的上下文处理能力提升到新高度[8] - 公司预告将持续一周发布新产品,可能涉及视频、音乐等领域[42][44][46] - 此次发布标志着AI六小虎之一的MiniMax重新活跃于行业前沿[1]