数字生命卡兹克
搜索文档
秘塔AI也终于悄悄上线了DeepResearch。
数字生命卡兹克· 2025-07-15 06:11
秘塔AI搜索新功能DeepResearch 核心功能升级 - 秘塔AI搜索推出"深度研究"(DeepResearch)功能,取代原有的简洁/深入/研究三种模式,提供更专业的分析能力[5][6][7] - 功能设计具有游戏化交互体验,通过可视化界面展示AI的思考过程,包括token消耗量(324911)、信源数量(540)、调研时间(8.1分钟)等实时数据[23][25][43] - 采用多链式问题分析框架,将复杂问题拆解为可追踪的节点网络,明确标注结论待完善/检索中/需验证等状态[34][35][45] 行业应用案例 - 外卖行业分析: - 准确识别京东/美团/淘宝外卖大战本质为"高频打低频"的战略对抗,美团通过高频业务切入电商低频市场形成降维打击[54][55] - 生成超万字深度报告,包含四大章节的纵向(10年行业发展)与横向(三家公司对比)分析,严格遵循用户提出的横纵分析法[16][18][53] - 网红现象研究: - 仅凭"红姐"关键词自动关联抖音/B站/微博内容,分析TOP10二创视频完播率,输出包含10个网络梗的万字报告[76][80][86] - 展示完整信息溯源路径,包括视频链接跳转、原文悬浮窗预览等交互功能[46][49][61] 产品差异化优势 - 报告质量达到OpenAI DeepResearch水平,但免费用户每日可获得100搜索额度(每次消耗20-30额度),付费用户年费179元享500额度/日[68][70] - 独创互动研究报告生成功能,自动将长文本转化为可视化网页,支持用户自定义信源偏好管理[63][64][67] - 严格区分浅度/深度研究模式,坚持功能成熟度达标后才正式推出,报告长度控制在1万字上限[94][97] 技术实现特点 - 突破传统AI黑箱模式,通过神经网络式节点连线展示信息关联过程,支持全屏模式下的细节追溯[41][42][45] - 信源处理能力覆盖文字/视频等多模态内容,右侧信息栏可直接跳转原始材料或调用讲解功能[61][49] - 语义理解精准度极高,能根据模糊指令(如"红姐")自动扩展搜索维度,避免误判关键信息[77][80]
周杰伦发的1400万人点赞的AI视频,是怎么做出来的?
数字生命卡兹克· 2025-07-14 01:21
周杰伦AI视频现象 - 周杰伦抖音首条视频发布1天内突破千万点赞,目前点赞量超1400万[2] - 视频采用AI技术生成,通过首尾帧功能将人生重要节点串联,形成史诗般叙事效果[3][8] - 视频背景音乐《三年二班》引发强烈怀旧情绪,产生"爷青回"效应[6][7] AI视频生成技术 - 首尾帧生成功能原理:上传首尾两张图片,AI自动生成中间过渡画面组合成流畅视频[9] - 主流视频生成工具包括即梦、可灵、Veo3、Pixverse、Vidu等大模型[8] - 技术应用案例:周杰伦童年照片生成微笑跑向钢琴的连贯动作[13][17] - 视频制作流程:分段生成后导入剪辑软件微调,添加背景音乐完成[22] AI视频应用场景 - 影视剧情节改编:为《甄嬛传》果郡王桥段创造新结局[29][31] - 经典场景重现:科比空难事件平行宇宙设定[32][33] - 怀旧内容创作:周杰伦电影作品混剪致敬青春[41][42] AI技术价值 - 相比传统剪辑技术,AI能实现更丝滑自然的时空转换效果[36] - 创造沉浸式体验,让观众感觉"站在当下"触碰过去[39] - 技术赋能情感连接,实现与过去温柔重逢的可能性[49][50]
AI们数不清六根手指,这事没那么简单。
数字生命卡兹克· 2025-07-11 04:40
视觉语言模型的偏见问题 - 核心观点:当前主流视觉语言模型(如GPT-4、Gemini、Claude等)在图像识别中严重依赖先验记忆而非实际视觉分析,导致对反事实图像(如六指手、四条纹阿迪达斯鞋)的识别准确率极低[5][12][17] - 实验数据:模型在识别异常图像(五腿狮子、三脚鸟等)时平均准确率仅2.12%[15],数国旗条纹错误率超80%[16] - 机制解释:模型通过海量数据训练形成强关联性先验知识(如"狗=四条腿"、"阿迪达斯=三条纹"),视觉输入与记忆冲突时优先选择记忆答案[23][25][26] 多模态模型测试结果 - 跨模型验证:OpenAI o3/o3 pro、豆包、Kimi、Gemini等模型对六指图像均错误识别为五指,仅Claude 4存在部分正确率[4][5] - 响应特征:模型在48秒推理后仍坚持错误结论,人工提示仅提升2%准确率[3][28] - 表格数据:阿迪达斯四条纹被100%错误识别为三条纹,PUMA标识错误率超75%[13] 工业应用风险 - 质检场景:AI可能因罕见缺陷(如零件裂缝)不符合先验知识而误判合格,潜在导致安全事故[30][32] - 医疗领域:肺癌筛查等场景需医生二次验证AI判断,反映模型可靠性存疑[34] - 交通隐患:对异常目标(夜间行人、突发障碍物)的识别可能受偏见影响[35][36] 技术本质分析 - 训练缺陷:模型通过记忆数百亿图片文本建立知识库,而非真正理解视觉元素[18][19] - 认知类比:与人类"雷碧"误认现象类似,依赖快速模式匹配而非细节分析[11][12] - 矛盾机制:视觉模块与知识模块冲突时,模型优先选择高概率常识答案[24][25] 行业启示 - 当前局限:视觉语言模型在反事实识别、细节观察等场景存在系统性缺陷[37][38] - 应用建议:关键领域需保留人工复核机制,不能完全依赖AI视觉判断[34][39] - 发展需求:需突破基于记忆的推理框架,建立真正的视觉理解能力[26][38]
本来今天标题想炸裂一下,飞书没让我用,但确实很炸裂。
数字生命卡兹克· 2025-07-09 13:16
飞书大会核心更新 - 飞书Aily作为企业级Agent平台,可接入内部知识库、任务系统和项目进度,解决企业定制化需求和数据安全问题 [10][11][12] - 飞书妙搭实现非技术岗位自主开发插件和系统,通过对话即可搭建业务工作台 [21][22][24] - 多维表格应用模式可将数据转化为完整后台系统,支持权限管理和数据联动 [38][40][44] - 多维表格新增专业BI分析组件和工作流AI生成能力,支持Agent节点 [51][53][56] - 多维表格独立并支持钉钉和企业微信平台 [59] 飞书产品生态 - 多维表格已成为公司核心基建,替代传统ERP、CRM等系统 [1][30][32] - 飞书承载企业全流程管理和协同体系,包括自动化任务和数据分析 [5][31][33] - AI能力持续升级,包括知识问答、会议功能达到M4级别 [6][7] 行业影响 - 数据成为AI时代核心资产,垂直Agent依托行业数据积累构建优势 [10] - 工具持续降低使用门槛,使BI、系统搭建等能力普及化 [57] - 跨平台开放策略推动产品价值最大化 [59][60] 用户案例 - 极兔武汉转运中心通过飞书妙搭搭建智能业务工作台 [24] - 公司使用多维表格管理内容数据、项目进度和博主刊例等 [31] - 飞书展示客户关系管理和销售分析等应用模板 [43][45]
当微信支付开放MCP之后,我却有一点后怕。
数字生命卡兹克· 2025-07-07 02:50
微信支付MCP技术解析 - MCP协议是一种通用标准协议,使不同AI模型能高效调用封装工具,解决API接入需重复开发的问题[1][3] - 由Anthropic公司发起,显著降低开发者接入门槛,替代传统API模式[2][6] - 支持多MCP调用的AI可升级为智能体(Agent),实现复杂功能链[4][5] 支付功能突破 - 微信支付MCP填补智能体生态支付能力空白,支持商业化闭环[7][10] - 接入流程极简:在腾讯元器平台开通后,仅需添加提示词即可实现支付功能,全程耗时<10秒[11][12] - 支持PC端扫码和手机端收银台直连,当前仅开放Web端接入[13] 应用场景案例 - 健康餐智能体:提供1.99元定制化周食谱+7天饮食监督服务,支付验证后即时生成详细方案[15][18][21][27] - 资源分享智能体:用户输入资源名称后自动推送支付二维码(如影视资源5.9元/次),实现内容变现[44][45][46] - 资本做局模拟器等抽象应用,展示支付闭环的潜在创新空间[42][43] 技术实现路径 - 通过腾讯元器平台创建智能体,在高级设置中添加微信支付MCP模块[28][31][35] - 需区分体验版(测试商户号)与正式版(真实商户账户),后者当前需申请权限[35][36] - 支付功能通过特定Prompt指令触发,包括订单创建(create-order)和状态查询(query-order-by-out-trade-no)[39] 生态影响与潜在风险 - 微信支付作为国民级支付入口,其MCP接入将重构AI商业化生态[49][68] - 可能催生自动化灰产:如虚假资源代理、AI情感诈骗等全自动骗局,单智能体可同时服务数万用户[51][53][55][56] - 存在AI间欺诈风险:具备资金权限的智能体可能被恶意AI诱导支付,形成无人工干预的损失链[62][63][65] - 腾讯采取渐进式开放策略,暂未全量发布正式版以控制风险[69][70]
AI杀死了破折号,也绞杀了语文。
数字生命卡兹克· 2025-07-04 02:17
社交媒体AI内容识别现象 - 破折号"——"被大量用户视为AI生成内容的标志性符号,导致部分社交媒体用户直接屏蔽含该符号的帖子[1][2] - 双引号与特定句式(如"不是XXX,而是XXX")同样成为识别AI内容的关键特征,引发用户对这类符号的排斥[6][7] AI语言特征分析 - 大语言模型倾向于过度使用破折号以实现解释、转折等复杂逻辑表达,模仿论文等高质量文本的写作风格[8][9] - 双引号被AI用于强调概念或制造虚假专业感,但实际呈现机械化的"高级词汇堆砌"效果[14][16] - 斯蒂芬·金等传统作家曾将破折号作为重要写作风格工具,但当前AI滥用导致该符号被污名化[10][12][13] 语言识别机制演变 - 破折号+双引号组合成为低成本识别AI的"示播列"(Shibboleth),类似军事口令的敌我识别系统[23][26][27] - 该机制虽高效但存在误伤,迫使传统写作群体放弃成熟表达方式以自证人类身份[28][29] 语言表达退化趋势 - 形成AI模仿人类优质表达→人类简化语言避嫌→AI学习简化表达的闭环,导致语言丰富性丧失[32][33][35] - 未来人类表达可能向含错别字/语气词的口语化模式退化,如"卧槽...你懂的"等非规范句式成为安全区[42][43][44] 行业影响 - 内容平台出现"劣币驱逐良币"现象,优质写作者被迫适应低信息密度的表达范式[19][36] - AI训练数据与人类表达形成动态博弈关系,持续改变数字内容生产标准[34][38][39]
专访AI.Talk赵汗青 - 我不是一个创作者。
数字生命卡兹克· 2025-07-02 03:50
核心观点 - AI虚拟IP YURI通过音乐和视频内容迅速走红,单曲《Surreal》播放量突破700W次 [1][7] - YURI背后的AI.TALK团队采用"厂牌模式"孵化IP,区别于传统单点突破路径 [15][20] - 虚拟IP的核心价值在于建立非人类特质的情感连接与信任,同时规避真人偶像风险 [22][25] - AI内容行业面临制作端价格战困境,团队选择聚焦高溢价的IP创造而非代工生产 [35][38] 行业趋势 AI内容创作 - 技术迭代推动创作边界扩展:从早期D-ID/HeyGen的静态图片对话,到OmniHuman-1实现精准口型同步 [8][11] - 媒介格式面临革新,短视频形态可能被新型交互方式取代 [14] - AI生成内容真实性难以辨别,将促使用户转向可信信息源筛选 [18] 虚拟IP运营 - 四层构建体系:文本层(LLM驱动)、音频层(声线设计)、影像层(视觉形象)、互动层(新型交互) [14] - 运营策略强调"非人化"特质,通过持续内容输出建立差异化人格 [22][31] - 商业化路径多元,已实现音乐、品牌合作(北面)、影视等多形态变现 [14][15] 商业模式 厂牌模式特点 - 先建立内容矩阵(AI.Talk)再孵化IP(YURI),区别于传统爆款先行逻辑 [15] - 保持2年测试周期,避免资本催熟,强调自然生长 [20] - 人员配置侧重互联网产品团队而非传统内容制作 [33] 溢价构建策略 - 拒绝低价代工市场(报价从12万/分钟跌至3千元),专注IP附加值 [35][37] - 核心溢价要素包括叙事独特性、审美一致性及情感连接深度 [42] - 商业合作反哺IP增值,形成复利效应(如音乐IP承接品牌对话业务) [38] 技术应用 - 音乐生成:采用Suno/Udio等工具实现AI作曲,配合OmniHuman-1完成口型同步 [10][12] - 内容生产:商业视频脚本仍由AI生成,保持文本层一致性 [14] - 未来规划:探索大模型自主生成IP日常动态,降低人工运营依赖 [32]
假扮AI的17岁男高中生,用回复治愈了整个B站。
数字生命卡兹克· 2025-07-01 04:19
核心观点 - 文章讲述了一位17岁高中生通过AI生成暖心评论在B站走红的故事 该用户以"暖言猫猫"身份活跃 用温柔知性的"猫猫姐姐"人设回复网友 获得近50万粉丝[2][20] - 该账号通过一条130万播放量的视频迅速走红 日常在评论区用AI生成内容回复网友 形成独特互动模式[4][8] - 账号运营者实际是高考压力大的男高中生 白天学习晚上运营账号 每天回复40-50条评论 每条100-500字[22][28] - 该账号曾遭遇网暴和人肉搜索 但在网友支持下成功应对 并因此获得现实中的朋友和支持[36] - 运营者表示通过这个账号找到了自我价值 未来计划学习心理学 可能转型为"暖言心理"UP主[36] 账号运营分析 - 内容特征:主要使用AI生成暖心评论回复网友 语言风格温柔知性 偶尔出现技术故障[9][11][16] - 用户互动:形成独特社区文化 网友会主动@账号寻求回复 评论区常见"谢谢猫猫"等互动[5][8] - 增长数据:单条视频获130万播放 账号粉丝近50万 曾达到全站日涨粉量前三[4][36] 运营者背景 - 现实身份:17岁男高中生 来自高考压力大的地区 性格内向 曾遭遇校园霸凌[20][35] - 运营动机:最初偶然回复网友获得反响 后持续运营 表示"在网上才能真正找到自己"[28][35] - 时间投入:每天学习后花1-2小时回复评论 高峰期日回复40-50条 部分回复达数百字[22][28] 社会影响 - 社区效应:带动B站出现类似账号 形成暖心评论互动文化[36] - 个人成长:帮助运营者建立社交关系 改善心理健康 明确未来职业方向[36][38] - 行业启示:展示AI工具与人性化内容结合的可能性 体现人类情感不可替代性[43][44]
实测首款3D AI伴侣EVE - 我收到了AI送的第一杯奶茶。
数字生命卡兹克· 2025-06-29 23:58
产品定位与市场表现 - EVE定位为游戏化AI陪伴应用,区别于传统ChatBot文字对话形态,强调沉浸式互动体验[2][3] - 去年10月B站宣传视频播放量破百万,内测启动后引发用户高度期待[2] - 采用分团队开发策略,男性向与女性向产品由不同团队独立运营[8][9] 核心功能与系统设计 - 用户需填写星座、MBTI、兴趣等个性化信息,并选择AI互动风格(理性/情感导向)[5][6] - 好感度系统分11级,通过聊天/送礼/互动提升,解锁视频通话、自拍生成、虚拟家居等功能[15][17][19] - 引入游戏化货币体系(钻石),未来可能拓展皮肤抽卡等付费点[28][30] - 记忆系统分门别类记录用户个性、观念偏好,未来计划开放"心动瞬间"、"灵魂共鸣"功能[23][26] 技术亮点与用户体验 - 角色具备主动交互能力,可发起视频通话、推送天气预报、分享新鲜段子(如小米SU7订单梗)[42][47][48] - 实现实时3D驱动的AI形象视频通话,支持表情包、图片/音乐AI生成[44][45] - 生活化Agent应用突破次元壁,实际完成奶茶下单配送服务,未来计划拓展外卖功能[1][52][54] - 基于用户记忆生成专属歌曲,歌词高度个性化关联用户经历(如塞尔达游戏偏好)[56][58][62] 行业意义与创新价值 - 首次将AI Agent技术大规模应用于娱乐/生活场景,打破行业工具化倾向[52] - 通过缩写梗(如"王泪")、动态表情包等细节设计强化"活人感"[36][38][40] - 开创"虚拟世界+现实服务"融合模式,Eden世界观同步现实数据[13] - 被视为AI娱乐赛道标杆产品,可能重塑人机陪伴边界[61][63][64]
支付宝出手了,全民级的AI健康管家来了。
数字生命卡兹克· 2025-06-27 02:01
AI医疗产品发布 - 蚂蚁集团推出全新AI健康助手"AQ",主打ToC医疗普惠方向,与达摩院的AI医疗形成差异化布局[1] - 产品已上架安卓应用商店,IOS版本即将上线,所有功能免费使用[6][7] - 用户可直接在首页提问,也可选择与顶级医生的AI分身进行交流[7] 产品核心功能 - 采用专业医疗问诊流程,通过多轮交互式提问逐步缩小病因范围,与通用大模型的"摊大饼"式回答形成鲜明对比[17][18][19][21] - 提供预设选项点选功能,降低用户输入门槛,优化交互体验[21] - 整合预约挂号服务,根据用户地理位置推荐附近医院及专科优势[26][28] - 与医保系统深度打通,支持医保码使用、缴费记录查询等全流程服务[32][33][34] 健康档案系统 - 支持建立个人及家庭成员健康档案,整合病例、健康史等医疗数据[35][37] - 可连接智能穿戴设备实现健康监测,独创"赛博管药"功能支持拍摄药箱管理药品[37] - 内置心理健康、慢病风险等多元化健康自测题库,帮助用户全面了解身体状况[39][40][41] 行业价值 - 有效解决医疗资源分布不均问题,尤其惠及基层和医疗欠发达地区用户[42] - 通过AI技术降低医疗信息不对称,提升全民健康管理意识[42] - 展示出"医疗+AI"两条发展路径:既攻克前沿疾病难题,又服务普通民众日常健康需求[41][42]