Workflow
数字生命卡兹克
icon
搜索文档
扣子空间上线极致拟人的AI播客,这次真是降维打击了。
数字生命卡兹克· 2025-05-28 01:24
一篇文章,一键转成几乎跟真人无异的十几分钟中文AI播客。 有打断、有语气、有停顿,就特么离谱。 这,就是我用我现在的这篇文章,生成的AI播客。 这个语气,这个聊天的感觉,我人麻了。 这个AI播客,来自于扣子空间。 昨天,很多人在群里说,扣子空间的AI播客更新了,变得超级拟人。 我就去直接试了一下。 当我实际听到扣子空间生成的AI播客音频的时候,我的第一反应是震撼,第二反应是恐惧,然后才是兴奋。 震撼,是因为它生成的声音之真实、之流畅,让我几乎怀疑自己的耳朵。 恐惧,是因为这种效果似乎已经越过了某个阈值,打破了人机声音之间那道隐形的次元壁,我真的无法想象,我在听的东西,是AI生成的聊天。 兴奋,是因为我知道,终于,这个世界上的无数内容创作者们,可以彻底摆脱过去声音内容生产的桎梏了,尽情享受一种前所未有的自由。 这个AI播客,打开扣子空间(就是扣子做的那个Agent平台)就能直接使用。 扣子空间网址在此:https://space.coze.cn/ 这里我插一句,扣子空间之前要邀请码,现在已经全量开放了,每个人都可以直接使用。 想要做一个类似的AI播客,非常简单。 你什么都不用管,把你想要转成播客的文件素材,上传 ...
Dify、n8n、扣子、Fastgpt、Ragflow到底该怎么选?超详细指南来了。
数字生命卡兹克· 2025-05-27 08:56
| 编者荐语: | | --- | | 一个我很喜欢的开发博主,这篇关于LLM应用平台的特点总结的很全,很受益,值得转载推荐给大家。 | | 以下文章来源于袋鼠帝AI客栈 ,作者袋鼠帝 | | 袋鼠帝AI客栈 . | | 持续分享AI实践干货,走超级个体崛起之路 | | 大家好。 | | 一直以来,我分享了不少关于工作流平台、LLM应用平台的不少干货文章。 | | 主要包含: Dify、Coze、n8n、Fastgpt、Ragflow | | 但是几乎每一篇文章的 评论区都有小伙伴问 ,xxx平台和xxx平台比怎么样,该怎么选? | | 这不就来了嘛,三连在看,养成习惯~ | | 确实,面对日新月异的AI技术,还有飞速发展的各种LLM平台,我们很容易患上选择困难症 | | 但我想说的是,每个平台各有优势,需要根据自身需求,选择合适的即可。 | | 这篇文章会 从实用角度出发,通过详细的功能对比、真实的使用体验和具体的应用场景 ,帮助你在Dify、Coze、n8n、FastGPT和RAGFlow这五 | | 款主流平台中找到最适合自己的那一个。 | | 无论你是AI开发者、企业用户,还是刚接触AI的新手,这篇对 ...
豆包上了视频通话后,我妈再也不用攒着问题等我回家了。
数字生命卡兹克· 2025-05-25 21:38
这个周末,豆包上了视频通话。 终于完成了去年12月火山大会上画的饼。 而我在看到这个消息之后,第一个告诉的人,不是AI发烧友的朋友,也不是群友,而是。 我妈。 我是安徽的,但自从18岁上大学后,我就一直在外漂泊,3年湛江、1年深圳、7年北京、2年天津、然 后又回到了北京。 这十几年,我回家的次数,其实屈指可数,几乎每年只会回家两次,一次是国庆节,一次是过年,然 后继续回到生活的轨迹上。 特别是现在越来越忙,每天几乎跟陀螺一样,睡眠都不够,跟我妈的交流也越来越少。 我不在家的日子里,我妈就一个人在老家的家里待着。我爸常年住在工厂里,每个月几乎都不回来一 次,这些年家里常年就只有我妈一个人。 其实坦率的讲,我妈不是个排斥新事物的人,她挺乐意接受新东西的。 我每次回家,总会带些电子产品回去。比如我淘汰的小米14Ultra,给她打太极的时候拍照完,还有 闲置的不用电脑,还有一堆乱七八糟我自己用的挺爽的智能家电,比如扫地机器人啥的。 她虽然嘴上经常说:"家里又不大,用不着这些",但东西一旦到了家,她比谁都稀罕,总想试试,又 害怕弄坏,说明书又很复杂,所以每次就跟我:"你教我一次吧,我记下来,以后就不麻烦你了。" 让每个 ...
现在,你终于可以用飞书搭自己的AI知识库了。
数字生命卡兹克· 2025-05-23 01:09
飞书知识问答产品发布 - 飞书正式推出AI知识库功能"飞书知识问答" 实现企业知识数据的智能化调用 [2] - 产品入口设计显眼 采用差异化配色强化视觉引导 左侧和顶部均设置快捷入口 [5] - 支持切换DeepSeek-R1和豆包两种大模型 核心功能是调用企业内部知识 [6] 知识覆盖范围 - 目前已覆盖飞书消息、群聊、文档、知识库等内容类型 [7] - 暂不支持多维表格、邮件和未导出文档的视频会议妙计 [7] - 支持微信文件导入 通过小程序扫码实现群聊文件一键上传 [8][9] - 导入文件以云文档形式存储 保持飞书原有产品逻辑 [9] 企业知识管理应用 - 可调用企业历史文档、会议纪要等非结构化数据 如内容创作方法论文档 [16][17] - 精准提取规章流程信息 如报销所需的发票格式、抬头等具体模板 [35][36] - 实现权限千人千面 根据用户职级自动过滤无权限内容 [37] 行业解决方案价值 - 解决企业知识沉淀痛点 尤其适合文档管理混乱的组织 [1][2] - 区别于传统AI知识库"先搭后喂"模式 直接激活现有飞书生态数据 [2][7] - 权限管理系统保障企业数据安全 符合组织架构管理需求 [37] 内容创作场景实测 - 成功调用内部创作方法论文档 包含选题来源、热点追踪等实战经验 [10][11] - 准确提取"内容军规"等零散准则 如"正确性优先于流量"等核心原则 [25][29] - 相比通用大模型 输出结果更贴合企业实际业务场景 [13][16]
Agent真的卷疯了,AI办公Agent也来了。
数字生命卡兹克· 2025-05-22 00:53
我一直说,每个行业,都一定会有专门优化的垂直领域的Agent。 你看,通用Agent的王座上有Manus,研究类的有DeepResearch,旅游有飞猪问一问,设计类有Lovart。 那现在,办公领域的Agent也来了。 专为办公打造。 海外版网址在此: https://skywork.ai/ 国内版网址:https://www.tiangong.cn/ 这玩意就是昆仑万维的Skywork Super Agents。 他们的首页是这样的。 我在五天前受到昆仑万维邀请,深度体验了一把。 虽然在体验过程中,还有点小小的插曲,因为单独给我开的测试服务器,所以其实是晚上限时开放的,结果有天晚上提前关了,我测的正High。。。 给我一下子干慌了,第一次见到这么真诚的品牌方,那一瞬间觉得我要是不好好体验测试,那我真是千古罪人= = 不过抛开这些情感因素不谈,在我体验了5天之后,我觉得,还是值得写一写这个产品。 因为作为一个Agent产品的第一代,做的功能确实完整,产品体验也很棒,而且它对大家的办公场景,是真的还有点用。分为海外版和国内版。 | 天工超级智能体 * | | | | | | | | --- | --- | - ...
一文看懂2025 Google I/O开发者大会 - 250刀Ultra会员、Veo3、Imagen4等等全线开花。
数字生命卡兹克· 2025-05-21 07:34
今年,Google算是打了个翻身仗。 不断的掏出新东西,不断的让大家,感受到惊喜。 而万众期待的Google I/O开发者大会,终于在今天凌晨1点正式开始了。 这次的大货,真的持续轰炸了整整两个小时。。。 说个小插曲,本来我现在,人应该是在硅谷Google总部现场的,因为受到小红书和Google的邀请,喊我去现场看。。。 但...作为一个八百年不出门宅在家里的死宅,有一个非常严重的问题,就是,我没有美国签证。 就...一次都没去过。。。 现申请也来不及了,最后,只能让我团队的小伙伴@jojo过去了,她在现场看,给我拍素材,我在家里坐着一边看直播一边熬夜写。。。 然后,她就跟皮查伊合影了。。。 我也好想...去啊... 会员发布其实比较晚,但是我依然想把它放在第一个,放在所有部分之前。 因为它代表着Google的整个战略。 这次,新加了一档249.99刀每月的超级会员,称为Google AI Ultra,还好他们没直接写250刀。。。 我说真的,Google在那kuku输出了2小时,我人都听麻了,就这俩小时的发布会光素材分类和整理就让我从凌晨3点半干到5点半,我特么。。。 那就,开始吧。 几乎囊括了所有的这次新 ...
DeepSeek们越来越聪明,却也越来越不听话了。
数字生命卡兹克· 2025-05-20 04:14
在今年,DeepSeek R1火了之后。 几乎快形成了一个共识,就是: AI推理能力越强,执行任务时就应该越聪明。 从2022年Chain-of-Thought横空出世,到今天Gemini 2.5 Pro、OpenAI o3、DeepSeek-R1、Qwen3,这些旗 舰模型的统治性表现,我们一直相信,让模型先想一想,是一个几乎不会出错的策略。 不过,这种聪明,也会带来一些副作用。 就是提示词遵循能力,变得越来越差。 换句话说,就是越来越不听你的话了。 我在过年期间写DeepSeek的攻略文: DeepSeek的提示词技巧,就是没有技巧。 的时候,也提到了这一 点。 不过,这只是我自己使用中的感觉,它变的越来越聪明,但是感觉,却越来越不听话了,以至于我现 在,最常用的模型,开始越来越变成了GPT4o,所有的推理模型,反而会用的越来越少了。 不过,确实没有经历过验证,所以也不是特别敢说。 直到昨晚回来,在扒拉论文的时候,看到一篇提到这个话题的论文,我读完以后,我觉得,终于可以来 聊聊这个事了。 这篇论文叫,《When Thinking Fails: The Pitfalls of Reasoning for I ...
HDRimg,30秒一键生成亮瞎眼的HDR表情包。
数字生命卡兹克· 2025-05-19 03:27
HDR技术原理 - HDR技术可实现亮度范围1000-2000+尼特(SDR仅100-300尼特),色域覆盖DCI-P3/BT2020,对比度达1,000,000:1,10-bit色深保留高光暗部细节[4] - HDR与SDR核心差异在于动态范围表现:HDR画面具有立体感且接近真实场景,而SDR画面呈现平均化亮度且易丢失细节[4] - 触发HDR显示需两个条件:设备具备高亮度广色域屏幕,且图片需携带HDR的ICC颜色配置文件[5][6] 微信表情包事件技术分析 - 微信处理图片时默认剥离ICC配置文件,但遗漏表情包文件导致HDR配置保留[7][8] - 保留ICC的表情包在苹果设备上触发HDR机制,局部亮度突破常规显示范围[9][10] - 同类现象早前出现在Slack平台,用户通过HDR头像和表情包实现强光效果[11] HDR图片转换工具开发 - 转换工具核心逻辑为植入Rec.ITU-R BT.2100P标准的ICC配置文件[15] - 开发流程包括Python脚本编写(提取参考图ICC并批量处理)、网页服务搭建(TailwindCSS前端)、域名部署[20][22] - 工具支持JPG/PNG格式批量转换,但实际显示效果依赖终端设备(仅iPhone/Mac完整支持)[24][26] 应用场景与行业影响 - HDR技术被创新性应用于社交软件表情包、网站强调色设计(如高亮二维码)等非传统场景[33] - 苹果生态统一性使其HDR支持度显著优于碎片化的安卓阵营[33] - 该事件反映技术漏洞可能催生新型用户交互方式,具有潜在商业化价值[34][35]
这才是现在最强的AI声音模型。
数字生命卡兹克· 2025-05-15 23:40
几个月前,我写过一篇MiniMax的AI声音模型。 我说,那就是当时最强的中文AI音频。数据也有点小爆。 而在去年12月之后,至今将近半年时间,在AI声音模型这块,我觉得还是没有能超越MiniMax的。 直到昨天,我看到 MiniMax在X上发了他们新一代声音模型的技术报告,Speech-02来了。看来想突破Speech-01的上限,还是得他们自己。 | MiniMax (official) & | ... | | --- | --- | | @MiniMax AI | | | | Language | WER J | | SIM ↑ | | | --- | --- | --- | --- | --- | --- | | | | MiniMax | 11LABS | MiniMax | 11LABS | | | Chinese | 2.252 | 16.026 | 0.780 | 0.677 | | | English | 2.164 | 2.339 | 0.756 | 0.613 | | | Cantonese | 34.111 | 51.513 | 0.778 | 0.670 | | | Japanese ...
今天我替煤炭给AI正个名。。。
数字生命卡兹克· 2025-05-15 04:05
过于无语了。 我真是没想到,有朝一日,我得出来替煤炭,替AI,写一篇正名的文章。 这两天,在X、微博、小红书,疯传着一个截图。 图中一份正儿八经标价8200元的研究报告,赫然写着这么一句: "煤炭素有'黑金'之称,是可再生资源,收获来自煤矿石以及击杀凋灵骷髅获得1~3个。" 这么一份标价天价、封面还特么打着"2022-2029行业发展趋势前景"旗号的专业研究报告。 告诉你,煤炭,是打游戏打怪掉落出来的。 这个事,直接冲上了知乎热搜第一。 各种衍生梗,遍地开花。 比如山西人,击杀凋零鼓楼获取煤炭。 还有这个。 甚至,就这个掉落数据,这篇报告都还粘贴错了。 是1/3概率掉落煤炭,不是掉落1到3个煤炭。。。 很多群里,都看到朋友,在嘲笑AI,说AI幻觉哈哈哈哈哈哈哈哈。 或者就是离谱的AI搜索,然后审核人员背锅。 真的太抽象了。 这不是一个段子。 这是一份实际在官网上对外销售、挂着研究机构名头的能源产业报告。 卖价8200一份,电子版都不打折。 这事儿要是搁以前,最多被拿来当做行业笑话讲一讲。 但今天不一样。 因为它的流行路径,已经变质了。 很多人看到这句话的第一反应是:"现在AI写研报真离谱。" 但是,我想说,你 ...