Workflow
数字生命卡兹克
icon
搜索文档
不是,高考刚结束,高考报志愿的Agent也来了?
数字生命卡兹克· 2025-06-12 11:29
就在刚刚,夸克官宣了他们最新的夸克高考志愿大模型。 虽然他们没咋提Agent这个词,但是我依然觉得,这玩意比Agent还Agent。 我左想右想,也没想到,夸克会在高考结束的这个时间点,发了可能是我觉得目前AI里,最落地最有用最有社会意义的产品。 高考报志愿Agent。 这个东西,对于广大学子来说,有多有用,我相信每个人都有数。 十几年前,我其实就倒在了志愿填报了,虽然我考的也并不咋地,但是其实后面复盘,发现还是有明显更好的机会。 但是2013年,一个小城市的人家,谁知道,高考志愿有那么多弯弯绕绕的啊。 最后也只能去了,一个普通普通的学校,一个我 可能并没有那么喜欢的专业。 大学期间到没有什么特别的感受,但是当大三开始找实习的时候,真正跟全社会竞争的时候,才能感受到,那种被碾压的压力。 就...完全不是一个起点。 海投了一圈简历,得到了北京一个中厂的面试机会,从广东坐了20多个小时的绿皮火车来到北京,带着我做了1个月的作品集,就为了一次面试。 也可能是面试官觉得我认真,可能觉得作为一个实习生我不仅能做设计还有数据思维,也可能是被我坐了20多个小时的火车就为了这一个面试而打动, 一个实习生居然面了5轮,最后总监 ...
一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。
数字生命卡兹克· 2025-06-11 11:36
火山引擎发布会核心内容 - 火山引擎发布多款AI模型产品线,包括豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、语音播客模型及端到端语音模型等[1] - Seedance 1.0 pro视频生成模型近期在行业榜单表现突出,技术实力获得市场关注[1][2] - 该模型已通过即梦AI视频3.0 pro形式进行内测,展现六边形战士式的全面能力[6][8] 视频生成技术突破 多镜头组合 - 支持通过"镜头切换"触发词实现分镜自动切换,完成复杂叙事结构[9][13] - 成功实现10秒视频中精确还原包含3次镜头切换的复杂Prompt指令[13][15] - 具备初级文字生成能力,能识别并生成路牌等场景文字元素[16][18] 运动质量 - 物理模拟能力突出,准确表现后坐力、火光反射等细节[20][22] - 复杂动作如骷髅跳踢踏舞、双人互动场景均保持稳定[22][24] - 运动场景处理优异,篮球运球投篮动作符合物理规律[26] 情绪表现 - 实现从微笑到恐惧的完整情绪谱系表现[32][36][38] - 宇航员缺氧场景提供两种差异化表演方案[44][46] - 角色微表情处理细腻,如战场新兵手足无措的状态[71] 技术参数与商业化 - 支持360度环绕、追车等专业级运镜技术[49][51][54] - 物理引擎覆盖陆地、水下及太空场景,保持规律一致性[55][57][59][61] - 风格化处理能力突出,保持像素风、动漫等特定风格一致性[71][73][75] - 商业化定价为每5秒1080P视频3.67元,已开放企业端接入[79] - 消费者端通过豆包App"照片动起来"功能全量上线[80] 行业影响 - 代表国产视频生成模型达到国际第一梯队水平[77] - 技术突破集中在语义理解、物理规律和风格一致性领域[77] - 行业竞争加剧推动技术快速迭代,最终利好终端用户[78][80] - 标志AI视频生成进入多维度能力比拼的新阶段[81][82]
我让10个大模型又参加了完整版数学高考,第一名居然是它。。。
数字生命卡兹克· 2025-06-10 05:20
昨天,我不是发了几个大模型参加数学高考的测试文章嘛。 没想到热度挺高,大家还挺关注的。 不过,很多评论区的小伙伴也说,根本看不出来区别。 因为缺了对AI难度最高的单选第6题,还有后面那些解答题。 那我想,不如再把模型补上,加上全缺失的智谱Z1、Kimi1.5、文心X1,(不带Claude 4,封号斗罗,我恨他),再做一个,完整的满血版的数学高考, 让大家最直观的,感受一下这些模型的数学能力水平。 让大家看看,满分150分,每个模型到底多少分,哪个模型能拿高考数学状元。 因为要做解答题了,和选则填空不太一样,所以我还是单独定了一下规则,规则如下: 1. 数学大题往往都有两到三个小问,但是每个小问具体的赋分都不太一样,邀请了朋友(高中老师)来估摸一下每个小问的分数,如下,都取后者: 2. 高考大题往往会按照步骤给分,但是主要我也看不懂步骤(勿喷),所以这里我们不妨对大模型严格一点,按照结果是否正确来给分。 3. 每道题任然使用大模型跑3次,根据正确比例给分。 4. 依然所有的文本题,都 使用LaTeX编辑器转成LaTeX文本格式,再扔给大模型进行回答。 5. 带图片的多模态题也加入测试,直接截图进行作答,没有多模 ...
看好了,这才是7家大模型做高考数学题的真实分数。
数字生命卡兹克· 2025-06-09 06:05
这两天,很多媒体都在写用AI考高考题的内容。 我本来真的没打算卷这个选题,因为知道大家肯定都会写,都会卷,我也想休息休息,真的就不打算写了。 但是吧,用AI测语文考试还没啥,但是看了一些用AI做数学考试的文章,真的给我看的一脸地铁老头表情包,就,那个测试方法,也特么太扯淡了。 我觉得既然是考试,那就公平公正的去测试? 当然,你要是玩整活,那就另谈了。 结果最后得出一些不太靠谱的结论,我觉得还是蛮误导大家的。 客观、公平、公正,是我觉得最核心的标准。 所以我觉得,我想按照我的玩法,再严谨一点的测一下大模纯数学能力型高考,给大家看一下,真实客观的评分。 测试试卷为2025年数学全国一卷。 测试规则如下: 1. 不考解答题(因为给我标准答案我也看不懂,不知道咋给分。。) 2. 所有的题目截图全部使用LaTeX编辑器转成LaTeX文本格式,再扔给大模型进行回答。 LaTeX是学术界最广泛使用的数学公式排版语言,能最精确地表达数学符号,我们考的是模型的数学能力,不是考模型的多模态识图能力,比如 DeepSeek根本就没多模态,用的是OCR提取文本,很可能识别错误,所以截图上传不公平,一律转化成LaTeX格式再进行统一测 ...
时隔500天,PixVerse终于上线国服了,但它叫拍我AI。
数字生命卡兹克· 2025-06-06 11:23
心情有点复杂。 因为早上发完即梦后,看到一个推送,临时加更一篇。 因为PixVerse的国内版产品上线了,而正式版名字,改成了拍我AI。 我心情复杂的点在于,上一次,他们开心的跟我说,我们要上国内了,是2023年的11月,这一眨眼,就是将近500天。 这500天里,AI视频模型,从寥寥星火,也到如今满眼璀璨星河。 同年10月,PixVerse内测版上线了,瞬间成了全球当时最好的几个AI视频模型公司,那时候,圈内人,一般把Runway、PIKA、PixVerse称为。 御三家。 而PixVerse在国内的第一次大爆,其实也跟一个作品有关。 这500天里,天翻地覆,绣口一吐,就是近半个盛唐。 从孤舟一叶,到如今千帆竞渡如潮。 我突然很想从我的眼睛,来写一写PixVerse的故事。 因为,在我们的体感里,已经太久了太久了。 可其实明明才1年半的时间。 故事的开始,是天津的一场饭局。 在2023年8月之前,其实根本没有什么AI视频,文生视频,图生视频,什么都没有,只有一个产品。 名叫Runway,当年还是很牛逼的。 在2023年4月,他们发布了第一个跟AI视频有关的产品,叫Runway Gen1,作用就是你扔一段视频 ...
即梦图片3.0又重磅更新,这可能是对普通人最有用的一次。
数字生命卡兹克· 2025-06-06 09:08
昨天晚上,即梦的最强AI绘图模型图片3.0,又又又更新了。 内测上线了即梦图片3.0的,智能参考,现在,可以垫图了。 MD,这次连设计师的参考图也一键干碎了。。。 我测了整整一夜,现在是凌晨4点21,我还在写这篇文章。 我人真的傻了,我真的不愿意用一些什么很夸张的词语,但是即梦的绘图,每一次,带给我的震撼,都会觉得,我这么多年的设计师生涯,在AI的进化 速度面前,不值一提。 什么样的言语,都无法比拟直接看图来的直接,直接给你们看效果。 一键改表情包的字,什么叫表情包自由,这就是。 这是一张,很好看的北京的字体设计。 而现在,我很喜欢这个字体设计,我想把北京,变成上海。 你只需要把这张图传给即梦,说,变成上海。 我一定要给你们看看细节,北京的字体设计里面,是有天坛地标的,而上海的设计里面,他自己把地标东方明珠也加上了。 真的,就一句话,太离谱了,真的。 做过设计的人都知道,做这种字体,有多复杂,但是现在,你只要一个效果,一键。 还有可以,继续一句话,做成杭州、新疆、成都。 Prompt:把文字改成"宇宙电波" 还有朋友@倒放 做的,把"九",改成"十"。 打麻将打的不爽了?把发发发换成胡胡胡。 @阿真Irene ...
618想换电脑跑AI?先听我一句劝。
数字生命卡兹克· 2025-06-04 23:08
最近618开始了,又到了一年一度换设备的日子。 端午节之后,就有好几个朋友问我,你的电脑用的是啥配置的。 我一般就会发两张图过去。 他们一般就会发一个地铁老头看手机的表情,然后问: 想买一台学AI的笔记本,有没有什么推荐的。 我每次总会反问一句话: 学 AI ?你主要学啥。 对方就会跟我说,搞个知识库,画画图,做做 AI 编程,学学AI视频啥的。 这时候我就会问他们,你是有很多的不能上云端的隐私数据吗,还是你要在本地玩一些自定义或者很特别的工作流? 这时候有朋友就懵逼了。。。 说啊?这些是啥?玩 AI 不需要好配置的吗。 反过来给我也问懵了。 所以,我觉得,我还是想写一篇文章,来给大家聊一聊,到底什么样的 AI ,适合在本地跑,什么样的AI,适合在云端跑,什么样的AI,直接网页 上用就行了。。。 也算是做个科普,如果看完了以后,你觉得,你确实有必要买一台新电脑的话,文末我也挑了几款我自己觉得还不错的,618+国补确实价格还行,可以 去看看。 什么样的AI适合在本地跑,其实一般只看两个点: 1. 对 算力 的要求是多少。 2. 是否有安全、保密的隐私需求。 模型的参数量种类有很多很多,1.5B,8B,14B,3 ...
用DeepSeek徒手造一个能对话的AI简历,助你当场拿下Offer。
数字生命卡兹克· 2025-06-03 03:47
故事是这样的。 我最近一直在招人,想招点人帮我分担一些压力,全职的实习的啥的都可以。 我这再怎么说,也是一个跟AI有关的地方,所以很多人在投简历的时候,都会写很多跟AI相关的经历,我甚至收到过很多AI生成的简历。 很多写的很玄乎,什么掌握全链路工作流,独立搭建xx系统,深度参与xx项目,掌握xx行业资源等等,但是一面,问用过最惊艳的AI产品是啥,10个有9 个说的是DeepSeek,再问最常用的AI产品是啥,还是DeepSeek。 再追问还用过哪些其他的AI产品?10个有9个说的就是豆包。 真的,我觉得我现在对DeepSeek有点PTSD可能就是从这来的。 不过,这个端午节,我收到了一个让我觉得有点与众不同、眼前一亮的简历。 第一次,看到一个人,把自己变成了AI简历。 我点进去看了下。 虽然已经跟她沟通过,写出来没啥问题,但是为了保护隐私,我还是都打码了。 虽然整体设计的很青涩,非常的AI,但是我依然觉得,这个非常的有意思。 毕竟,在千篇一律的PDF简历之后,我终于看到了一个,不一样的。是用AI编程把自己的简历,给可视化的东西。 但是如果只是这样,我觉得也还好,毕竟PDF做成可视化网页已经流行很久很久了,这也 ...
聊聊如何缓解越来越严重的AI焦虑。
数字生命卡兹克· 2025-05-30 07:17
但今天晚上躺在床上,辗转反侧睡不着觉,我已经很久没睡过一个好觉了,我决定还是起来,有些话 特别想和你们聊一聊,聊一些事。 准确地说,是关于AI焦虑。 过去这一两个月,说句大实话,我过得不太好。 甚至,可以说是非常非常的糟糕。 具体糟糕到什么程度呢? 就是那种你表面看上去很正常,每天照样更新着公众号,日常也在各种群里活跃,偶尔也会对一些新 的AI工具、新的AI产品评价几句,说些看起来挺厉害的话,但是总是会有一种,身心俱疲的感觉。 平时你们见到的我,好像永远精力充沛,好像总是能从各种新技术、新产品中找到快乐和兴奋点。 见字如面。 现在是2025年5月30日凌晨5点06,5月工作日的最后一天。 说实话,我本来没什么打算为这个最后一天写点什么,最近有点太累了,只想好好放个假。 但这背后,一直伴随着很深的焦虑。 直到最近一两个月,这焦虑感越来越强。 这种焦虑并不是忽然爆发出来的,而是像一个影子,一直带给你漫长的潮湿。只是过去一年多,我习 惯性地忽略它,用无数次尝试新产品、新技术的兴奋感,来掩盖它的存在。 但最近一个月,新的应用和产品还好,但是特别像是Midjourney V7、Gemini 2.5 Pro更新、Clua ...
可灵2.1刚刚上线,价格降了65%,更快、更听话、也更强。
数字生命卡兹克· 2025-05-29 11:42
刚刚,可灵2.1正式上线了。 我提前好几天拿到了内测资格,测了不少case,但是要说这次2.1最大的变动,我觉得,效果、速度和价格,都很惊艳。 就像这个老哥说的一样。 | Dan Pradana | | --- | | @mxvdxn | | Got early access to test @Kling ai 2.1 | | As always, never disappointed! | | They've released KLING 2.1 Professional Mode, which honestly feels like | | Kling 2.0 es but now it's cheaper and faster (hell yeah!). There's also | | KLING 2.1 Master, which is more expensive but a lot more dynamic. | | To be totally honest, even for me, KLING 2.1 Professional Mode is more | | than enough for ...