Workflow
Pretext
icon
搜索文档
48小时,10k星!React 大佬借助 Claude 和 Codex 搞出新项目卷翻前端
AI前线· 2026-03-31 11:36
项目发布与市场反响 - 前React核心成员、Midjourney工程师Cheng Lou发布了一个名为Pretext的开源库,旨在解决不依赖DOM精确计算文本排版尺寸的技术难题 [2] - 项目在GitHub发布两天内星标数达到1.1万,在Hacker News、X等平台引发密集讨论,传播速度远超一般工具类项目 [3] - 开发者社区对项目评价不一,既有高度赞扬其解决了核心难题、改变了互联网,也有批评认为其效果不美观且不实用 [29][31] 技术原理与核心创新 - Pretext的核心思路是将文本测量计算拆分为`prepare`(预处理)和`layout`(布局计算)两个纯函数调用 [16] - 技术实现上,使用`Intl.Segmenter`进行多语言分词,通过Canvas API测量词段并缓存,最后用纯数学算法模拟浏览器换行规则来计算行数与高度 [19] - 项目通过向Claude Code和Codex等AI编码工具展示浏览器真实情况,让AI辅助进行测量和迭代开发,并利用整本《了不起的盖茨比》等语料在不同浏览器中对比测量结果,以算法逼近真实排版行为 [7][21] 性能优势与解决的问题 - Pretext完全绕过DOM和CSS,避免了触发昂贵的浏览器重排(layout reflow)[15] - 在批量处理场景下性能提升显著:500段文本的批量预处理仅需19毫秒,后续布局计算仅需0.09毫秒,比传统DOM测量方法快数百倍 [15] - 解决了传统Web开发中“先渲染再测量”模式带来的性能瓶颈,该模式在复杂界面中可能带来每帧数十毫秒的性能开销 [15] 应用场景与行业价值 - 直接受益场景包括:聊天应用(实现精确的虚拟滚动)、内容类产品(瀑布流、杂志排版)、编辑器/文档工具(自动增高文本框、分页),以及AI生成UI [26][27] - 在AI时代价值突出:它将文字布局抽象为纯函数接口,输入文字和宽度即可输出精确高度和字符位置,降低了AI理解CSS复杂规则以生成可用界面的难度 [23][27] - 引擎体积小巧(仅几KB),能识别浏览器差异,并支持包括韩语、RTL阿拉伯语混合使用及平台特定表情符号在内的所有语言 [7][25]
腾讯研究院AI速递 20260331
腾讯研究院· 2026-03-31 00:12
人工智能预测系统 - UniPat AI发布名为Echo的预测智能基础设施,包含动态评测引擎、Train-on-Future训练范式和专用模型EchoZ-1.0,该系统在General AI Prediction Leaderboard上以Elo 1034.2的分数排名第一 [1] - 专用模型EchoZ在全部9组参数敏感性测试中均保持第一,是唯一排名未波动的模型,在政治治理领域对人类预测者的胜率达到63.2% [1] - 该系统通过动态排行榜、实盘市场对照和全量数据公开三重验证机制,构建了可追溯的预测评估体系,并计划推出AI原生预测API [1] 前端性能优化技术 - Midjourney前端工程师Cheng Lou开源Pretext项目,该项目使用纯TypeScript在用户态自研高精度文本测量引擎,绕过DOM渲染机制,通过canvas.measureText()实现布局计算 [2] - 性能测试显示,该技术使Chrome浏览器上的排版速度提升483倍,Safari浏览器上提升1242倍,可在120fps下处理数十万文本框的滚动与缩放,在三大浏览器上进行的7680项穷举测试全部实现像素级吻合 [2] - 项目在GitHub上的星标迅速突破11K,开发者社区涌现大量创意应用,包括文字内嵌动画、游戏渲染等,预示网页UI可能向Canvas/GPU渲染时代迈进 [2] 语音识别与全模态AI模型 - 微软开源VibeVoice-ASR语音识别模型,该模型拥有70亿参数,可单次处理长达60分钟的连续音频,支持说话人分离、时间戳标注和自定义热词识别 [3] - 该模型支持50多种语言的自动识别,原生支持中英混合等代码切换场景,在MLC-Challenge数据集上英语词错误率(WER)为7.99,整体平均词错误率约为12 [3] - 通义实验室发布Qwen3.5-Omni全模态模型,支持文本、图片、音频及音视频输入,在音频和音视频理解、推理、对话、翻译等任务上取得了215项SOTA(当前最优)成绩 [4] - Qwen3.5-Omni模型自然涌现出Audio-Visual Vibe Coding能力,可根据音视频指令直接生成可运行代码,支持语义打断、音色克隆和语音控制等实时交互功能 [4] - 该模型采用升级版Thinker-Talker架构搭配Hybrid-Attention MoE,支持256K超长上下文和113种语言识别,可处理长达10小时的音频或1小时的视频 [4] 企业级AI应用与开发工具 - 企业微信正式开源CLI项目,支持Claude Code、Codex等主流AI Agent调用其消息、通讯录、文档、智能表格、日程、会议和待办事项等7大核心办公能力 [5][6] - 该项目优先面向10人及以下的小团队,CLI模式让AI无需解析复杂接口文档即可围绕任务目标拆解执行,旨在降低开发门槛和Token使用成本 [6] - 开发者仅需3步即可接入:创建机器人获取配置、安装CLI和SKILL、调用能力,这标志着企业微信正从“给人用”转向“可被AI调用” [6] - Claude Code创始人分享了15个高频使用但常被忽略的实用功能,包括移动端App写代码、/teleport跨设备无缝切换、/loop和/schedule自动化运行等,其中/loop支持按时间间隔自动执行任务最长一周 [8] - 开发效率类功能包括hooks生命周期控制、git worktrees并行开发(可同时运行数十个实例)、/batch并行分发大规模变更,以及--bare参数提升SDK启动速度最多10倍 [8] - 交互体验类功能包括/btw不打断主流程提问、/voice语音输入写代码、Chrome扩展验证前端输出,以及Cowork Dispatch远程控制等 [8] AI视频生成与健康监测技术 - 爱诗科技(PixVerse)上线V6视频模型及实时世界模型R1,1080P视频几十秒即可生成,在仿真性、物理规律、电影质感等方面均有提升 [7] - 公司新增Team Plan协同功能,支持2至15人团队共享积分池、角色权限管理和资产同步,面向AI视频工作室场景 [7] - 作为AI视频赛道早期“御三家”中唯一持续迭代的产品,PixVerse凭借快速生成和高性价比形成差异化优势,保持在行业第一梯队 [7] - 香港科技大学等团队在Nature Communications发表研究,推出基于微型嗅觉传感芯片的AI可穿戴戒指,核心传感器面积仅0.0081平方毫米,可非侵入式读取饮食和活动状态 [9] - 该戒指能准确识别六类饮食和三种运动状态,KNN分类准确率达98.2%,还可定量预测酒精摄入量,通过蓝牙连接手机提供个性化健康建议 [9] - 该技术采用三维垂直异质界面纳米管结构耦合AA-sLSTM算法框架,未来可拓展至糖尿病、肝病等疾病的早期筛查,为下一代数字化健康监测提供新方向 [9]
前端大神Cheng Lou新项目火了!「文字绕图」玩法炸裂,Bad Apple新版火出圈
机器之心· 2026-03-30 14:52
Pretext项目概述 - 项目是一个名为Pretext的开源前端文本排版库,由React核心团队成员Cheng Lou开发,能在完全不触碰DOM的情况下实现极速、精确的文本测量与布局,速度大约是传统方案的数百倍[3] - 项目发布后迅速爆火,在GitHub上star量已超过1.2万,相关创意玩法在社交媒体上广泛传播[10][11] 技术核心与创新 - 核心解决了文本布局与测量的性能瓶颈,通过分离`prepare()`和`layout()`函数,将昂贵的文本测量计算缓存并复用,从而实现了高性能的动态文本渲染[17][18] - 该引擎体积小(仅几KB),支持多语言及复杂文本(如韩文混RTL阿拉伯文),且API设计为AI友好型,便于AI编程助手直接调用[6][17] - 与苹果Pages/Keynote等封闭原生应用不同,Pretext是开源、纯TypeScript、跨浏览器的Web解决方案,旨在成为替换CSS文本测量底层的基础设施[22] 开发者背景与项目意义 - 开发者Cheng Lou是React核心团队成员,曾主导ReasonML/ReScript开发,目前任职于AI图像生成平台Midjourney,具备深厚的技术背景[9] - 项目被开发者称为“未来几年内UI工程中最重要的基础设施之一”,其价值在于打破了在炫酷视觉效果与文本实用性之间必须二选一的限制[6][17] - 技术发展需要避免经验过拟合,该项目展示了在AI时代保持开放视野所能带来的技术可能性[24] 项目影响与社区反响 - 项目发布后,社区迅速涌现大量创意应用,包括动态歌词动画、物理模拟“课本”、交互式小游戏等,展示了其强大的应用潜力[11][12][14] - 项目解决了Web开发中长期存在的性能难题,即无需渲染即可计算自动换行文本的高度,为浏览器应用实现了全新的文本渲染效果[17]