Workflow
PixVerse V6视频模型
icon
搜索文档
腾讯研究院AI速递 20260331
腾讯研究院· 2026-03-31 00:12
人工智能预测系统 - UniPat AI发布名为Echo的预测智能基础设施,包含动态评测引擎、Train-on-Future训练范式和专用模型EchoZ-1.0,该系统在General AI Prediction Leaderboard上以Elo 1034.2的分数排名第一 [1] - 专用模型EchoZ在全部9组参数敏感性测试中均保持第一,是唯一排名未波动的模型,在政治治理领域对人类预测者的胜率达到63.2% [1] - 该系统通过动态排行榜、实盘市场对照和全量数据公开三重验证机制,构建了可追溯的预测评估体系,并计划推出AI原生预测API [1] 前端性能优化技术 - Midjourney前端工程师Cheng Lou开源Pretext项目,该项目使用纯TypeScript在用户态自研高精度文本测量引擎,绕过DOM渲染机制,通过canvas.measureText()实现布局计算 [2] - 性能测试显示,该技术使Chrome浏览器上的排版速度提升483倍,Safari浏览器上提升1242倍,可在120fps下处理数十万文本框的滚动与缩放,在三大浏览器上进行的7680项穷举测试全部实现像素级吻合 [2] - 项目在GitHub上的星标迅速突破11K,开发者社区涌现大量创意应用,包括文字内嵌动画、游戏渲染等,预示网页UI可能向Canvas/GPU渲染时代迈进 [2] 语音识别与全模态AI模型 - 微软开源VibeVoice-ASR语音识别模型,该模型拥有70亿参数,可单次处理长达60分钟的连续音频,支持说话人分离、时间戳标注和自定义热词识别 [3] - 该模型支持50多种语言的自动识别,原生支持中英混合等代码切换场景,在MLC-Challenge数据集上英语词错误率(WER)为7.99,整体平均词错误率约为12 [3] - 通义实验室发布Qwen3.5-Omni全模态模型,支持文本、图片、音频及音视频输入,在音频和音视频理解、推理、对话、翻译等任务上取得了215项SOTA(当前最优)成绩 [4] - Qwen3.5-Omni模型自然涌现出Audio-Visual Vibe Coding能力,可根据音视频指令直接生成可运行代码,支持语义打断、音色克隆和语音控制等实时交互功能 [4] - 该模型采用升级版Thinker-Talker架构搭配Hybrid-Attention MoE,支持256K超长上下文和113种语言识别,可处理长达10小时的音频或1小时的视频 [4] 企业级AI应用与开发工具 - 企业微信正式开源CLI项目,支持Claude Code、Codex等主流AI Agent调用其消息、通讯录、文档、智能表格、日程、会议和待办事项等7大核心办公能力 [5][6] - 该项目优先面向10人及以下的小团队,CLI模式让AI无需解析复杂接口文档即可围绕任务目标拆解执行,旨在降低开发门槛和Token使用成本 [6] - 开发者仅需3步即可接入:创建机器人获取配置、安装CLI和SKILL、调用能力,这标志着企业微信正从“给人用”转向“可被AI调用” [6] - Claude Code创始人分享了15个高频使用但常被忽略的实用功能,包括移动端App写代码、/teleport跨设备无缝切换、/loop和/schedule自动化运行等,其中/loop支持按时间间隔自动执行任务最长一周 [8] - 开发效率类功能包括hooks生命周期控制、git worktrees并行开发(可同时运行数十个实例)、/batch并行分发大规模变更,以及--bare参数提升SDK启动速度最多10倍 [8] - 交互体验类功能包括/btw不打断主流程提问、/voice语音输入写代码、Chrome扩展验证前端输出,以及Cowork Dispatch远程控制等 [8] AI视频生成与健康监测技术 - 爱诗科技(PixVerse)上线V6视频模型及实时世界模型R1,1080P视频几十秒即可生成,在仿真性、物理规律、电影质感等方面均有提升 [7] - 公司新增Team Plan协同功能,支持2至15人团队共享积分池、角色权限管理和资产同步,面向AI视频工作室场景 [7] - 作为AI视频赛道早期“御三家”中唯一持续迭代的产品,PixVerse凭借快速生成和高性价比形成差异化优势,保持在行业第一梯队 [7] - 香港科技大学等团队在Nature Communications发表研究,推出基于微型嗅觉传感芯片的AI可穿戴戒指,核心传感器面积仅0.0081平方毫米,可非侵入式读取饮食和活动状态 [9] - 该戒指能准确识别六类饮食和三种运动状态,KNN分类准确率达98.2%,还可定量预测酒精摄入量,通过蓝牙连接手机提供个性化健康建议 [9] - 该技术采用三维垂直异质界面纳米管结构耦合AA-sLSTM算法框架,未来可拓展至糖尿病、肝病等疾病的早期筛查,为下一代数字化健康监测提供新方向 [9]