Workflow
智谱AI输入法
icon
搜索文档
下一代 AI 交互,会长成什么样子?| 42章经 AI Newsletter
42章经· 2025-12-11 21:31
(一) 为什么独立的 Vibe Coding 必死,但 Personal Software 会火? Personalized software (个性化软件) 这个方向最近很火。 蚂蚁的灵光上线后,听说一天内的数据就达到了团队定的年度目标。 Replika 的创始人 Kuyda 最近也再次创业,做了一个叫 Wabi 的产品,定位是 Youtube for Apps,一个 mini app 的集合平台。(类似方向的产品国内还有马卡龙、 Youware 等等) 姚顺雨(前 OpenAI 研究员)曾反反复复表达过一个观点,我印象很深: 「创业公司最大的机会,在于设计不同的交互方式。」 于是这期就索性围绕「交互」这个主题展开,分享一下我们最近观察到的一些机会。 目录 我最近听了她的两期播客,很有意思,摘录一些 insights: 1. 软件的未来将是「应用的 YouTube 化」。 在 Kuyda 看来,软件行业正在经历内容行业当年的变迁。 就像视频从专业制作走向人人可拍,软件开发也将从全球「2000 万开发者」的特权,泛化为「80 亿创作者」的日常媒介。 在这个语境下,未来的软件,更多会像快消品,它不再需要追求 S ...
腾讯研究院AI速递 20251211
腾讯研究院· 2025-12-11 00:01
生成式AI 2. 开发者实测显示OpenAI生图质量尤其在人物面部生成效果上不如谷歌Nano Banana Pro,推测可能仍基于GPT- 4o训练但相较上一代有所提升; 3. 谷歌Nano Banana Flash新模型也将本周登场,同时Gemini 3 Flash即将发布,OpenAI与谷歌正面争锋AI"大 戏"即将上演。 https://mp.weixin.qq.com/s/VsFTC-85bLSvma7icsbb_w 二、Mistral再开源!发布代码模型Devstral 2及自家原生CLI 1. Mistral AI发布下一代代码模型系列Devstral 2(123B)和Devstral Small 2(24B),在SWE-bench Verified 上分别达到72.2%和68.0%,成本效率比Claude Sonnet高出7倍; 2. 同步发布原生CLI工具Mistral Vibe,提供项目感知上下文、智能引用和多文件编排功能,已作为Zed扩展程序提 供; 3. 采用修改版MIT许可证增加收入限制条款,月收入超2000万美元的公司无权免费使用,需联系Mistral AI购买商业 授权。 http ...
智谱正式推出「智谱AI输入法」,要真正实现“指尖即模型,语音即指令”
IPO早知道· 2025-12-10 13:30
产品发布与开放 - 智谱于12月10日正式发布并开源GLM-ASR系列语音识别模型,并推出基于该系列模型打造的桌面端智谱AI输入法 [2] - 即日起,智谱AI输入法面向所有用户开放 [1][7] 核心产品功能与定位 - 智谱希望让用户真正做到“动动嘴,活就干了”,从“把话变成字”走向“直接用语音完成任务” [2] - 智谱AI输入法基于GLM-ASR系列模型打造,让用户在PC端用语音丝滑交互,实现“指尖即模型,语音即指令” [4] - 用户不仅可以实现精准的语音转文字,还可以在输入法中直接调用大模型能力,完成翻译、改写、情绪转化等操作 [4] 核心技术:GLM-ASR模型性能 - GLM-ASR-2512支持将语音实时转换为文字,在多场景、多语种、多口音的真实复杂环境测试中,字符错误率(CER)仅为0.0717 [2] - 智谱开源了GLM-ASR-Nano-2512,这是一个1.5B参数的端侧模型,取得了当前开源语音识别方向的SOTA表现,并在部分测试中优于若干闭源模型 [3] - 该模型将识别能力压缩到本地运行,在保证高精度的同时,实现更强的隐私保护与更低的交互延迟 [3] - 在多个基准测试中,GLM-ASR-Nano (1.5B) 的平均错误率为4.10,优于OpenAI Whisper V3 (1.5B) 的6.93和FunAudio-ASR (7.7B) 的3.67 [3] 输入法特色功能 - **所选即所改**:直接调用底层GLM模型帮助用户翻译、扩写、精简屏幕上的任意一段文字,并完成智能润色,整个过程在输入框内完成,实现“理解-执行-替换”一体化 [4] - **千人千面人设切换**:支持设置不同“人设”风格,如“面对老板”可将口语转化为逻辑严谨的工作汇报,“面对伴侣”可使文字变得温柔俏皮 [4] - **Vibe Coding(语感编程)**:针对开发者,结合多语言支持与代码理解能力,可通过语音快速输入代码逻辑和注释、查找Linux指令、用自然语言指挥AI完成复杂计算或脚本编写 [5] - **耳语捕捉与高效热词**:优化对微弱声音的捕捉能力,并区分环境噪声,解决公共场合使用痛点;支持用户一键导入专属词汇、项目代号及生僻人名地名 [6]
智谱推出AI输入法
北京商报· 2025-12-10 10:13
具体到GLM-ASR-2512,是智谱新一代语音识别模型,支持将语音实时转换为文字。智谱AI输入法基于 GLM-ASR系列模型打造,让用户在电脑端用语音交互,可以实现精准的语音转文字,在输入法中直接 调用大模型能力,完成翻译、改写、情绪转化等操作。 北京商报讯(记者魏蔚)12月10日,智谱正式发布并开源GLM-ASR系列语音识别模型,并推出基于该系 列模型的桌面端智谱AI输入法。本次发布模型与产品包括云端语音识别模型GLM-ASR-2512;参数量 1.5B的开源SOTA端侧语音模型GLM-ASR-Nano-2512;将语音识别与大模型深度融合的桌面端工具智谱 AI输入法。 ...