语言能力

搜索文档
AI重划语言能力边界,国际测评权威专家迈克•米兰诺维奇博士贵阳发声:人类核心能力与AI协作智能将分轨评估
环球网资讯· 2025-07-23 11:43
语言能力双轨进化论 - 米兰诺维奇博士提出语言能力正裂变为两大支柱:人类核心能力(如精准词汇运用、严谨语法结构)和AI协作智能(如指令工程、多源信息整合)[3] - 传统语言测试测量的"独立能力"逐渐脱离现实,数字时代职场更需考察AI协同能力[3] - 未来测评可能转向追踪解题认知过程而非答案正确性,利用AI识别认知流程潜力[3][4] 动态命题技术突破 - 朗思考评局AI动态命题技术成功率从4%跃升至50%,实现"千人千卷"定制化测评[5] - 技术可即时生成海量差异化试题,有效打击题目记忆与贩卖产业链[5] - 2017年起已开发AI反作弊方案,包括生物识别、答题模式分析等多项安全技术[5] 行业应对框架与未来方向 - 呼吁全球测评机构共享反作弊情报,共建安全考试生态系统[5] - 未来研究聚焦三大领域:AI影响实证研究、创新评估方法验证、跨文化接受度研究[7] - 强调通过主动适应将AI挑战转化为行业发展新动力[7] 朗思国际测评创新实践 - 在中国率先推出在线远程监考考试,打破时空限制[8] - 试题紧密贴合真实场景,采用自适应技术快速评估能力[8] - 汇聚全球顶尖研发团队,结合教育与科技打造新一代测评体系[8]
vivo突破手机AI部署难题,绕开MoE架构限制,骁龙8 Elite流畅运行|ICCV 2025
量子位· 2025-07-03 17:00
多模态大模型在移动端的部署挑战与解决方案 - 当前端侧多模态大模型(MLLM)面临纯语言任务性能下降超10%的问题,尤其在MATH、AlignBench和MT-Bench测试中表现明显 [4] - 手机NPU平台尚不支持MoE架构部署,包括联发科天玑9400和高通骁龙8 Elite在内的旗舰SoC均存在此限制 [7] - vivo AI研究院联合学术团队提出GenieBlue方案,通过冻结原始LLM参数并引入复制Transformer层+LoRA模块解决上述问题 [2] GenieBlue核心技术突破 - 采用不共享基座的推理策略,在骁龙8 Elite芯片上实现流畅运行,完全保留原始纯语言性能 [3] - 通过1/4层复制Transformer+LoRA模块设计,多模态性能达到全量微调的96%以上 [18] - 相比CogVLM-Skip方法,GenieBlue-Skip在多模态任务平均表现提升1-2个百分点 [23] 训练数据与模型结构优化 - 实验显示增加200万纯文本数据对多模态能力无显著影响,但能部分恢复客观NLP任务性能 [11][12] - 全量微调导致纯文本任务性能下降22-36%,而LoRA和CogVLM方法可保持90%以上原始能力 [17] - 在BlueLM-3B模型上,GenieBlue-Skip结构实现98.99%多模态性能保留率 [23] 部署效果验证 - 在MMBench等9项多模态测试中,GenieBlue(3.2B)表现优于InternVL2-8B(8B) [32] - 采用不共基座部署策略实现100%原始语言能力保留,显著优于Qwen2.5VL-3B的92.98% [34] - 在骁龙8 Elite平台实现30token/s推理速度,模型加载时间仅增加15% [35]
聊过 200 个团队后的暴论:不要拿 AI 造工具,要建设「新关系」
Founder Park· 2025-06-24 16:31
AI Native 产品的新目标 - AI Native 产品的核心是构建 AI 能力与人之间的新关系,而非单纯创造新工具 [13] - 系统提示词(System Prompt)成为定义 AI 与用户关系的关键,例如 NotebookLM、Manus、Cursor 等产品通过提示词设定人设和交互逻辑 [15] - AI 的「超语言能力」使其具备主体性,与人类形成「互为主体」的关系,这是高阶关系的核心 [18] 新关系带来的挑战 - 情商成为产品价值交付的一部分,例如 Cursor 通过系统提示词管理用户负反馈并提升交互体验 [21] - 生命感是增强 AI 产品主体性的关键,类宠物智能硬件通过传感器和简单反应创造情绪价值 [24] - 生命感的设计需多样化,涵盖顾问、朋友、宠物等关系类型,以低智能交付高情绪价值已被验证有效 [27] 新关系带来的机遇 - 跨次元混合价值交付:硬件与软件结合突破传统价值天花板,例如情绪管理可穿戴设备 [35] 和 Fuzzi 气囊支架 [36] - 新关系形成服务分发新通路,突破传统 ARPU 和 LTV 天花板,例如 Agent 产品按用量付费模式 [46] - 建设性关系需解放而非纵容人性,产品需避免隐藏议程以维持长期信任 [50][52] AI Native 产品的新管线 - 产品工程的核心是在不确定性中增强确定性,Broad Input(宽输入)和 Liquid Outputting(柔输出)是关键 [56][58] - 宽输入需多模态实时感知和高分辨率生活流捕捉,例如 Dia 浏览器通过主动获取标签页信息提升用户体验 [65][68] - 柔输出需分步交付并与用户协行,例如 Devin 追问需求、Deep Research 确认方案、YouWare 提供模板起点 [74][75] AI Native 的新价值模型 - 创业者需同时服务用户和 AI,通过产品工程释放 AI 能力 [82][84] - 价值模型从二维平面变为三维立体,AI 能力高度决定总体积 [85] - 传统产品经济学和管理学被颠覆,收费模式、组织形态等需重新思考 [95][97] 行业趋势与未来展望 - AI 推动生产力与生产关系的变革,3 年看生产力,10 年看生产关系 [95] - 极客公园通过社区支持技术创业者,探索新时代产品创新 [81] - 开放性问题如智能合约付费、价值创造新循环等预示行业未来方向 [95]