kimi

搜索文档
AI们数不清六根手指,这事没那么简单
虎嗅· 2025-07-11 10:54
视觉语言模型的偏见问题 - 核心观点:视觉语言模型(VLMs)并非真正"看"图像,而是依赖记忆中的先验知识进行判断,导致对反常识图像的识别错误[19][20][38] - 实验证据:当展示6根手指图片时,包括GPT-4、Gemini-2.5 Pro、Claude 3.7等主流模型100%错误识别为5根[40][45][63] - 机制分析:模型通过高频关联建立强先验知识(如"阿迪达斯=三条纹"),当视觉输入与常识冲突时优先选择记忆而非真实观察[54][55][64] 行业应用风险案例 - 工业质检:AI可能将罕见零件缺陷误判为光学误差,导致安全隐患[72][73][74] - 医疗领域:肺癌筛查等医疗诊断仍需医生复核AI判断,显示可靠性存疑[77] - 自动驾驶:对非常规交通场景(如异常数量行人)的识别可能失效[77] 技术局限性数据 - 品牌标识测试:修改阿迪达斯条纹数量后,所有模型仍坚持回答3条[39][40] - 动物肢体测试:5腿狮子/3脚鸟等异常图片识别准确率仅2%[43][45] - 国旗测试:美国国旗条纹数识别错误率达92%(模型回答13条vs实际12/14条)[47] 底层机制解释 - 数据训练方式:模型通过吸收数百亿张图片建立关联记忆而非理解[50][51] - 决策冲突:视觉模块与知识模块产生矛盾时,后者权重显著更高[63][65] - 干预无效:明确要求模型"仅根据图片回答"仅提升2%准确率[67][68]
AI们数不清六根手指,这事没那么简单。
数字生命卡兹克· 2025-07-11 04:40
视觉语言模型的偏见问题 - 核心观点:当前主流视觉语言模型(如GPT-4、Gemini、Claude等)在图像识别中严重依赖先验记忆而非实际视觉分析,导致对反事实图像(如六指手、四条纹阿迪达斯鞋)的识别准确率极低[5][12][17] - 实验数据:模型在识别异常图像(五腿狮子、三脚鸟等)时平均准确率仅2.12%[15],数国旗条纹错误率超80%[16] - 机制解释:模型通过海量数据训练形成强关联性先验知识(如"狗=四条腿"、"阿迪达斯=三条纹"),视觉输入与记忆冲突时优先选择记忆答案[23][25][26] 多模态模型测试结果 - 跨模型验证:OpenAI o3/o3 pro、豆包、Kimi、Gemini等模型对六指图像均错误识别为五指,仅Claude 4存在部分正确率[4][5] - 响应特征:模型在48秒推理后仍坚持错误结论,人工提示仅提升2%准确率[3][28] - 表格数据:阿迪达斯四条纹被100%错误识别为三条纹,PUMA标识错误率超75%[13] 工业应用风险 - 质检场景:AI可能因罕见缺陷(如零件裂缝)不符合先验知识而误判合格,潜在导致安全事故[30][32] - 医疗领域:肺癌筛查等场景需医生二次验证AI判断,反映模型可靠性存疑[34] - 交通隐患:对异常目标(夜间行人、突发障碍物)的识别可能受偏见影响[35][36] 技术本质分析 - 训练缺陷:模型通过记忆数百亿图片文本建立知识库,而非真正理解视觉元素[18][19] - 认知类比:与人类"雷碧"误认现象类似,依赖快速模式匹配而非细节分析[11][12] - 矛盾机制:视觉模块与知识模块冲突时,模型优先选择高概率常识答案[24][25] 行业启示 - 当前局限:视觉语言模型在反事实识别、细节观察等场景存在系统性缺陷[37][38] - 应用建议:关键领域需保留人工复核机制,不能完全依赖AI视觉判断[34][39] - 发展需求:需突破基于记忆的推理框架,建立真正的视觉理解能力[26][38]
2024年北京市人工智能核心产业规模近3500亿元 占全国一半
中国产业经济信息网· 2025-07-03 08:39
数字经济核心产业表现 - 北京市2025年一季度数字经济增加值同比增长8.3%,其中核心产业增长9.7% [1] - 人工智能核心产业规模2024年达近3500亿元,占全国总量50% [2] 人工智能领域优势 - 北京人工智能顶尖人才占全国43%,拥有14家AI领域全国重点实验室 [1] - 累计备案上线大模型132款,占全国总量35%,豆包、kimi等模型性能全球领先 [1][2] - 23家人工智能北京市重点实验室和4家新型研发机构支撑技术研发 [2] 数据要素市场发展 - 北京国际大数据交易所1-5月新增数据产品152个,场内交易规模超4400万元,同比增长37.63% [2] - 数据基础制度先行区完成监管沙盒3.0升级,汇聚20余个行业超17PB数据 [2] 数字基础设施升级 - 北京市基础电信企业完成IPv6全网络改造,新建千兆光网和5G网络均部署IPv6 [2] - 大型商业网站全部支持IPv6访问 [2] 应用场景与政策支持 - 教育、医疗、文化等领域开放数字化转型场景,专项政策推动AI与实体经济融合 [1] - 推出"模力AI大讲堂"服务品牌,形成企业全周期服务体系 [2]
防作弊?腾讯元宝、夸克等大模型高考期间关闭识图、答题功能
南方都市报· 2025-06-09 17:10
AI聊天助手功能调整 - 多个AI聊天助手在高考期间关闭了识图功能或"拍题解答"功能,包括腾讯元宝App、阿里通义App、夸克App、豆包App和kimi [1] - 腾讯元宝App回复"为确保高考的公平性,该项功能在高考时段无法使用" [1] - 阿里通义App关闭"高考考试时段拍照讲题服务暂时关闭"但能识别其他图片 [1] - 夸克App显示"高考考试时段答题服务暂时关闭"但能识别其他图片 [1] - 豆包App能识别普通风景照片,但输入考试相关题目则显示"图片内容不合规,上传失败" [1] - kimi输入随意照片显示"为确保高考的公平性,此项功能在高考时段无法使用" [1] 高考安保措施 - 广东省公安厅出台全力护航高考26项服务措施,省市县三级公安机关成立高考安保联勤指挥部 [6] - 广东省各地公安机关组建涉考违法犯罪打击专班,持续开展24小时监测预警 [6] - 联合网信、市场监管、工信等部门加强线索摸排、网上有害信息处置 [6] - 对网上售卖作弊器材、组织作弊、贩卖答案,特别是利用人工智能技术组织作弊等黑灰产业链开展全链条打击 [6] - 重大案件由省厅挂牌督办 [6]
小米将多枚商标转让至Kimi
快讯· 2025-06-03 09:16
商标转让 - 小米科技有限责任公司将多枚"kimi"商标转让至北京月之暗面科技有限公司 这些商标最早申请于2013年 当前状态多为已注册 [1] 公司信息 - 北京月之暗面科技有限公司成立于2023年4月 法定代表人为杨植麟 注册资本100万人民币 [1] - 公司经营范围包括软件开发 软件销售 人工智能基础软件开发 人工智能应用软件开发 计算机系统服务 信息技术咨询服务等 [1] - 公司由杨植麟 周昕宇 吴育昕等5位股东共同持股 [1] 产品信息 - Kimi是北京月之暗面科技有限公司于2023年10月9日推出的智能助手 [1] - 主要应用场景包括专业学术论文的翻译和理解 辅助分析法律问题 快速理解API开发文档等 [1]
当AI开始制造假新闻
创业邦· 2025-03-30 18:15
AI生成假新闻的现状与案例 - 近期网络流传多起AI生成的虚假新闻,如"顶流男星豪赌10亿""路易吉自杀""梅西去世"等,这些内容通过社交平台迅速扩散并引发舆论风波[3][5][23] - "顶流男星豪赌10亿"案例中,网友使用AI软件输入热点词生成谣言,细节包括"输掉10.3亿元流动资产""抵押三处豪宅及私人飞机"等虚构数据,发布者已被行政拘留8日[5][11][13] - 西藏地震期间,AI生成的"小男孩被埋图"被证实为伪造,图片由青海网友通过AI工具嫁接其他地区地震现场合成[18][19] AI在新闻生产中的应用与问题 - 新闻机构早期尝试AI工具,如新华社2015年推出的"快笔小新"机器人记者,可将15-30分钟的稿件撰写时间缩短至3-5秒[7][23] - 国际媒体如意大利《Il Foglio》发布全球首份全AI生成报纸,包含4页AI创作的政治、经济内容及读者来信[24][25] - 体育媒体出现AI生成错误战报案例,如未上场的梅西被描述为"通过灵活跑位创造机会",暴露AI内容审核漏洞[27] AI假新闻的传播机制与行业影响 - AI生成内容形成"虚空内容环":用户发布AI假新闻→其他用户提问→AI抓取假新闻反馈→循环强化虚假信息[8][35][41] - 生成技术门槛低,普通用户可通过网页版AI工具输入简单指令(如参考新闻教科书模板)快速生产虚假内容[36] - 媒体从业者反映AI工具(如ChatGPT、DeepSeek、kimi)提供的数据需额外验证,部分生成内容看似权威但实为虚构[32][33] 行业应对措施与技术规范 - 中国《人工智能生成合成内容标识办法》将于2024年9月实施,要求对AI内容添加显式/隐式标识以追溯来源[43][44] - OpenAI与《金融时报》等机构合作,在ChatGPT中提供注明出处的新闻摘要与链接,强化内容可信度[44] - 学术界提出三大鉴别技术:监督分类器法(准确率依赖训练数据)、零样本分类器法(基于特征识别)、水印法(存在被移除风险)[43]
你的企业用上DeepSeek和Manus了吗?
混沌学园· 2025-03-28 20:47
AI工具在企业中的应用现状 - 当前AI工具如GPT-4o、DeepSeek、ChatGPT、midjourney等广泛流行,但企业实际提效增收效果不明确 [1] - 企业面临工具功能重叠、场景适配不清的问题 [1] - 业务与AI技术之间存在理解鸿沟,懂业务者不熟悉AI,懂AI者不熟悉业务 [1] 企业AI落地的痛点与解决方案 - 不同规模企业(小微企业到大厂)均存在AI落地痛点 [1] - 明略科技聚焦AI Copilot产品及自有大模型,在数据技术与分析服务领域处于Top级 [1] - 直播将分享从DeepSeek到Manus的企业AI应用策略,主讲人包括混沌AI负责人张雷及明略科技CEO吴明辉 [1] 主讲人背景与活动信息 - 吴明辉为北京大学人工智能专业在读博士,拥有15年数字营销经验 [1] - 直播主题为《从DeepSeek到Manus:企业到底该怎么用AI?》,时间定于明晚19:00 [1]
那个建议我跳槽的AI,比猎头多要了30%涨薪
36氪· 2025-03-18 17:35
AI求职工具市场概况 - 58%的求职者使用AI工具辅助求职,主要渗透职业规划、简历修改、模拟面试、面试辅助四大环节 [3][4] - 2023年起求职AI工具市场进入高峰期,国内以小型创业公司为主,仅智谱AI推出未成熟产品"有时" [4] - 国外产品多采用订阅制(9.9-50美元/月),国内产品多免费(如Yoo简历、职徒简历) [19] 职业规划类工具 - 通用大模型(ChatGPT/Kimi/DeepSeek)凭借多领域数据整合能力最受欢迎,需精确提示词调试 [12][13] - 垂类工具如COACH联合职业组织开发,针对学生/转行者提供分身份服务 [10][11] - 职升机AI实现"测评+简历分析+行业匹配"三位一体功能,案例显示用户转行薪资提升30% [14][34] 简历优化类工具 - 45%求职者用AI优化简历,Yoo简历/职徒简历具备语法纠错、排版优化、岗位探测功能 [15][16] - Kickresume/Rezi等提供ATS友好模板,支持40+模板库及多语言求职信生成 [17][18] - 有效指令需包含角色设定(如资深HR)、数据量化要求、分模块优化等要素 [19][35] 模拟面试类工具 - 多面鹅/Final Round AI覆盖20,000+题库,支持管理咨询/投行等技术领域模拟 [20][22] - 面试狗训练大厂面试官模型,牛客网新增AI模拟面试功能,单次收费29-39元 [25][26] - Cedars.AI生成包含仪表仪态建议的深度分析报告,支持万字简历上传 [23][24] 实时面试辅助工具 - 面试通/面霸支持腾讯会议/Zoom等多平台,问题响应速度<0.8秒 [27][28] - 多面鹅兼具实时辅助与模拟功能,但存在诚信争议及HR反作弊技术风险 [29][30] - 用户反馈需提前练习使用,直接应用效果可能不理想 [29] 用户案例与使用策略 - 案例1:建筑设计师通过职升机AI转行售前支持,薪资提升30% [34] - 案例2:应届生利用Jobright AI优化简历匹配度,投递反馈率显著提升 [34] - 策略:组合多个AI工具形成"智囊团",通过指令差异获取多元视角 [36]
啊...越炒越污了
猫笔刀· 2025-02-20 22:17
LPR与房贷利率 - 2月LPR维持不变 一年期3.1% 五年期3.6% 已连续4个月未调整 [1] - 2024年10月LPR下调0.25%后 一线城市房价连续4个月止跌 二三线城市跌速放缓 [1] - 当前房贷利率与公募债收益率接近 招商产业债过去一年收益3.25% 与房贷利率利差收窄导致提前还贷性价比提升 [1][2] 债券市场动态 - 信托城投债收益率从两年前6.7%降至4.4% 与房贷利率利差仅1% 风险收益比不具吸引力 [2] - 家庭资产配置采用三档风险策略 低风险档(<5%)主要配置公募债 [1] A股市场表现 - 当日成交1.76万亿 中位数涨幅0.51% 橡胶制品板块异动上涨6.23% 受AI女友概念驱动 [2] - 生理传感技术概念股同步上涨 AI赋能情趣机器人预期带动橡胶需求 [2] - 3400点附近存在强阻力位 需新叙事或增量资金突破解套盘压力 [2] 互联网与科技行业 - b站四季度营收77.3亿(增19%) 利润4.5亿 美股盘前涨10% 但较历史高点仍回撤95% [6] - 阿里巴巴季度营收2801亿(增8%) 盘前涨9% 将推出基于Qwen2.5-max的深度推理模型 [6] - xAI推出免费grok3模型 登顶美区免费app榜首 超越chatgpt和gemini [4] - deepseek产品力显著优于kimi 但kimi在响应速度保持优势 [4] 政策与监管动态 - 港澳银行内地分行获准开办境内卡业务 不涉及离岸账户开立 [5] - 特朗普计划未来5年每年削减8%国防预算 拟对汽车/半导体/芯片等行业加征关税 [6] - 马斯克政府改革方案包括削减驻外使馆人员10-20% 目标减少政府支出2万亿 [6]
「AI三杰」背后的广东隐忧
投资界· 2025-02-17 09:33
AI三杰背景分析 - De e ps e e k创始人梁文锋1985年出生于广东湛江 17岁考入浙江大学信息与电子工程系 2015年创办幻方量化 2021年资产管理规模突破千亿 2023年进军AI领域创办De e pSe e k [7][8] - Kimi创始人杨植麟1993年出生于广东汕头 2011年保送清华大学热能工程系后转计算机系 博士毕业于卡内基梅隆大学 曾在Facebook和谷歌任职 2023年在北京创办月之暗面科技 发布kimi大模型后融资超10亿美元 估值达30亿美元 [9][10][11] - 科学家何恺明1984年出生于广州 2003年广东省高考满分状元 本科就读清华大学物理系 研究生师从汤晓鸥 现任职于MIT 其ResNet技术突破神经网络19层限制至152层 论文引用量52万居全球AI学界第三 [12][13][14][15] 区域创业环境差异 - 广东缺乏世界一流科研院所 高校实力与清华 浙大 MIT存在差距 难以承载顶尖科研人才 [17] - 广东营商文化侧重短期快速回报 民营经济占比96 48% 但高科技产业需长期投入 如华为芯片 阿里云等项目需承受十年不盈利压力 [18] - 加州通过建设斯坦福等高校扭转"文化沙漠"印象 孕育硅谷 广东近年加速高校建设以提升基础科研能力 [17][19] 行业发展趋势 - AI领域创业门槛显著提高 头部项目如kimi de e ps e e k均由高学历人才主导 知识密集型特征明显 [17] - 深度学习核心技术突破依赖基础研究 ResNet等成果直接推动ChatGPT AlphaGo等应用发展 [13][14] - 量化金融与AI结合形成新赛道 幻方量化通过数学模型实现资产管理规模千亿级突破 [8]