Workflow
月之暗面Kimi
icon
搜索文档
黄仁勋谈中国AI创新:以令人难以置信的速度前进
快讯· 2025-07-16 16:44
中国人工智能发展 - 中国人工智能行业正在以令人难以置信的速度前进 [1] - 模型层有DeepSeek、阿里巴巴、月之暗面Kimi等优秀技术公司 [1] - DeepSeek是世界上第一个开源推理模型 这是一个毫无疑问的突破 [1] - 中国在模型层进步非常快 应用层发展也很快 [1] - 中国人工智能行业竞争激烈 参与者都致力于建立伟大公司或开展伟大业务 [1] - 越来越多优秀功能被开发出来 [1]
六大AI模型出战高考作文,人工智能ETF(159819)、科创人工智能ETF(588730)助力布局AI全产业链
每日经济新闻· 2025-06-09 11:20
市场表现 - 中证人工智能主题指数上涨0.3%,上证科创板人工智能指数上涨0.2% [1] - 人工智能ETF(159819)最新规模超160亿元,居同类产品第一 [1] AI技术进展 - 六大AI大语言模型(DeepSeek、百度文心一言、阿里通义千问、字节跳动豆包、月之暗面Kimi、GPT4o)在高考作文测试中评分均不低于50分(满分60分),展现语言理解与创作实力 [1] 行业观点 - 科技板块自底部抬升,整体仍处于高性价比区间,海外不确定性降温带动科技板块大涨,对A股科技成长板块形成映射 [1] - 建议以AI产业链为抓手,关注上游算力自主可控与中下游应用创新 [1] 产品信息 - 人工智能ETF(159819)、科创人工智能ETF(588730)覆盖AI全产业链,为投资者提供布局工具 [1] - 上证科创板人工智能指数覆盖30只科创板人工智能龙头股,聚焦算力和应用环节,电子和计算机行业占比超85% [4]
九大AI模型再答高考作文:座次剧烈变动
第一财经· 2025-06-07 23:24
AI模型高考作文表现 - 2025年九大AI模型高考作文测评显示,谷歌Gemini和DeepSeek以61.5分并列第一,元宝(61分)、通义千问(59.75分)、Kimi(59.5分)紧随其后,豆包(59分)、文心一言(58.5分)表现中等,智谱清言(50.75分)和ChatGPT(50.5分)垫底 [3][4][20][28][36][46][62][70][80][92][94] - 新晋模型Gemini和DeepSeek首次参评即登顶,去年前三名通义千问、元宝、豆包排名下滑至第三、第四和第六位 [3][4] - 测评采用上海卷思辨性作文题目,AI在逻辑明确的任务中表现更优;全国一卷诗歌类题目则普遍审题不清 [6][7] AI作文能力进步与局限 - 教师评价AI作文语言规范、材料丰富、逻辑性强,审题准确且结构程式化,但缺乏个性化思考和情感共鸣 [97][98][99] - 相比2024年,AI在情感表达和思想深度上有进步,但仍存在案例堆砌、逻辑错误和"论文味过重"问题 [1][2][99] - 高分作文如Gemini和DeepSeek的共性:论点鲜明、论据充实(引用爱因斯坦相对论、马尔克斯《百年孤独》等),结构完整且扣题紧密 [20][28] 头部模型厂商格局变化 - 测评覆盖国内外头部厂商,包括谷歌、DeepSeek、腾讯(元宝)、阿里(通义千问)、字节(豆包)、百度(文心一言)、月之暗面(Kimi)、智谱和OpenAI(ChatGPT) [5] - 谷歌Gemini和DeepSeek凭借技术迭代迅速崛起,成为新头部;国内厂商中腾讯元宝稳定性较强,阿里通义千问和字节豆包排名波动较大 [3][4][36][46] - 智谱清言和ChatGPT因内容生硬、分析浅显垫底,反映部分厂商在语言理解和逻辑构建上的技术短板 [92][94][96] 作文内容与评分细节 - 高分作文典型结构:Gemini采用"点题-关系阐述-正反论证-结论"框架,DeepSeek通过历史典故(孔子、钱锺书)强化思辨 [20][24][28] - 评分差异体现教师偏好:元宝获左建国最高分(63分)但文旭仅给52分,通义千问获文旭和许珊68分高分但左建国仅评51分 [36][46] - AI仍存在事实错误(如将黄庭坚诗句误标为苏轼),显示幻觉问题未完全解决 [47]
“有提升”,高考阅卷名师再评AI高考作文:九大模型座次剧烈变动
第一财经· 2025-06-07 22:00
AI模型高考作文表现 - 2024年九大AI模型参与上海高考思辨类作文测评,新增谷歌Gemini和DeepSeek两大头部模型,与去年通义千问、元宝、豆包等形成新竞争格局[2] - Gemini与DeepSeek以61.5平均分并列第一,元宝61分第三,通义千问59.75分第四,豆包降至第六名59分,ChatGPT和智谱清言分别以50.5分和50.75分包尾[3][4][20][42][52] - 头部模型优势体现在:审题准确度、逻辑严密性、材料丰富度,Gemini作文获65分最高单评,引用爱因斯坦相对论等案例论证多元传播路径[12][13] AI写作能力进化与局限 - 教师评价显示AI较去年进步明显:情感表达更自然,思想深度提升,但仍缺乏个性化思考与生命温度,难以产出满分作文[1][4][53] - 技术短板集中体现在:案例堆砌(如智谱清言)、论文腔调(ChatGPT)、结构模板化(Kimi),且存在引用错误等"幻觉"问题[21][42][52] - 任务适应性差异显著:思辨类明确题目(上海卷)平均分超60,而开放式诗歌命题(全国一卷)表现混乱[5][53] 行业竞争格局变化 - 国际厂商突破本土壁垒:谷歌Gemini首战登顶,与国产元宝、通义千问形成三强格局,OpenAI的ChatGPT表现垫底[2][3][52] - 新锐厂商快速崛起:DeepSeek空降榜首,月之暗面Kimi以59.5分超过百度文心一言(58.5分),显示技术迭代加速[13][32][36] - 测评标准影响排名:同一模型(如豆包)分差达13分(56-69),反映评价体系主观性对结果的影响[20][29]