Workflow
月之暗面Kimi
icon
搜索文档
京东“618”整体订单量超22亿单;月之暗面Kimi首个Agent开始灰度测试|一周未来商业
每日经济新闻· 2025-06-23 06:39
电商新零售 - 唯品会营销副总裁冯佳路因涉嫌个人经济问题被公安机关调查 公司强调对贪腐行为零容忍且业务运营正常 [1] - 天猫"618"453个品牌成交破亿元 同比增长24% 苹果、美的等13个品牌进入"10亿俱乐部" [2] - 京东"618"整体订单量超22亿单 下单用户数同比翻倍 DAU创历史新高 采销直播成交额同比增285% [3] 物流供应链 - 京东物流在沙特推出自营快递品牌JoyExpress 提供当日达、货到付款等服务 加速中东市场布局 [4] - 菜鸟推出2.18万元平价款快递无人车 优惠价1.68万元 自动驾驶系统未减配 目标降低网点使用成本 [5][6] 生活服务 - 饿了么上线"悦享会员"体系 针对高频用户提供精细化服务 强化用户粘性与差异化竞争力 [7] - 中国连锁Top100企业2024年销售规模2.13万亿元 同比增4.9% 沃尔玛中国以1588亿元销售额居首 鸣鸣很忙新晋前十 [8] 创新创投 - MiniMax发布全球首个混合架构开源模型M1 长文本处理达百万级Token RL成本降至53万美元 同期推出复杂场景视频生成模型Hailuo 02 [9] - AI记忆大模型公司记忆张量获近亿元天使轮融资 由孚腾资本等投资 核心技术聚焦低成本、低幻觉、高泛化 [10] - 月之暗面Kimi首个Agent模型Kimi-Researcher启动灰度测试 计划逐步开源预训练及强化学习模型 [11]
六大AI模型出战高考作文,人工智能ETF(159819)、科创人工智能ETF(588730)助力布局AI全产业链
每日经济新闻· 2025-06-09 11:20
市场表现 - 中证人工智能主题指数上涨0.3%,上证科创板人工智能指数上涨0.2% [1] - 人工智能ETF(159819)最新规模超160亿元,居同类产品第一 [1] AI技术进展 - 六大AI大语言模型(DeepSeek、百度文心一言、阿里通义千问、字节跳动豆包、月之暗面Kimi、GPT4o)在高考作文测试中评分均不低于50分(满分60分),展现语言理解与创作实力 [1] 行业观点 - 科技板块自底部抬升,整体仍处于高性价比区间,海外不确定性降温带动科技板块大涨,对A股科技成长板块形成映射 [1] - 建议以AI产业链为抓手,关注上游算力自主可控与中下游应用创新 [1] 产品信息 - 人工智能ETF(159819)、科创人工智能ETF(588730)覆盖AI全产业链,为投资者提供布局工具 [1] - 上证科创板人工智能指数覆盖30只科创板人工智能龙头股,聚焦算力和应用环节,电子和计算机行业占比超85% [4]
九大AI模型再答高考作文:座次剧烈变动
第一财经· 2025-06-07 23:24
AI模型高考作文表现 - 2025年九大AI模型高考作文测评显示,谷歌Gemini和DeepSeek以61.5分并列第一,元宝(61分)、通义千问(59.75分)、Kimi(59.5分)紧随其后,豆包(59分)、文心一言(58.5分)表现中等,智谱清言(50.75分)和ChatGPT(50.5分)垫底 [3][4][20][28][36][46][62][70][80][92][94] - 新晋模型Gemini和DeepSeek首次参评即登顶,去年前三名通义千问、元宝、豆包排名下滑至第三、第四和第六位 [3][4] - 测评采用上海卷思辨性作文题目,AI在逻辑明确的任务中表现更优;全国一卷诗歌类题目则普遍审题不清 [6][7] AI作文能力进步与局限 - 教师评价AI作文语言规范、材料丰富、逻辑性强,审题准确且结构程式化,但缺乏个性化思考和情感共鸣 [97][98][99] - 相比2024年,AI在情感表达和思想深度上有进步,但仍存在案例堆砌、逻辑错误和"论文味过重"问题 [1][2][99] - 高分作文如Gemini和DeepSeek的共性:论点鲜明、论据充实(引用爱因斯坦相对论、马尔克斯《百年孤独》等),结构完整且扣题紧密 [20][28] 头部模型厂商格局变化 - 测评覆盖国内外头部厂商,包括谷歌、DeepSeek、腾讯(元宝)、阿里(通义千问)、字节(豆包)、百度(文心一言)、月之暗面(Kimi)、智谱和OpenAI(ChatGPT) [5] - 谷歌Gemini和DeepSeek凭借技术迭代迅速崛起,成为新头部;国内厂商中腾讯元宝稳定性较强,阿里通义千问和字节豆包排名波动较大 [3][4][36][46] - 智谱清言和ChatGPT因内容生硬、分析浅显垫底,反映部分厂商在语言理解和逻辑构建上的技术短板 [92][94][96] 作文内容与评分细节 - 高分作文典型结构:Gemini采用"点题-关系阐述-正反论证-结论"框架,DeepSeek通过历史典故(孔子、钱锺书)强化思辨 [20][24][28] - 评分差异体现教师偏好:元宝获左建国最高分(63分)但文旭仅给52分,通义千问获文旭和许珊68分高分但左建国仅评51分 [36][46] - AI仍存在事实错误(如将黄庭坚诗句误标为苏轼),显示幻觉问题未完全解决 [47]
“有提升”,高考阅卷名师再评AI高考作文:九大模型座次剧烈变动
第一财经· 2025-06-07 22:00
AI模型高考作文表现 - 2024年九大AI模型参与上海高考思辨类作文测评,新增谷歌Gemini和DeepSeek两大头部模型,与去年通义千问、元宝、豆包等形成新竞争格局[2] - Gemini与DeepSeek以61.5平均分并列第一,元宝61分第三,通义千问59.75分第四,豆包降至第六名59分,ChatGPT和智谱清言分别以50.5分和50.75分包尾[3][4][20][42][52] - 头部模型优势体现在:审题准确度、逻辑严密性、材料丰富度,Gemini作文获65分最高单评,引用爱因斯坦相对论等案例论证多元传播路径[12][13] AI写作能力进化与局限 - 教师评价显示AI较去年进步明显:情感表达更自然,思想深度提升,但仍缺乏个性化思考与生命温度,难以产出满分作文[1][4][53] - 技术短板集中体现在:案例堆砌(如智谱清言)、论文腔调(ChatGPT)、结构模板化(Kimi),且存在引用错误等"幻觉"问题[21][42][52] - 任务适应性差异显著:思辨类明确题目(上海卷)平均分超60,而开放式诗歌命题(全国一卷)表现混乱[5][53] 行业竞争格局变化 - 国际厂商突破本土壁垒:谷歌Gemini首战登顶,与国产元宝、通义千问形成三强格局,OpenAI的ChatGPT表现垫底[2][3][52] - 新锐厂商快速崛起:DeepSeek空降榜首,月之暗面Kimi以59.5分超过百度文心一言(58.5分),显示技术迭代加速[13][32][36] - 测评标准影响排名:同一模型(如豆包)分差达13分(56-69),反映评价体系主观性对结果的影响[20][29]
加码多模态能力,夸克发布全新“AI相机”
观察者网· 2025-04-28 17:29
夸克AI相机功能升级 - 公司发布全新AI相机功能"拍照问夸克",基于视觉理解与推理模型创新下一代搜索体验[1] - 功能覆盖旅游(行程制定、景点识别)、文物识别(中外语音讲解)、跨国翻译(菜单翻译)、图像处理(杂物消除、表情调整)及社交文案生成[3] - 生活场景支持故障诊断(电器蓝屏拍照解决方案)、物品购买指导(灯泡/螺丝型号识别)[5] - 健康管理功能包括体检报告解读、用药禁忌查询及定制化食谱生成(如尿酸偏高食谱)[7] - 工作学习场景支持合同补全、图表计算、代码注释复现等[10] 多模态AI行业动态 - 行业竞争聚焦多模态能力,OpenAI推出视频生成工具Sora,谷歌发布跨模态模型Gemini[13] - 国内企业快速跟进:腾讯混元大模型新增视频生成,月之暗面发布Kimi1.5支持跨模态推理,字节豆包1.5实现视觉推理[13] - 公司通过"AI超级框"迭代拓展多模态应用场景,3月发布后持续升级用户体验[12] 技术实现与定位 - 产品定位为阿里巴巴AI旗舰应用,目标打造生活/工作/学习的超级入口[1] - 核心技术依托视觉理解与思考推理模型,实现物理世界问题的交互解答[1] - 交互方式创新体现在拍照即搜索的跨场景应用(旅游/健康/工作等)[3][5][7][10]