印度AI模型Sarvam-M发布与市场反响 - Sarvam AI发布基于Mistral Small构建的240亿参数混合语言模型Sarvam-M,支持10种印度本地语言,但上线两天仅获334次下载,截至发稿累计下载718次[1][3] - 风投人士批评该模型下载量"令人尴尬",对比韩国学生开发的Dia模型获20万次下载,印度政府支持的BharatGen模型Param-1上线后仅12次下载[3][4] - 公司联合创始人强调模型性能超越Llama-4 Scout,与更大规模模型对比表现稳健,但英文知识评估(MMLU)出现1%下降[7] 公司战略与融资背景 - Sarvam AI成立于2023年7月,获4100万美元融资,估值达1.11亿美元,目标是从零构建印度自主AI技术栈[6][11] - 联合创始人Pratyush Kumar提出2040年印度需具备独立训练基础模型能力,认为DeepSeek案例证明无需数十亿美元即可训练强大模型[6] - 公司正开发700亿参数新模型,预估成本4000-5000万美元,此前与Meta合作优化Llama模型但转向自主开发[7] 行业争议与用户反馈 - 反对者指出Google等已提供更便宜且表现更优的多语言模型,质疑4100万美元融资与成果不匹配[11][12] - 支持者列举模型在农业、法律等本土场景的应用潜力,但被反驳印度弱势群体缺乏科技使用基础[12][13] - 开发者社区分歧明显:部分认为模型构建方法论具有参考价值,另一些强调需聚焦数据收集等基础设施重构[13][15] 印度本土AI发展现状 - 印度6亿智能手机用户中大量使用本土语言输入,已有IRCTC等部署本土语言AI客服案例[18] - 行业人士指出本土模型在特定语言场景优于开源权重模型,但需解决算力天花板和应用场景推广问题[18][19] - 谷歌科学家指出印度市场对本土模型存在矛盾期待:既要求自主技术又对实际成果不满[17]
印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!
AI前线·2025-05-26 14:46