百度文心一言

搜索文档
大模型高考成绩单出炉,讯飞星火语数外实力位居第一梯队
和讯网· 2025-06-09 17:05
国产大模型高考表现 - DeepSeek R1以143分成为国产大模型数学科目状元,讯飞星火X1以141分紧随其后,两者在函数题、数列证明等高难度题型中均展现完整解题链[9] - 数学实测显示DeepSeek R1在128K上下文优势明显,复杂题目分步推导无遗漏,但存在OCR识别短板需人工转写题目[10] - 不同评测机构结果存在差异:IT之家测试中DeepSeek数学143分第一,而自媒体"数字生命卡兹克"评测中其得分64.3分低于讯飞星火X1和豆包1.5[9][11][12] 语文作文能力对比 - 讯飞星火X1作文《以歌为刃破长夜且将热血铸山河》获52/54高分,专家评价其结构如交响乐章,选材如历史长卷,构建从个体觉醒到文明永续的逻辑链[2] - DeepSeek《悲歌当泣》采用六段式结构层层递进探讨艺术作用,获52.5分但被指敦煌案例"缺乏现代表达"[4][6] - 文心一言因过度抒情跌至47分垫底,豆包1244字超长作文因"沉默与发声辩证不足"扣分[6] 英语作文跨文化表达 - 讯飞星火X1英语作文以19.5平均分夺冠,其"全球气候行动网络"提案内容完整且句式多样,展现对国际议题精准理解[13][14] - DeepSeek R1英语作文结构严谨逻辑流畅但UN initiatives翻译不够具体,ChatGPT o3因口语化表达和腾讯混元T1因非正式语体得分较低[16] 技术路线与行业格局 - 全国产算力下70B量级的讯飞星火凭借算法优化与教育领域深耕,超越更大参数规模对手[1] - 深度推理大模型执行"解析题干-提炼论点-匹配论据"流程,可成为学生写作思考链条,启发突破套路化表达[18] - 国产大模型推理能力实现质的飞跃,讯飞星火等多家模型高考数学成绩突破130分[18]
六大AI模型出战高考作文,人工智能ETF(159819)、科创人工智能ETF(588730)助力布局AI全产业链
每日经济新闻· 2025-06-09 11:20
科创人工智能ETF 跟踪上证科创板人工智能指数 截至9:36,中证人工智能主题指数上涨0.3%,上证科创板人工智能指数上涨0.2%。 2025年高考进行时,DeepSeek、百度文心一言、阿里通义千问、字节跳动豆包、月之暗面Kimi、GPT4o这六个AI大语言模型充当"考生",试写全国一卷 高考作文题。在有关人士的评分下,六大AI的评分均不低于50分(满分60分),展现了大模型在语言理解与创作上的强劲实力。 中信证券表示,近期科技板块的位置已自底部抬升,整体仍处于高性价比区间,海外不确定性仍在降温,风险偏好修复带动海外市场尤其是科技板块大 涨并重回年内高位,也将对A股科技成长板块形成映射。可以以AI产业链为抓手,关注上游算力自主可控与中下游应用创新。 人工智能ETF(159819)、科创人工智能ETF(588730)均覆盖AI全产业链,为投资者布局产业发展机遇提供了便捷工具,其中人工智能ETF (159819)最新规模超160亿元,居同类产品第一。 (责任编辑:张晓波 ) 【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示 ...
九大AI模型再答高考作文:座次剧烈变动
第一财经· 2025-06-07 23:24
作者 | 第一财经 刘晓洁、郑栩彤 一年一度高考来临,考生之后,按惯例是各家AI的答题时间。这一年AI模型圈加速迭代进化,让AI写作文,水平会有提高吗?让名师来打分,各大模型的成绩排名有多大变化? "相较去年,AI进步很快,不再机械单一,变得有思想了。"在看完几家模型的作文后,四川南充市嘉陵一中语文教师李东林对第一财经表示。 2024年,第一财经写了一期九大模型"决战"高考,当时李东林老师在看完AI作文后,认为它们"缺一点情感和灵气",到今年,他觉得AI已经补上了这方面,但仍达不到细腻。 "人写作,可以刻意抒情和感性,即使是思辨类题目,也需要去契合某些人的感受。"李东林认为,这是AI仍然缺少的部分。 湖南省中学语文特级教师左建国有同样的看法,他觉得Al作文整体有提升,但提升幅度不大。因为有关时代、社会与生活方面的新素材并不多,明显储存不够,尤其是在抒发个人情感方面, 仍然是短板,缺少生命的温度。 左建国老师曾担任高考作文阅卷组的副组长,在高考阅卷方面有十几年的经验。"Al作文已经把考场作文变成一种可计算的拼图,形式上固然能逼近完美,但个性化的思考,以及拨动人心的 语言,几乎没有看到,这是AI与真人思维的真正差 ...
“有提升”,高考阅卷名师再评AI高考作文:九大模型座次剧烈变动
第一财经· 2025-06-07 22:00
"相较去年,AI进步很快,不再机械单一,变得有思想了。"在看完几家模型的作文后,四川南充市嘉陵一中语文教师李东林表示。 一年一度高考来临,考生之后,按惯例是各家AI的答题时间。这一年AI模型圈加速迭代进化,让AI写作文,水平会有提高吗?让名师来打分,各大模型的 成绩排名有多大变化? "相较去年,AI进步很快,不再机械单一,变得有思想了。"在看完几家模型的作文后,四川南充市嘉陵一中语文教师李东林对第一财经表示。 2024年,第一财经写了一期九大模型"决战"高考,当时李东林老师在看完AI作文后,认为它们"缺一点情感和灵气",到今年,他觉得AI已经补上了这方面, 但仍达不到细腻。 "人写作,可以刻意抒情和感性,即使是思辨类题目,也需要去契合某些人的感受。"李东林认为,这是AI仍然缺少的部分。 湖南省中学语文特级教师左建国有同样的看法,他觉得Al作文整体有提升,但提升幅度不大。因为有关时代、社会与生活方面的新素材并不多,明显储存不 够,尤其是在抒发个人情感方面,仍然是短板,缺少生命的温度。 左建国老师曾担任高考作文阅卷组的副组长,在高考阅卷方面有十几年的经验。"Al作文已经把考场作文变成一种可计算的拼图,形式上固然能 ...
六大AI同写高考作文 文学评论家周泽雄毒舌点评
经济观察报· 2025-06-07 20:55
国产AI写作能力测评 核心观点 - 高考作文模拟考展示2025年国产AI写作力横截面 通过六款主流中文生成AI同题竞技 检验其在语言表达 立意深度与思维灵活度的综合表现 [1][3] - AI写作呈现"复调式写作"特征 擅长历史与现实 文化与个人等意象并置 但在思想穿透力与论证逻辑上存在提升空间 [25] 参测企业及产品 - 腾讯元宝 百度文心一言 字节跳动豆包 讯飞星火 夸克 DeepSeek六款产品参与测试 采用统一提示词与匿名互评机制 [2][4] 写作表现分析 腾讯元宝 - 生成《在苦难中歌唱的民族脊梁》 获56.8分排名第二 被评"宏大叙事与文采典范" [8][23] - 文学评论家指出其存在知识点堆砌 观点推进不足问题 但三星堆 敦煌等素材运用展现历史深度 [8][9] DeepSeek - 产出《在无声处发声》获50.7分 聚焦"表达之困"主题 被肯定"逻辑清晰"但本土案例不足 [10][11][23] - 互评环节展现独特评价能力 为每篇作文提供锐评如"主题聚焦 逻辑清晰" [23] 百度文心一言 - 作品《以歌为刃 以血为墨》获54.8分 创新性结合焦裕禄等当代素材 但存在古典与现代案例适配问题 [13][14][23] 字节跳动豆包 - 以《灵魂的交响》获57分夺冠 被赞"思想与艺术性巅峰之作" 互评环节获5个最高分 [19][23] - 语言表现力突出 如"把对世道的悲叹都咽进了沸腾的水汽里"等文学化表达 [19][20] 讯飞星火与夸克 - 讯飞星火《破茧之声》因材料关联弱排名第五 夸克作品被评"中规中矩 深度待提升" [21][22][23] - 夸克存在虚构论据问题 如"敦煌飞天飘带指向长安"等诗化表述影响论证严谨性 [17] 行业技术特征 - 当前AI写作优势集中在语体模仿 语义构建及典故化用 平均字数超800字要求 [24] - 共性短板体现在思辨性任务处理 如主线提炼 立场表达等 需向"更有用 有力"方向进化 [25]
六大AI同写高考作文 文学评论家周泽雄毒舌点评
经济观察网· 2025-06-07 19:42
阅读下面的材料,根据要求写作。(60分) 6月7日,高考作文题目出炉。经济观察报特别策划"高考作文模拟考",邀请了在中文生成领域表现突出的六款国产AI参与,它们分别是腾讯元宝、 Deepseek、百度文心一言、夸克、字节跳动豆包、讯飞星火(排名不分先后)。 作文被视为语言表达、立意深度与思维灵活度的集中检验。这场模拟考不仅是一场趣味化测试,更是一幅2025年国产AI写作力的横截面画像。 【测试规则与方法】为确保公平公正,所有AI使用完全相同的提示词(Prompt),作文长度、写作要求等也完全一致,输出结果全凭实力。 【评价方式】三位评论人:文学评论家周泽雄;广东省写作学会副会长、广东外语外贸大学创意写作中心执行主任朱志刚;重庆市南开两江中学一级教师李 春梅;以及6款AI匿名互评,形成多维度的横向测评矩阵,满分60分,评价标准见全文最后。 【2025年全国一卷作文题目】: 他想要给孩子们唱上一段,可是心里直翻腾,开不了口。——老舍《鼓书艺人》(见全国一卷阅读II) 假如我是一只鸟,我也应该用嘶哑的喉咙歌唱——艾青《我爱这土地》 我要以带血的手和你们一一拥抱,因为一个民族已经起来——穆旦《赞美》 【以上材料引发了 ...
评论丨AI智能体如何重构搜索战场
21世纪经济报道· 2025-05-23 01:41
在此情况下,搜索行业竞争正从"流量争夺"转向"心智占领"。传统搜索引擎的护城河建立在海量网页索 引与精准关键词匹配之上,而AI Agent的介入彻底打破了这一规则。谷歌推出的"AI模式"通过"查询扇 出"(query fan-out)技术将用户问题分解为子任务,调用多模态工具实现深度信息整合,其运行逻辑已与 Perplexity、ChatGPT等新兴AI搜索工具趋同。这种转变使得行业竞争焦点从链接排序算法转向智能体的 周城雄(中国科学院科技战略咨询研究院研究员) 近日在谷歌2025年开发者大会上,AI智能体成为绝对主角。从Alpha Evolve这一能自我进化的数学难题 克星,到Project Astra这个可主动调用工具的多模态智能助手,谷歌正通过AI智能体重新定义搜索的边 界。搜索引擎的AI化革命,本质是互联网从"人适应机器"到"机器适应人"的范式转换。在这场变革中, 传统巨头与新晋玩家站在同一起跑线上:谷歌的生态整合、OpenAI的技术激进、垂类应用的场景深 耕,共同绘制着行业新版图。当搜索不再只是"找答案"而是"解决问题",这个万亿级市场正孕育着比移 动互联网时代更剧烈的格局变化。 传统搜索市场长期由 ...
2025年迈向智能驱动新纪元,大语言模型赋能金融保险行业的应用纵览与趋势展望报告-众安信科
搜狐财经· 2025-05-01 06:57
大模型技术发展与行业机遇 - 全球大模型技术发展多元化,垂类大模型通过定制化训练提供精准行业解决方案,中国在算力自主化、数据优化等方面取得进展[1][24] - 新技术降低大模型训练、运维和推理成本,推动金融行业流程重构,企业需平衡购置、推理和运维成本[1][29] - 国产大模型如DeepSeek和通义千问在成本控制与推理性能上突破,实现数据安全合规、低成本高性能和中文语义优化[1][26][27] - DeepSeek通过混合专家技术将6710亿参数活跃计算量压缩至37亿,训练成本仅为同规模模型的6%[26] - 通义千问融合预训练与垂直领域优化能力,在对话交互、代码生成等场景形成专项突破[27] - 腾讯混元T1模型解码速度提升2倍,在中英文推理基准中领先[28] 大模型赋能保险全链 - 保险机构加速接入大模型,应用聚焦内部提效,覆盖业务全链条及中后台管理环节[1][16] - 初期优先选择容错成本低的场景如智能客服、智能质检、营销助手等,建立调试与反馈机制[6][7] - 大模型推动行业由结构化数据向多源动态信息系统演进,提升风险识别广度与响应及时性[8] - 金融机构经营理念重塑,呈现金融服务精准化跃迁和跨行业生态化协同两大趋势[9] - 银行利用实时企业数据优化信贷评估,保险与医疗平台合作开发预防型保险产品[9] 合作范式演变 - 数据要素价值凸显,金融保险行业通过横向、垂直和政企协同构建高质量数据集[1][19] - 政企协同推动数据要素流通,垂直整合构建企业级智能协同底座,横向协同拓展跨场景联动[19][42] - 多模态大模型为金融保险带来智能化转型机遇,填补非结构化信息处理能力空白[62] - 多模态模型应用于智能客服、理赔审核、欺诈识别等场景,提升审核准确率与风控能力[62] - 通义干问通过双核架构实现全模态实时交互,视觉推理模块采用链式思维增强方法[53] 技术演进与成本优化 - 垂类大模型通过行业特定数据集训练,减少计算成本并提供精准解决方案[33][40] - GPT-4级别模型单周期训练成本近5000万美元,垂类模型更经济高效[33] - 国产模型生态呈现功能分化趋势,语言生成模型与推理模型分别专注语义理解和逻辑决策[48] - 轻量化技术如蒸馏模型降低终端部署成本,Qwen-32B等模型实现对OpenAI-o1-mini的局部超越[49] - 模型部署从"可用"向"可适配"迈进,聚焦跨架构柔性部署机制构建[31]