Workflow
大模型
icon
搜索文档
B站接入千问3,618期间商单成交效率提升5倍以上
快讯· 2025-06-18 10:09
公司动态 - B站接入阿里大模型通义千问3和VL等模型用于打造数据洞察智能体InsightAgent [1] - 该智能体应用于"花火"和"必达"等商业平台 [1] - 618期间花火平台的商单成交效率提升5倍以上 [1] - 必达平台的数据洞察效率提升3倍以上 [1] 技术应用 - 公司通过接入AI大模型技术显著提升商业平台运营效率 [1] - 通义千问3等模型的应用带来明显的业务提效效果 [1]
2025年AI赋能教育行业发展趋势报告-多鲸
搜狐财经· 2025-06-18 08:55
AI赋能教育行业核心观点 - 2025年AI与教育深度融合推动教育模式根本性变革,重塑教育生态 [1] - 大模型成为核心驱动力,推动AI+教育进入智能时代,降低技术门槛并催生教育垂类大模型 [1] - 教育需求与人才培养体系重构,AI突破地域限制降低成本,促进教育公平与精准化 [1] - 产业格局覆盖校园、教企、用户端,商业模式分层(G端/B端/C端) [1] - 生态融合加强产业链合作,国内市场饱和推动企业出海,呈现"文化+模式+技术"三维输出特征 [2] 技术应用与创新 - 生成式AI在语言理解等方面接近人类基准,优化教学效率与体验 [1] - 开源大模型推动行业进入"全民时代",技术门槛降低 [1] - 大模型技术从工具辅助转向场景重构,实现"一校一模型"(MaaS模式) [31] - 多模态交互、实时语音技术推动AI教学助手从"工具型"走向"伴随式智能" [17][33] - AI与通信技术融合重构教育底层逻辑,实时分析能力结合低延时通信云打破规模化与个性化矛盾 [18] 市场规模与细分领域 - 2025年中国AI+教育市场规模超700亿元,2030年达近三千亿元 [2] - 校内市场规模可观但增长有限,校外市场因智能硬件和内容升级潜力更大 [2] - 细分领域AI渗透率差异明显,智能硬件、自适应学习系统等增长显著 [2][40] - 教育智能硬件日均交互token调用超25亿次,验证终端陪伴价值 [40] 企业案例与商业模式 - 头部企业如好未来、编程猫通过自研大模型或接入开源模型创新智能硬件与课程体系 [2] - 商业模式分层:G端聚焦政府管理,B端服务机构定制,C端提供个性化培训 [1] - 技术、产品、服务、数据四大商业模式并存,一站式解决方案成趋势 [1][19] - 出海模式从资本输出转向AI+教育产品输出,聚焦特定市场 [2] 政策与行业生态 - 国家层面政策频出,如《中小学人工智能通识教育指南》《教育信息化2.0行动计划》等 [73][74] - 地方政策推动一线城市形成创新示范路径,如北京、上海、深圳的学科建设与课程体系 [76] - "政产学研用"协同推进,产业链上下游合作加强 [2][31] - 政策落地效果显著,在人才培养、技术应用、基座构筑等方面取得阶段性成果 [77] 专家观点与未来趋势 - AI实现教育"不可能三角"(高质量、大规模、个性化) [4][68] - 教育从知识传递转向能力培养,强调提问力、元学习力等核心素养 [8][37] - AI时代教师角色转型为学习设计师,人机协同成新常态 [35][60] - 未来3-5年AI+直播或成教育主流,重塑学习方式与生态 [33] - 十大趋势包括政策深化、技术升级、垂直细分、出海拓展等 [72]
红杉中国正式开源AI基准测试xbench评测集
快讯· 2025-06-18 08:37
红杉中国开源AI基准测试工具xbench - 红杉中国于6月18日正式开源其AI基准测试工具xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch [1] - 公司表示未来将基于大模型和AI Agent的发展情况动态更新评测集 [1] - 采用"黑白盒"机制以服务更多大模型和Agent开发者并避免静态评测集的过拟合问题 [1] - 目标是通过动态更新确保xbench工具的长期有效性 [1]
用好大模型赋能数字金融
经济日报· 2025-06-18 06:23
欧阳日辉也表示,推动更多的公共数据向消费金融机构赋能,以公共数据开发利用引领撬动各方数据的 融合应用,有助于消费金融机构构建更精准的用户画像,提升获客和活客能力。 作为消费金融领域头部机构,招联金融参与了行业标准建立,助力AI技术安全、可靠和可持续发展, 并探索人工智能赋能传统产业领域。招联金融日前亮相第八届数字中国建设峰会,现场展示的"招联仲 思智能中医大模型"平台受到参会者关注。 (文章来源:经济日报) 兴业消费金融近年来加快发展人工智能、大数据,从流程、准入、审查到贷后全链条优化升级管理。在 数据采集层面,通过清洁取数、用户自主授权源头数据等方式,提升用户体验,进一步保障数据真实 性。同时,持续深化外部数据引入与应用,依托数字技术,构建自动化、标准化的风险识别、反欺诈和 运营体系。 今年以来,深度求索(DeepSeek)等国产大模型快速发展,给消费金融行业带来巨大机遇。记者采访 了解到,各金融机构正加快深耕普惠金融和数字金融,通过加大研发投入、充实人才队伍,不断提高金 融服务质效,推动人工智能落地更多应用场景,依托数智化技术助力实体经济高质量发展。 大模型应用于精准营销、理财顾问、贷前风控、信用评估等核 ...
吴晓波:你的第一本“大模型”书长什么样?
吴晓波频道· 2025-06-18 01:02
点击图片▲立即试听 " 我们的目光所及,只是不远的前方,但是可以看到,还有许多工作要做。 " —— 艾伦 · 图灵 文 / 吴晓波(微信公众号:吴晓波频道) 1950年,38岁的英国数学家艾伦·图灵发表论文《计算机器与智能》,在开篇,他就提出了一个开天辟地式的问题 : "机器可以思考吗?" 6年后的1956年,10多位数学家聚集美国新罕布什尔州的达特茅斯学院,举办了第一场"人工智能夏季研讨会",很可惜,图灵无法与会,他在1954 年因服用含氰化物的苹果去世。1956年被视为"人工智能元年"。 其后 30年,数学家们在符号主义和联结主义两条路径上分别突进,前者在很长时间里处于主流地位,直到1986年,杰弗里·辛顿等人提出反向传播 算法,推动了神经网络理论的诞生。 几乎与此同时, 1985年,被日本企业打得晕头转向的英特尔放弃存储器业务,转而专攻CPU(中央处理单元),拉开了算力飙升的大幕,摩尔定律 像魔咒一样激发芯片计算能力的指数级提升。1999年,英伟达在纳斯达克上市,黄仁勋在GPU(图形处理单元)战场上掀起了一场规模更大的海 啸。 2006年,杰弗里·辛顿提出深度学习算法,李飞飞发起创建大型图像数据集项目I ...
憋大招,MiniMax发布全球首个混合架构开源模型M1 能后来者居上吗?
每日经济新闻· 2025-06-17 23:01
模型技术突破 - 公司发布全球首个开源大规模混合架构推理模型MiniMax-M1,具备百万Token级长文本处理能力,上下文窗口达100万Token,与谷歌Gemini 2.5 Pro持平,是DeepSeek-R1的8倍 [1][4] - 模型采用独创"Lightning Attention"混合架构,显著优化长文本计算效率,传统Transformer模型计算量随序列长度呈平方级增长的问题得到解决 [6] - 强化训练成本下降一个量级至53万美元,推理效率数倍于竞争对手 [1] 定价策略 - 采用分档定价策略:0-3.2万Token档输入0.8元/百万Token、输出8元/百万Token;3.2万-12.8万Token档输入1.2元/百万Token、输出16元/百万Token;12.8万-100万Token档输入2.4元/百万Token、输出24元/百万Token [4] - 前两档定价低于DeepSeek-R1,第三档为独家覆盖领域,自有平台App和Web端保持不限量免费使用 [4] 算法创新 - 提出CISPO算法(Clipped IS-weight Policy Optimization),通过裁剪重要性采样权重优化强化学习效率和稳定性,替代传统PPO/GRPO裁剪方式 [6] - 该算法未采用调整Token更新方式,而是另辟蹊径提升训练和推理成本效益 [6] 行业竞争格局 - 行业呈现技术快速迭代态势:阿里开源Qwen3参数量仅为DeepSeek-R1的1/3,百度文心大模型4.5 API价格仅为GPT-4.5的1% [7] - 专家认为基础模型仍有较大优化空间,算法突破方向将决定下一代科技巨头归属 [10] 公司战略方向 - 明确"加速技术迭代"为现阶段核心目标,结束半年战略摇摆期,将增长和收入目标置于技术突破之后 [8] - 2023年完成品牌整合(海螺AI更名MiniMax),2024年连续发布文本/视觉/语音多模态模型(01系列/VL-01/Speech-02) [8][9] - 布局AI Agent赛道,认为2025年将是关键发展节点,开源策略旨在促进长上下文研究和应用创新 [9] 商业化布局 - 采取B端+C端双线布局,覆盖国内外市场,在保持技术攻坚的同时推进商业化 [9] - 计划开展"开源周"活动,连续4个工作日发布新技术或产品更新 [10]
xbench评测集正式开源
红杉汇· 2025-06-17 21:27
开源AI基准测试xbench - 红杉中国正式开源xbench的两个评测集xbench-ScienceQA和xbench-DeepSearch,旨在量化AI系统在真实场景的效用价值并采用长青评估机制[1] - xbench-ScienceQA聚焦STEM学科,包含数学、物理、化学等8个主流学科,题目平均正确率仅32%,其中34%题目正确率低于20%[2][5][12] - xbench-DeepSearch专注评估AI Agent的深度搜索能力,要求综合运用规划+搜索+推理+总结的端到端能力,弥补中文语境搜索题库不足的弱点[3] 评测集特点 xbench-ScienceQA - 题目来源:邀请顶级院校博士和行业专家出题,确保来源可靠、多学科、搜索引擎未收录且答案明确[2] - 题型分布:包含77道问答题、14道多选题和9道单选题,降低模型"蒙对"概率[8] - 难度控制:采用LLM难度检验、同行检验等方式,实测不同模型得分差距超30%[2][10] xbench-DeepSearch - 题目设计:要求搜索空间大或推理步骤多,淘汰正确率>80%的题目[13][14] - 主题覆盖:参考OpenAI BrowseComp分类,确保多样性,涵盖历史、科技等方向[15] - 更新机制:每月汇报模型表现,每季度更新评估集,内部维护黑盒版本防止刷榜[3] 例题分析 ScienceQA示例 - 计算机题示例:考察图论单源最短路算法,正确答案为O(m√(log n·log log n)),被测模型平均正确率<5%[21][22] - 化学多选题:涉及物质结构最新研究成果,采用"全对才得分"评分方式,平均正确率<20%[24][26] DeepSearch示例 - 广度搜索题:计算东北三省接壤外国的地市数量,需跨省份数据整合,平均正确率47%[28][29] - 深度推理题:统计尼米兹级航母建造期间总统海军服役年限,侧重分步推理,正确率33%[29][30] 行业影响 - 填补高质量Agent评测集空白,动态更新机制适应AI技术快速迭代[3][31] - 开源模式吸引全球开发者参与,推动AI评估标准进化[1][33]
微医控股与阿里云达成战略合作
快讯· 2025-06-17 20:48
战略合作 - 微医控股与阿里云达成战略合作,将基于通义千问大模型联合打造医疗全场景智能体 [1] - 双方共同构建医疗垂类大模型 [1]
从“六小龙”到“四小强”,零一和百川做错了什么?
36氪· 2025-06-17 20:27
行业洗牌与公司分化 - 2023年被称为"大模型元年",国内"AI六小龙"累计融资超60亿元人民币,占国产大模型早期融资总额一半以上 [2] - 2024年底行业进入"冷静期",六小龙中仅智谱AI和阶跃星辰保持融资活跃,零一万物和百川智能明显掉队 [2][3] - 行业竞争法则从烧钱和技术参数转向商业化落地,幸存者智谱、MiniMax、月之暗面和阶跃星辰选择深耕细分赛道 [3] 零一万物的困境 - 技术参数领先但产品落地滞后,工程化能力不足,ToB业务场景有限,ToC海外项目组在2024年底被裁撤 [4] - 2024年底创始团队人事震荡,核心高管离职,预训练团队被阿里收编,放弃自研大模型底座转向应用层 [5] - 高管离职潮持续至2025年,包括COO张帆、首席战略官张阔等多名核心成员 [6] 百川智能的战略失误 - 一年内经历三次战略转向:从C端超级应用到多模态通用大模型,最终聚焦医疗AI但未达行业标准 [7] - C端产品"百小应"App DAU未突破5000,远落后竞品;医疗领域合作松散,错失先发优势 [7][8] - 2025年初联合创始人陈炜鹏等核心成员离职,团队核心瓦解 [8][10] 幸存者面临的挑战 - MiniMax开源混合注意力推理模型MiniMax-M1,性能比肩DeepSeek-R1,但商业化进度克制 [11][13] - 月之暗面主打产品Kimi用户增长乏力,尝试内容社区但面临冷启动难题,内部治理问题频发 [14][16] - 阶跃星辰转向ToB与终端合作,视频生成负责人段楠离职释放人才红利减退信号 [17][19] - 智谱具备ToB基础但面临算力成本高、定制交付难等挑战,生态依赖头部客户 [20] 行业格局变化 - DeepSeek以GPT-4水准性能及1/10成本改变竞争格局,新晋"基模五强"包括字节、阿里、阶跃星辰、智谱和DeepSeek [11] - 行业从技术赛马转向创业公司战略调整能力考验,长期价值取决于场景聚焦与产品闭环 [21]
马斯克悄悄给新车增加硬件传感器,重新将FSD定义成“自动”
虎嗅· 2025-06-17 16:47
特斯拉自动驾驶技术升级 - 特斯拉新版Model S/X新增车外前视摄像头,硬件配置从8个摄像头升级至9个 [7][9][30] - 官方将FSD功能描述从"自动辅助驾驶"改为"自动驾驶",删除"辅助"二字 [12][13][17] - 采用"切香肠"战术逐步推进自动驾驶概念,区别于国内厂商强调"辅助"的宣传策略 [16][19] 硬件方案迭代 - HW 3.0硬件采用自研芯片,单芯片算力72TOPS,板卡算力144TOPS,配备前向毫米波雷达+环视摄像头+超声波雷达 [24][26] - HW 4.0取消所有毫米波雷达和超声波雷达,纯视觉方案8摄像头,算力700TOPS+,中国市场版本加回毫米波雷达 [27][29] - HW 5.0预计明年推出,算力达数千TOPS,可能成为特斯拉宣称"自动驾驶"的技术基础 [47] 软件与算法体系 - FSD最新版本V13.2.5增强非规范场景理解、降低碰撞风险、提升摄像头清洁效率,覆盖HW3.0和HW4.0所有车型 [34][36] - 采用超大规模基座模型,参数规模远超竞争对手,算力集群约30 EFLPOS [38][39] - 算法架构基于VLA模型,通过认知理解能力处理Corner case,采用预训练+强化学习+模型蒸馏技术 [40][43] Robotaxi与市场策略 - 特斯拉Robotaxi采用Model Y车型,硬件与量产车相同,软件可能搭载FSD V14 [50][51] - 北美政策或允许特斯拉生产不符合现行机动车规定的自动驾驶车型 [53] - 中国区6月起扩大FSD推送范围,可能推出月付订阅模式降低体验门槛 [56][57] 行业技术路线对比 - 国内厂商如小鹏、蔚来、华为采用类似技术路线,但命名为"L3"而非"自动驾驶" [48] - 特斯拉Robotaxi采用大算力+模型驱动,区别于Waymo等传统L4玩家的多传感器冗余方案 [50] - 纯视觉方案与多传感器方案在技术路径上形成明显分野 [27][29]