大语言模型
搜索文档
冯帅章:部分院校的专业设置与实际需求脱节
经济观察报· 2025-10-11 17:15
就业问题尤其是青年人就业值得全社会重视,但没有必要过于 焦虑。今年就业市场整体相对稳定,企业、应届毕业生、学校 都在积极调整心态,以适应新的就业形势。未来,应谨慎对待 高等教育扩招,需更注重质量而非数量。 作者: 田进 封图:图虫创意 近几年,随着应届生毕业规模与新型灵活就业群体规模不断增长,两类群体的就业现状备受关注。 一方面,高校毕业生数量屡创历史新高,2025年预计达1222万人,较去年增加43万;另一方面,据暨南大学经济与社会研究院院长冯帅章的最新测 算,2023年中国平台就业者总规模已达2.47亿人,占当年劳动年龄人口的28.6%,其中不乏一定比例的大学毕业生。 国家统计局数据显示,8月全国城镇16—24岁劳动力(不含在校生)失业率为18.9%,相比7月上升1.1个百分点,为2023年12月按新标准公布该数据以 来的新高。 冯帅章表示,就业问题尤其是青年人就业值得全社会重视,但没有必要过于焦虑。今年就业市场整体相对稳定,企业、应届毕业生、学校都在积极调整 心态,以适应新的就业形势。未来,应谨慎对待高等教育扩招,需更注重质量而非数量。 针对规模仍在持续增长的灵活就业群体,冯帅章表示,新型灵活就业中的" ...
北大 & 作业帮团队提出 Text-to-SQL 新框架 Interactive-T2S,攻克宽表处理与低资源对齐难题
AI前线· 2025-10-11 12:14
论文核心信息 论文标题: Interactive-T2S: Multi-Turn Interactions for Text-to-SQL with Large Language Models 论文链接: https://arxiv.org/abs/2408.11062v1 Text-to-SQL 技术的 核心价值与现实挑战 作者 | 作业帮技术团队 审校 | 蔡芳芳 本论文由北京大学与作业帮教育科技(北京)有限公司联合研发,核心团队长期深耕自然语言处理与 数据库交互领域,聚焦大语言模型(LLMs)在结构化数据查询中的落地痛点,文章已入选国际顶会 CIKM2025(第 34 届信息与知识管理国际会议)。对比传统工作中将大型语言模型(LLM)看作一 个一次性生成完整 SQL 代码的翻译器,本文将其塑造成一个能够与数据库进行多轮、迭代式交互的 智能代理(Agent) 。这个代理通过一系列"思考 - 行动 - 观察"的循环,逐步分解问题、搜集信息、 构建并最终执行 SQL 查询,从而有效解决了现有方法在处理复杂、宽表(列数非常多)数据库时的 低效率和资源限制问题。 作者团队: Guanming Xiong (北京大 ...
中康科技·天宫一号:完成对前沿大语言模型DeepSeek-V3.2-Exp的适配,持续深化开放的健康产业AI应用生态
格隆汇· 2025-10-11 10:03
公司战略与技术架构 - 公司核心战略为技术自主与生态开放并重 [1] - 公司技术体系基石为自主研发的“卓睦鸟”医疗大模型与“天宫一号”决策大模型构成的双核心驱动架构 [1] - 该双核心架构深度融合医学专业性与商业决策广域性,旨在确保在复杂多变的健康产业应用场景中的领先地位与专业壁垒 [1] 平台生态与模型适配 - 平台智能体生态采用“超市”与“工厂”相结合的模式 [2] - “超市”模式提供覆盖“医、药、患、管”全场景的标准化智能体产品,支持用户开箱即用以快速解决常见问题 [2] - “工厂”模式提供强大的智能体创作工具,支持客户根据自身独特业务流程自主编排,沉淀企业专属智能体资产,实现核心能力的长期锁定与持续进化 [2] - 完成对前沿大语言模型DeepSeek-V3.2-Exp的适配工作,此举极大地丰富了“工厂”模式下的“原材料”库 [1][2] - 企业构建专属智能体时,可根据具体任务的性能、成本和效率要求,自由组合调用“卓睦鸟”医疗大模型、“天宫一号”决策大模型以及DeepSeek等多种模型,以实现协同效应 [2]
开发智能康养机器人,「如身机器人」完成千万级天使++轮融资 | 早起看早期
36氪· 2025-10-11 07:57
打造通用型养老服务机器人 的窗口期已经到来。 文 | 海若镜 来源| 36氪(ID:wow36氪) 封面来源 | 企业官网 36氪获悉,康养具身智能公司"如身机器人"(RobotGym)近日获千万元级人民币天使++轮融资,由力合金融独家投资,资金主 要用于核心技术的持续迭代、产品工程化落地推进、养老场景规模化试点及市场前期布局。 当前,如身机器人已启动Pre-A轮融 资。 齐家Q1养老机器人 在养老院等机构,如身机器人团队发现,"能出门遛弯"是很多老人直接而强烈的需求之一,但因为护工配比不足,很多老人无法 自由外出。因此,具备自动导航、智能避障能力的移动辅助机器人,有望解放老人双腿,拓展其日常安全行动的半径。 同时,基于团队开发的多模态大模型,齐家养老机器人能与用户自然对话,为老人提供情感陪伴和生活助手,如提醒日常用药、 安排行程等。师云雷表示,作为一个新家庭终端,养老照护机器人可以成为一个平台,集成多种软件服务,比如帮助老人书写回 忆录;生成老人生活日报并发送给子女等家庭社交、健康管理功能。 如身机器人团队具备深厚的机器人研发与产业化背景,创始人及CEO师云雷师从德国国家工程院院士张建伟,核心团队成员来自 ...
传统的感知被嫌弃,VLA逐渐成为新秀...
自动驾驶之心· 2025-10-11 07:32
自动驾驶VLA行业趋势 - 端到端技术之后,视觉语言动作模型成为学术界和工业界聚焦的核心方向,其提供类人思考能力并通过思维链形式展现车辆决策过程,以实现更可靠安全的自动驾驶能力[1] - 自动驾驶VLA目前可分为模块化VLA、一体化VLA和推理增强VLA三个子领域[1] - 传统BEV感知、车道线、Occupancy等方向相对成熟,行业关注度逐渐下降,自动驾驶VLA成为各家企业急需攻克的方案,主流自动驾驶企业及智驾方案供应商均在发力自研[4] 自动驾驶VLA技术核心 - 技术涉及视觉感知、大语言模型、Action建模、大模型部署及数据集制作等核心内容[6] - 最前沿算法包括思维链、混合专家模型、检索增强生成及强化学习等[6] - 模块化VLA强调多阶段流程,语言模型从被动场景描述演变为主动规划组件[16] - 一体化VLA直接连接动作解码器,实现感知到控制的端到端映射,通过单次前向传播将传感器输入映射为控制动作[16] - 推理增强VLA趋势由解释转向长思维链推理、记忆和交互,新增推理模块并同步输出控制信号和自然语言解释[17] 行业应用与课程设计 - 课程由清华大学教研团队联合开展,包含自动驾驶VLA三个子领域前沿算法细致讲解及两个实战加一个课程大作业[6] - 课程大纲涵盖VLA算法介绍、算法基础、VLM作为解释器、模块化与一体化VLA、推理增强VLA及大作业共六章[12][13][14][15][16][17][20] - 课程选取华科与小米提出的ReCogDrive及清华AIR与博世提出的Impromptu VLA等主流算法进行实战代码学习[16][19] - 课程进度安排自10月20日开始,预计两个半月结课,采用离线视频教学配合VIP群答疑及三次线上答疑模式[23]
用4.39亿方块在《我的世界》手搓一款ChatGPT?玩家又一次“整活”,还把游戏玩出了新高度!
猿大侠· 2025-10-10 12:11
整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 在《我的世界》里搭建一个虚拟的"世界",然后待在里面玩 GPT,这可行吗? 别眨眼,总之已经有人真的这么干了,而且构建起来的排面还颇为惊人! 最近,一位网友在社交媒体 X 上分享了自己的震惊感受:"这对我来说简直震撼到不行。有人居然在 Minecraft 里建了一个 500 万参数的语言模型 , 还训练好了,让它具备基本的对话能力。说实话,这是我这个月看到的 最牛的东西 了。" 虚拟"世界"长这样,左下角显示的 CraftGPT 就是这名牛人创造的 GPT 项目,另外他还搭配了虚拟键盘,方便与这个 GPT 进行对话: 那么,在方块世界里运行 AI 模型 ,他究竟是怎么做到的?我们不妨一起看看! 4.39 亿个方块,在《我的世界》里造了一款 GPT 这名开发者名为 Sammyuri,他花了数月的时间,经过大量的规划和投入,才完成了在 《Minecraft》中运行的小型语言模型 CraftGPT 以及支撑它的 世界。 据 Sammyuri 介绍,起初他只是在 ChatGPT 提了一个问题:"能在 《Minecraft》中构建一个你吗? " 然后就有了后 ...
Nature子刊:山东大学张磊/赵国平团队开发AI大模型,用于发现抗菌肽,对抗多重耐药菌
生物世界· 2025-10-10 12:05
撰文丨王聪 编辑丨王多鱼 排版丨水成文 世界卫生组织 (WHO) 曾发一份多重耐药菌名单,统称为 ESKAPE , 代表了六种最棘手、最常见的多重耐药细菌, 名单之首是 耐碳青霉烯类鲍曼不动杆菌 (CRAB) 。碳青霉烯类抗生素是所有其他治疗手段都失败时的"最后一道防线",但其极易受到抗生素耐药性的出现和传播的影响。鉴于这一紧迫问题,人们越 来越关注 抗菌肽 (AMP) 作为传统抗生素的有前景替代品。 与传统抗生素相比, 抗菌肽 (AMP) 因其广谱活性、快速杀菌机制以及诱导耐药性的可能性较小,成为很有前景的抗生素替代品。发现针对临床多重耐药菌的 新型抗菌肽,对于应对持续的抗生素耐药危机至关重要。 2025 年 10 月 3 日,山东大学齐鲁医学院 张磊 教授、 赵国平 教授团队在 Nature 子刊 Nature Microbiology 上发表了 题为: A generative artificial intelligence approach for the discovery of antimicrobial peptides against multidrug-resistant bacteria ...
用4.39亿方块在《我的世界》手搓一款ChatGPT?玩家又一次“整活”,还把游戏玩出了新高度
36氪· 2025-10-09 19:44
在《我的世界》里搭建一个虚拟的"世界",然后待在里面玩 GPT,这可行吗? 别眨眼,总之已经有人真的这么干了,而且构建起来的排面还颇为惊人! 最近,一位网友在社交媒体 X 上分享了自己的震惊感受:"这对我来说简直震撼到不行。有人居然在 Minecraft 里建了一个 500 万参数的语言模型,还训 练好了,让它具备基本的对话能力。说实话,这是我这个月看到的最牛的东西了。" 虚拟"世界"长这样,左下角显示的 CraftGPT 就是这名牛人创造的 GPT 项目,另外他还搭配了虚拟键盘,方便与这个 GPT 进行对话: 那么,在方块世界里运行 AI 模型,他究竟是怎么做到的?我们不妨一起看看! 4.39 亿个方块,在《我的世界》里造了一款 GPT 这名开发者名为 Sammyuri,他花了数月的时间,经过大量的规划和投入,才完成了在《Minecraft》中运行的小型语言模型 CraftGPT 以及支撑它的世界。 据 Sammyuri 介绍,起初他只是在 ChatGPT 提了一个问题:"能在《Minecraft》中构建一个你吗?" 然后就有了后续的 CraftGPT。 他在发布的视频中表示:"从技术上讲,它算是一个'小型 ...
开发智能康养机器人,「如身机器人」完成千万级天使++轮融资 | 36氪首发
36氪· 2025-10-09 15:50
36氪获悉,康养具身智能公司「如身机器人」(RobotGym)近日获千万元级人民币天使++轮融资,由力合金融独家投资,资金主要用于核心技术的持续迭 代、产品工程化落地推进、养老场景规模化试点及市场前期布局。当前,如身机器人已启动Pre-A轮融资。 格物系列,主要面向居家康复场景,覆盖手部、上肢与下肢等全身康复训练;能够支持个性化康复训练计划,实时调节训练参数,查看训练报告等。该系列 产品相对轻量,已实现千台量产并出口至北美、欧洲、东南亚等市场。除了为公司带来持续现金流外,格物系列产品也是如身机器人深入康复场景、积累真 实世界数据和用户的触角。 数据积累,于具身智能的价值毋庸置疑。在师云雷看来,数据价值高度依赖于AI模型的架构,未来能够满足高级照护需求的AI模型,必然需要更多模态的 数据,比如触觉、力觉等现在尚未大规模采集的数据。因此如身机器人选择商业化先行,尽可能多地卖出产品,建立起能够快速、大规模采集多模态数据的 硬件网络,为未来技术迭代积累先机。 齐家系列,则直接切入当下养老刚需,尝试让智能机器人进入独居、半失能及失能老人的日常照护场景。基于深入调研,齐家Q1系列养老机器人的核心功 能被规划为三个层级模块 ...
更大,还能更快,更准!蚂蚁开源万亿参数语言模型Ling-1T,刷新多项SOTA
机器之心· 2025-10-09 10:24
文章核心观点 - Ling-1T作为一款万亿参数的开源大模型,通过高效的MoE架构实现了规模、速度与推理精度的兼顾,标志着大模型竞争正转向效率范式 [2][5][53] - 该模型在多项基准测试中表现亮眼,尤其在编程、数学推理等高推理密度任务上稳居第一梯队,同时实现了“万亿级储备,百亿级开销”的产业级落地 [3][8][53] - 蚂蚁集团通过开源Ling-1T及其底层技术,旨在降低AI应用门槛,推动技术普惠,特别是在金融、医疗等高合规要求的行业场景中 [71][72][74] 模型性能表现 - 在编程能力上,LiveCodeBench得分61.68,CodeForces-rating达1901,显著高于DeepSeek等对比模型 [7][8] - 在数学推理方面,Omni-Math与UGMathBench得分均突破74分,FinanceReasoning达到87.45,展现出强大的逻辑一致性 [7][8] - 知识理解维度表现出色,C-Eval得分92.19,MMLU-Redux得分92.25,OlympiadBench得分91.3,多项指标领先竞争对手1-3个百分点 [7][9][10] - 在AIME-25推理测试中准确率达70.42%,与Gemini-2.5-Pro精度相当,但消耗的token更少,实现了更高的思考效率 [14][15] 技术架构与效率创新 - 模型采用高效MoE架构,总参数规模达1T,但每次推理仅激活约500亿参数,通过“按需思考”机制实现低成本、高效率 [5][55][56] - 支持128K上下文长度,结合分组查询注意力技术,使长文档理解与敏捷响应兼得,推理速度不受长上下文拖累 [62][63] - 训练数据超过20T+ token的高质量、高推理浓度语料,为模型提供了更强的逻辑密度与思维深度 [55][66] - 采用三阶段精英教育训练路径,并自研WSM调度器和LPO优化方法,使模型在综合能力上普遍跑赢旧策略 [67][69][70] 实际应用与场景体验 - 在代码生成任务中能精准理解抽象视觉要求,完成度高,并展现出一定的审美能力 [19][21] - 具备强大的逻辑推理与科普能力,能用通俗比喻解释复杂概念如量子隧穿效应,有效降低理解门槛 [28][34] - 创意写作能力出色,能为播客节目撰写富有张力的开场白和可直接发布的小红书文案 [37][43] - 拥有工具调用能力,能执行复杂任务如推荐真实存在的小众徒步路线,并给出自洽的理由判断 [46][48] 行业影响与开源战略 - 2025年9月全球开源大模型数量较8月翻倍不止,中国力量表现亮眼,蚂蚁集团以“开源风暴”密集上线7款新品 [3] - 开源路线能降低技术迭代成本,加快版本演进,并通过社区的“质量与安全红队”效应降低边际改进成本 [72] - 开源透明性有助于金融、医疗等高合规行业审计决策路径,植入自有知识,在可控的安全边界内释放智能价值 [72] - 蚂蚁集团开源了从模型到训练框架的整套底层能力,旨在让AI能力像电力与支付一样无感却无处不在 [74]