大模型

搜索文档
齐鲁文化大模型入选山东省重大科技创新工程
齐鲁晚报网· 2025-07-09 23:39
齐鲁文化大模型项目入选山东省重点研发计划 - 齐鲁文化大模型项目入选2025年山东省重点研发计划(重大科技创新工程) 为全省文化领域唯一入选项目 [1] - 山东省重点研发计划是全省最高层次科研项目之一 聚焦产业重大共性关键技术突破 重大创新产品研发和成果转化示范 [1] - 该项目被写入2025年山东省政府工作报告 并获国家网信办算法备案 是山东唯一文化类大模型 [1] 齐鲁文化大模型的技术架构与功能 - 项目采用"一底、三层、四库"架构 作为全省文化数字化和数据业务化的技术基座 [1] - 集成八大核心功能:文化基因解码 知识问答 历史名人对话 关系图谱编织 AB路径探索 时空地图推演 自然景观复刻 文化产品创作 [1] - 项目一期开发成果显著 已上线公测 将构建N种体验新生态 [1] 山东数字文化集团的战略定位 - 公司是省管国有大型文化企业 由大众报业集团出资设立 肩负实施国家文化数字化战略和山东文化强省战略的职责 [2] - 作为山东文化产业核心运营主体 负责推进文化数字化行动计划 涵盖算力网络 数据贯通 科技研发 应用呈现等领域 [2] - 公司致力于探索文化和科技融合机制 深化文化体制机制改革 引领山东文化"两创"发展 [2] 公司未来发展计划 - 将以入选重大科技创新工程为契机 提升科技创新能力 统筹全省文化资源 [2] - 重点深化大模型在文化领域的应用开发 打造全省文化数字化技术底座 [2] - 全面参与数字文化基础设施工程建设 通过数字化 网络化 智能化手段提升文化资源利用效率 [2]
“小米系”具身智能大模型创企,完成新一轮亿级融资!
Robot猎场备忘录· 2025-07-09 23:05
融资动态 - 小雨智造完成约亿元A+轮融资,由滴滴领投、北京信产基金追加投资[1] - 公司累计完成4轮融资,包括2023年3月/6月种子轮/天使轮(小米集团、雅瑞资本等参与)、2024年11月A轮(北京国管和科大讯飞联合投资)[1] - 最新融资前股权结构显示北京国管为第一大外部股东持股9.8684%,小米集团持股0.7849%[1] - 滴滴成为2025年继华为、腾讯、京东后第四家投资具身智能领域的科技大厂[2] 行业趋势 - 2025年科技大厂加速布局具身智能:美团5-7月领投自变量机器人数亿元A轮、星海图超1亿美元融资;蚂蚁集团2-5月领投星海图和星尘智能;华为4月通过哈勃投资千寻智能[3] - 腾讯/京东3-5月领投智元机器人B轮,字节跳动4-5月投资星尘智能和乐享智能,比亚迪6月重投帕西尼感知持股12%[3] - 全球具身智能公司超200家,分三类:专注大模型(如穹彻智能)、人形机器人本体、两者兼顾(如千寻智能、银河通用)[10] - 国外专注机器人大模型企业更受资本青睐,如Physical Intelligence、Skild AI、Genesis AI等[10] 公司概况 - 小雨智造成立于2023年1月,专注工业领域大模型机器人技术,开发"一脑多形"的通用机器人大脑[4] - 创始团队核心成员来自小米、华为、微软、字节跳动,拥有自动驾驶、操作系统、智能硬件研发背景[7] - 创始人乔忠良为小米初创成员、原MIUI研发负责人,联创王文林为原小米软件系统平台部总经理[11] 技术产品 - 研发"Xiaoyu Brain"通用机器人大脑,具备自学习、自优化能力,可提升工业场景任务执行效率[8] - 解决方案涵盖智能感知决策引擎、高精度运控技术、动态实时闭环控制系统等模块,具有高鲁棒性和泛化性[8] - 滴滴加入将强化大模型训练能力,通过深度学习提升平台智能化水平[8] 商业化进展 - 2024年7月与唐山松下合作开发智能焊接机器人,已获某龙头重工企业100台战略订单[9] - 与重型机械、建筑结构领域龙头达成合作,覆盖航空航天、船舶制造场景,锁定10家"灯塔客户"[9] - 某国家级车企集团即将展开深度合作[9] 行业洞察 - 软件算法是推动人形机器人功能提升的关键,大模型的通识理解和多级推理能力构成具身智能核心[11] - 资本从投资人形机器人本体转向具身智能大模型,因其应用不限于人形机器人(如自动驾驶车辆、机械臂)[11] - 软硬件一体全栈路线受推崇,智元机器人首席科学家认为单纯做大脑难以长期存活[11] - 人形机器人企业需自研大模型构建技术闭环,才能在竞争中掌握主动权[12]
腾讯研究院AI速递 20250710
腾讯研究院· 2025-07-09 22:49
一、AI视频生成技术升级 - 谷歌Veo 3升级支持仅用一张图片生成音频和视频,角色在多镜头下保持高度一致性[1] - 新功能通过Flow平台的"Frames to Video"选项实现,加入丰富运镜功能[1] - 用户实测显示人物表情自然、表演到位,适用于广告、动画等多领域[1] - Vidu Q1多参考生视频功能可上传最多7张参考图像,实现角色一致性强、多元素同框和零分镜视频生成[4] - 清晰度升级至1080P,支持主体库存储角色素材,单条视频成本不到9毛钱[5] 二、开源大模型进展 - Hugging Face开源3B参数模型SmolLM3,性能超越Llama-3.2-3B和Qwen2.5-3B,支持128K上下文窗口及6种语言[2] - 模型采用双模式系统,用户可在深度思考和非思考模式间灵活切换[2] - 昆仑万维开源Skywork-R1V 3.0多模态模型,高考数学得142分,MMMU评测达76分,超越部分闭源模型[3] - 模型通过强化学习策略GRPO和关键熵驱动机制,仅用1.2万条监督样本和1.3万条强化学习样本实现高性能[3] 三、端侧与多模态模型 - vivo发布端侧多模态模型BlueLM-2.5-3B,支持GUI界面理解,在20余项评测中表现优异[6] - 模型支持长短思考模式自由切换,引入思考预算控制机制[6] - 采用精巧结构(ViT+Adapter+LLM)和四阶段预训练策略,缓解多模态模型文本能力遗忘问题[6] 四、AI系统突破 - X-Masters系统在"人类最后的考试"(HLE)上首次突破30分,达到32.1分,超越OpenAI和谷歌[7] - 系统基于DeepSeek-R1模型构建了工具增强推理智能体X-Master,能在内部推理和外部工具使用间流畅切换[7] - 采用分散-堆叠式多智能体工作流,通过求解器、批评者、重写器和选择器多角色协作[7] 五、行业并购与市场格局 - 智元机器人以21亿元收购科创板上市公司上纬新材控制权,预计收购63.62%-66.99%股份[8] - 2025年上半年Gemini系列模型占据大模型API市场近一半份额,谷歌以43.1%位居第一[9] - DeepSeek V3自发布以来用户留存率极高,位列使用量前五[9] - 细分领域呈现差异化竞争格局:Claude-Sonnet-4在编程领域领先(44.5%),GPT-4o在营销领域领先(32.5%)[9] 六、AI应用趋势 - 全球已有18亿AI用户,但付费率仅3%,学生使用率高达85%,家长群体成为AI重度用户[10] - AI主要应用于邮件撰写(19%)、研究兴趣主题(18%)和管理待办事项(18%)等日常场景[10] - 未来18-24个月AI将迎来六大趋势:垂直领域工具崛起、完整流程自动化、语音AI爆发等[10]
未来50年最具突破潜力的方向是什么?这些科学家共话科学发展趋势
证券时报· 2025-07-09 21:24
前沿科技发展趋势 - 美国2022年12月5日实现净能量增益的惯性约束核聚变反应,标志着人类首次掌握可控核聚变能技术,预计20年内聚变能将普及并带来巨大变革[1] - 未来20年最具颠覆性的科技是通用量子计算机,未来50年需聚焦AI for Science方向[1] - 人工智能与量子计算的融合将成为未来20年重塑人类文明的关键方向,超导量子计算目前占优但未来可能与光结合[1] 能源与材料突破 - 受控核聚变有望在未来20年实现,将永久解决人类能源问题并为工业革命提供支撑[2] - 室温超导若在未来50年实现,将带来科技重大变革,突破医疗磁共振和量子计算冷却等成本瓶颈[2] - 未来20年核心关键材料可能成为引发人类变革的重要力量[2] 人工智能发展 - AI技术如AlphaFold已颠覆传统生物学研究模式,可从三维结构倒推生物学功能[2] - 大模型将赋能千行百业,多模态是其发展的重要里程碑,需解决模型理解和推理能力等关键技术难点[3] - 对齐技术目前基于强化学习较脆弱,未来可借助计算机和密码学方法增强AI安全性[3] 科研方法论 - 科研工作者需拥抱AI并打好基础,培养批判性思维和跨学科合作能力[2] - 发展以人为本的机器智能,实现人机有效协作是重要课题[3]
智谱获10亿战略投资 商业化之路仍待开启
中国经营报· 2025-07-09 21:23
战略投资与融资 - 浦东创投集团和张江集团宣布对智谱进行总额10亿元的战略投资,并完成首笔交割 [1] - 智谱在上市辅导前夕密集收获多地国资战略投资,包括杭州城投产业基金及上城资本的10亿元融资、珠海华发集团的5亿元投资、成都高新区的3亿元投资 [2] 技术发布与突破 - 开源发布新一代通用视觉语言模型GLM-4.1V-Thinking,以推理能力为核心突破点,刷新10B级别多模态模型性能上限 [1] - GLM-4.1V-Thinking支持图像、视频、文档等多模态输入,引入"思维链推理机制"和"课程采样强化学习策略",提升跨模态因果推理能力与稳定性 [2][3] - 轻量版GLM-4.1V-9B-Thinking在28项权威评测中23项达成10B级模型最佳成绩,18项持平或超越72B参数的Qwen-2.5-VL [3] 商业化与经营策略 - 公司经营策略从"卖模型"转向"卖服务",2025年新签订项目大部分为模型应用开发类,交付压力较大 [4] - 商业化挑战包括算力资源利用率低、模型能力不及DeepSeek V3、多模态模型应用场景有限 [4] - 政府背书和融资能力是公司优势,但商业化能力不足可能影响长期竞争力 [9] 技术优势与特色 - GLM模型在中文理解与生成能力上表现突出,适合教育、政务、文化等领域 [5][6] - 支持128K上下文长文本处理,适合合同、论文等长文档分析 [7] - 开源生态活跃,ChatGLM-6B/12B在GitHub累计超3万星,适配消费级显卡 [7] - API价格低于国际主流模型,GLM-4输入价格仅为GPT-4-Turbo的1/5 [7] 技术劣势与不足 - 多模态能力起步较晚,弱于GPT-4V、Gemini 1.5 Pro等成熟多模态模型 [7] - 英文能力相对弱,在复杂英文逻辑推理、学术写作等场景表现落后于Claude 3/GPT-4 [7] - 工具生态成熟度不足,插件市场和开发者工具丰富度不及OpenAI [8] - 长上下文实际性能波动,超长文本中精准定位关键信息的能力弱于Claude 3 [9]
人工智能与大模型专题:央国企科技创新系列报告之四
招商证券· 2025-07-09 21:00
人工智能与大语言模型发展 - 中国人工智能行业遵循“技术 - 硬件 - 终端 - 应用”范式,大语言模型及 Agents 技术是行业爆发点[5][6] - 全球大模型技术进入深度竞争阶段,中美发展路径差异化,中国企业注重实际场景导向[16] - 海外 AI 企业如 OpenAI、Anthropic、谷歌、Meta 等在模型研发上有新进展[21][25][28][31] AI 大模型硬件投资 - 国产 AI 算力芯片在制程、工艺等方面进步,增长空间大,可关注算力、制程、研发强的 GPU 厂商[43][51][52] - ASIC 适合固定运算场景,性价比高,国内市场份额有望扩大;FPGA 灵活性强,但国产替代有难点[55][57] 大模型产业链投资 - 光模块及光器件需求高增,2024 年 400G 以上高速光模块全球出货量近 2000 万只,2025 年预计增至 3700 万只[61] - 供配电技术、液冷散热、高速互联与存储、软件生态等领域有投资机遇[60] 央国企相关产业布局 - 上游布局半导体设计、制造和封测关键工艺节点,如华大九天、华润微等[78][79] - 中游构建算力基建全产业链,提供云服务;下游三大运营商开发通用大模型,多家央企开发行业模型[82][91]
以五维安全体系构筑基石,中汽中心、清华、华为联合发布智驾技术白皮书
财联社· 2025-07-09 20:48
智能驾驶技术发展现状 - 智能驾驶技术已进入商业化落地期,行业需以客观公正视角理性看待发展[1] - 智能驾驶经过百年发展,通过硬件、软件、网络、数据融合改变出行体验[2] - 一季度新能源车险签单保费314亿元同比增44%,报案数增速36.3%低于保费增幅,反映技术带来的风险改善[2] - 65%以上用户使用高阶智驾频次超2次/周,智能驾驶成为购车重要因素[2] - 智能驾驶板块近一年涨幅超60%,成为资本市场最热门领域之一[3] 行业标准与概念定义 - 中国首个自动驾驶国标GB/T 40429-2021将驾驶自动化分为L0-L5六级[6] - 辅助驾驶指L0-L2功能总称,自动驾驶指L3及以上功能,无人驾驶特指无驾驶员参与的L4/L5功能[7] - 智能驾驶是行业通俗叫法,覆盖L1-L5全级别,既非单纯辅助驾驶也非自动驾驶[8] 技术安全与创新 - 多传感器融合方案实现"边刹边让"优于"单一刹停",华为eAES升级为"刹车+换道避让"模式[9] - 华为ADS系统累计行驶35.41亿公里,泊车辅助使用2.3亿次,避免潜在碰撞超200万次[11] - 行业存在VLA大模型滥用现象,纯视觉方案难以满足需求,多传感器融合才是解决之道[14] - 华为多传感器方案可应对强光、暗光、雨天、雾天及低附着路面等极端场景[14] 商业化与产业生态 - 智能驾驶生态链涵盖技术研发、硬件制造、软件算法、整车集成等协同网络[12] - 多数车企"全栈自研"实为第三方代工,华为选择完全自研路线构建成本优势[12][13] - 鸿蒙智行进入规模效应期,带来更快迭代、更低成本和更优体验[13] 未来发展趋势 - 政策端需完善法规体系并规范市场宣传,产业端要构建协同创新生态与核心技术攻关[15] - 消费端需提升认知教育并加强权益保护,整车智能正向"智能体"终极形态演变[15]
金融大模型迈向价值创造,智能体如何突破“最后一公里”
第一财经· 2025-07-09 20:41
大模型金融应用现状与未来方向 - 论坛聚焦AI技术从降本增效迈向价值创造 并探讨数据安全与算法可靠性等关键挑战 [1] - 与会专家一致认为AI Agent将成为推动金融智能化升级的核心力量 [1] - 2024年52%金融机构已试点AI/AGI应用 预计年内普及率将超90% [7] 金融机构应用实践 - 工商银行通过大模型构建智能体生态 实现客户经理全流程智能化 显著提升服务效率 [2] - 恒丰银行搭建智能体平台与知识库 降低AI应用门槛 推动业务与科技平权协作 [2] - 中金公司利用大模型开发智能投研/投顾系统 文档审核效率提升且风险降低 [3] - 东亚银行结合全球方案与本地创新 在跨境审单等场景实现智能化突破 [3] 技术挑战与风险 - 大模型存在安全能力不足 推理能力与数理计算不匹配 幻觉现象等问题 [4] - 新攻击面包括提示词注入 越狱攻击等 可能导致错误输出或数据泄露 [4] - 训练数据含未过滤敏感信息 私域经验共享障碍制约技术落地 [4][6] 解决方案与基础设施 - 蚂蚁数科通过垂类大模型+知识工程体系 提升金融场景准确性与稳定性 [6] - 华为昇腾AI战略提供全栈算力解决方案 支撑大模型高效运行 [6] - 阿里云提出AI原生五大工程体系 涵盖应用/模型/知识/算力/安全维度 [6] 未来发展趋势 - 1-3年内AI将优化客服/风控流程 3-5年部分替代人工决策 5-10年催生算法银行新业态 [7] - 金融业大模型下半场以智能体为抓手 结合先验知识+环境交互拓展应用上限 [8] - 智能体开发需聚焦场景选择 平衡模型稳定性与成本 如数字核保员等应用 [9] 智能体关键作用 - 解决"最后一公里"问题 提升未被科技覆盖的细分工作效率 [8] - 需加强AI工具测评环节 提高落地效率并降低开发成本 [8] - MCP开发模式可促进智能涌现 但需同步保障数据安全与伦理合规 [9]
赛意信息全球研发中心奠基:汇聚全球英才 助力中国工业软件走向世界
广州日报· 2025-07-09 19:43
公司战略布局 - 赛意信息举办全球研发中心奠基仪式,标志着公司在深化产品研发、强化自主创新能力、布局全球化战略方面迈出坚实一步 [2] - 全球研发中心承载"业务布局全球、产品服务全球、汇聚全球英才"的战略雄心,建成后将统筹全球业务、加速产品迭代、吸引国际顶尖人才 [2] - 公司计划用5年时间引进超过1000位研发人员,提升工业软件水平,致力于研发属于中国的、能走向世界的软件 [3] 研发中心规划 - 全球研发中心占地11.72亩,规划总建筑面积达3.69万平方米,总投资超3亿元 [4] - 设计理念植入开普勒曲线概念,打造象征无限链接与科技未来的"赛意未来PARK" [4] - 中心将聚焦工业AI与前沿技术底座、工业互联网平台研发、核心工业软件产品研发等方向,计划组建博士后基地及工作站 [4] 工业软件发展 - 中国制造业品类齐全为工业软件发展提供丰富实践土壤,持续打磨可不断提升水平 [3] - 预计未来三到五年中国工业软件有望逐步形成一定实力,甚至达到或超过国外水平 [3] AI技术应用 - 赛意深耕23个不同行业,积累大量行业经验,深谙新一代信息技术及AI技术发展前沿 [5] - 公司在PCB电子、家电等行业已开展AI智能体试点和共创,部分智能体投入应用并取得领先成绩 [5] - 未来将持续深化"算力+模型+AI工具链+制造AI积木应用"全栈自主体系,提供全业务链智能化升级解决方案 [5]
智谱GLM-4.1V-Thinking登顶HuggingFace Trending全球第一:同尺寸效果最好
IPO早知道· 2025-07-09 18:01
模型性能与突破 - GLM-4.1V-9B-Thinking凭借9B模型尺寸登顶HuggingFace Trending第一 [2] - 该模型在28项权威评测中23项达成10B级模型最佳成绩,其中18项持平或超越72B的Qwen-2.5-VL [4] - 采用"思维链推理机制"和"课程采样强化学习策略",系统性提升跨模态因果推理能力与稳定性 [3] 多模态能力 - 支持视频理解,可解析最长两小时内容并分析时间、人物、事件和逻辑关系 [4] - 具备图像问答能力,能深入分析图像内容并解答,逻辑能力和世界知识较强 [4] - 支持学科解题,包括数学、物理、生物、化学等学科的看图解题并给出详细思考过程 [4] 应用场景 - 文字识别:准确抽取图片和视频中的文字及图表内容并结构化输出 [5] - 文档解读:对金融、政务、教育等领域文档进行原生理解、抽取、提炼和问答 [5] - GUI Agent:识别网页、电脑和手机屏幕的交互界面元素,支持点击、滑动等指令执行 [5] 技术特点 - 轻量版模型参数控制在10B级别,兼顾部署效率与性能突破 [4] - 融合丰富多模态能力,包括代码生成(基于图片文字内容自动编写前端代码) [5] - 支持Grounding功能,识别图片特定区域并抽取坐标位置 [5]