文心大模型4.5系列模型

搜索文档
腾讯,最新发布!
中国基金报· 2025-08-04 19:33
腾讯混元开源模型发布 - 腾讯混元宣布开源四款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,最小仅0.5B [1][2] - 模型亮点在于Agent和长文能力,支持从端侧到云端、从通用到专业的多样化需求,手机也能运行 [1][3] - 消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景 [2] - 支持垂直领域低成本微调,具有较强的开放性,主流推理框架和多种量化格式均能支持 [2][4] 模型技术特点 - 原生长上下文窗口达到256k,可一次性处理相当于40万中文汉字或50万英文单词的超长内容 [4] - 技术上通过数据构建和强化学习奖励信号设计,提升模型在任务规划、工具调用和复杂决策等Agent能力 [3] - 知识密度显著高于同尺寸模型,专业领域接近更大模型效果 [3] - 可以在回答效率与深度间自由切换,256K超长上下文窗口 [3] 模型应用场景 - 已在腾讯会议AI小助手、微信读书AI问书AI助手中应用,实现对完整会议内容、整本书籍的一次性理解和处理 [4] - 适用于实时响应场景,推理性能与准确性双优 [3] - 支持边缘计算到专业微调,抗幻觉能力优 [3] - 手机、PAD都可部署,推理速度飞快 [3] 行业开源趋势 - 开源成为全球大模型领域的重要主题,中国大模型表现尤为亮眼 [1][6] - 腾讯混元大语言模型持续推进开源,已覆盖文本、图像、视频和3D生成等多个模态 [7] - 阿里近期发布三款重磅大模型,分别斩获基础模型、编程模型和推理模型等主流领域全球开源冠军 [7] - 字节跳动开源AI Agent开发平台Coze Studio,降低AI应用开发门槛 [7] - 小米开源声音理解大模型MiDashengLM-7B,刷新多模态大模型最好成绩 [8] - 百度开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家模型等10款模型 [8] 行业影响 - 开源模型将成为推动中国人工智能发展最强劲的引擎 [9] - 中国科技公司选择开源路线,不仅是为了竞争,更是为了加速AI的采用和创新 [9] - 这一趋势将推动中国AI领域的快速发展,甚至可能缩短技术差距 [9]
腾讯,最新发布!
中国基金报· 2025-08-04 19:30
腾讯混元开源模型 - 腾讯混元宣布开源四款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调 [4] - 模型的亮点在于Agent和长文能力,通过数据构建和强化学习奖励信号设计提升任务规划、工具调用和复杂决策等能力,原生长上下文窗口达到256k,可一次性记住并处理相当于40万中文汉字或50万英文单词的超长内容 [6] - 四个模型已在Github和HuggingFace等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台宣布支持部署,只需单卡即可部署,部分PC、手机、平板等设备可直接接入 [6][7] - 腾讯混元大语言模型持续推进开源,已覆盖文本、图像、视频和3D生成等多个模态,未来将推出更多尺寸、更多模态的模型 [9][10] 中国大模型开源趋势 - 全球开源领域异常热闹,中国大模型表现抢眼,开源模型将成为推动中国人工智能发展最强劲的引擎 [8][11] - 阿里近期发布三款重磅大模型,分别斩获基础模型、编程模型和推理模型等主流领域全球开源冠军 [10] - 字节跳动开源AI Agent开发平台Coze Studio,旨在降低AI应用开发门槛 [10] - 小米开源声音理解大模型MiDashengLM-7B,在22个公开评测集上刷新多模态大模型最好成绩 [10] - 百度开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家模型等10款模型 [11] - 昆仑万维开源全新推理大模型Skywork MindLink,能够根据任务难度自适应整合推理和非推理的生成回复 [11] - 智谱AI发布新一代旗舰大模型GLM-4.5,专为智能体应用打造,在复杂推理、代码生成及智能体交互等通用能力上实现融合与技术突破 [11]
马斯克xAI获100亿美元融资引关注,亚马逊/微美全息布局AI大模型应用加速落地
搜狐财经· 2025-07-03 14:18
xAI融资与估值 - 公司完成50亿美元债务融资及50亿美元战略股权融资,合计100亿美元(约合人民币716亿)[1] - 正在谈判200亿美元股权融资,若完成将使估值超过1200亿美元[3] - 融资获得超额认购,参与方包括全球知名债务投资者,资金将用于开发AI解决方案及升级Grok平台[3] xAI技术发展与竞争 - 公司由马斯克于2023年7月创办,核心团队来自OpenAI、谷歌DeepMind等巨头[3] - 正在研发Grok 4人工智能模型,目标与ChatGPT直接竞争[3] 亚马逊AI与机器人进展 - 推出新AI基础大模型Deep Fleet[5] - 部署机器人数量突破100万大关[5] 百度开源大模型动态 - 开源文心大模型4.5系列,涵盖47B、3B MoE模型及0.3B稠密型模型等10款模型[7] - 开源内容包含预训练权重和推理代码,可在飞桨星河社区、HuggingFace等平台下载[7] 苹果AI战略调整 - 考虑放弃自研模型,可能采用Anthropic或OpenAI技术驱动新版Siri[7] - 已与两家公司接触,讨论在苹果云基础设施上部署LLM进行测试[7] 微美全息AI布局 - 通过技术积累形成差异化竞争优势,推动大模型向普惠性基础设施转化[9] - 开源模式推动基座大模型创新,支持多模态数据融合分析,计划推出更高精度推理模型[9] 行业趋势总结 - 全球大模型竞争白热化,国产DeepSeek实现技术突破,推动AI应用落地[10] - AI技术加速渗透千行百业,或将改变行业格局[10]
坚持定位非盈利机构,魔搭社区发起人周靖人:开源开放是创新的核心力量
财经网· 2025-07-02 11:21
魔搭社区定位与发展 - 魔搭社区坚持非盈利机构定位 立足公益性和中立性 保持开源开放 以促进中国开源生态繁荣发展 [1] - 社区发起人周靖人强调AI技术普惠目标 推动技术变革与产业发展 认为当前AI技术仍处于加速发展阶段 [1] - 社区已汇聚全球200余位AI专家及数千开发者 覆盖谷歌 英伟达 阿里巴巴 腾讯等头部企业及中科院等科研机构 [1] 技术布局与里程碑 - 2022年11月前瞻性提出"模型即服务"(MaaS)理念 将AI模型转化为直接可用服务 [2] - 2023年首发文本生成视频开源模型 并吸引百川智能 零一万物等领先模型在社区开源首发 [2] - 2024年推出AIGC专区 提供图片 视频创作及模型训练服务 2025年新增MCP广场 托管数千款服务并开放接口 [2][3] 行业开源趋势 - DeepSeek出圈后 百度开源文心大模型4 5系列(含47B MoE模型) 华为开源盘古70亿参数稠密模型及720亿参数MoE模型 [3] - 国内企业对开源社区理解突飞猛进 过去两年参与公司数量显著增加 [3] - 魔搭社区作为技术桥梁 连接开发者与前沿技术 已支持36个国家1600万开发者 模型总量超7万个 [4] 开发者生态建设 - 推出开发者勋章激励计划 提供免费GPU算力 AIGC训练券等奖励 已支持超1亿次服务调用 [4] - 计划扩展勋章激励至代码贡献 社区布道等活跃行为群体 [5] - MCP广场已发布超4000项服务 支付宝 MiniMax等厂商独家首发新服务 [3][4]
马斯克再提建新党;文心4.5系列模型开源;苹果或放弃自研AI模型
观察者网· 2025-07-01 08:55
马斯克政治言论与摩尔线程IPO - 马斯克批评共和党"大而美"法案将增加债务上限五万亿美元并暗示建立新政党[1] - 摩尔线程科创板IPO获受理拟募资80亿元用于GPU及AI芯片研发项目[1] 大模型开源进展 - 百度开源文心大模型4.5系列包含47B/3B MoE模型等10款模型并开放API服务[2] - 华为开源盘古7B稠密模型和72B MoE模型相关代码已上线昇腾平台[3] 科技巨头AI战略调整 - Meta重组AI团队成立超级智能实验室整合Llama等开源项目[4] - 苹果考虑放弃自研AI模型转而采用Anthropic或OpenAI技术驱动Siri[5] 苹果产品动态 - iPhone17 Pro或调整后盖Logo位置为iPhone11以来最大设计变化[5] - 苹果计划2027年起发布多款头戴设备包括3款Vision系列和4款智能眼镜[6] 行业数据与事件 - 特斯拉欧盟销量连续三月下滑3月注册量锐减36%至18224辆[7] - 猫王音响创始人称遭小米水军攻击并重提十年前与雷军合作被拒旧事[8] - 小米YU7锁单量超预期雷军将于7月2日进行直播答疑[8] - 《哪吒2》总票房达154.45亿元创下113项影史纪录[8]
百度正式开源文心大模型4.5系列模型
第一财经· 2025-06-30 11:12
百度文心大模型4.5系列开源 - 百度于6月30日正式开源文心大模型4.5系列模型 [1] - 开源系列包含10款模型 涵盖47B和3B激活参数的混合专家(MoE)模型以及0.3B参数的稠密型模型 [1] - 开源内容包括预训练权重和推理代码 [1] - 模型可在飞桨星河社区 HuggingFace等平台下载部署 [1] - 开源模型API服务可通过百度智能云千帆大模型平台使用 [1]