文心4.5

搜索文档
DeepSeek给王一博道歉被当真,年度AI幻觉/马斯克Grok 4跑分曝光/华为盘古团队回应模型争议|Hunt Good周报
搜狐财经· 2025-07-06 11:35
Grok-4模型性能曝光 - Grok-4在HLE评估中基础得分35%,开启推理功能后提升至45%,显著领先OpenAI o3和Google Gemini系列[1] - 在GPQA测试中得分达87%-88%,代码能力评测SWE Bench得分72%-75%[2] - 新版本支持多模态输入、130k token上下文、结构化输出、数学推理和函数调用等功能[3] - Grok 4 Code将深度集成在Cursor编辑器,具备智能补全、调试和执行功能[3] 华为盘古模型开源争议 - 华为开源盘古7B稠密模型及72B混合专家模型,被质疑与阿里云通义千问Qwen-2.5 14B高度相似[4] - 华为声明盘古Pro MoE模型基于昇腾硬件平台独立开发,采用创新MoGE架构解决分布式训练负载均衡难题[5] - 承认部分基础组件代码参考业界开源实践,但严格遵循开源许可证要求[5] Cluely公司ARR快速增长 - AI面试辅助工具Cluely企业版推出后ARR一周内翻番至700万美元[7] - 产品实时分析用户在线对话生成隐蔽提示,应用于销售、客服和远程教学等场景[7] - 面临免费开源竞品Glass的挑战,增长持续性存疑[9] 特斯拉Optimus项目调整 - 暂停人形机器人零部件采购进行设计调整,预计耗时2个月[10] - 硬件存在关节电机过热、灵巧手负载低等问题,软件计划增加合成数据训练[12] - 原计划年产5000台目标恐难达成,目前仅完成约1000台[13] 百度搜索重大升级 - 搜索框升级为"智能框",支持超1000字文本输入和多模态交互[16] - 集成文心大模型和视频生成技术,可快速生成电影级短视频[17] AI基础设施投资热潮 - Amazon新建1200英亩数据中心与Anthropic合作,目标训练全球最大AI系统[21] - Oracle通过去中心化策略建立高效AI云基础设施[21] - 行业预计新建数据中心总投资超3200亿美元,年耗电量相当于百万家庭需求[23] Meta成立超级智能实验室 - 整合FAIR、大语言模型开发和AI产品团队,由Scale AI前CEO Alexandr Wang领导[24] - 吸引多位来自OpenAI、DeepMind和Anthropic的核心人才加入[26] - 计划未来几年投入数千亿美元发展AI基础设施和模型研发[26] 开源模型进展 - 百度文心4.5系列开源10款模型,包含47B和3B MoE模型及0.3B稠密模型[30] - 苹果开源DiffuCoder-7B-cpGRPO代码生成模型,EvalPlus基准性能提升4.4%[36] - B站开源AniSora V3动画视频生成模型,支持多种风格一键生成[34]
氪星晚报|德迈仕:尚未直接与小米汽车合作;国脉科技发布居家养老场景AI智能体;腾讯云与微盟启动“私域安全护航计划”
36氪· 2025-06-30 19:26
大公司动态 - 上海机场加强充电宝安检 不合规充电宝禁止携带 合规充电宝可暂存7天 [1] - 日产汽车要求供应商延迟付款 目标两年削减5000亿日元成本 全球裁员15%并关闭7家工厂 [1] - 德迈仕澄清未直接与小米汽车合作 但其生产的3款汽车零部件最终用于小米汽车 [1] 数字营销与品牌合作 - 鲸鸿动能亮相意大利零售峰会 展示中国高端市场精准营销策略 获欧洲奢侈品牌青睐 [2] - 胖东来申请"自由爱"酒类商标 与酒鬼酒推出联名产品 商标覆盖酒类/办公用品等类别 [5] 基建与新能源 - 中航沈飞新区建设项目年底产线贯通 2025年交付办公大楼 新旧厂区运营无缝衔接 [3] - 中国铁建在长沙成立新能源开发公司 注册资本500万元 业务覆盖太阳能/风力发电及储能 [9] 科技与产品创新 - 腾讯云与微盟启动"私域安全护航计划" 联合资源为私域运营/全渠道融合提供支持 [4] - 国脉科技发布3款居家养老AI智能体 采用自研轻量级协议 实现智能体间直接对话 [6][7] - 海光DCU深度合作文心4.5系列模型 支撑预训练模型FLOPs利用率达47% [10] - 大疆发布旗舰运载无人机DJI FlyCart 100 支持多场景应用及第三方负载适配 [11] - 袋鼠出海科技推出景区联名卡解决方案 覆盖95%消费场景 未来拟用区块链降低30%跨境支付成本 [12] 投融资与财务 - 新世界发展签订882亿港元再融资协议 覆盖现有境外无抵押债务 [8] 政策与市场观点 - 财政部推出税收优惠 境外投资者2025-2028年利润再投资可抵免10%税额 [14] - 欧洲央行副行长称欧元区市场估值过高 但整体保持乐观 [13] - 郭明錤预测苹果2027年推多款Vision系列及智能眼镜产品 目前7个项目在研 [14] 气候与环境 - 北半球多国遭遇极端高温 专家警告全球变暖将加剧极端天气频率 [15]
成本仅千元,数字人直播GMV超越真人主播,百度优选上演“真假”罗永浩!
搜狐财经· 2025-06-27 16:36
核心观点 - AI数字人直播技术取得突破性进展,罗永浩数字人直播表现超越真人,GMV达5500万元,观看人次1300万,订单量较真人直播增长150%,人均观播时长增长30% [1][6][11] - 百度文心4.5Turbo技术实现数字人1:1复刻"罗氏幽默",调用知识库1.3万次,生成9.7万字内容,完成8300个动作,40%动作由AI生成 [2][3][4] - 数字人直播进入3.0高说服力阶段,具备智能脚本创作、多智能体调度能力,成本较真人降低80%,制作成本降至千元级别 [16][20][23] 技术突破 - 双数字人搭档实现自然互动,支持双音轨、多模态响应,动作与文本高度统一,能应对突发互动需求 [7][9] - 通过流式生成设计实现环境感知,智能体可自主决策互动时机,如发福袋、回复弹幕等 [9] - 采用真人高克隆技术,分浅层幽默(语言风格)和深层幽默(社会热点)进行特化训练 [8][9] 行业应用 - 百度优选平台已服务超10万商家,每天600万用户在数字人直播间购物,618期间商家GMV同比增长最高达375% [18] - 数字人在保健品、教育等品类优势显著,可解决名师无法高频开播等问题 [20] - 行业数据显示92%消费者接触过电商AI应用,商家端AI工具使用率超60% [13] 商业布局 - 推出"梦蝶计划"和"繁星计划",追加10万个数字人资源,投入1亿元补贴扶持中小商家 [25] - 数字人业务已贡献几十亿收入,未来目标是通过技术降本实现AI普惠 [26][27] - 技术具备泛化能力,可将超头主播经验迁移至普通主播,加速规模化应用 [24]
闪电快讯|官宣罗永浩为首席体验官,百度电商官宣两大计划培育数字主播生态
新浪财经· 2025-06-17 17:46
数字人直播技术应用 - 罗永浩启用数字人直播并与数字人朱萧木共同讲解商品 首场直播GMV突破5000万 [1] - 数字人罗永浩由百度电商慧播星团队打造 采用多模协同数字人技术 为业界首个双数字人互动直播间 [1] - 直播总时长7小时 其中真人直播2小时 数字人直播5小时 吸引超130万人次观看 [1] - 技术基于文心4.5T实现剧本生成与多模协同 数字人"神、形、音、容、话"高度统一 [1] - 百度称其为业内首个多模态高度融合数字人 带货效果媲美真人 支持24小时不间断直播 [1] 战略合作与人事任命 - 罗永浩担任百度慧播星首席体验官 入驻百度优选平台 将进行"真人+数字人"不定期直播 [2] - 百度优选与"交个朋友"达成战略合作 [2] 未来发展规划 - 百度电商推出梦蝶计划 通过超头主播数字人打造与流量扶持实现超头主播数量倍增 [4] - 繁星计划将追加10万个慧播星免费数字人 投入1亿元消费补贴与千万级运营扶持 [4]
罗永浩用 AI 带货发财了,一晚狂卖5500万,行业大为震惊
36氪· 2025-06-16 20:51
罗永浩数字人直播表现 - 罗永浩数字人在百度电商首播吸引超1300万人次观看,GMV突破5500万元[2] - 数字人直播26分钟GMV超过罗永浩真人1小时带货金额,部分3C、食品品类单量超真人首秀数据[5] - 数字人表现逼真自然,能机智回应网友提问如"Labubu能用吗"等互动问题[7] - 罗永浩本人评价数字人效果"把自己都吓了一跳"[5] 百度AI技术支撑 - 百度电商"慧播星"平台依托文心4.5大模型打造"高说服力数字人"[10] - 采用脚本智能创作、多模态融合、自主决策思考等技术实现超拟真表达[10] - 突破传统数字人套路化表情和互动局限,实现"能思考、会协同"的操作能力[9][10] 行业合作背景 - 罗永浩是首位采用数字人直播的头部主播,与百度优选达成战略合作[23][25] - 合作基于双方对AI技术驱动电商变革的共识,百度借此布局智能电商[25][26] - 百度电商聚焦AI领域,通过差异化竞争弥补真人直播领域劣势[24][25] 数字人直播行业现状 - 京东去年618期间数字人在5000+品牌直播间开播,累计时长超40万小时[17] - 快手、腾讯等平台曾对AI生成内容限制流量扶持,强调内容真实性[13][17] - 消费者购买决策仍以产品质量(34.69%)和优惠力度(32.8%)为主导因素[19][20] 技术挑战与局限 - 市场上数字人技术水平参差不齐,存在被封禁、互动僵硬等问题[19] - 部分数字人需预设关键词应答,难以处理突发问题[19] - 仅20%消费者认为虚拟数字人会影响购买意愿[19][20]
「火山」烧向百度云
36氪· 2025-06-12 11:03
火山引擎增长战略 - 公司2025年营收目标超过250亿元,较2024年120亿元增长100%以上,增速远超行业平均水平[1] - 2025年营收规模将接近百度智能云(预测280亿元),形成直接竞争关系[1] - 公司总裁谭待表示将采取"激进"策略实现目标,强调聚焦基本功和创新[1][7] 价格战策略 - 豆包1.6模型定价为输入0.8元/百万tokens、输出8元/百万tokens,综合成本仅为竞品1/3[4][11] - 2024年豆包初始定价比行业均价低99.3%,0.8厘可处理1500+汉字[9] - 低价策略使客户日均tokens使用量增长20-30倍,2024年市场份额达46.4%[3][9] - 采用统一定价和按上下文长度分区定价的创新模式[11] 技术能力提升 - 豆包1.6-thinking在推理和指令执行能力超越DeepSeek-R1-0528[19] - Seedance 1.0 pro视频生成模型测评超越快手可灵2.0,ELO评分达1299[20][22] - 成立研究型组织"Seed Edge",确立"探索智能上限"目标[19] 市场竞争格局 - 百度智能云2025Q1中标数和金额居行业第一,2025年预测增速30%[1][17] - 阿里云营收规模比火山高一个数量级,百度智能云营收为火山近2倍[12] - 竞品文心4.5 Turbo输入0.8元/百万tokens、输出3.2元/百万tokens,价格已低于豆包1.6[18] 战略转型 - 从"低价叙事"转向技术和服务能力建设[18][19] - 重点转向相同价格下提升模型能力,拓展更多行业应用场景[19] - 需要实现从调用量到实际营收的转化,缩小与头部云厂商差距[12][16]
百度发布金融行业大模型,沈抖:产业从提示词优化走向智能体构建
钛媒体APP· 2025-06-08 19:23
央企合作与行业智能体 - 65%央企已与百度智能云开展深度合作 [2] - 发布千帆慧金金融大模型及覆盖能源、交通、汽车、医疗等领域的行业场景智能体家族 [2] - 联合国家电网打造"营销供电方案智能体",实现需求自动识别、任务拆解及方案生成 [8] - 公路应急指挥智能体在河北京雄高速落地,突发事件预警准确率提升至95%以上 [8] 行业大模型战略 - 行业大模型需融入行业特定数据与知识,提升专业领域准确性与实用性 [3] - 金融行业试点面临数据安全、行业知识及算力成本三大挑战 [4] - 千帆慧金金融大模型基于数百亿tokens高质量金融语料训练,提供8B(小参数)和70B(大参数)双版本,支持32K上下文输入 [6] - 百亿参数规模金融模型效果超越千亿参数通用模型 [6] 智能体技术演进 - 2025年被视为智能体应用元年,企业投入重心转向智能体构建 [7] - 智能体通过自主决策、持续交互及工具调用解决复杂任务,替代传统提示词优化 [7] - 百度智能体内置行业知识、标准流程及工具链,支持轻量定制快速嵌入业务系统 [8] 模型与算力基础设施 - 文心4.5 Turbo多模态理解效果提升30%,性能对标GPT 4.1但价格仅其6% [9] - 昆仑芯P800万卡集群实现全国产化方案,单卡吞吐性能较主流芯片高90% [10] - 百舸平台适配多款芯片,与长安汽车共建智算中心综合资源利用率提升50% [10]
牵手65%央企,深入千行百业
搜狐财经· 2025-06-06 23:41
央企合作与产业落地 - 百度智能云已与65%的央企达成深度合作,共同推进大模型产业落地 [1][3] - 合作聚焦AI技术在实体产业中的前沿实践,打造可推广、可复制的标杆案例 [1] - 合作覆盖能源、交通、医疗、汽车、环境等多个领域 [4] 行业场景智能体 - 百度智能云推出"行业场景智能体家族",覆盖电力、交通、医疗等高价值场景 [5] - 智能体通过轻量定制快速接入企业业务系统,显著加快AI落地速度 [7] - 在智能出行领域推出"座舱大模型智能体",已应用于深蓝汽车"深蓝精灵"产品 [7] 金融大模型发布 - 推出千帆慧金金融大模型,基于海量金融语料深度训练 [8] - 提供8B和70B两个版本,支持最长32K上下文输入 [8] - 在金融Benchmark评测中综合表现领先,百亿参数模型得分超过千亿通用模型 [8] 旗舰模型升级 - 发布文心4.5 Turbo和X1 Turbo两款旗舰模型 [9] - 文心4.5 Turbo多模态理解能力提升超30% [9] - X1 Turbo在企业预算管控场景展现强大数据分析与决策支持能力 [9] 算力基础设施 - 成功点亮自研万卡及三万卡集群,百舸GPU算力平台提供保障 [10] - 3万卡集群有效训练时长占比超95%,算力成本压缩至市场价一半 [10] - 与长安汽车共建智算中心,总算力规模超1000PFLOPs [10]
百度AI战略提速首季赚77亿 千辆萝卜快跑奔向全球15城
长江商报· 2025-05-23 07:40
财务表现 - 2025年一季度营业收入325亿元同比增长3% 归母净利润77亿元同比增长42% [2] - 核心业务收入254.63亿元同比增长7% 归母净利润76.33亿元同比增长48% [4] - 在线营销收入160亿元同比下降6% 非在线营销收入94亿元同比增长40% 爱奇艺收入72亿元同比下降9% [5] 智能云业务 - 智能云收入同比增长42% 云业务经营利润率超10% AI相关收入实现三位数增长 [6] - 中标国内大模型项目19个金额4.5亿元 在通用大模型厂商中中标数量和金额均列第一 [7] - 升级MaaS平台千帆 扩充多模态与推理模型工具链 文心4.5 Turbo和X1 Turbo提升性能并降价 [6] 自动驾驶进展 - 萝卜快跑覆盖全球15座城市 部署超1000辆无人车 一季度订单量140万单同比增长75% [9][11] - 进入迪拜/阿布扎比市场 开展公开道路测试 计划部署超1000台全无人车 [9] - 与神州租车合作推出自动驾驶汽车租赁服务 探索扩展至瑞士/土耳其等地区 [10] 研发投入与资本动向 - 一季度研发投入45.44亿元 2021-2024年研发投入连续四年超200亿元 [11] - 桥水基金持仓从20万股增至210万股 富达投资从33万股增至250万股 [11][12] - ARK创始人六次增持百度 累计持仓翻倍 [12] 行业地位 - 拥有中国最大规模AI专利组合 涵盖基础模型/智能体等领域 [7] - 入选《Fast Company》亚太最具创新力公司第二 因自动驾驶实验规模获认可 [6] - 国内大模型招投标总规模24.67亿元 百度中标金额占比达18.2% [7]
一场对话,我们细扒了下文心大模型背后的技术
量子位· 2025-05-22 20:34
大模型技术发展 - OpenAI CEO指出行业已进入复杂推理模型的新范式阶段[1] - 推理模型成为继基础模型后厂商竞争的新焦点[1] - 中国信通院评估显示文心X1 Turbo在24项能力中16项获满分5分,综合评级达最高"4+"级,为国内唯一通过该测评的大模型[1] 文心大模型技术突破 - 文心4.5 Turbo和X1 Turbo分别聚焦多模态与深度思考两大方向[6] - 多模态混合训练技术实现文本/图像/视频统一建模,训练效率提升2倍,理解能力提高30%[7][8] - 自反馈增强技术框架构建"训练-生成-反馈-增强"闭环,显著降低模型幻觉并提升复杂任务处理能力[10][12][13] - 融合偏好学习的强化学习技术使模型理解/生成/逻辑/记忆能力全面提升[14][16] - X1 Turbo突破线性思维链,构建复合型思维链实现"边思考边行动"等人类式策略,复杂任务效果提升22%[18][19][21][23] 基础设施与性能优化 - 飞桨框架3.0支持使文心4.5 Turbo训练吞吐达前代5.4倍,推理吞吐提升8倍[31][32] - 算力-框架-模型三位一体协同优化路径成效显著[34] - 文心4.5 Turbo在14个数据集平均成绩80分超越GPT-4.5和DeepSeek-V3[35] - X1 Turbo各项数据集表现均优于DeepSeek-R1[37] 实际应用场景 - 教育领域:X1 Turbo可模拟人类思维解析物理题目[42] - 代码场景:AI生成代码占比超40%,累计服务760万开发者[44] - 数字人技术:支持10万主播,直播转化率31%且成本降低80%[47][48] - 行业规模:2029年全球K-12在线教育预计达8991.59亿元,2024年数字人核心市场480.6亿元将带动6402.7亿元关联产业[49] 长期技术战略 - 6年迭代9大版本形成全栈技术能力[52] - 坚持知识增强技术强化事实性/时效性/知识性[56] - 通过智能体技术结合工具使用解决现实复杂问题[56] - 视大模型为新一轮科技革命周期,注重技术长期价值与层层扩散效应[57][58] - 底层飞桨框架到上层应用的完整技术栈构成核心竞争力[61]