讯飞星火
搜索文档
AI聊天记录分享即变公开网页,实测8款大模型小心隐私泄露
南方都市报· 2025-12-16 16:23
"帮我拟一份个人求职简历""分析下我近期的工资流水"——当用户在AI聊天窗口输入这类包含敏感信息 的内容后,若点击"分享"按钮,这些隐私信息可能会以无密码保护的公开网页形式,暴露在互联网中。 此前南方都市报、南都大数据研究院曾报道ChatGPT存在聊天记录泄露风险,近日南都大数据研究院对 国内8款主流AI大模型的同类功能展开实测,发现多款产品存在类似隐私风险,用户对外分享的对话记 录以无密码的公开网页或小程序形式呈现;个别大模型产品即使删除对话历史,分享链接仍然有效。 【实测】 讯飞星火分享页暴露用户手机部分号码 12月5日—16日,南都大数据研究院选取了DeepSeek、Kimi、豆包、千问、元宝、讯飞星火、文心一 言、智谱清言等8款国内AI大模型产品网页端及手机App端进行实测。结果显示,8款AI产品的对话记录 分享功能均通过公开网页或小程序等形式实现,用户一旦点击"分享"按钮,对话内容即可能暴露在互联 网上。 在操作流程上,8款产品的内容分享功能设计较为相似。用户与AI完成一轮对话后,点击AI回答内容下 方的"分享"图标,聊天界面即弹出包含"复制链接""生成图片"等选项的菜单,供用户选择对话记录的分 享 ...
传媒行业AI周度跟踪之四十六:OpenAI 发布 GPT-5.2,谷歌开源深度研究 Agent-20251214
广发证券· 2025-12-14 16:45
行业投资评级 * 报告对传媒行业给予“买入”评级 [1] 核心观点 * 报告核心观点为关注AI技术迭代与应用落地带来的产业链变革与投资机会,尤其关注AI视频平台商业化闭环的潜在影响 [6] 国内AI动态跟踪 * **大模型产品数据**:根据SimilarWeb数据,上周(2025/12/1-2025/12/7)国内主要AI大模型产品网页端访问量中,DeepSeek以7453.49万次保持领先,但环比下降1.35% [6][20];豆包访问量为2226.72万次,环比下降0.82% [6][20];Kimi访问量为945.08万次,环比下降7.11% [6][20];腾讯元宝访问量为467.12万次,环比上升1.96% [6][20];通义千问访问量为14.93万次,环比上升21.90% [6][20];文心一言访问量为90.20万次,环比下降2.65% [6][20];智谱清言访问量为53.44万次,环比上升1.93% [6][20];讯飞星火访问量为11.10万次,环比上升11.00% [6][20];天工AI访问量为8.15万次,环比上升8.39% [6][20] * **大模型产品用户时长**:近期人均日均访问时长方面,Kimi在8分钟左右;通义千问、DeepSeek在5分钟左右;天工AI、豆包在4.5分钟左右;腾讯元宝、文心一言、智谱清言在3分钟左右;讯飞星火在2分钟左右 [12] * **应用产品数据**:上周国内AI应用产品中,AI搜索产品秘塔AI搜索网页访问量为136.00万次,环比上升4.35% [26][31];AI设计产品美图设计室网页访问量为31.37万次,环比上升14.26% [26][31];AI视频产品PixVerse网页访问量为143.92万次,环比下降5.23% [31] * **应用买量追踪**:根据APPGrowing数据,上周腾讯元宝广告投放素材量保持第一,为577812个,环比下降3.77% [32];通义千问投放素材量为466714个,环比下降30.56% [32];2025年12月至今,腾讯元宝广告投放金额为53212.44万元,通义千问为27880.12万元 [32] * **公司重点事件**:智谱AI在2025/12/8-2025/12/12期间的多模态开源周中,开源了视觉理解模型GLM‑4.6V、AutoGLM项目、语音识别模型GLM‑ASR、工业级语音合成系统GLM‑TTS以及四项视频生成核心技术 [37][38] 海外AI动态跟踪 * **大模型产品数据**:根据SimilarWeb数据,上周海外主要AI大模型产品网页端访问量中,ChatGPT以133707.15万次稳居第一,环比上升0.50% [6][42];Claude访问量为4096.75万次,环比上升3.70% [6][42];Gemini访问量为166.51万次,环比下降17.13% [6][42] * **应用产品数据**:上周海外AI应用产品中,AI陪伴产品Character AI网页访问量为4233.91万次,环比上升1.13% [47][51];AI搜索产品Perplexity AI网页访问量为4381.87万次,环比上升1.62% [47][55];AI设计产品Canva网页访问量为23174.21万次,环比上升0.70% [47][55];AI图像产品Midjourney网页访问量为407.07万次,环比上升7.77% [47][55] * **公司重点事件**:Mistral AI发布代码模型Devstral 2系列,在SWE-bench Verified基准测试中获得72.2%的高分 [56][57] 海内外科技大厂AI动态 * **OpenAI发布GPT-5.2**:OpenAI正式发布GPT-5.2模型,包含Instant、Thinking、Pro三个版本,在多项基准测试中表现突出,在GDPval知识工作任务评估中首次达到或超越人类专家水平,软件工程能力(SWE-Bench Pro)创下55.6%的新纪录 [6][58] * **谷歌开源深度研究Agent**:谷歌开源基于Gemini 3 Pro模型的深度研究Agent Gemini Deep Research,在DeepSearchQA基准测试中达到46.4%的SOTA水平,性能与GPT-5 Pro相当,而成本仅为后者的十分之一 [6][58] * **迪士尼与OpenAI战略合作**:迪士尼公司与OpenAI达成为期三年的战略合作协议,将向OpenAI投资10亿美元并获得股权,OpenAI的Sora视频生成平台将获得迪士尼旗下超过200个角色的IP授权 [6][58] * **国内大厂动态**:阿里推出新一代原生全模态大模型Qwen3-Omni-Flash-2025-12-01 [59];腾讯发布混元大模型最新版混元2.0 [59];美团发布并开源图像生成模型LongCat-Image [59] 投资建议 * **云基建方向**:建议关注阿里巴巴、腾讯控股 [6][60] * **AI视频与IP产业链**:若Sora推动AI视频平台跑通商业化闭环,建议关注IP产业链的阅文集团、中文在线、上海电影、奥飞娱乐、华策影视、欢瑞世纪等,AI内容确权关注阜博集团,视频平台关注快手、哔哩哔哩 [6][60] * **AI营销方向**:建议关注汇量科技、易点天下、蓝色光标、天下秀 [6][60] * **AI细分应用方向**:AI终端关注出门问问;AI电商关注值得买;AI客服agent关注神州泰岳;AI游戏关注恺英网络;AI医疗关注京东健康、阿里健康;同时关注商业化进展较好的快手、美图、粉笔等 [6][60]
独家首发!2025中国AI四大顶流榜单出炉,谁跻身年度产品/企业/人物/投资标杆?
搜狐财经· 2025-12-10 15:44
2025中国AI年度产品 - **DeepSeek**:以架构创新与开源战略为核心,通过自研稀疏注意力等技术,在数学推理、代码生成上比肩国际顶尖水平,并大幅降低部署成本,通过全栈开源构建生态,推动AI普惠并打破海外垄断,成为中国AI从跟跑到并跑的核心标杆 [4] - **讯飞星火**:由科大讯飞自主研发的通用大模型应用,作为当前中国主流大模型中唯一基于全国产算力训练的通用大模型,其最新升级的星火X1.5在模型参数小一倍的情况下对标国外领先水平,多语言能力超130种,2025年前三季度在央国企大模型公开招标市场蝉联第一,超过第二名和第五名总和,已联合央国企打磨300多个重要岗位智能体 [5][6] - **豆包**:字节跳动推出的综合性AI智能助手,深度融合字节系生态,成为推动中国AI普惠化、规模化落地的标杆 [6] - **纳米AI**:整合智能体专用工具如视频剪裁、配音等,可快速推动视频生成等功能落地,聚焦中小企业老板、电商市场部人员等高价值场景,支持生成视频、Word、PPT等多种格式输出,并接入国内80+模型 [7] - **夸克**:阿里巴巴AI ToC业务布局的核心产品,基于阿里通义大模型升级为“AI超级框”,满足用户工作、学习、生活各类AI需求,在通用模型基础上深耕夸克健康大模型、夸克灵知学习大模型等垂直模型,并在多模态领域推出国内首个支持音画同步视频生成的AI创作平台“造点” [8][9][10] - **科大讯飞移动数字人**:新增超拟人和个性化能力,多模态交互从语音拓展到音视频流实时交互,数字人回复更自然共情,具备全流程智能引导与沉浸式讲解交互服务,支持自主动线规划与站点导览讲解 [11] - **天工超级智能体(Skywork Super Agents)**:昆仑万维于2025年5月全球上线,采用AI agent架构和deep research技术,能够一站式生成文档、PPT、表格、网页、播客和音视频多模态内容,代表传统的Office类软件被颠覆 [12][13] - **千问**:阿里千问APP在2025年11月月活增速高达149.03%,在AI产品榜全球增速榜位列第一,其增长建立在阿里Qwen模型技术实力和开源影响力之上,Qwen模型家族全球下载量突破7亿次,在核心指标上超越Meta Llama等竞争对手,上线后仅三天就冲入苹果App Store免费总榜前三 [14] - **百度文库**:2025年已完成从传统文档平台向AI驱动的一站式内容生态转型,作为百度移动生态战略级产品,定位为“智能创作-精准分发-高效消费”的全链路服务平台,依托百度搜索入口优势及10亿级用户基础,2025年11月发布GenFlow3.0,上线Office Agent和GenX全模态通用智能体两大关键智能体,实现多Agent协同、多人团队协同、人机协同的全向协作 [16][17][18] - **可灵AI**:快手推出的新一代AI创意生产力平台,以其卓越的视频与图像生成能力引领创作浪潮,可灵2.0模型在多项核心评测中表现超越国际顶尖模型,并创新性推出“多模态编辑”功能 [19] - **MiniMax Agent**:MiniMax推出的国内首款全栈通用智能体,具有强大的编程能力、开放的MCP生态以及领先的多模态能力,可规划专家级解决方案、灵活拆解任务需求、同时执行多个子任务从而实现最终结果交付,具备从前端、后端、数据库、测试、MCP调用、建设和部署等全流程的编程开发能力 [20] - **腾讯元宝**:腾讯AI战略核心载体,依托混元与DeepSeek双引擎架构,构建全场景AI服务生态,打通微信、腾讯会议、微信读书等数十个核心应用,覆盖办公协作、内容创作、智能搜索等多元场景 [21] - **Manus**:全球首款通用AI Agent产品,凭借多智能体协同,实现从任务拆解、工具调用到成果交付的全流程自主执行,产品发布后邀请码引发全球市场热潮 [22] - **GenSpark**:强调“一条指令完成所有工作”的新一代AI生产力平台,将AI搜索、AI写作、AI演示文稿、AI表格、AI文档等能力整合在同一工作空间中,其“超级智能体”能自主执行复杂任务如深度调研、数据分析、生成图片与视频 [23] - **噜咔博士AI拍学机**:通过“AI+场景化”设计,将学习融入儿童日常探索、语言训练、家庭互动等环节,产品内置多种卡通数字人提供AI语音对话与情感陪伴,并具备AI创意特效可将孩子拍下的景物一键生画,家长可通过手机获取孩子学习报告 [24][25][26][27] - **DingTalk A1**:钉钉8.0推出的新一代语音智能工具“AI听记”及首款AI硬件DingTalk A1,AI听记依托大模型实现语音内容的实时转写、语义分析与智能摘要,内置36类场景模板,DingTalk A1厚度仅3.8mm,支持8米超远拾音,续航达45小时,提供1000分钟免费语音转写时长及10GB云存储空间,并可唤起超过10种角色的钉钉AI助理 [28] - **拍我AI(PixVerse国内版)**:全球领先的AI视频生成工具,支持文字、图片和视频等多模态输入,最快5秒生成视频,支持从360p到4K的高清输出,是全球首个上线自动生成视频音效功能的平台,内置百余种爆款模板和Agent模板 [29][30] - **网易有道词典**:累计用户已突破10亿,2025年3月完成底层技术架构升级,全面迭代至子曰翻译大模型2.0,以“小参数高性能”的技术路径实现翻译质量远超通用大模型,达到行业领先水平 [31] - **Pollo AI**:获1400万美元融资,是一款集图像生成、视频生成与创意编辑于一体的多功能AI创作平台,用户只需输入文字、上传图片或视频即可快速生成高质量的图片、动画、短视频等,平台整合多个主流生成模型,提供背景去除、动作模仿、角色替换等轻量编辑工具 [32] - **Lovekey键盘**:专为恋爱及社交场景设计的智能输入法键盘,主打AI智能回复、聊天人设定制及亲密度调节功能,2025年年收入较2024年同期增长40%,通过持续优化猜猜看文本大模型算法,AI话术生成的自然度显著提升,支持高情商、幽默、暧昧等数十种风格,并新增“职场模式” [33][34] - **Saylo**:元象XVERSE基于大模型开发的AI角色扮演与互动应用,主要面向海外用户,提供AI驱动的角色故事聊天体验,支持全维度角色定制,AI可记忆数十万字内的交互细节,核心用户日均交互超90次,相关功能留存率达72%,推出“剧情工坊”整合AI编剧、智能分镜功能,平台累计UGC超300万部剧本 [35] - **PicMa**:帝视科技旗下的全球AI影像处理平台,推出业界领先的智能修图智能体,支持语义级对话修图与多步骤自动生成,图像超分、背景替换等功能全面升级至实时处理水平,平均生成速度提升60%,年内累计上新300+ AI风格模板,通过动态风格运营实现续费率稳定在70%+,完成从移动App到Web、API的全平台覆盖并推出SaaS版本 [36][37] - **MeshyAI**:用AI重新定义3D内容生产,致力于成为“3D领域的Canva”,通过生成式AI技术将复杂的3D建模过程简化到只需输入文字或图片就能完成 [38] - **ChatPPT.cn**:产品版本多兼容性好,自研“图笏”模型,支持PPT生成、美化、演讲、动效、路演、溯源、编辑导出AI全流程驱动 [39] - **Fotor**:基于AI的视觉内容创作的一站式服务平台,提供AI图像生成与增强、AI视频生成、AI老照片修复等超100种AI图像、图形和视频功能,已覆盖全球200多个国家和地区的近8亿用户,月处理图片/视频超1亿 [39] 2025中国AI年度企业 - **深度求索人工智能基础技术研究(DeepSeek所属公司)**:推动国产AI产业自主可控与全球竞争力提升的核心引擎 [41] - **昆仑万维**:公司AGI与AIGC业务商业化取得重要进展,AI社交报告期内单月最高收入突破100万美元,成为海外收入增长速度最快的中国AI应用之一,截至2025年3月底,AI音乐年化流水收入ARR达到约1,200万美金(月流水收入约100万美金),短剧平台DramaWave年化流水收入ARR达到约1.2亿美金(月流水收入约1000万美金),海外信息分发与元宇宙平台Opera 2024年实现营业收入4.8亿美元,同比增长21.1%,海外社交网络和短剧平台业务实现营业收入12.5亿元,同比增长28.5%,综合推动公司海外业务收入规模上升至51.5亿元,同比增长21.9%,占总收入比重达91.0%,公司自研并发布了天工语言大模型、天工多模态大模型等8个大模型,并积极开源多个SOTA级别AI模型和算法 [42][43] - **360**:AI时代推出全球首个L4级别智能体系统,独创“蜂群协作框架”,可实现5万+ L3级垂直智能体灵活组队,突破单智能体跨领域协作瓶颈,连续执行超1000步任务成功率达95.4%,以及全球首个融合视频生成+AI视频编辑器的蜂群,能够真正实现一站式成片 [45] - **MiniMax**:全球领先的通用人工智能科技公司,自主研发了一系列多模态通用大模型,包括MiniMax M2、Hailuo 2.3、Speech 2.6和Music 2.0,具备强大的代码和Agent能力,以及超长上下文处理能力,基于自研模型面向全球推出一系列AI原生产品,自研多模态模型及AI原生应用已累计为来自超过200个国家及地区的个人用户,以及来自超过100个国家及地区的100,000余名企业客户以及开发者提供服务 [46] - **阶跃星辰**:行业领先的通用大模型创业公司,已对外发布Step系列通用大模型矩阵,覆盖从语言、多模态到推理的全面能力,并连续开源多个业内领先的多模态大模型,产业应用聚焦智能终端Agent,已在汽车、手机、具身智能、IoT等关键应用场景与行业头部公司达成深度合作,例如助力千里科技打造RLM大模型,联手吉利汽车集团发布下一代智能座舱Agent OS,与OPPO联合打造“一键问屏”和“一键全能搜”两大创新性AI手机功能,50%以上头部国产手机品牌已接入其多模态能力 [47][48][49] - **智谱**:致力于打造新一代认知智能大模型,2025年在模型、智能体和多模态融合方面不断迈出关键步伐,发布GLM-Realtime、旗舰模型GLM-4.5及全民可用的AutoGLM 2.0,GLM-4.5在12个最具代表性的评测基准中综合平均分取得全球模型第三、国产模型第一,开源模型第一,并迅速冲上全球开源社区HuggingFace趋势榜单全球第一,AutoGLM 2.0率先推出人人可用的全球首个手机Agent,开创Agent+云手机/云电脑的新技术范式 [51][52] - **万兴科技**:面向全球的AIGC数字创意软件产品提供商,专注于视频创意产品,天幕音视频多媒体大模型具备文/图生视频、文生图及文生音乐等一系列创新性AIGC功能,其创意资源库包含数以万计的专业设计效果、视频转场、电影级滤镜、动画标题和可复用的AI视频模板,以及海量图片、免版税音乐/音效库的内置媒体库 [53] - **面壁智能**:以推动AGI终端场景革命为战略核心,专注高效大模型的全栈研发、产业应用与生态构建,自主研发MiniCPM面壁小钢炮®系列端侧模型,2025年6月推出新一代“面壁小钢炮”MiniCPM 4.0,为行业首个原生稀疏模型,实现长文本、深思考在端侧真正运行,220倍极限加速、一半参数翻倍性能,2025年7月,端侧多模态模型MiniCPM-V核心研究成果登《Nature》子刊,仅8B参数实现多模态综合性能超越GPT-4V、Gemini Pro等万亿参数云端模型,首次在手机、平板、汽车等算力受限终端实现实时推理 [54] - **科大讯飞**:亚太地区知名的智能语音和人工智能上市企业,基于“平台+赛道”发展战略持续赋能教育、医疗、金融等行业,2023年5月正式发布讯飞星火大模型,2024年10月发布基于全国首个国产万卡算力集群训练的讯飞星火4.0 Turbo,七项核心能力在中文领域全面超过GPT-4 Turbo,代码能力和数学能力超越GPT-4o,2025年1月发布业界首个基于全国产算力平台训练的深度推理大模型讯飞星火X1,4月其数学、代码、逻辑推理等通用任务能力显著提升,整体对标OpenAI o1和DeepSeek R1,7月整体效果对标OpenAI o3等国内外一流大模型最新版本效果,多语言能力覆盖130+语言 [55][56] - **金山办公**:国内领先的办公软件和服务提供商,为来自全球220多个国家和地区的用户提供办公服务,WPS灵犀的创新点在于“软件AI化”与“AI软件化”的深度协同,重构Office内核将复杂功能封装成标准化API接口,并训练AI模型深度理解Office操作逻辑和用户真实意图 [57] 2025中国AI年度人物 - **梁文峰**:DeepSeek(深度求索)创始人,带领团队不断突破技术边界,以一款颠覆性开源模型DeepSeek撬动全球AI生态格局 [60] - **陈天石**:中科寒武纪科技董事长兼总经理,带领团队在AI算力领域从全球首款深度学习处理器芯片“寒武纪1号”到性能对标英伟达的思元590,让中国芯片从“跟跑”走向“并跑” [61][62] - **李想**:理想汽车的创始人、董事长兼CEO,以“理想不是一家汽车公司,而是一家人工智能企业”的认知,引领行业聚焦具身智能,用VLA司机大模型搭建物理与数字世界的连接,推动汽车升级为“空间机器人” [63] - **戴文渊**:第四范式创始人兼CEO,深耕AI产业化赛道,依托核心技术与架构推动AI在金融、零售、制造等多领域实现规模化落地,累计服务超200家头部企业 [64] - **袁进辉**:硅基流动创始人兼CEO,打造分布式深度学习框架OneFlow,2025年1月领导硅基流动团队与华为昇腾团队在AI云服务平台上线了基于国产芯片的DeepSeek服务 [65] - **祝铭明**:杭州灵伴科技有限公司/Rokid创始人,深耕AI+AR领域十余年,推出49克级轻量化消费级AI眼镜,产品远销80余国,引领AI+AR成为下一代人机交互终端 [66] - **蒋凡**:阿里电商事业群CEO,将AI升级为重构电商生态的核心引擎,主导战略顶层设计与全链路落地,推动AI深度融入消费者体验、商家经营、供应链管理,成为阿里电商AI转型的核心推动者 [67] - **王小川**:百川智能创始人兼CEO,曾担任搜狗CEO并带领搜狗在美国纽交所上市,2023年创立百川智能,以“为人类造医生,为生命建模型”为使命,助力生命科学和大众健康事业发展 [68] - **彭志辉**:智元机器人联合创始人兼CTO,带领团队致力于让AI走向真实的物理世界,立志让中国机器人在全球具身智能领域占据一席之地,2025年其核心产品灵犀X2实现量产突破5000台,标志着通用具身机器人正式迈入规模商用阶段 [69] - **张鹏**:北京智谱华章科技股份有限公司CEO,带领智谱团队实现国产大模型全栈自主创新,打造顶尖开源GLM系列模型,推动AutoGLM等Agent技术突破,赋能行业应用生态 [70] 2025中国AI年度投资机构 - **VC**:红杉中国、IDG资本、五源资本、梅花创投、启明创投、源码资本、深创投、金沙江创投、云启资本、纪源资本、线性资本、高瓴资本、锦秋基金、蓝驰创投 [71][72] - **CVC**:腾讯投资、阿里战投、星连资本 [71][72] - **VC/孵化器**:中科创星、创新工场 [71][72] - **FA**:华兴资本 [71][72]
科大讯飞的“AI叙事”
YOUNG财经 漾财经· 2025-12-01 19:00
公司战略与市场表现 - 董事长刘庆峰公开表示讯飞星火大模型明年参加高考应能达到清华、北大水平 [4] - 公司抛出40亿元定增计划,其中80%资金投向星火教育大模型与算力建设 [4] - 股价自10月9日以来震荡走低,2023年7月曾达1700亿市值高点但近两年二级市场表现不佳 [4] 历史股价驱动因素 - 2015年上半年股价最大涨幅近240%,受益于创业板牛市和讯飞超脑计划发布 [6][7] - 2017年6-11月股价从18.2元飙升至48元,受AlphaGo事件催化并成为AI国家队成员 [8][9] - 2020年底至2021年6月股价从36元涨至68元,智慧教育业务借双减政策东风 [10] - 2023年上半年股价从32元冲至81.7元历史高位,受ChatGPT热潮推动发布星火大模型 [11] 技术竞争格局变化 - ChatGPT重构AI竞争逻辑,大模型多模态特性稀释公司传统语音单模态优势 [11] - 公司在通用互联网级高质量文本数据方面难以匹敌拥有搜索引擎的互联网巨头 [12] - 与华为合作建成国内首个全国产万卡平台飞星一号,成为唯一基于全国产算力的大模型企业 [14] - 市场偏好转向寒武纪、浪潮信息等AI产业链上游企业,对中游技术层企业关注度下降 [14] 财务与估值状况 - 当前市盈率约137倍,显著高于软件开发行业117.15倍的平均水平 [15] - PEG指标达2.36(基于58%的2025年预测盈利增长率),显示估值偏高 [15] - 总市值1145亿元、总资产432.9亿元行业领先,但净利润-0.67亿元排名98/145 [16][17] - 2024年前三季度累计亏损超10亿元,第四季度利润大增实现全年净利润5.6亿元 [17] 业务模式特点与风险 - ToG业务构成独特护城河,星火大模型在教育、医疗等多行业市占率第一 [18] - 2021-2024年累计获得政府补助17.35亿元,同期扣非净利润累计17.04亿元 [19][20] - 应收账款从2020年57.33亿元升至2025年前三季度159亿元,占流动资产超60% [20] - 短期借款从2024年底3.1亿元暴增至2025年上半年17.39亿元,货币资金31.5亿元 [21] C端业务发展态势 - 2025年中报显示C端业务营收同比增长38%,占比达32%成为主要增长动力 [24] - 公司战略调整为"加强C端、做深B端,选择G端",学习机被定义为跨越鸿沟产品 [27] - 2025年Q2讯飞AI学习机销售额登顶中国学习平板市场,高端份额超60% [27] - 黑猫投诉平台有630条涉及学习机品控问题投诉,包括卡顿、屏幕变曲等 [30]
查资料、劝老板、写周报,给上班人准备的大模型评测
晚点LatePost· 2025-11-25 23:01
大模型用户增长与市场趋势 - 截至2025年11月,中国每天使用大模型助手应用的用户数量已超过1亿人,与2024年4月相比,用户数增长超过900%[3] - 用户使用大模型的心态发生变化,从让大模型执行任务转向更多地进行咨询询问,OpenAI报告显示“询问”类互动占比从40%增长到50%,而“执行”类任务从40%下降到30%[96] - 工作场景中42%的任务与写作相关,其中约三分之二不是从头生成内容,而是让大模型修改文本[96] 参与测评的大模型概况 - 测评涵盖14款国内外大模型,包括GPT-5.1、Claude Opus 4.5、Gemini 3 Pro、文心5.0、Kimi K2 Thinking等最新版本[3] - 测评通过官方网页版助理进行,测试时间在11月中下旬,累计交互超千次,采用中文提问,每个问题单开对话框[4][5] - 测评聚焦日常工作相关场景,设定15个问题,不涉及编程工作、agent和深度研究[3] 角色扮演与头脑风暴能力 - 在组建8人决策委员会任务中,ChatGPT盲评得分最高(22.4分),阶跃星辰StepFun排名第二(22.2分),商汤商量排名第三(21.3分)[8][13] - MiniMax Agent得分最低(13.2分),仅调整提示词而未有效组织委员会[11][13] - 在劝说老板调整商业计划任务中,阿里千问得分最高(4.6分),其话术将修改方案融入执行策略并引用名人名言[18][22] - 阶跃星辰话术得分最低(2.2分),因直接指出“三大致命矛盾”而被认为不合理[20][22] 长文本处理能力 - 在处理36页会议手册提取参会人员名单任务中,无一大模型完美解决,Gemini 3.0 Pro和腾讯元宝表现相对较好但仍有错误[25] - 智谱清言出现幻觉,添加未参会人员如创始人唐杰;通义千问表现最差,仅提取4个参会者且3个单位错误[25][26] - 在总结长文章任务中,ChatGPT、Gemini和Kimi总结质量最高,作者盲评得分均为4分;MiniMax Agent表现最差,仅生成920字总结且有事实错误[31][32][33] 周报生成与识别能力 - 在周报生成任务中,ChatGPT周报最长(1902字),DeepSeek周报最短(488字)[37][43] - 多数大模型会虚构工作细节,如客户名称和潜在收入,仅阿里千问未脑补细节[37] - 在周报识别任务中,Claude最严格,识别出11份AI生成周报并给予低分(平均4.3分);豆包和文心一言最宽松,仅识别出1份AI周报[41][42] - Claude生成的周报获得最高工作努力程度评分(8.2分),阿里千问因未脑补细节得分最低(4.6分)[42][43] 规划与统筹能力 - 在聚餐做菜规划任务中,Claude、豆包、千问、智谱清言、Kimi、MiniMax均能提供合理方案,智谱清言甚至考虑洗锅时间[44][46] - GPT-5驱动的ChatGPT表现不如去年的GPT-4,建议当场腌腊肉;DeepSeek、文心一言、阶跃星辰、讯飞星火提供的方案导致牛腩炖不熟[46][50] 联网搜索能力 - 在搜索大疆技术文章任务中,GPT-5、Kimi、GPT-5.1驱动的ChatGPT、文心一言、MiniMax均能找到相关官方文章[54][69] - 在搜索英伟达1999年招股书任务中,5款大模型(ChatGPT、Claude、Gemini、豆包、Kimi)能直接提供招股书链接[60][69] - 在以图找图任务中,10款大模型正确识别数据来自中国互联网络信息中心;Gemini 2.5 Pro最初杜撰答案,升级3.0 Pro后改正[65][67][69] 多模态识别能力 - 在识别未标注数据图表任务中,仅Gemini能给出接近实际数据的答案,其他模型仅提供估算[70][71] - 在分析甲状腺体检报告任务中,大多数模型建议“细针穿刺活检”,与三甲医院医生建议一致;DeepSeek建议定期观察,科大讯星星火还建议基因检测[75][79] - 在工位整理视觉识别任务中,DeepSeek和Kimi提示仅能使用OCR识别文字;能工作的模型仅识别部分物体,GPT-5.1驱动的ChatGPT提供ASCII示意图[86][89]
谁在逆势增长?10月AIGC增速榜发布:Meta AI翻倍,视频、翻译工具强势崛起
搜狐财经· 2025-11-22 17:18
全球AIGC产品增长趋势 - 2025年10月全球AIGC产品增速榜单显示,视频生成与多功能平台引领增长,前十名呈现多元化爆发态势 [2] - Meta AI以105.15%的惊人增长率强势登顶,xAI(46.97%)、PLAN by ixigo(44.12%)分列增速榜二三位 [2] - 视频生成工具VIGGLE和Runway分别以39.48%和31.37%的增长率位列第四和第八,AI搜索引擎Perplexity以29.12%的增长率位列第十 [2] 全球市场地域分布特征 - 美国市场主导格局稳固,榜单中高达七成产品的热门地区为美国 [3] - 印度市场亮点凸显,旅行规划工具PLAN by ixigo和AI搜索引擎Perplexity的入榜显示新兴市场成为重要增长极 [3] 全球增长驱动因素演变 - 与9月教育类产品霸榜不同,10月增长由技术迭代驱动的多媒体内容生成和拥有庞大用户基础的大型AI平台引领 [5] - 实用工具需求持续旺盛,翻译工具彩云小译(38.77%)、语音转文本工具TurboScribe(36.36%)、AI检测工具GPTZero(30.12%)等垂类工具增速均超过30%,反映市场对AI深度整合具体工作流的强烈需求 [6] - 前十名中美国产品占据绝对主导(7席),中国产品MaxAI.me(通用写作)作为唯一代表以35.06%的增长率位列第7,其增长更多依赖本土市场,凸显美国产品在全球化布局上的优势 [7] 中国AIGC产品增长表现 - 2025年10月国内AIGC产品增速榜单显示,翻译工具及百度系产品表现抢眼,彩云小译以38.77%的增速领跑 [9] - 讯飞星火以17.56%的增速位列第二,百度旗下橙篇AI以50.94万的增长量和13.91%的增速位列第三 [9] - 百度生态多款产品(AI搜索、AI伙伴、文心一格)集体上榜,凸显其协同优势 [9] 中国市场细分领域增长 - 除翻译、聊天机器人外,视频剪辑(剪映网页版,12.18%)、PPT生成(AiPPT,11.37%)、社区平台(魔塔社区,10.22%)等细分工具均实现稳健增长,覆盖内容创作、办公提效等多类场景 [10] - 增速前列的彩云小译、剪映网页版、沉浸式翻译等工具聚焦高频、易用的具体需求,显示用户偏好从技术炫技转向解决实际问题 [12] 中国产品全球化挑战 - 百度旗下三款产品(橙篇AI、AI搜索、AI伙伴、文心一格)同时入榜,其中三款的热门地区标注为美国,反映其国际化布局成效 [11] - 榜单中过半产品(如彩云小译、讯飞星火、百度多款产品)的热门地区为美国,但其增长数据统计范围为国内,体现中国AIGC产品对国际市场的深度依赖与潜在风险 [13]
拒绝同质内卷,科大讯飞决心做“更懂你的AI”
经济观察网· 2025-11-13 17:50
产品与技术发布 - 公司于11月6日发布深度推理大模型“讯飞星火X1.5”,这是唯一基于全国产算力平台训练的顶尖模型[1] - 公司同步推出“AI+麦克风阵列”、“AI+扬声器阵列”等软硬件一体化方案,并强化多模态交互体验[1] - 公司全球首发“非自回归语音大模型架构”原创技术,使语音大模型训练效果相对提升16%,推理成本下降520%[13] - 深度推理大模型讯飞星火X1.5首发了个性化记忆能力,能实现多源记忆库信息检索和应用[14] - 公司展示了多样化行业解决方案,包括AI老师、专科AI、智能座舱2.0及可定制人设的AI陪伴角色等[18] 市场地位与竞争优势 - 在央国企市场,公司2024年大模型解决方案中标项目数达91个,中标金额达8.48亿元,项目数及金额均位列所有厂商首位[6] - 2025年前三季度,公司在央国企大模型公开招标市场再次蝉联第一,市场占比超过第二名和第五名的总和[7] - 公司在教育、医疗、汽车等行业持续保持大模型应用行业第一的地位[8] - 公司是主流大模型中唯一基于国产算力训练的通用大模型,并与华为昇腾生态深度合作[11] - 公司攻克国产算力训练难题,深度推理训练效率从30%提升至84%以上,并大幅提升MoE全链路训练效率[11] 开发者生态与全球化进展 - 截至2025年10月31日,公司开放平台已开放872项AI产品及能力,聚集超过968万开发者团队[21] - 平台总应用数超过368.4万,累计覆盖终端设备数超过42.6亿,链接超过千万生态伙伴[21] - 近一年新增开发者200万,其中智能硬件开发者增长102%,大模型企业开发者增长125%,海外开发者团队数达55.2万[21] - 讯飞星火支持130+种语言,整体性能达到GPT-5(high)的95%以上,在14个重点语言效果领先[21] 财务表现与行业前景 - 2025年第三季度公司实现营业收入60.78亿元,同比增长10.02%;归母净利润1.72亿元,同比增长202.40%;经营性现金流净额8.95亿元,同比增长25.19%[23] - 全球大模型市场已发布模型总数达3755个,其中中国企业贡献了1509个[4] - Gartner预测到2026年超过80%的企业将采用生成式AI,创造出万亿级别的市场增量[23] - 国务院审议通过《关于深入实施“人工智能+”行动的意见》,要求深入实施“人工智能+”行动[23]
【产业互联网周报】马斯克:5年后手机彻底消失,AI 与机器人是“饭碗终结者”;Meta被曝靠海量诈骗广告赚取巨额利润;苹果AI入华计划再延期,研发过程面...
钛媒体APP· 2025-11-10 16:16
AI技术发展与行业预测 - 埃隆·马斯克预测AI将在2026年超越任何单个人类智商,2030年超越人类智慧总和,职业替代将从邮件处理、客服等桌面工作开始,逐步扩展到编程、内容创作、驾驶物流等领域,未来设备将演变为AI推理边缘节点,传统手机和App生态将在5-6年内消失[2] - 阿里巴巴CEO吴泳铭认为AI发展将经历“学习人”、“辅助人”、“超越人”三个阶段,目前处于“辅助人”阶段,AI Agent已能完成大量数字世界工作,阿里巴巴正在建设超大规模AI基础设施并打造超级AI云[16] - 诺贝尔化学奖得主迈克尔·莱维特表示AI对一切都有帮助,关键在于人类需要提出正确问题,他每天使用DeepSeek、Kimi、ChatGPT等中美AI产品,并认为中国正以远超西方速度构建科研生态[5][12][13] 算力与能源挑战 - 微软CEO纳德拉指出AI行业最大问题不是算力过剩而是电力短缺,缺乏足够电力支撑GPU运行,导致芯片无法启用,当前面临机房外壳不足的瓶颈[3] - 英伟达CEO黄仁勋称Blackwell芯片需求非常强劲,业务每月都在增长,已向台积电要求增加芯片供应,三家AI存储芯片供应商SK海力士、三星和美光均已提升巨大产能[39][40] - 蚂蚁集团已部署万卡规模国产算力集群,训练任务稳定性超过98%,训练与推理性能可媲美国际算力集群[38] 大模型技术进展 - 阿里通义千问Qwen在AI大模型实时投资比赛中以22.32%收益率夺冠,DeepSeek同样盈利,而GPT-5亏损超62%垫底,中国模型表现优于美国模型[21] - 月之暗面Kimi K2 Thinking在人类终极考试上取得44.9%分数,超过GPT-5、Claude 4.5等先进模型,训练成本仅460万美元,低于DeepSeek V3的560万美元和GPT-3的数十亿美元[34] - 百度文心大模型5.0-Preview登榜LMArena,核心指标超越GPT-5-High,创意写作单项得分全球第一,复杂长问题理解能力和指令遵循维度表现亮眼[32] 企业动态与战略合作 - OpenAI年收入远超130亿美元,但与微软合作导致当季亏损可能超过120亿美元,公司正与亚马逊云科技签署380亿美元协议,将使用AWS计算资源支持生成式AI工作负载[6][49] - 微软计划2026-2029年间向阿联酋投资超79亿美元,其中55亿美元用于AI和云基础设施,已获得出口许可将英伟达GPU出口至阿联酋[51] - 亚马逊向Perplexity发出停止并终止律师函,指控其AI浏览器代理Comet违规购物,违反服务条款并带来隐私风险[54] 硬件与终端创新 - 英特尔预计到2024年底AI PC累计出货约1亿台,个人计算机正迎来颠覆性升级[14] - 科大讯飞发布AI软硬一体方案,多款AI硬件降噪能力刷新行业标准,智能办公本X5在远场高噪环境下效果远超iPhone 17 Pro,翻译耳机复杂噪声环境下识别准确率达97.1%[34] - 全球首款生成式AI吉他“TemPolor”亮相,深度融入吉他演奏体验,支持追光独奏、单音弹奏、AI创作,重新定义人与音乐交互方式[41] 机器人与具身智能 - 宇树科技创始人王兴兴表示全中国智能机器产业平均每家公司增长至少超过50%-100%,虽然机器人大模型进展比预期慢,但深度强化学习全身运控技术进步明显[8] - 优必选Walker人形机器人再获1.59亿元订单,全年累计突破8亿元订单,预计11月完成交付[43] - 小鹏汽车发布新一代IRON机器人,何小鹏回应真人质疑发布一镜到底视频,公司港股盘中拉升2.74%[36][37] 政策支持与产业环境 - 工信部部长李乐成表示将推进AI手机、AI电脑等消费终端换代,加快人形机器人、脑机接口等新一代智能终端研发与应用,完善“人工智能+制造”政策体系[5] - 国家卫健委发布实施意见,目标到2027年建立卫生健康行业高质量数据集,形成临床专病专科垂直大模型,到2030年基层诊疗智能辅助应用基本实现全覆盖[60] - 日本执政党计划每年投入约65亿美元支持半导体和AI产业发展,大部分资金将通过常规预算筹措,确保稳定资金来源[63] 资本市场与投资动态 - 美国知名空头迈克尔·伯里押注逾10亿美元做空英伟达和Palantir,Palantir CEO回应称做空这两家获利能力极强的公司本质是做空AI[10][11] - 摩根大通预计AI资本支出有更大上行空间,12个月资本支出普遍预期从35%上调至39%,2026年投资支出增速将显著提升[59] - 深朴智能3个月内完成近2亿元融资,将用于具身机器人大脑及本体研发,投资方包括顺为资本、创世伙伴创投等知名机构[48] 应用落地与商业化 - 5款AI原生App月活破千万,豆包、DeepSeek、腾讯元宝、即梦AI、AQ分别来自字节跳动、腾讯、DeepSeek、蚂蚁四家大厂,市场从流量竞争转向生态绞杀与场景深耕[24] - 美团宣布餐饮堂食合作门店全量接入AI经营助手“智能掌柜”,试点期间已服务超百万家餐饮门店,每周有3万家门店与AI对话[26] - 金蝶推出首个企业级AI原生超级入口“AI产品小K”,构建企业管理AI原生应用新范式,从卖产品向按订阅或结果收费转型[22]
科大讯飞刘庆峰:国产集群推理训练效率已从对标英伟达A800的30%提升至84%
中国经营报· 2025-11-06 22:41
行业宏观趋势 - 中国生成式AI用户规模从2024年12月的2.49亿人增长至2025年6月的5.15亿人,半年内实现翻倍增长 [1] - 未来5年AI将替代900万个岗位,同时催生1100万个新岗位 [1] - 2025年上半年全球新晋54家独角兽企业中,AI相关公司占比高达57% [1] 公司技术进展 - 公司发布深度推理大模型讯飞星火X1.5,融合AI与麦克风阵列、扬声器阵列、摄像头阵列、视觉呈现等软硬件一体解决方案 [4] - 公司与华为联合打造的国产算力集群实现深度推理训练效率从对标英伟达A800的30%提升至84%,在MoE模型训练上效率达93% [2] - 讯飞星火是唯一基于全国产算力训练的中国主流通用大模型 [2] 公司应用成果 - 公司联合头部企业深度打造300多个“开箱即用”智能体,并涌现出多个优秀“AI员工” [1] - “星火行业分析师”成为国内首个通过工信部考试认证的行业分析AI应用,在《大数据分析师技术水平考试》中得分92分,超过85%的人类考生 [1]
推理效率提升100%!“星火X1.5”发布,科大讯飞刘庆峰:AI红利已到兑现时刻
中国证券报-中证网· 2025-11-06 20:21
新产品发布 - 公司发布基于全国产算力的深度推理大模型讯飞"星火X1.5" [1] - 星火X1.5采用MoE架构,总参数量293B,激活参数量30B,1台昇腾标配服务器即可部署 [2] - 模型推理效率相比星火X1提升100%,多语言能力覆盖超过130个语种,整体性能达到GPT-5的95%以上 [2] 技术突破 - 攻克长思维链强化学习训练效率难题,深度推理训练效率从30%提升至84%以上 [3] - 全球首发非自回归语音大模型架构,相比同尺寸自回归模型效果提升16%,推理成本下降520% [3] - 实现"百变声音复刻"能力,仅需一句录音即可复刻任意音色,并支持多语言生成 [5] 财务与市场表现 - 公司前三季度实现营收169.89亿元,同比增长14.41% [3] - 第三季度单季度归母净利润1.72亿元,同比增长202.40% [3] - 第三季度大模型相关项目中标金额达5.45亿元,1-9月相关项目中标数量和金额在行业中排名第一 [4] 开发者生态与用户数据 - 讯飞开放平台开发者总数达968万,近一年新增200万 [1] - 智能硬件开发者增长102%,大模型企业开发者增长125% [1] - "AI星朋友"用户周均使用频次9.8次,月活率56%,82%用户给予正向情绪反馈 [6] 软硬一体战略 - 公司认为"软硬一体"是AI红利兑现的关键支撑,发布融合AI与多种阵列的软硬件一体解决方案 [5] - 讯飞智能办公本X5高噪环境下识别准确率达95.08%,AI翻译耳机复杂噪声下识别准确率达97.1% [5] - 公司发布情感陪伴伙伴"AI星朋友",拥有自然度4.35MOS的高保真声音克隆和超过160种人设模型 [6]