通义

搜索文档
QuestMobile 2025年AI应用市场半年报:移动端达6.8亿,三类形态应用此消彼长,手机厂商亟需提升生态整合能力……
36氪· 2025-08-05 10:47
AI应用市场格局 - 2025年上半年AI应用形成四大梯队格局:第一梯队AI搜索引擎(6.85亿MAU)和AI综合助手(6.12亿MAU)遥遥领先,第二梯队AI社交互动(1.26亿MAU)和AI专业顾问(1.11亿MAU),第三梯队AI效率办公(0.69亿MAU)和AI图像处理(0.49亿MAU),第四梯队AI创作设计等细分领域约0.2亿MAU [1] - 应用形态呈现三足鼎立:移动端应用插件(In-App AI)规模6.3亿(较3月增0.5亿),移动端原生App5.7亿(降0.2亿),PC网页应用1.8亿(降0.3亿) [1] - 拍摄美化行业AI化进度达35.6%居首,育儿母婴(33.3%)和移动娱乐(20.2%)紧随其后,而手机游戏(0.5%)和出行服务(1.9%)AI化程度最低 [15] 应用形态发展趋势 - 应用插件形态增长迅猛,反映用户对"场景化工具"和"大模型稳定输出"的诉求,典型如夸克AI搜索使用率达56%,百度AI达9.6% [2] - 原生App市场进入洗牌期,67.4%的原生App上半年负增长,手机厂商预装AI助手因场景缺失和同质化问题增长乏力 [22][26] - PC网页端80%玩家用户量低于50万且68.8%负增长,但效率办公赛道71.7%用户集中在PC端且保持3%增长 [31][34] 头部企业竞争态势 - 五大互联网集团占据AI应用Token总消耗量的51.8%(60.3万亿/116.3万亿) [17] - 百度AI以2940万MAU领跑搜索引擎赛道,小布助手(1605万MAU)和通义(284万MAU)主导综合助手领域 [19][59] - 腾讯元宝App上半年复合增长率达55.2%,抖音即梦AI增长33.4%,显示场景深耕能力成为增长关键 [24][61] 技术演进与场景突破 - 视频大模型技术突破推动行业向"场景解决方案"转型,拍摄美化类App平均落地5.5个AI功能,育儿母婴类4.2个 [12][15] - 混元T1模型在生图领域表现突出,而kimi1.5模型因长文输出速度慢导致流量下滑 [54] - 手机厂商在图像编辑场景具备系统级优势,但美图秀秀AI修图MAU仅100.9万且呈下滑趋势 [46][48] 未来发展方向 - 行业将围绕"搜索即服务"(原生App)和"定制搜索能力"(In-App AI)展开竞争,网页端需建立"AI+工作流"护城河 [33][35] - 成功路径需满足:成为用户心智"唯一选项"或嵌入不可替代工作流节点,依赖模型迭代速度、场景深耕与生态整合 [56] - 手机厂商5.1亿用户体量显示硬件入口价值,但需突破预装依赖提升主动使用率,目前DeepSeek和豆包在手机用户中渗透率已超10% [9][45]
ETF盘中资讯|特朗普发布“AI行动计划”,国产替代重要性凸显!重仓国产AI的589520盘中猛拉3%,寒武纪涨超7%
搜狐财经· 2025-07-25 14:41
AI行业市场表现 - 科创人工智能ETF华宝(589520)场内价格盘中涨逾3%,实时成交额超2000万元,交投活跃 [1] - 成份股中云从科技涨超10%,寒武纪、恒玄科技涨逾7%,虹软科技、云天励飞涨超4% [1] - 科创人工智能ETF华宝近4日连续获资金净流入,合计金额1332万元,反映资金看好板块后市 [1] 美国AI政策动向 - 美国总统特朗普发布"AI行动计划",签署三项行政命令推进政策落实 [3] - 政策包括出口美国人工智能全栈产品、加快数据中心建设审批、取消阻碍AI开发的联邦法规 [3] - 市场分析认为该政策将使英伟达、AMD、谷歌、微软、OpenAI和Meta受益 [3] - 中信证券认为该计划将加剧美国科技巨头在AI领域的军备竞赛,包括人才争夺和研发投入 [3] 技术发展动态 - OpenAI将于8月推出GPT-5,可能引入视频等新输入形式,拓宽生成式AI应用场景 [4] - 中银证券指出GPT-5发布将为产业链上下游带来新投资机会,并倒逼国内厂商加速技术迭代 [4] 国产AI产业链特点 - 科创人工智能ETF华宝(589520)具备端云融合、自主可控特征,配置应用软件、终端应用、终端芯片、云端芯片四大环节 [5] - 国产DeepSeek实现弯道超车,打破海外算力封锁,为国产AI公司奠定基础 [6] - 科创板人工智能指数自9.24行情以来累计上涨90.90%,跑赢科创综指(61.53%)等宽基指数 [6]
警惕黑化!实测十款:部分AI可被恶意指令污染输出危险内容
南方都市报· 2025-07-21 12:29
大模型安全性能测试结果 - 在"注入反常场景"环节,智谱清言和阶悦AI直接拒绝执行包含负面内容的语料训练请求,表现出较强的伦理防线 [2] - DeepSeek、通义、元宝、讯飞星火、文心一言和百小应六款模型试图修改或纠正负面语料,显示初步警惕性 [3] - Kimi和豆包直接接受"坏语料",暴露出安全规则漏洞 [3] 反常语料测试表现 - 元宝、讯飞星火在测试中拒绝输出或主动修正为合规内容,未被开发者强行扭曲判断 [3] - DeepSeek、Kimi、豆包、通义、文心一言和百小应六款模型直接输出了预设的伤害性回答 [3] 有害指令迁移效应 - DeepSeek、豆包和元宝三款模型在延展测试中输出"抢银行""水泥灌内胎"等危险方案,显示核心决策机制被污染 [4][5] - 通义和文心一言虽未输出实质性错误答案,但采用负面语气表达,存在形式正确但表达方式问题 [4] - Kimi、讯飞星火保持客观回答,百小应回归正常应答,未出现跨领域污染 [4] 技术机制与行业动态 - OpenAI研究发现AI"毒性人格特征"可能源于预训练阶段对反派角色文本的学习,而非后天调教失误 [6] - "再对齐"技术仅需120个安全样本即可纠正模型行为,国产大模型也具备一键切换正常模式的选项 [7] - 复旦大学团队提出通过小模型监管大模型、建立内部自省机制及伦理审查制度应对风险 [8] 政策监管进展 - 中国科技部等10部门2023年将大模型纳入《科技伦理审查办法(试行)》监管范围 [8]
中国AI大模型测评报告出炉,8款大模型首测伦理判断能力
贝壳财经· 2025-07-10 18:02
行业应用现状 - 媒体工作中使用大模型的受访者比例达96.27%,较去年提升22.9个百分点 [2][4] - 约半数受访者经常使用大模型,八成受访者认同其提升工作效率,其中25.16%认为"非常有帮助" [2][7] - 45岁以上群体使用比例增幅最高达41.98个百分点,26-35岁用户占比最高达97.37% [6] - 行业应用处于创新扩散理论中的加速增长阶段,26-35岁用户被视为"创新者"推动扩散 [6] 技术能力表现 - 通义、讯飞星火、文心一言、腾讯元宝以超7500分位列前四,均背靠大厂 [2][13] - 通义和文心一言各维度得分均超1500,讯飞星火在翻译领域表现突出 [13] - 长文本能力仍存短板:DeepSeek/Kimi/智谱清言仅能处理18%-52%的财报文件 [15] - 多模态能力满意度偏低,尤其在视频/图片生成方面未达预期 [8] 伦理与风险问题 - 96%受访者每周至少遭遇1次错误或偏见,较去年增加7个百分点 [2][9] - 99.37%受访者最担忧幻觉产生虚假新闻,95.6%担忧数据隐私(上升9.17个百分点) [11] - 腾讯元宝和文心一言在伦理测试中被诱导爆粗口,腾讯元宝该项垫底 [3][14] 头部厂商优势 - 大厂模型在综合能力上领先:通义总分7627.76居首,文心一言7572.83分 [14] - 信息检索/文本生成/翻译领域价值显著,通义和文心一言精准定位长文本隐藏内容 [15][16] - 资源和技术积累使大厂模型在稳定性上具备明显优势 [16]
生而全球”!在中国企业的“新航海”时代,阿里云正在打造一艘“AI航母
证券时报网· 2025-06-24 22:06
中国企业出海趋势 - 中国企业出海进入"新航海时代",涌现大批"生而全球"企业,这些企业从创业第一天就定位全球化,将重心放在海外 [1][2] - 中国企业出海历程分为四个阶段:2008年前为黄金时期,2009-2016年为制造业"借船出海"时期,2017年起数字经济出海蓬勃发展,2022年起中小企业成为主力军 [2] - 2024年起科技产品为核心的AI数字形态成为新趋势,中国在APP排行榜、AI智能硬件、具身智能等领域占据重要地位 [3] "生而全球"企业特点 - 具备高附加值竞争力,AI驱动产品能力升级带来差异化优势 [3] - 拥有全球化合规认证与资质,符合本地合规要求 [3] - 技术能力实现全球统一标准管理,国内外业务可平滑迁移 [3] - 实现全球业务能力的互联互通 [3] 阿里云出海战略 - 2025年出海成为阿里云核心战略,与AI战略优先级相同 [2] - 打造全球云计算一张网,覆盖29个地域、88个可用区、3200个边缘节点,未来三年投入超3800亿人民币建设云和AI基础设施 [4] - 提供全栈AI能力,包括开源模型通义、119种语言支持、AI研发支持,助力企业构建全球化Agent [5] - 具备领先合规体系,获150余项安全合规认证,包括全球隐私保护标准"全满贯" [5] 阿里云服务案例 - 雷鸟创新借助阿里云全球基础设施,将AI响应时间降至1.3秒,回答准确率达98% [4] - 冰川网络利用阿里云AI能力实现游戏智能客服、智能评论等功能,并开发AI角色生成、NPC智能化训练等新应用 [5] - 小鹏汽车依托阿里云全球基础设施实现业务快速部署,海外销量同比增长3倍多 [6]
AI大模型幻觉测试:马斯克的Grok全对,国产AI甘拜下风?
搜狐财经· 2025-06-24 19:45
马斯克与xAI动态 - xAI正在进行3亿美元股权交易 估值达1130亿美元 [1] - 马斯克计划用Grok 3.5/4重写人类知识语料库 旨在删除错误信息并补充缺失内容 [1] - Grok 3在AI幻觉测试中表现优异 三轮问题均回答正确 [9][16][29] AI幻觉行业现状 - 行业普遍采用RAG框架、外部知识库结合及精细化训练工具减少AI幻觉 [2] - 测试显示深度思考模式可显著降低幻觉 豆包和通义开启后纠正草莓问题错误答案 [7][11] - 联网功能提升准确性 豆包和通义因默认联网在误导问题中表现优于其他国产模型 [16][21] 技术解决方案与争议 - 多轮推理、分步验证及外部知识融合机制被证明可有效抑制AI幻觉 [35] - 用户可通过开启深度思考、联网搜索及增加限定词减少幻觉 [37] - 学术界指出AI幻觉在蛋白质设计等领域有创造性价值 诺贝尔奖得主David Baker团队利用该特性取得突破 [38] 知识语料库重构争议 - 行业专家Gary Marcus质疑重写语料库可能导致观点偏见 影响客观性 [37] - 清华大学研究团队认为完全消除幻觉可能阻碍科学创新 [38] - 实时更新机制比全量重写更具效率优势 后者可能拖累开发进度 [37]
提前7年布局,靠谱的理财AI来了
搜狐财经· 2025-06-23 16:53
公司动态 - 蚂蚁集团旗下理财AI"蚂小财"于6月23日新增接入通义大模型,结合自研大模型提升服务能力 [1] - "蚂小财"定位为普惠金融AI助手,2023年9月正式发布,2024年8月底月度活跃用户达7000万,45%来自三线及以下城市 [5] - 产品功能覆盖行情查询、基金诊断、资产配置建议等,支持"哪里不懂按哪里"的交互方式,实现7*24小时陪伴式服务 [5][9][12] 技术优势 - 基于蚂蚁20年金融科技积累和通义大模型的通用能力,"蚂小财"在金融专业性与AI技术结合上形成断层领先 [8][9] - 技术团队曾登顶SQuAD2.0机器阅读理解榜单(模型分数超真人),并拿下NL2SQL国际权威榜单Spider第一名 [8] - 接入200多家金融机构数据,实现业务场景深度结合,输出兼具专业性与通俗易懂的理财建议 [12] 市场影响 - 将传统高净值人群专属的理财经理服务普惠化,用户资产配置合理程度提升5%,频繁交易比例下降60% [1][7] - 在全球金融AI领域尚无绝对领先者的背景下,"蚂小财"在交互体验和场景结合方面实现突破 [8][12] - 马云自2008年起布局云计算,2018年启动智能客服项目"安娜",为AI应用奠定基础 [2][5] 行业地位 - 蚂蚁集团通过"蚂小财"在数字金融赛道建立技术壁垒,有望引领全球普惠金融AI化浪潮 [8][12] - 区别于通用大模型和娱乐类AI,金融AI需攻克数据时效性、专业理解等难点,公司已具备技术+业务双重优势 [8] - 产品在国际AI赛事中多次击败Meta、微软等竞争对手,展现中国在金融科技领域的创新实力 [8]
下一个十年,AI的大方向
虎嗅· 2025-06-12 09:16
人工智能行业发展回顾 - 2015年AlphaGo击败李世石标志着人工智能技术出圈并迎来爆发期,AI四小龙等公司纷纷创业,主打视觉识别技术 [1] - 2025年行业回顾显示AI四小龙已纷纷凋零,中国AI领域涌现出文心、通义、混元等十余个大模型 [3][4] - 2015-2025年被视为AI上半场(视觉识别),2025-2035年可能转向视觉生成领域 [4] 当前AI技术热点 - 文本生成领域聚焦代码生成和文案生成 [4] - 语音生成领域集中在音乐生成和播客生成 [4] - 图片生成技术应用于海报制作和美颜功能 [5] - 视频生成技术覆盖广告制作和影视创作 [5] - 除中国代码生成外,中外AI企业已在其他生成领域实现商业化变现 [6] 技术里程碑事件 - 2017年Transformer架构颠覆传统专有模型研究范式,导致大量学者回归学术界 [7] - 2023年ChatGPT突破引发行业震动,谷歌仓促推出Gemini应对 [7] - 2024年OpenAI先后发布Sora视觉模型和深度思考o1系统,推动行业突破文本长度竞赛 [8] 头部企业技术路线 - ChatGPT和DeepSeek未重点布局生成技术,而是强化推理能力建设 [10] - DeepSeek的核心优势被归纳为国产化、开源架构、资源效率高、中文语料优化和媒体背书 [10] 技术发展方向争议 - 行业存在AGI(通用人工智能)与AIGC(生成式AI)发展路径的哲学争论 [11] - 可回收火箭案例显示技术创新价值常需事后验证,类比当前AI技术争议 [13][14][15] 技术应用原则 - 历史经验表明局域网/互联网/移动互联网/云计算时代均有明确应用边界 [16][17][18][19] - 人工智能时代需要建立类似"若无法实现XX功能则不应强行AI化"的应用准则 [20]
2025年中国GEO行业研究(二):认知战争2.0-GEO如何让品牌成为生成式AI的“标准答案”
头豹研究院· 2025-06-11 20:48
报告行业投资评级 未提及 报告的核心观点 - GEO利用生成式AI技术创建与用户意图高度匹配的内容,提升其在AI搜索中的排名和引用率,能解决企业营销痛点,是更智能、可持续的新一代品牌营销方式 [6][28][38] 根据相关目录分别进行总结 GEO的定义 - GEO即生成式搜索引擎优化,利用生成式AI技术创建与用户意图高度匹配的内容,提升其在AI搜索中的排名和引用率,强调内容的可解析性与权威性,直接输出答案而非引导跳转 [6] AI搜索产品网页端流量情况 - 2025年3月中国AI搜索网页流量呈现高度集中的“头部效应”,Deepseek与纳米AI凭借巨大的用户规模和体验优势遥遥领先,多数同类产品面临用户习惯培养不足和差异化竞争的严峻挑战 [12] - Deepseek以4.94亿次的月访问量领先,纳米AI搜索以3.01亿次的访问量居第二,两者构成第一梯队;排名靠后的C知道、天工AI和智谱清言等月访问量均未突破500万次 [12] AI搜索产品应用端流量情况 - 2025年3月中国AI搜索产品在移动应用端的用户活跃度高度集中,夸克、豆包与Deepseek三家占据绝大部分用户,与其他产品差距巨大 [16] - 夸克月活近1.5亿,豆包接近1亿,Deepseek超7700万,构成头部阵营;腾讯元宝、Kimi智能助手和纳米AI搜索月活在两千万至四千万级别,形成第二梯队;智谱清言刚过千万,讯飞星火、通义等多数产品月活不足六百万,形成长尾 [16] 企业在营销层面的核心痛点 - 企业面临信任危机、信息缺失、竞品承压、内容失衡等营销痛点,源于内部管理短板和外部市场压力 [18][27] - 信任危机表现为价值承诺不符、沟通失实误导、危机响应不力等;信息缺失体现为用户洞察片面、价值传递不充分、内容更新滞后失准等;竞品承压包括核心市场被蚕食、行业话语权旁落等;内容失衡有内容产出效率与质量瓶颈、技术应用与优化能力不足等问题 [25][26][27] GEO如何解决企业营销痛点 - GEO能系统性应对企业营销痛点,赋能品牌实现深层次营销价值 [28] - 针对信任危机,GEO可提升信息准确与合规性、保障价值承诺一致性、增强操作透明度;针对竞品承压,能实现竞品洞察与策略反制、提升关键渠道可见度、动态适应竞争环境;针对信息缺失,可实现信息整合与完整覆盖、深化价值传递与场景适配、确保内容时效与准确性;针对内容失衡,能突破内容产能瓶颈、降低内容优化技术门槛、进行效果验证与迭代 [36][37] 传统营销与GEO的对比 - 传统营销渠道存在成本高、见效慢、转化路径长、用户信任度低等问题,GEO在用户主动搜索中以“答案”形式精准触达,具备转化链路短、长期复用、高信任、高性价比等优势 [38] - 信息流广告曝光量大但受平台算法限制、用户信任度低,GEO内容可信度高、可沉淀为长期流量资产;品牌自媒体需长期运营、转化链条复杂,GEO可缩短认知到转化的路径、提升“非关注用户”转化可能;传统SEO优化周期长、难以覆盖复杂用户意图,GEO语义理解能力强、优质内容易获推荐;明星代言与KOL合作成本高、舆情风险大,GEO成本更低、结果更可控、信任基础更高 [40]
6大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底
机器之心· 2025-06-08 06:35
大模型高考数学测试表现 - 字节豆包与腾讯元宝以68分并列第一,正确率93% [6][8] - 深度求索DeepSeek和阿里通义分别以63分、62分紧随其后,正确率86%和85% [8] - 百度文心X1 Turbo得分51分(正确率70%),OpenAI o3表现最差仅34分(正确率47%)[10][11] 题目类型分析 单选题(8题/40分) - 豆包、通义、元宝、文心均得35分,DeepSeek得30分,o3仅20分且错4题 [16][17] - o3在基础题出现逻辑混乱,如第2题未给出答案,第5题计算错误 [17] - DeepSeek因OCR识别问题导致第6题无法作答 [22][23] 多选题(3题/18分) - 豆包、DeepSeek、元宝全部满分,通义错1题得12分 [29][31] - 文心X1错2题(含1题未响应),o3未全对且存在单选式作答 [31][33] - 通义因步骤简略导致第11题误选AD,而正确答案为ABC [32] 填空题(3题/15分) - 豆包、DeepSeek、通义、元包均满分,文心X1因第13题取值错误得10分 [34][36] - o3第13题仅答-2、第14题以小数2.44替代分数61/25,共得10分 [36] 技术进展与现存问题 进步 - 国产模型均超及格线(43.8分),较去年显著提升,豆包/元宝正确率达93% [40] - 增加反思能力,如DeepSeek会验证步骤(耗时达15分钟/题) [40] - 推理步骤更完善,多数模型展示完整逻辑链路(除通义外) [41] 问题 - 计算细节错误频发,如符号误判、公式套用错误 [43] - 图形与几何直觉处理不足,如DeepSeek无法识别图表信息 [23][43] - 对题目条件敏感度低,多选题易漏选/误选 [43]