自然语言

搜索文档
App Store新增App标签、CPP可绑定关键词、截图影响搜索排名...WWDC25后与推广息息相关的新功能来了!
36氪· 2025-06-16 19:43
App Store新增App标签 - 苹果推出App标签功能,旨在帮助用户更深入了解应用特性,标签由大语言模型生成并经过人工审核[3] - 标签将展示在产品页面和App Store关键区域如搜索标签页面和搜索结果中,提升应用曝光[4] - 功能将分阶段推出,目前仅限美国区少量应用,今年将扩展至全美应用并覆盖其他市场[6] - 开发者可通过优化多维元数据(描述、截图、评价等)来影响标签生成准确性[8] 自然语言搜索支持 - App Store搜索新增自然语言支持,用户可用日常用语查找应用,提升搜索结果相关度[9] - 目前仅支持英文和美国区少量应用,今年将扩展至全美应用及更多语言地区[11] - 该功能将重构传统ASO优化模式,建议采用场景化描述和本地化短语组合[12] - 用户评论高频短语可能被算法关联,可加强评论分析和优化[12] 自定产品页关键词功能 - 开发者可为自定产品页分配关键词,使其出现在相应搜索结果中[13] - 关键词需从应用最新版本中挑选,不能随意创建[14] - 分配关键词的自定产品页无需审核即可上线[15] - 功能将提供搜索流量数据追踪,建议为不同语言和页面分配唯一关键词[16] 截图关键词可能影响搜索 - 业内猜测苹果可能通过OCR技术提取截图文本影响搜索排名[20] - 建议优化截图设计:使用高对比度文字、易识别字体、将关键词置于顶部/底部区域[21][23] - 每张截图聚焦单一关键词主题,避免信息堆砌[23] - 目前尚无官方证实,建议在优化主要元数据基础上小步测试[24] 辅助功能标签新增 - App Store新增辅助功能标签,涵盖旁白、更大字体等9大功能[25][27] - 开发者需根据实际功能选择标签,虚假标注可能影响审核[31] - 今年秋季起辅助功能标签将作为搜索词,影响应用曝光[31] - 功能目前处于Beta测试阶段,今年晚些时候全面开放[30]
IPO周报 | 影石创新登陆科创板;曹操出行、云知声通过港交所聆讯
IPO早知道· 2025-06-15 21:31
影石创新科创板上市 - 公司于2025年6月11日以股票代码"688775"在上海证券交易所科创板挂牌上市 成为A股"智能影像第一股" [3] - 本次科创板上市募资规模为19.38亿元 在今年上交所(主板+科创板)整体募资额排名第三 在科创板排名第一 [3] - 公司成立于2015年 专注于全景相机、运动相机等智能影像设备的研发、生产和销售 产品覆盖全景新闻直播、国防军事、政法警务等多个领域 [3] - 旗下品牌"Insta360影石"2023年全球市场占有率达67.2% 连续六年排名第一 预计2024年市占率将提升至81.7% [5] - 在运动相机领域 该品牌2023年全球排名第二 [5] - 公司创始人刘靖康表示未来将继续秉持"成为世界一流的智能影像品牌"的愿景 [5] 曹操出行港股通过聆讯 - 公司于2025年6月10日通过港交所聆讯 华泰国际、农银国际和广发证券(香港)担任联席保荐人 [7] - 业务覆盖136座城市 2024年新拓展85座城市 [7] - 2023年和2024年总GTV分别为122亿元和170亿元 同比增长37.5%和38.8% [7] - 按GTV计算 过去三年均位列中国网约车平台前三名 2024年市场份额升至行业第二 [7] - 2025年第一季度总GTV为48亿元 同比增长54.9% 订单量同比增长51.8% [7] - 截至2024年底拥有超过34,000辆定制车的车队 为中国同类车队最大 [7] - 2025年2月上线曹操智行自动驾驶平台 在苏杭两地试点Robotaxi服务 预计2026年底推出L4级Robotaxi定制车型 [8] - 2022-2024年营收分别为76.31亿元、106.68亿元和146.57亿元 2024年毛利率为8.1% 较2023年提升2.3个百分点 [8] 云知声港股通过聆讯 - 公司于2025年6月12日通过港交所聆讯 中金公司和海通国际担任联席保荐人 或将成为"港股AGI第一股" [11][12] - 作为中国AGI技术先行者 拥有自研大语言模型山海大模型(600亿参数) 在2024年MedBench评测中以82.2分位列第一 [12][13] - 智算集群拥有超过184 PFLOPS计算能力和10PB存储容量 [12] - 按2024年收入计算 是中国第四大AI解决方案提供商 在年收入超5亿元企业中增长第二快 [14] - 2022-2024年营收分别为6.01亿元、7.27亿元和9.39亿元 复合年增长率25% [14] - 2022-2024年毛利率分别为39.9%、40.5%和38.8% 经调整净亏损率从30.5%收窄至17.9% [14] - 2025年第一季度营收保持约25%同比增长 [15] 圣贝拉港股通过聆讯 - 公司于2025年6月9日通过港交所聆讯 瑞银集团和中信证券担任联席保荐人 [17] - 截至2025年6月3日拥有96家高端月子中心 包括62家自营中心和34家管理中心 [17] - 以2024年月子中心收入计算 是中国及亚洲最大的产后护理及修复集团 [17] - 2022-2024年营收分别为4.72亿元、5.60亿元和7.99亿元 [18] - 2023年实现扭亏为盈 经调整净利润2077万元 2024年增至4225万元 [18] - IPO前腾讯和高榕创投分别持股11.6%和8.3% 为前两大机构投资方 [19]
云知声通过港交所聆讯:将成「港股AGI第一股」,今年一季度营收同比增长25%
IPO早知道· 2025-06-12 23:06
公司概况 - 云知声是亚洲最早将AI大语言模型商业化的公司之一,成立于2012年,专注于交互式AI研发[2] - 公司已通过港交所聆讯,或将成为"港股AGI第一股",中金公司和海通国际担任联席保荐人[2] - 拥有自研大语言模型山海大模型(600亿参数),计算能力超184 PFLOPS,存储容量超10PB[3] 技术优势 - 2016年建立Atlas AI基础设施,支持机器学习任务动态调度算力[3] - 山海大模型在MedBench评测中综合得分82.2位列第一,SuperCLUE报告总分72位居全球第一梯队[3] - 早期将深度学习应用于语音识别,并推动CNN、GAN、RL等算法的商业应用[4] 市场地位 - 按2024年收入计算是中国第四大AI解决方案提供商,生活AI解决方案排名第三,医疗AI排名第四[4] - 中国AI解决方案市场规模预计从2024年1804亿元增至2030年11749亿元(CAGR 36.7%)[2] 商业化进展 - 采用"灯塔客户"战略,合作头部企业如格力、平安科技、北京协和医院、中国人保等[5] - 2022-2024年营收CAGR 25.0%(6.01亿→7.27亿→9.39亿元),毛利率稳定在38.8%-40.5%[5] - 2024年经调整净亏损率从2022年30.5%收窄至17.9%,2024Q1营收同比增长约25%[5][6] 资本运作 - 获启明创投、挚信资本、京东、中金、高通等机构投资[7] - IPO募资将用于研发能力提升、新兴商业机会投资、国际扩张及营运资金[7]
研判2025!中国自然语言处理行业产业链、相关政策及市场规模分析:技术突破推动行业增长,低成本算力与小样本学习加速技术落地[图]
产业信息网· 2025-06-08 10:10
行业概述 - 自然语言处理(NLP)是计算机科学与人工智能的重要分支,旨在实现计算机对人类语言的理解、解释和生成,广泛应用于搜索、翻译、语音交互等场景 [2] - NLP技术类型分为基于规则的方法、统计方法和深度学习方法三大类 [2] - 2024年中国NLP行业市场规模约为126亿元,同比增长14.55% [1][15] 行业发展历程 - 萌芽期(20世纪50-60年代):以机器翻译为起点,基于简单规则实现单词级处理,受限于计算能力和数据规模 [4] - 规则主导期(20世纪70-80年代):手工构建复杂规则系统,涉及语法分析与引用处理,但规则灵活性不足问题显现 [4] - 统计学习期(20世纪90年代-2012年):统计模型与机器学习结合,利用大规模语料库提升性能,神经语言模型和词嵌入概念奠定深度学习基础 [5] - 深度学习期(2013年至今):深度学习模型(如RNN、LSTM、Transformer)与预训练语言模型(如BERT、GPT)主导,推动NLP性能跃升 [6] 行业产业链 - 上游包括硬件设备(高性能服务器、GPU、TPU等)、数据服务、开源模型、云服务等 [8] - 中游为NLP技术研发环节 [8] - 下游应用领域包括金融、医疗、教育、智能制造等行业 [8] - 2024年中国云服务市场规模约为5326.5亿元,同比增长11.95%,为NLP行业提供弹性计算资源 [10] 相关政策 - 2025年3月,教育部等部门印发《关于加强数字中文建设 推进语言文字信息化发展的意见》,提出到2027年建成国家语言文字大数据中心,到2035年提升中文在数字空间的使用占比 [12] - 2024年1月,工信部等七部门发布《关于推动未来产业创新发展的实施意见》,明确利用人工智能等技术支撑新型工业化 [14] - 2024年6月,工信部发布《国家人工智能产业标准化体系建设指南(2024版)》,提出制定50项以上自然语言处理相关标准 [14] 重点企业经营情况 - 百度集团:NLP技术覆盖机器阅读理解、跨模态交互等前沿方向,文心ERNIE 3.0刷新54个中文NLP任务基准,2024年总营收1331亿元 [17][21] - 科大讯飞:智能语音技术全球领先,AI学习机、智医助理等产品市场占有率领先,发布"讯飞超脑2030计划" [17][20] - 阿里巴巴:达摩院推动NLP技术突破,发布"通义千间"大模型,技术深度融入电商、金融场景 [17][20] - 拓尔思:聚焦智能风控、智能消保等金融场景,覆盖5大国有银行,2025年一季度营收1.25亿元,同比下降29.89% [18][20] 行业发展趋势 - 大模型与多模态融合:预训练语言模型参数量级跃升至万亿级,跨模态语义理解技术成为研发重点 [24] - 垂直领域深化与智能硬件融合:NLP技术深度融入医疗、金融、教育等行业,智能硬件渗透率达62% [25][26] - 数据安全与伦理规范:《数据安全法》与《个人信息保护法》推动NLP企业建立数据合规使用框架,推动"可信AI"演进 [27]
Gemini2.5弯道超车背后的灵魂人物
虎嗅· 2025-06-05 11:14
Gemini 2.5 Pro崛起背后的底层逻辑 - 大语言模型训练的核心步骤包括预训练、监督微调和对齐阶段,过去一年行业重点转向对齐阶段,特别是强化学习方向的探索[2] - Google在Gemini系列迭代中积累了坚实的基座模型训练经验,并更加重视强化学习的作用,引入"让AI批判AI"的机制[3] - 编程能力成为各家模型竞争焦点,Anthropic在预训练阶段优先投入高质量代码数据,使其在代码生成质量上领先[4][5] - Google通过整合预训练和强化学习优势,在Gemini 2.5中实现编程和数学等高确定性任务的突破性表现[3][11] - 模型能力差异源于数据配比和训练优先级选择,Anthropic专注编程导致其他能力稍弱,OpenAI侧重人类偏好输出[5][10] Google技术团队与资源整合 - Google DeepMind由Jeff Dean、Oriol Vinyals和Noam Shazee三位专家形成技术铁三角,分别代表预训练、强化学习和自然语言处理能力[15] - Google Brain与DeepMind合并实现强强联合,前者擅长大规模资源调度和预训练,后者专精强化学习[16][17] - Sergey Brin回归带来"Founder Mode",显著提升团队士气和工作强度,推动Gemini快速迭代[19][20] - Google拥有全球最强计算资源、人才储备和近乎无限的资源投入能力,为Gemini快速反超奠定基础[20] Google的API价格优势 - Google十年前开始布局TPU生态,避免依赖NVIDIA GPU并节省"NVIDIA税"[22] - 基础设施能力远超同行,拥有动态调度大规模集群的独家优势,OpenAI等仍需依赖第三方云服务[22][23] - 软硬件一体化优化能力使Google在成本控制上具备天然优势,API定价策略具有显著竞争力[22][23] - 行业数据显示AI服务存在高溢价空间,Google凭借规模效应可承受更低利润率[23][24] 行业竞争格局演变 - OpenAI早期凭借人类偏好输出领先,Anthropic通过代码能力突破建立优势,Google最终以推理能力实现反超[10][11] - 模型能力发展呈现螺旋式上升,各家在不同领域轮流领跑:写作→代码→推理[10][11] - XAI的Grok在数学领域表现突出,反映创始团队背景对模型特化能力的影响[12] - 编程能力商业化成为焦点,Anthropic明确追求生成可直接投入生产的代码而不仅是解题[12]
消失的人工客服,“智障”的AI客服
36氪· 2025-06-04 18:33
AI客服行业现状 - AI客服在电商、金融、物流、教育、通信、医疗等行业广泛应用,但存在沟通不畅、答非所问、转接人工客服难等问题,损害消费体验[1] - 2024年电商售后服务领域与"智能客服"相关的投诉同比增长56.3%[2] - 30款互联网App实测显示40%无法接通人工客服,接通后超半数需12分钟以上响应[3] AI客服主要痛点 - 无法解决个性化问题、回答生硬机械、不能准确理解提问是用户最不满的三大缺点[2] - 30.98%用户反映智能客服无法照顾老年人、残障人士等特殊群体[2] - 用户需刻意调整说话方式(如咬字清晰)才能与AI客服沟通,稍有不慎即导致理解错误[2] 企业服务策略问题 - 部分企业将AI客服作为削减成本工具,背离"以用户为中心"宗旨[6] - 技术应用存在服务逻辑悖论:用户拨打语音客服时通常问题较复杂,而AI客服应对能力不足[7] - 缺乏有效人工客服转接通道,仅11%App能在4分钟内接通人工服务[3] 技术改进方向 - 需通过优化算法、扩充语料库、提升自然语言处理能力强化AI客服技术[7] - "智能体"技术可提升多系统串联能力(如旅游平台整合机票、酒店等数据)[7] - 应明确AI客服适用场景边界,标准化服务可通过App等渠道完成[7] 消费者行为反馈 - 实测显示消费者明显倾向选择纯人工客服(假设企业同时提供两种服务时)[2] - 中老年用户因操作困难已放弃使用客服热线[5] - 当前AI客服仅代表高效而非优质服务,实际能力与宣传存在差距[5]
微信ai客服怎么处理咨询?哪里查看记录?
搜狐财经· 2025-06-04 17:36
微信AI客服的核心功能 - 微信AI客服通过自然语言处理技术识别和理解客户问题,实现高度自动化咨询处理 [4] - 系统从知识库搜索相关答案并以友好方式回复,复杂问题可转接人工客服确保满意度 [4] - 全程记录咨询详情(时间/内容/结果)用于后续服务分析与改进 [4] 咨询记录管理 - ChatWave后台提供按时间排序的完整互动记录,支持客户名称/咨询日期/问题类型等多维度筛选 [5] - 记录分析可评估AI回答准确率,识别知识库优化需求及客户关注热点 [5] 服务优化策略 - 定期更新知识库内容以适应业务变化和客户需求演进 [6] - 通过数据分析工具挖掘咨询记录中的客户行为模式,指导服务策略调整 [6] - 结合用户反馈优化对话流程设计,提升应答自然度与需求贴合度 [6] ChatWave的差异化优势 - 具备多轮对话能力和精准意图识别的自然语言处理技术 [7] - 自动化功能显著提升效率,减少人工客服工作量 [7] - 深度咨询数据分析为企业提供产品服务优化洞察 [7] - 本地私有AI知识库与定制化语音回复强化数据安全与个性化服务 [1]
给“开盒”上锁是平台的能力试金石
经济观察报· 2025-05-28 14:36
网暴治理与平台责任 - 平台需将网暴治理内化为自觉行动,而非仅应对监管要求,这关乎平台生态存亡[1][6] - 中央网信办专项治理"开盒"乱象,要求重点平台以"零容忍"态度打击,凸显整治决心[2] - "开盒挂人"形成完整黑产链条,包含人肉搜索、隐私泄露和群体围攻,破坏性远超传统网暴[2] 平台治理失责表现 - 信息推送机制偏好争议内容助长攻击性言论传播[3] - 用户身份审核漏洞为匿名攻击提供便利[3] - 投诉响应滞后导致违法信息清除不及时,部分平台或与"毒流量"存在利益共生[3] - 典型案例显示平台因处置不力被判赔8000元,3家大型平台因类似问题被处罚[3] 治理机制优化方向 - 需从运动式清理转向常态化治理,提升"开盒"防治优先级[3] - 平台应超越"通知-删除"义务,建立事前预防和事中干预机制,落实主体责任[4] - 中央网信办2022年提出建立网暴预警机制,相关法规明确平台需建立预警模型[4] 技术防御与用户保护 - 需采用NLP情感分析、异常行为监测等技术精准拦截隐晦攻击内容[5] - 建立平台间风险信息共享库提高黑产跨平台操作门槛[5] - 设置快速举报入口,提升受害者请求处理优先级,优化"一键防暴"功能设计[5] - 抖音已将可能诱发网暴的信息纳入争议热点处置,实施流量降热和冷静机制[5]
腾讯申请一种文本处理模型训练等专利,提升模型改写能力
金融界· 2025-05-28 12:44
公司专利技术 - 腾讯科技申请了一项名为"一种文本处理模型训练、文本处理方法、装置及电子设备"的专利,公开号CN120045650A,申请日期为2023年11月 [1] - 专利涉及自然语言处理技术领域,通过获取样本会话数据并输入第一文本处理模型,生成标注改写关联数据,进而构建改写训练集 [1] - 方案采用第二文本处理模型(数据量小于第一模型)进行训练,目标为提升改写训练集构建效率和质量,同时增强模型改写能力 [1] 公司背景信息 - 腾讯科技成立于2000年,位于深圳市,主营业务为软件和信息技术服务业,注册资本200万美元 [2] - 公司对外投资15家企业,参与招投标项目254次,拥有商标信息5000条,专利信息5000条,行政许可439个 [2] 数据来源 - 信息源自金融界,作者为情报员 [3]
小红书高级副总裁汤维维: 从“文字转换”到“文化解码”的跨越
深圳商报· 2025-05-28 04:29
小红书国际文化交流与技术突破 - 2025年1月大量海外用户涌入小红书平台,引发跨文化交流现象,包括宠物互动、语言学习、中餐教学等内容 [1] - 语言障碍成为核心挑战,用户高频提出翻译需求,如"一键翻译"功能和文字识别需求 [1] - 公司迅速响应,数天内通过技术迭代上线"一键翻译"功能,实现英语评论自动转中文,减少用户跨应用操作 [1] 技术实现与文化解码 - 翻译功能采用多模态AI模型,整合NLP、OCR、CV技术,能解析文字及表情包谐音梗等非结构化内容 [1] - 建立动态学习机制,用户对译文的编辑行为持续优化模型,尤其在宗教符号、历史典故等文化敏感领域实现渐进式改进 [1] - 技术目标从"文字转换"升级至"文化适配",覆盖千年历史的阿姆哈拉语和网络热梗等多样性内容 [1] 平台战略与行业意义 - 公司将跨语言能力定位为基础设施级服务("水电煤"),通过技术+人文驱动构建无国界社交平台 [2] - 实践验证技术融合人文可突破文化边界,案例体现行业在AI社交领域的创新方向 [2]