Natural Language Processing

搜索文档
报名倒计时|探索外汇、固收及贵金属领域量化交易新机遇
Refinitiv路孚特· 2025-07-29 14:03
Tick History解决方案 - 数据库覆盖全球500家交易所的1亿多种工具 历史数据可追溯25年 包含87万亿笔成交记录[2] - 基于云的历史实时定价数据服务 涵盖500+交易场所和第三方报价商 数据量超过45PB[3] - 提供标准化处理后的跨交易所一致性数据 同时支持原始格式数据查看[3] - 核心解决方案包括数据包抓取(PCAP) 规模达20PB的高质量全球市场数据存储库[4] - 支持Google BigQuery快速查询 可在几分钟内访问分析海量数据[5] - Tick History Workbench提供标准工具 专注分析市场微观结构 交易策略和执行质量[6] MarketPsych分析与模型 - 提供基于AI的自然语言处理(NLP)解决方案 包括数据源和预测分析模型[8] - 独家合作利用尖端语言分析技术 从实时多语言新闻 社交媒体和金融文件中提取洞察[8] - 数据数字化服务可将各类资产的情绪转化为机器可读的价值信号[9] - 编辑语言框架可测量新闻和社交媒体中的情绪 金融语言和主题[10] - 应用场景包括交易策略创建 波动预测 事件监测和宏观经济预测[11][13]
浙大校友打造AI代码测试神器,零代码零bug,30分钟创建网站
量子位· 2025-07-24 09:18
产品功能与性能 - TestSprite 2.0是行业首个专为AI编程设计的智能测试平台,可实现零代码、零bug,30分钟创建完整网站[1][3][13] - 平台能自动生成测试报告、调试并修复错误,全程无需人工干预[4][5][15] - 在Trae开发平台上表现尤为惊艳,可自动完成测试用例生成、测试代码编写、脚本编译、云端并行执行测试及返回结构化报告等全流程[11][12] - 引入调度和监控功能,支持持续测试场景,通过智能测试清单与批处理模块将混乱测试转化为结构化工作流[17] - 全域智能调度引擎实现跨时区多频率自动化测试,实时推送QA预警及故障分析[17] 技术突破与行业影响 - 将AI写代码准确率从行业平均42%提升至93%,实现翻倍增长[2][18][19] - 通过审查需求文档、描述符和代码库生成标准集成测试计划,验证开发意图实现情况[9][10] - 结构化报告清晰标注功能通过/缺失/Bug情况,帮助团队精准优化[10] - 2025年90%的web开发人员使用AI生成代码,TestSprite解决行业代码质量痛点[18][19] 公司发展与融资 - 公司由浙大校友焦云皓2024年在西雅图创立,致力于通过AI测试缩短软件发布周期高达十倍[25][31] - 2024年4月发布测试版,11月获150万美元种子轮融资,投资方包括Techstars Mobility Accelerator等顶级机构[32] - 2025年1月发布1.0正式版,7月完成2.0重大升级,Starter版本提供1个月免费试用后月费19美元[34] - 目前已获6000多个开发团队采用[21] 创始人背景 - 创始人焦云皓本科就读浙江大学,后获耶鲁大学计算机科学硕士学位[25] - 2015年起专注NLP研究,曾在WWW2018发表关于对话系统优化的论文[27] - 2014-2019年任职亚马逊,担任AWS与Amazon Business软件开发工程师[29] - 曾参与编写面向高中生的人工智能教材,负责神经网络与模式识别章节[30]
Eviden sets the stage for AtLaS, the European Defence Fund challenge on Human Language Technology processing
Globenewswire· 2025-07-22 16:35
项目概述 - Eviden被欧盟委员会选中为AtLaS项目提供技术平台,该项目由欧洲国防基金资助,专注于国防领域的人类语言技术(HLT)发展 [1] - AtLaS项目结合人工智能(AI)和自然语言处理(NLP)技术,旨在处理低质量和多语言数据,提升国防通信和情报收集能力 [2] - 项目目标包括开发抗噪声和多语言处理的弹性系统,并建立欧洲语言技术库 [2] 技术细节 - Eviden将提供BARTENDER软件,支持数百种语言的自然语言处理 [1] - 项目评估自动语言处理(ALP)解决方案,解决不同方言和语言在恶劣环境下的处理问题 [3] 公司背景 - Eviden是Atos集团旗下品牌,专注于先进计算、网络安全产品、关键任务系统和视觉AI,年收入约10亿欧元 [6] - Eviden在36个国家运营,拥有4,200名员工和2,100项专利 [7] - Atos集团是全球数字化转型领导者,年收入约100亿欧元,在68个国家运营,拥有72,000名员工 [8] 行业影响 - 欧洲国防基金支持成员国公司开发创新和互操作的国防技术 [5] - Eviden通过其在系统集成和人类语言处理方面的专业知识,为国防领域提供关键技术支持 [3]
Viewbix: Metagramm Unveils AI-Powered Grammar Solution for Enterprises Seeking Secure, Private, and Customized Language Models
Globenewswire· 2025-07-11 19:32
文章核心观点 - 全球广告技术创新技术开发商Viewbix旗下子公司Metagramm推出面向大型组织的新型先进本地语法引擎,该引擎将在六个月内推出,具有数据隐私、准确性高等优势 [1][3] 分组1:公司介绍 - Metagramm专注开发利用人工智能、机器学习和自然语言处理技术的高级写作辅助工具,旗舰产品Bubbl可提供个性化定制文本 [5] - Viewbix通过子公司开展数字广告业务,有搜索和数字内容两大活动,其技术工具可让广告商和网站所有者从广告活动中获利 [6] 分组2:语法引擎特点 - 本地部署,确保数据隐私和控制,无需外部数据共享 [8] - 定制语言模型,基于用户自身文档、邮件和通信指南进行训练 [8] - 企业级准确性,针对特定行业语言进行语法、语气和风格校正 [8] - 安全集成,可与文档管理、内部网平台和邮件服务器等内部系统无缝连接 [8] - 多语言支持,具备本地化语法智能,支持多种语言 [8] 分组3:语法引擎适用行业 - 适用于金融、法律、医疗和政府等对安全、精确通信要求高的行业 [8]
抱团取暖的日本AI半吊子们
虎嗅· 2025-05-09 18:07
真AI企业特征分析 - 核心产品基于AI算法:依赖深度学习、NLP、生成模型等技术,有自研模型和AI框架 [1] - 产品通用性和扩展性:技术具备通用性,有API、SDK或开放平台,可迁移到多行业 [1] - 具备自主学习能力:能实现学习、推理、生成代码等类人智能任务 [1] - 技术定位与商业化模式:输出AI技术本身(如芯片、框架、模型)作为商品,具备技术壁垒 [1] Preferred Networks公司概况 - 成立于2014年,开发了深度学习框架Chainer [3] - 产品通用性强:覆盖工业自动化、医疗、材料科学、自主移动机器人、教育等多个领域 [4] - 主要产品包括Matlantis(新材料探索模拟器)、Visual Inspection(外观检测软件)、生成AI产品、自主移动机器人Kachaka等 [5] - 拥有435项专利,其中287项有效,涵盖213个专利族 [6] - 研发了日本第一个大语言模型PLaMo,专注于日语和日本文化 [6] Preferred Networks的发展特点 - 国际化受阻:从PLaMo推出开始显现本土化倾向 [7] - 创始团队主要为日本工程师,文化相对保守,对公开分享代码和技术谨慎 [8] - 融资方式特殊:只拿CVC(企业风险投资),主要投资方为丰田、日产、NTT等日本大企业 [9] - 放弃自研框架Chainer,转向与PyTorch合作 [12] - 2024年创办子公司Preferred Elements,专注于基础技术平台 [14] 日本AI行业其他代表企业 - PKSHA Technology:2012年创办,2017年IPO,2024年迁移到Prime市场 [22][23] - 盈利能力突出:2024年营业收入160亿日元,营业利润31.5亿日元 [25] - 主要产品为"应用型AI",依赖传统机器学习方法,不擅长自主学习/生成能力 [26] - 客户涵盖零售、汽车、保险、教育等多个行业 [25] 日本AI行业生态 - "国家队"组织:METI牵头与Tenstorrent合作,计划派遣200名工程师赴美培训 [34] - 学术核心人物:东京大学教授杉山将(理论派)和松尾丰(产业推动者) [37] - 大公司AI部门:NEC、NTT、富士通、日立等主要服务于政府和B2B业务 [38] - 政府机构角色:NEDO主导技术研发拨款,内阁府推动"可信AI",经济产业省支持AI创业 [39] 日本AI行业特点总结 - 形成自给自足闭环:创业公司服务于大公司,大公司服务于政府 [44] - 融资结构特殊:创业公司主要依赖CVC支持,难以摆脱大公司影响 [44] - 项目制导向:大公司和政府客户偏好定制化服务,抑制通用型产品发展 [44] - 文化因素:国民生活舒适度高,缺乏颠覆式创新动力 [45][46]
Performant Financial (PFMT) - 2025 Q1 - Earnings Call Transcript
2025-05-09 06:00
财务数据和关键指标变化 - 2025年第一季度公司总营收3330万美元,同比增长22%;若排除上一年同期150万美元的客户服务收入,营收增长近30% [17] - 第一季度运营费用约3300万美元,较去年同期增加约200万美元,主要因新业务实施和技术投资 [23] - 第一季度调整后EBITDA为330万美元,而2024年第一季度调整后EBITDA亏损120万美元 [5][24] - 第一季度现金流为正140万美元,而去年同期为负360万美元 [26] - 提高2025年全年营收和调整后EBITDA指引,营收指引提升至1.33 - 1.35亿美元,调整后EBITDA指引提升至900 - 1000万美元 [27] 各条业务线数据和关键指标变化 索赔审计业务 - 第一季度索赔审计业务收入1710万美元,同比增长38%,在商业审计领域赢得新业务并实现业务拓展 [18] 资格认证业务 - 第一季度资格认证业务收入1610万美元,同比增长约20%,商业客户贡献显著,CMS MSP合同表现符合预期 [19] 商业业务 - 第一季度实施13个商业项目,预计稳态年化收入达450 - 500万美元;第二季度实施团队将专注纽约州RAC合同,预计商业实施会暂时下降,但全年商业预期不变 [8][20][21] 各个市场数据和关键指标变化 - 商业市场是公司最大机会,商业客户面临患者病情加重和利用率增加的挑战,公司技术驱动和以客户为中心的方法得到认可,商业管道持续扩张 [8] - CMS RAC地区业务量在第一季度出现反弹,公司对CMS重视RAC计划持乐观态度 [19] 公司战略和发展方向和行业竞争 - 公司战略是推进技术发展,优先发展以客户为中心的合作伙伴关系,通过战略投资赢得新业务,实现可持续、盈利的长期增长 [7] - 公司核心业务为索赔审计和资格认证,资格认证业务自2017年签约首个客户后快速发展,通过严格的质量控制和数据丰富工作,取代了一些传统供应商 [12][13] - 公司在政府业务方面保持与CMS和HHS的长期合作关系,虽未入选CMS RAC部分地区采购,但将资源重新分配到更具价值的商业业务 [9][10] - 行业处于关键转折点,对医疗支付诚信服务的需求迫切,公司服务能为客户带来可衡量的投资回报率,在经济压力时期更具优势 [6][12] 管理层对经营环境和未来前景的评论 - 公司第一季度业绩出色,增强了调整全年指引的信心,预计未来各季度EBITDA为正并实现自由现金流 [5][25] - 公司认为销售和实施周期在2024年行业干扰后正趋于正常化,商业市场机会大,纽约州Medicaid RAC项目进展顺利,有望实现两位数年化收入 [8][9] - 公司业务受关税压力影响不大,因其收入100%来自国内,费用结构不依赖外国商品或服务,联邦合同成本结构也为100%国内 [22] 其他重要信息 - 公司在项目Touring方面进行技术投资,通过整合人工智能和自然语言处理技术,提高流程效率和准确性,这是长期利润率提升战略的关键 [23][24] 总结问答环节所有的提问和回答 问题1: 本季度索赔服务收入增长快于资格认证收入的主要驱动因素是什么,以及如何看待未来的收入组合? - 主要驱动因素可能是一到两年前的实施项目更多倾向于索赔业务;公司预计业务两侧将实现平衡增长,商业资格认证业务增长强劲,成熟的CMS合同为资格认证业务增长提供支撑 [30][31] 问题2: 调整后EBITDA指引暗示年中会下降,预计下降幅度有多大? - 公司仍致力于每个季度实现正的调整后EBITDA,不会出现亏损;下降主要是由于对纽约RAC项目的投资和RAC Region 5业务的减少 [33] 问题3: 项目Touring和其他技术举措的实施进展如何,预计何时开始看到这些投资的回报? - 本季度已开始进行初始产品集成,2025年将逐步投入运营,提高效率并推动EBITDA利润率扩大 [34]
EXL named a Leader and Star Performer in Everest Group Payment Integrity Solutions PEAK Matrix® Assessment 2025
Globenewswire· 2025-05-05 22:32
文章核心观点 - EXL被评为Everest Group 2025年支付完整性解决方案PEAK Matrix评估的领导者和明星表现者,凭借其多样化、适应性强且集成先进技术的支付完整性解决方案,满足行业不断变化的需求 [1][2][4] 公司信息 - EXL是一家全球数据和人工智能公司,成立于1999年,总部位于纽约,约有6万名员工,为多个行业的企业提供服务和解决方案,核心价值观包括创新、协作、卓越、诚信和尊重 [5] - Everest Group是一家全球领先的研究公司,其PEAK Matrix评估能为企业提供分析和见解,帮助做出关键决策,服务提供商也可借此评估自身产品 [6] 评估情况 - Everest Group对24家支付完整性解决方案提供商进行详细分析,根据愿景、能力和市场影响评估企业,通过年度行业调查、客户参考检查和市场分析确定企业定位 [3] - EXL因多样化、适应性强且集成生成式AI、自然语言处理和机器学习的支付完整性解决方案参与模式获认可,能提供端到端支付完整性结果,用于增强索赔验证、欺诈检测和覆盖差距分析 [2] 行业趋势 - 支付完整性市场正从支付后恢复转向主动的支付前准确性,由人工智能驱动的欺诈检测、实时索赔验证和预测风险建模推动 [4] 公司举措与展望 - EXL针对行业需求变化推出近乎实时的供应商人口统计和数据完整性监测解决方案,并采用基于结果的定价模式,获得更好的客户反馈 [4] - EXL总裁表示公司连续第二年获Everest Group领导者称号并成为明星表现者,未来将进行新投资,为客户提供更强大、完全透明的支付完整性解决方案 [3]
ICLR 2025 Oral|差分注意力机制引领变革,DIFF Transformer攻克长序列建模难题
机器之心· 2025-04-28 16:04
Transformer架构的局限性 - 传统Transformer架构在自然语言处理领域取得巨大成功,但在处理长文本、关键信息检索及对抗幻觉等任务时表现受限,主要因过度关注无关上下文[2] DIFF Transformer的创新架构 - DIFF Transformer由微软和清华团队提出,基于差分注意力机制,通过计算两组Softmax注意力图的差值放大关键上下文关注并消除噪声干扰[3][8] - 核心数学表达式为差分注意力公式,采用可学习标量参数调节两组注意力图权重[9][10] - 引入多头机制提升表达能力,每个头独立计算差分注意力并拼接输出,采用RMSNorm保持梯度一致性[15][16] DIFF Transformer的性能优势 - 语言建模效率显著提升:仅需65%参数规模或训练数据量即可达到与传统Transformer相当性能,如6.8B参数DIFF Transformer性能对标11B参数Transformer[4][21] - 长文本建模能力突出:在64K上下文长度下,累积平均负对数似然指标全面优于Transformer[23] - 关键信息检索准确率大幅提高:在64K上下文中,答案位于25%深度时准确率比Transformer高76%[25] - 数学推理能力领先:20B token微调后准确率差距达11%,第二阶段蒸馏后平均准确率再提升7.5%[35][37] 跨任务与跨模态潜力 - 在幻觉评测中表现优异:文本摘要任务准确率提升最高达0.19(XSum数据集),问答任务提升0.11(Qaspe数据集)[32] - 激活值异常减少:注意力激活值Top-1最大激活值比Transformer低8倍,更适配低比特量化[33] - 初步验证跨模态适用性:DiffCLIP研究已扩展至视觉与多模态领域,显示通用潜力[41] 行业影响与未来方向 - 获ICLR 2025 Oral论文收录(入选率1.8%),集成至Hugging Face transformers库引发广泛讨论[5][40] - 未来可探索低比特注意力算子设计、键值缓存剪枝及多模态应用[41]