Workflow
Marco
icon
搜索文档
阿里国际AI进展:日均调用量已破10亿次
财经网· 2025-07-27 16:52
公司AI解决方案获奖 - 阿里国际跨境电商AI解决方案Marco获2025世界人工智能大会SAIL之星奖,成为该领域首个获奖者 [1] - Marco支持30余种语言,覆盖电商全链路60+场景,从生成式大模型到AI agent [1] - 该解决方案成本低于主流大模型,为商家解决营销、合规、售后等问题 [1] AI服务调用量增长 - 阿里国际AI服务日调用量突破10亿次(截至2025年7月),相比2023年的100万次实现大幅增长 [1] - 公司旗下所有电商平台均已接入AI解决方案 [1] - 外部伙伴AI调用量增长23倍,头部跨境电商服务商如店小秘、三态等均已接入 [1] 商家高频使用AI功能 - 商家使用频次最高的AI功能:图文翻译、图像识别完善商品信息、营销文案生成 [1] - 翻译功能已全面从小模型转向大模型,欧洲TOP语种消费者满意度提升30% [1] - AI提供的SEO占整体SEO近40%,未来有望达到50%以上 [1] AI技术应用进展 - 公司从生成式大模型进入AI agent时代,推出智能退款agent、海关编码agent、在线招商agent [2] - 智能退款agent降低商家15%退款成本,海关编码agent准确率提升23%,在线招商agent邮箱有效率提升近一倍 [2] - AI核心技术已开源,包括大语言模型Marco、多模态模型Ovis、Agentic ADK框架等 [2] 行业技术趋势 - AI使用方式发生变化:通过场景构造和训练闭环提升推理模型效果 [2] - 行业正从生成式大模型向垂直agent解决方案转型 [2]
阿里国际AI解决方案Marco获世界人工智能大会SAIL之星
观察者网· 2025-07-27 11:58
奖项与认可 - 阿里国际跨境电商AI解决方案Marco荣获2025世界人工智能大会SAIL之星奖,成为该领域首个获奖者 [1] - Marco由阿里国际AI Business团队研发,支持30余种语言,覆盖电商全链路60+场景 [1] - 日均调用量达10亿次,是2023年的1000倍,所有能力可在阿里国际AI开放平台Aidge上试用 [1] 技术与应用进展 - 阿里国际数字商业集团2023年4月成立AI Business部门,专注于全球化电商场景AI技术探索 [3] - 旗下所有电商平台均已接入AI解决方案,商家高频使用功能包括图文翻译、商品信息完善、营销文案生成 [3] - 翻译功能已全面从小模型转向大模型,欧洲TOP语种消费者满意度提升30% [3] - AI提供的SEO占比近40%,未来有望达到50% [3] - 外部伙伴AI调用量增长23倍,头部跨境电商服务商如店小秘、三态等均已接入 [3] - AI服务调用量每两个月翻一番,跨境电商成为首个实现规模级AI应用的行业 [3] - 核心技术已开源,包括大语言模型Marco、多模态模型Ovis、Agent应用开发框架Agentic ADK等 [3] 技术架构与性能 - 基础设施层推理引擎MarsEngine在翻译场景极限吞吐比业界SOTA引擎最高提升116%,实时场景延迟低至其他引擎的8% [5] - 数据层构建了大规模数据采集处理平台及工业级评测框架 [5] - 模型层包括多语言增强的Marco-LLM文本大模型、电商优化翻译大模型Marco-MT、自研多模态理解模型Ovis及图像生成模型 [5] - 产品层提供标准化业务场景能力 [5] - AI解决方案层提供高价值场景端到端能力 [5]
首个AI翻译实战榜单出炉!GPT-4o稳坐天花板,文化方面Qwen系列一马当先丨开源
量子位· 2025-05-23 08:24
核心观点 - 首个应用型AI翻译测评榜单TransBench上线,由阿里国际AI Business团队联合上海人工智能实验室、北京语言大学共同发布,旨在通过新增幻觉率、文化禁忌词、敬语规范等指标重新定义翻译测评标准 [1][2][3][32] - TransBench评测体系从"通用标准""电商文化""文化特性"三大维度构建,数据集涵盖中英法日韩西等多语言并持续更新小语种,评测方法与数据已全面开源 [5][6][7][8][44] - 首期测评结果显示GPT-4o在英语翻译综合得分领先,DeepSeek-V3在中文翻译综合得分第一,阿里Qwen系列在文化特性维度表现突出 [14][16][20][23][24][26] - 阿里国际自研翻译大模型Marco MT日均调用量达6亿次,其真实用户反馈成为TransBench测评体系构建基础 [39][40][41] 评测体系创新 - 新增幻觉率、鲁棒性评测,解决大模型翻译中"编造内容"问题 [3][34] - 首次针对电商等垂直行业构建评测数据,采用真实场景反馈和专家标注训练行业打分模型 [4][35] - 首创文化禁忌和敬语规范评测标准,覆盖跨文化场景下的用户体验痛点 [36][38] 首期测评结果 英语翻译能力 - **综合得分前三**:GPT-4o(51.596)、DeepL Translate(49.855)、GPT-4-Turbo(47.753)[16] - **电商行业前三**:Qwen2.5-0.5B-Instruct(0.488)、Qwen2.5-1.5B-Instruct(0.451)、EuroLLM-1.7B-Instruct(0.377)[19] - **文化特性前三**:GPT-4o、DeepL Translate、GPT-4-Turbo [20] 中文翻译能力 - **综合得分前三**:DeepSeek-V3(4.420)、Gemini-2.5-Pro(4.391)、Claude-3.5-Sonnet(4.377)[23] - **文化特性前三**:Qwen2.5-0.5B-Instruct、Llama-3.3-70B-Instruct、Qwen2.5-1.5B-Instruct [24] - **电商行业第一**:DeepSeek-V3(4.420)[25] 阿里国际业务关联 - 旗下AliExpress等电商平台覆盖200+国家地区,多语言翻译需求驱动AI技术投入 [42] - AI Business部门已服务超50万卖家,形成全球化电商AI应用规模效应 [43] - 2026届校招80%岗位为AI相关,包括算法、研发、产品经理等方向 [45]
首个AI翻译实战榜单出炉!GPT-4o稳坐天花板,文化方面Qwen系列一马当先丨开源
量子位· 2025-05-22 22:24
TransBench评测体系发布 - 首个应用型AI翻译测评榜单TransBench在OpenCompass上线 由阿里国际AI Business团队联合上海人工智能实验室、北京语言大学共同发布[1][2] - 与传统测评体系相比新增幻觉率、文化禁忌词、敬语规范等指标 专门针对大模型翻译易出错的关键问题[3] - 评测方法与数据集已全面开源 首期测评结果已发布[5] 评测维度与数据集 - 数据集涵盖中、英、法、日、韩、西班牙等多种语言 并持续更新海量小语种[6][7] - 根据"通用标准""电商文化""文化特性"三大类整理不同数据集[8] - 从"综合得分""通用标准""电商文化""文化特性"四个维度对模型翻译能力打分[9] 英语翻译评测结果 - 综合得分和通用标准前三:GPT-4o(51.596)、DeepL Translate(49.855)、GPT-4-Turbo(47.753)[16] - 电商行业前三:Qwen2.5-0.5B-Instruct(0.488)、Qwen2.5-1.5B-Instruct(0.451)、EuroLLM-1.7B-Instruct(0.377)[19] - 文化特性前三:GPT-4o、DeepL Translate、GPT-4-Turbo[20] 中文翻译评测结果 - 综合得分和通用标准前三:DeepSeek-V3(4.420)、Gemini-2.5-Pro(4.391)、Claude-3.5-Sonnet(4.377)[23] - 电商行业第一:DeepSeek-V3(4.420)[25] - 文化特性前三:Qwen2.5-0.5B-Instruct、Llama-3.3-70B-Instruct、Qwen2.5-1.5B-Instruct[24] 评测标准创新 - 三大创新维度:全面的通用标准(含幻觉率和鲁棒性)、行业垂直标准、跨文化特性标准[33][35][36] - 首次提出文化禁忌和敬语规范评测 数据来自行业真实场景反馈[4][38] - 基于阿里国际Marco MT翻译大模型日均6亿次调用的真实用户反馈构建[40][41] 阿里国际AI布局 - 2023年3月成立AI Business 基于全球化电商场景探索AI技术[43] - 电商平台已广泛应用AI能力 服务超50万卖家[43] - 2026届校招80%岗位为AI相关 包括算法、研发、产品经理等[45]
晚点独家丨阿里海外推出首个 B2B 领域的 AI 搜索引擎
晚点LatePost· 2024-11-12 22:35
阿里海外AI战略布局 - 公司长期在AI投入与业务发展间寻求动态平衡[2] - 阿里海外AI进展快于国内电商 11月12日推出全球首个B2B领域对话式AI搜索引擎Accio 整合超3000万家跨境贸易供应链企业信息[3] - Accio采用多智能体架构 每次使用进行5-10次后台任务再分配 内置多重交叉验证机制减少大模型幻觉[8] Accio产品特性 - 产品形态类似Perplexity 定位个人采购代理 覆盖亿级商品量 支持5种语言 PC/WAP端已上线[4] - 试运行阶段"找工厂"模块使采购转化率提升20%-30%[4] - 功能演示显示输入"迪拜建滑雪场"可输出从市场调研到设备采购的全流程解决方案[6] 产品开发背景 - 项目由蒋凡直接指挥 原为阿里国际站"买家AI Agent" 后升级为独立AI原生搜索引擎[6] - 团队规模超400人 分2B(张阔)和2C(张凯夫)方向[4] - 名称灵感来自《哈利·波特》召唤咒 象征商品"飞来"体验[6] 行业竞争格局 - B2B数字广告市场2024年达387亿美元(+13%) 预计2026年为2019年三倍[9] - AI搜索领域竞争者包括Perplexity(黄仁勋日常使用)和OpenAI的SearchGPT[9] - 阿里国际站商家将在平台供应链优先级中排序最高[9] 阿里海外AI矩阵 - 除Accio外推出B2B产品AI生意助手和OKKI AI B2C领域已部署40多个电商场景AI工具[10] - 翻译大模型Marco在Flores数据集表现超越Google翻译和GPT-4[10] - 速卖通等平台AI工具日调用量达2.6亿次[10] 业务发展现状 - 阿里海外为集团增速最快板块 但二季度经营亏损37亿元(为本地生活业务十倍)[10] - 跨境电商天然适合AI应用 存在语言门槛和复杂合规要求[10] - 公司采取务实策略 从自身业务出发推进AI 类似Google/Amazon模式[10]