Workflow
Software and Internet
icon
搜索文档
全球首个宠物翻译器,上线爆火
36氪· 2025-05-23 08:47
AI跨物种交流技术发展 - 谷歌推出DolphinGemma大模型 可实现人类与海豚水下实时交流 并预测海豚发声[1][24] - 华人团队研发Traini应用 成为全球首个AI人狗翻译器 翻译准确率超过80%[1][2][9] - 百度公开动物语言转换专利 运用大模型技术分析动物行为并转换为人类语言[22] 宠物经济发展现状 - 中国宠物数量首次超过4岁以下婴幼儿总量[4] - 2023年中国宠物经济产业规模达5928亿元[4] - 年轻养宠群体呈现情感消费与拟人化养宠趋势 将宠物视为"孩子"与"朋友"[4] Traini产品技术细节 - 采用自主研发的PEBI模型 可识别12种狗狗情绪及行为表现[9][17] - 模型通过多模态数据训练 能预测宠物犬下一秒情绪变化[18] - 数据覆盖120个犬种 但地域和品种覆盖仍不够全面[20] - 翻译功能分为心智语言(基因决定)和社会语言(后天学习)[9] - 人类语言转犬吠功能包含18个短句[9] 行业技术演进 - 20年前日本已有单向解读犬吠情感的翻译器[12] - OpenAI的LLM技术扩展了多模态处理能力 为人宠交流提供新可能[13] - 国际"鲸语翻译计划"正分析40亿个抹香鲸交流代码[26] - AI技术已应用于家猪、绵羊等养殖动物情绪研究[22] 产品开发历程 - 灵感源于76%的狗粮用户对理解宠物行为感兴趣[7] - 研发耗时2年 最大难点在于情感模拟和共情表达[10][18] - 声音克隆经历多次尝试 最终采用儿童录音确定初版音调[18] - 团队包括前OpenAI工程师 获华源科技协会最受用户喜爱奖[15][16]
OpenAI宣布“星际之门”首个国际部署项目落户阿联酋
快讯· 2025-05-23 08:13
项目概述 - OpenAI宣布"星际之门阿联酋"(Stargate UAE)项目,首个国际部署项目落户阿联酋 [1] - 项目将为阿布扎比带来一个1GW的数据中心集群 [1] - 预计2026年投入使用 [1] 合作伙伴 - 项目将与G42、甲骨文、英伟达、思科和软银等合作伙伴共同开发 [1] 项目影响 - 阿联酋将成为全球第一个在全国范围内启用ChatGPT的国家 [1] - 全国各地的人们都能使用OpenAI的技术 [1]
智能体大爆发,腾讯要怎么做?
虎嗅APP· 2025-05-22 23:11
以下文章来源于AGI接口 ,作者宋思杭 "AI持续落地,每个企业正在成为AI公司,每个人也将成为AI加持的'超级个体'。"汤道生开门见 山地表示。而在加大AI投入力度方面,腾讯的做法可以说是相当激进,其打通了各业务条线与AI 之间的壁垒,极大权限地对各业务开放了AI能力。 而"全面拥抱AI",既是本场峰会的主题,同时也贯穿了腾讯2025年的全年战略重要。它正在影响 着这家科技大厂的方方面面。在演讲中,汤道生还提出了大模型、智能体、知识库和基础设施"四 个加速"的战略。其中,智能体则是极为重要的一种呈现形式。它所代表的是当大模型在国内走过 三年时间,应用范式的迭代。 然而,究竟什么是智能体?这个定义在行业里似乎还不够清晰。 在大部分人的眼中,智能体是这样的——当你想打开软件订机票,或者查找、整理信息,统计一 个excel表,不再需要打开不同软件app自己完成,而是告诉智能助手,它就能够自动帮你完成,最 终帮你订好机票。就好像在媒体群访间,腾讯云副总裁吴运声对媒体打趣道,"我现在就很希望有 一个智能体来替我回答你们的问题。" 从这个层面来理解,智能体的概念并不模糊。然而,目前之所以概念模糊,正是因为行业内存在 诸 ...
腾讯押错“宝”
新浪财经· 2025-05-22 18:10
腾讯元宝市场表现 - 截至5月20日腾讯元宝在苹果应用商店免费App下载榜跌至43名,远低于豆包(第1名)和DeepSeek(第6名)[1] - 3月3日元宝曾短暂登顶苹果商店免费应用榜,但6天后滑落至第三名[7] - 用户反馈元宝存在感弱,模型能力差且指令遵循表现不佳[1][3] 腾讯AI战略调整 - 公司4月29日重组混元大模型部门,成立大语言模型部和多模态模型部,终结低效赛马机制[6] - 管理层强调AI需与微信生态深度绑定,打造"特有型Agent"连接数百万小程序[18] - 马化腾明确表示不急于展示半成品,重点在于底层算法、算力和场景落地[2][18] 产品技术问题 - 元宝接入混元T1和DeepSeek-R1后仍存在推理中断、结论不完整等技术缺陷[5][6] - 用户集中反馈复利计算错误、大模型幻觉、PC端功能简陋等问题[3] - 产品迭代速度加快(3月更新30余次),但基础能力仍落后同行[3][6] 市场竞争与投入 - 2025年2月元宝投放金额达3.03亿元,3月接近10亿元,为接入DeepSeek前的近十倍[10] - 行业周留存率仅25%,30日留存可能不足2%,同质化竞争严重[10] - 腾讯2024Q4 AI资本开支增至390亿元,超过前三季度总和[10] 微信生态整合 - 4月16日元宝新增微信好友对话功能,试图降低使用门槛[4] - 实际使用中用户更倾向调用DeepSeek而非混元模型,导致生态协同效果不佳[7] - 微信小店等过往生态创新案例表现未达预期,引发对微信承载力的担忧[13][17] 行业横向对比 - 阿里宣布未来三年将投入超3800亿元用于云和AI基础设施建设[10] - 国内AI产品底层能力与ChatGPT/Gemini仍有明显差距[12] - 字节、百度等竞品在2024年4月均实现大模型显著升级[6]
腾讯混元上新:多模态和智能体,两手都要抓 | 最前线
36氪· 2025-05-22 16:01
腾讯大模型战略升级 - 腾讯混元大模型迎来全面升级 包括旗舰快思考模型混元TurboS和深度思考模型混元T1的新迭代版本 [1] - 基于TurboS基座推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice [1] - 同步上新混元图像2.0 混元3D v2.5及混元游戏视觉生成等一系列多模态模型 [1] 混元TurboS模型性能 - 混元TurboS在Chatbot Arena排名全球前八 国内仅次于DeepSeek [2] - 代码和数学等理科能力进入全球前十 [2] - 采用大规模混合Mamba-MoE模型 理科推理提升超10% 代码能力提升24% 竞赛数学成绩提升39% [2] 混元T1模型进展 - 深度思考模型混元T1持续快速迭代 在元宝App上线后实现多项能力提升 [6] - 竞赛数学效果提升8% 常识问答提升8% 复杂任务的Agent能力提升13% [6] 多模态模型突破 - 混元视觉深度推理模型T1-Vision支持多图输入 具备原生长思维链 [8] - 整体效果提升5.3% 理解速度提升50% [8] - 混元Voice语音模型响应速度提升超30% 降至1.6秒 [8] - 混元图像2.0在主观画面质量和美学层面被认为"AI味"最少 [8] 智能体平台战略 - 将大模型知识引擎升级为"腾讯云智能体开发平台" [12] - 整合RAG技术和全面Agent能力 帮助企业激活私域知识和构建专属智能体 [13] - 大模型显著提升语义理解 上下文建模 内容切分等能力 [14] - 多模态模型发展使视觉+文本协同任务成为可能 [14] 开源与业务应用 - 混元3D模型在Hugging Face下载量超过160万 [16] - 计划推出多尺寸混合推理模型 适配企业与端侧不同需求 [16] - 混元已深度融入微信 QQ 腾讯元宝 腾讯会议 腾讯文档等核心产品 [17]
不甘于工具,谷歌、微软重注AI Agent
21世纪经济报道· 2025-05-21 21:12
"更智能""更主动" 21世纪经济报道记者董静怡 上海报道 在2025年谷歌I/O开发者大会上,AI几乎贯穿整场发布会。自去年 谷歌宣布进入"Gemini时代"后,AI就成了发布会的绝对主角,"更智能"、"更主动"是更新迭代的核心。 在此次发布会上,谷歌除了发布升级版的Gemini 2.5模型,也全面重构了其产品体系,将Gemini AI嵌入 所有核心业务,从搜索到生产力工具,从智能助手到XR(扩展现实)设备。 Gemini不再被视为单一的语言模型,而是将其定位为整个AI生态的核心架构,用户和开发者面对着全 新的AI交互模式。 与此同时,谷歌也在推动AI从被动工具向主动代理(Agent)转变,行业普遍认为2025年将会是AI智能 体爆发的一年。就在一天前,微软在Build大会上广泛布局Agent生态,进一步印证了这一趋势的行业共 识。 站在AI时代的十字路口,科技巨头也面临着前所未有的挑战与机遇。 Gemini重构一切 谷歌对AI时代全面拥抱。据初步统计,在2小时的发布会里,Gemini被提及95次,AI被提及92次。这两 个关键词几乎构成了整场发布会的叙事主线。 谷歌在发布会上公布的数据显示,去年同期,谷歌 ...
腾讯大模型战略首次全景亮相
北京日报客户端· 2025-05-21 18:51
腾讯大模型战略全景亮相 - 腾讯在2025腾讯云AI产业应用峰会上首次全景展示大模型战略 包括自研混元大模型 AI云基础设施 智能体开发工具 知识库及场景应用等矩阵产品全面升级 [1] - 公司高层提出"每个企业都将成为AI公司 每个人都是AI加持的超级个体"的愿景 过去一年各项业务已全面拥抱AI 观察到产业对大模型的庞大用量和深切需求 [1] 智能体平台升级 - 腾讯云大模型知识引擎升级为"腾讯云智能体开发平台" 成为行业关注焦点 新平台可快速激活私域知识并构建企业专属智能体 [1] - 智能体功能包括:从复杂Excel表提取精准答案并秒级返回自然语言查询结果 自动生成文档问答降低人工成本 实现文档差异比对与一键处理操作 [1] 知识库战略布局 - 公司提出"大模型+知识库"是当前AI落地最优路径之一 强调知识库对提升大模型解决问题能力的关键作用 [2] - 除智能体外 公司正在知识库赛道持续加码投入 显示其双轨并行的技术发展策略 [2]
腾讯大模型战略首次全景亮相:自研混元大模型、知识库、智能体开发、工具箱一应俱全
新浪科技· 2025-05-21 13:30
腾讯AI战略升级 - 公司全面升级大模型矩阵产品,包括混元大模型、AI云基础设施、智能体开发工具、知识库及场景应用,致力于打造"好用的 AI" [1] - 公司高层提出"每个企业都将成为AI公司"、"每个人将是AI加持的超级个体"的愿景 [1] - 业务已全面拥抱AI,未来将加速大模型创新、智能体应用、知识库建设和基础设施升级 [3] 混元大模型技术进展 - 混元TurboS在Chatbot Arena排名全球前八(国内第二),代码/数学能力进入全球前十 [3] - 推出视觉深度推理模型混元T1 Vision和端到端语音通话模型混元Voice,即将推出实时视频通话AI [3] - 混元图像2.0实现"毫秒级"生图,混元3D v2.5采用稀疏3D原生架构实现代际飞跃,Hugging Face下载量超160万 [3] - 实现全模态开源(图像/视频/3D/文本),计划推出0.5B-32B dense模型和13B MoE模型 [4] 智能体平台发展 - 大模型知识引擎升级为"腾讯云智能体开发平台",整合RAG技术和Agent能力 [4] - 平台支持零代码多Agent协同、工作流模式拖拉拽,降低智能体搭建门槛 [5] - 智能体具备自主任务拆解、工具调用能力,成为企业执行复杂任务的助手 [5] 知识库产品布局 - 升级知识库系列产品(腾讯乐享和ima),服务企业/组织/个人用户 [5] - 乐享知识库累计服务超30万客户,覆盖比亚迪、友邦保险、清华大学等行业标杆 [5] - 提供知识整合、AI问答等功能,提升企业知识流转效率 [5] 行业应用落地 - 代码助手CodeBuddy升级为Craft软件开发智能体,支持自然语言需求到代码全流程生成 [6] - 企点营销云发布"营销云智能体",实现从人群洞察到效果追踪的全链路智能决策 [6] - 办公协同产品全面AI化:腾讯文档支持AI生成内容、腾讯会议接入DeepSeek双模型、电子签实现AI合同管理 [6]
四点速读2025谷歌开发者大会
第一财经· 2025-05-21 11:22
谷歌AI技术进展 - 核心观点:谷歌在开发者大会上展示了AI技术的最新进展,包括基础模型升级、生成式内容工具推出和硬件更新,标志着其AI生态系统建设迈出重要一步 [1] Gemini模型升级 - Gemini 2 5 Pro和Flash模型全面支持视听输入和原生音频输出对话,开发者可通过Live API预览版微调对话体验的音调、口音和说话风格 [2] - Gemini可作为Chatbot登录Chrome浏览器,帮助用户快速理解页面上下文并完成任务 [2] - Deep Think模式引入增强型推理机制,显著提升模型在数学、编程和多模态任务中的推理能力 [2] 生成式内容工具升级 - Veo 3视频生成模型支持原生音频生成,可为视频添加背景音乐、音效甚至对白,解决AI视频"有影无声"问题 [3] - Imagen 4图像生成模型在细节和文本输出质量上有质的飞跃,支持渲染织物、水滴和动物皮毛等精细细节,可创建2K分辨率图像 [3] AI代理工具更新 - Project Mariner优化工作方式,可一次承担近十几项任务,如购买门票或杂货,无需访问第三方网站 [4] - 推出视频通话平台Google Beam,硬件包括六摄像头阵列和光场显示器,软件通过AI模型实现3D渲染,支持毫米级头部跟踪和60fps视频流 [4] XR智能眼镜 - 与Xreal、Samsung合作推出集成AI助手功能的Android XR智能眼镜,支持实时翻译、导航和信息提示 [5] AI订阅计划 - 推出每月249 99美元的AI Ultra订阅计划,提供Gemini 2 5 Pro的Deep Think模式、Veo 3视频生成工具等高级功能访问权限 [6]
加大AI投入!腾讯汤道生:加速AI大模型、智能体、知识库和基础设施建设
新浪科技· 2025-05-21 11:07
腾讯云AI产业应用峰会核心观点 - 生成式AI已从"量变"发展到"质变",公司持续加大AI投入,业务全面拥抱AI,通过大模型、智能体、知识库和基础设施"四个加速"打造"好用的AI" [1] - 行业对大模型API调用量和算力需求快速增长,未来需从"可用"到"好用",从"一部分人用"到"人人能用",需优化交互体验、执行能力、内容准确性和落地成本 [3] 腾讯AI技术进展 - 腾讯混元T1和Turbo S持续迭代,混元TurboS进入全球Chatbot Arena前8,中国大模型中仅次于DeepSeek [3] - 多模态领域,腾讯混元在视觉理解、语音交互、3D、实时生图等能力获行业认可 [3] - 智能体开发平台助力企业快速构建应用,QQ浏览器、腾讯健康、腾讯云代码助手CodeBuddy等已接入智能体能力 [3] 知识库与基础设施优化 - 发布腾讯乐享企业AI知识库,管控知识有效性、更新时间和权限,解决企业场景专业知识缺失问题 [4] - 行业智算需求从训练转向推理主导,公司通过IaaS层与工具层协同优化,提升推理场景的响应速度、延时和性价比 [4] 行业应用与愿景 - AI需走进千行百业,通过技术升级降低使用门槛,使其服务于企业经营者、开发者和普通用户 [1][4]