Workflow
腾讯ima
icon
搜索文档
腾讯研究院AI速递 20250806
腾讯研究院· 2025-08-06 00:01
Claude Opus 4.1内测与行业动态 - Claude Opus 4.1正在内部测试,预计半月内发布,主打提升推理和规划能力 [1] - Anthropic年收入增长5倍达50亿美元,编程客户Cursor和GitHub Copilot贡献14亿美元API收入 [1] - Claude在AI编程领域优势明显但面临OpenAI等竞对威胁 [1] 腾讯ima功能更新 - ima新增AI播客功能,基于混元大模型提供自然对话与优质听感 [2] - 支持文件夹一键导入功能,大幅简化知识导入流程 [2] - 新增Xmind脑图解读与知识库内容置顶功能,提升知识管理效率 [2] 阿里开源Qwen-Image模型 - 通义千问开源200亿参数图像生成模型Qwen-Image,中英文文本渲染能力出色 [3] - 模型能精准生成含复杂文字的图像,包括PPT、海报和商品宣传图 [3] - 采用MMDiT架构和渐进式训练策略,多项基准测试达SOTA水平 [3] 华为开源盘古模型与CANN架构 - 华为开源三款盘古模型,规模分别为1B、7B和718B,Ultra MoE达7180亿参数 [4] - AI计算架构CANN及Mind系列应用使能套件全面开源开放 [4] - 采用Multi-head Latent Attention和负载均衡策略等创新技术 [4] 纳米AI多智能体蜂群技术 - 纳米AI推出多智能体蜂群,一句话生成10分钟高质量AI视频,降低95%制作成本 [5] - 引入L4级智能体标准,实现多智能体共享记忆和协作 [5] - 单步智能体成功率达99.97%,支持无限Token和上下文长度 [5] 谷歌大模型对抗赛 - 谷歌发起首届大模型对抗赛,8款顶级AI模型将在国际象棋领域对决 [6][7] - 参赛模型包括OpenAI、DeepSeek、Kimi、谷歌、Anthropic和xAI等 [6] - 比赛采用单败淘汰制,全程透明直播 [7] 苹果脑控技术进展 - 苹果与Synchron合作推出BCI HID协议,让脑电波成为原生输入方式 [8] - 渐冻症患者通过Stentrode脑机接口设备成功操控iPad [8] - 相比Neuralink采用低风险无创手术方式 [8] 宇树科技机器人产品 - 宇树科技发布四足机器狗Unitree A2,可负重100kg,最大奔跑速度5米/秒 [9] - 此前发布人形机器人R1,售价3.99万元起,被称为行业"价格屠夫" [9] - 公司2024年营收突破10亿元,Go1机器人全球出货量超5万台 [9] AI对社会结构影响预测 - 前谷歌高管预警2027年起AI将开启15年"地狱期",中产阶级或被消灭 [10] - 预测未来社会将只剩顶端0.1%富人和底层民众 [10] - 2042年后或进入AI主导的乌托邦时代 [10] 阶跃星辰开源基座模型 - 阶跃星辰开源基座模型Step 3,为3210亿参数的多模态推理模型 [11] - CEO坚信多模态生成与理解统一是通往AGI的必由之路 [11] - 聚焦智能终端Agent和垂类Agent两大方向 [11]
腾讯首次晒出大模型战略:加速智能体落地,加码知识库赛道
南方都市报· 2025-05-21 22:56
腾讯AI战略与产品升级 - 公司提出"每个企业正在成为AI公司,每个人也将成为AI加持的'超级个体'"的核心理念,强调生成式AI已跨过"可用性"门槛,未来需向"好用"和"人人能用"发展 [2] - 公司首次全面公布大模型战略,涵盖自研混元大模型、AI云基础设施、智能体开发工具、知识库及场景应用的全矩阵产品升级 [2] - 混元TurboS在全球权威评测平台Chatbot Arena排名全球前八(国内第二),代码与数学能力进入全球前十 [3] - 混元图像2.0实现"毫秒级"生图,3D v2.5采用稀疏3D原生架构实现代际飞跃,开源社区下载量超160万 [3] - 混元已实现图像/视频/3D/文本全模态开源,将推出0.5B-32B的dense模型及13B MoE模型适配企业需求 [4] 技术迭代与客户驱动 - 混元产品迭代速度明显加快,推出视觉深度推理模型T1 Vision和端到端语音模型混元Voice,即将推出实时视频通话AI [3] - 技术节奏加快源于客户需求驱动,公司通过整合视觉/多模态/文本/智能体技术形成系统性解决方案 [4] - 公司强调技术堆栈优化并非孤立演进,而是基于多年能力积累借助大模型/Agent等新范式重新激活 [4] 智能体平台创新 - 2025年被定位为Agent智能体元年,公司认为智能体将降低AI应用门槛成为企业创新利器 [5] - 腾讯云智能体开发平台整合RAG技术/Agent能力,支持零代码多Agent协同与工作流模式,实现任务自主拆解与工具调用 [5] - 平台创新性地在工作流中引入"全局视野"智能体节点,兼顾流程确定性与智能体灵活性 [6] - 当前智能体落地面临技术层面自主规划准确性不足与客户认知鸿沟的双重挑战 [6] 知识库战略布局 - 公司认定"大模型+知识库"为当前AI落地最佳路径,升级腾讯乐享和ima知识库产品 [7] - ima面向个人用户支持课程作业/论文写作等场景,乐享服务企业客户已累计覆盖30万包括比亚迪/清华大学等行业代表 [7] - 知识库产品在知识整合/更新/权限管理/AI问答等层面提升流转效率,适配政务/法律/教育等知识驱动领域 [7] 云计算基础设施 - 智能时代云计算正从"资源供给"转向"智能服务",公司推出智算系列产品在效能/可靠性/易用性三大方向升级 [8] - 基础设施升级旨在应对AI应用和模型爆发对算力性能提出的全新挑战 [8]
谷歌ToC助手炸场,飞书ToB「知识问答」跟牌 | 36氪独家
36氪· 2025-05-21 18:40
谷歌AI新功能 - 谷歌在I/O大会上推出搜索AI模式 核心功能Personal Context可记忆用户搜索历史 邮箱 收藏 网盘等资料 提供个性化问答服务 [3] - Gemini大模型助手通过授权获取用户数据 可结合天气 地点偏好等生成定制化建议 如提取邮件日程信息 [3] 飞书知识问答产品 - 飞书即将推出企业级AI问答工具 基于企业知识库自动调用消息 文档 文件等信息生成精准答案 [4] - 产品定位为"记得住事的实习生" 支持询问项目进度 预算 撰写总结等场景 无需手动整理知识库 [4][6] - 权限管理与企业文档系统一致 不同职级员工获取的答案存在差异 解决信息保密问题 [7] 行业动态 - 飞书知识问答已完成数万用户内测 网页版上线 支持DeepSeek 豆包等模型调用及联网搜索 [8] - 腾讯ima 夸克等大厂加码知识库AI赛道 Youmind Remio等初创公司用户增长显著 [8] - 推理模型技术进步改善输出准确性 推动AI知识库产品集中爆发 [8]
加大AI投入!腾讯汤道生:加速AI大模型、智能体、知识库和基础设施建设
新浪科技· 2025-05-21 11:07
腾讯云AI产业应用峰会核心观点 - 生成式AI已从"量变"发展到"质变",公司持续加大AI投入,业务全面拥抱AI,通过大模型、智能体、知识库和基础设施"四个加速"打造"好用的AI" [1] - 行业对大模型API调用量和算力需求快速增长,未来需从"可用"到"好用",从"一部分人用"到"人人能用",需优化交互体验、执行能力、内容准确性和落地成本 [3] 腾讯AI技术进展 - 腾讯混元T1和Turbo S持续迭代,混元TurboS进入全球Chatbot Arena前8,中国大模型中仅次于DeepSeek [3] - 多模态领域,腾讯混元在视觉理解、语音交互、3D、实时生图等能力获行业认可 [3] - 智能体开发平台助力企业快速构建应用,QQ浏览器、腾讯健康、腾讯云代码助手CodeBuddy等已接入智能体能力 [3] 知识库与基础设施优化 - 发布腾讯乐享企业AI知识库,管控知识有效性、更新时间和权限,解决企业场景专业知识缺失问题 [4] - 行业智算需求从训练转向推理主导,公司通过IaaS层与工具层协同优化,提升推理场景的响应速度、延时和性价比 [4] 行业应用与愿景 - AI需走进千行百业,通过技术升级降低使用门槛,使其服务于企业经营者、开发者和普通用户 [1][4]
腾讯研究院AI速递 20250521
腾讯研究院· 2025-05-21 00:01
微软智能体生态布局 - Coding Agent将GitHub Copilot升级为自主编程助手,实现bug修复、代码维护全流程自动化 [1] - NLWeb开源项目支持自然语言交互网站,Agent Factory平台可构建Grok等智能体应用 [1] - Copilot Tuning允许企业用自有数据微调智能体,适配独特语言风格 [1] - Microsoft Discovery具备生成科研想法、模拟结果和自主学习能力 [1] 谷歌AI编程助手动态 - 发布基于Gemini 2.5 Pro的Jules编程助手,每日提供5次免费额度并直连GitHub仓库 [2] - Jules可自主完成代码编写、Bug修复及测试运行,支持生成详细计划并在云虚拟机验证代码 [2] - 即将推出Codecast功能生成代码库音频摘要 [2] 腾讯AIGC游戏引擎突破 - 发布工业级AIGC游戏内容生产引擎"混元游戏",基于百万级游戏动漫数据集训练 [3] - 提供AI美术管线、实时画布、2D美术生成和角色多视图生成功能,后者耗时从12小时缩短至30分钟 [3] - 包含四大图像模型和五大视频模型,首创游戏特效生成模型并支持多种风格实时交互 [3] AI音频工具创新 - ListenHub支持链接/文档转2-3分钟对话式播客,生成速度优于谷歌NotebookLM且中文语音更自然 [4][5] - 产品已开放公测,支持网页/App/浏览器插件,但存在内容长度不可调等限制 [5] 智源向量模型技术领先 - BGE-Code-v1支持14种编程语言,在CoIR和CodeRAG-Bench基准超越商业/开源模型 [6] - BGE-VL-v1.5针对多模态检索优化,BGE-VL-Screenshot在MVRB基准达60.61分SOTA成绩 [6] 谷歌知识管理工具升级 - NotebookLM推出iOS/安卓APP,支持离线听书、实时互动提问和跨平台分享 [7] - 当前支持网页/PDF/视频链接转播客,但仅限海外用户使用 [7] AI科研平台突破 - Microsoft Discovery无需编程即可用超算能力,200小时内发现新型环保冷却剂 [8] - 平台结合基础/专业模型构建AI博士后团队,支持医药/芯片设计等领域研发 [8] 开源机器人进展 - UC伯克利BHL机器人总成本低于5000美元,采用3D打印模块化设计且机械效率达90% [9] - 配备英特尔N95迷你PC和手机级IMU,实现双足行走和遥操作功能 [9] AI编程行业预测 - Anthropic CEO预测AI将在3-6个月内编写90%代码,谷歌已有25%代码由AI生成 [10] - 未来程序员角色或转向AI系统架构师和训练师,人类专注创造性工作 [10] 腾讯知识管理战略 - ima产品定位为AI驱动的"搜读写"工作台,已积累近1000万篇内容 [11] - 通过知识库/知识号/知识库广场三层架构实现从个人管理到生态共建的演进 [11]
生成五一攻略,随手画出毕加索风格的画作,腾讯AI引关注
南方都市报· 2025-04-30 17:31
腾讯AI技术展示 - 腾讯在第八届数字中国建设峰会上展示多项AI应用,包括旅游攻略生成、三维模型创作和大师风格画作生成[1] - 腾讯混元大模型3D生成2.5版本支持图像、视频、3D等多模态生成能力,参数规模达万亿级[3] - 腾讯AI助手元宝支持双模型(腾讯混元和DeepSeek),具备读图、文件分析、图表制作等功能[3] 腾讯AI技术应用场景 - 办公协同领域:腾讯文档AI助手可通过指令生成文档、PPT、思维导图等可编辑内容[5] - 智能客服领域:一汽丰田使用腾讯大模型知识引擎升级智能汽车客服系统[5] - 政务领域:腾讯ima工作台可批量导入政策文件提升惠民政策宣传效率[5] - 乡村振兴领域:AI助手"小耕"为村民提供农产品直播、农业技术等精准建议,计划覆盖1万个村庄[5] 腾讯研发投入与战略 - 2018年以来累计研发投入超过3400亿元,重点布局人工智能领域[1][5] - 已构建从算力基础设施到多元智能应用的大模型产品矩阵[1][5] - 未来将继续利用前沿技术推动实体产业创新突破[5] 行业数据 - 2024年开发或应用人工智能的企业数量同比增长36%[5] - 高质量数据集数量同比增长27.4%[5] - 利用大模型的数据技术企业和数据应用企业同比分别增长57.21%和37.14%[5]
数字中国建设峰会开幕 腾讯以“好用的AI”激活产业新增长
证券日报网· 2025-04-29 21:43
腾讯AI战略与产品展示 - 公司以"打造好用的AI,激活产业新增长"为主题展示人工智能在生产生活领域的多项应用 [1] - 公司致力于通过开源进化和普惠化发展让AI更有用、好用、离生产生活更近 [1] - 公司希望以"人工智能+"为抓手成为产业升级的加速器和美好生活的连接器 [1] 腾讯混元大模型技术能力 - 腾讯混元大模型参数规模达万亿级各项能力稳居国内第一梯队 [1] - 该大模型拓展多模态生成能力涵盖图像、视频、3D等 [1] - 能有效支撑图像创作、三维模型生成、视频制作等多种功能 [1] AI技术应用场景 - 展示AI在办公协同、医疗、政务、零售生活、数字地图、能源制造等场景的落地应用 [2] - 一汽丰田通过腾讯大模型知识引擎升级智能汽车客服 [2] - 腾讯ima工作台产品可将政策文件等服务指南批量导入提升惠民政策宣传效率 [2] - 腾讯文档AI助手用"一句话"指令即可生成文档、PPT等可编辑内容 [2] 云服务与安全能力 - 腾讯云智算已服务90%的国内大模型厂商 [2] - 成为美团、快手等行业数万客户的稳固算力底座 [2] - 制定大模型全生命周期安全防护方案涵盖训练、推理部署等各阶段 [2] 研发投入与技术布局 - 2018年以来累计研发投入超过3400亿元 [3] - 依托自研技术构建从算力基础设施到多元智能应用的大模型产品矩阵 [3] - 未来将继续利用前沿技术打造好用的AI推动实体产业创新突破 [3]
腾讯用最 C 端的方式,为AI产品注入灵魂
新财富· 2025-03-20 15:29
文章核心观点 - 通用型AI发展漫长未知,大模型迭代趋缓,AI产品发展进入新阶段,腾讯推出以知识库为核心的ima产品,其依托微信公众号有独特优势和发展潜力,垂类AI产品构建是行业入局者需思考的方向 [1][5][49] 分组1:AI行业发展现状 - 通用型AI发展漫长未知,单一通用大模型实现赢家通吃的预期过于乐观,OpenAI将推理模型作为新路径 [1][4] - 基座大模型发展趋缓,AI产品成为发展重点,“AI应用”在2025年被提及频率更高 [5] 分组2:腾讯ima产品介绍 - 腾讯在2024年10月发布以文字类知识库为核心的ima产品,集“搜、读、写”功能于一体,定位抽象 [7][8] - ima以知识库为核心,解决了“知识从哪里来”的痛点,答案是微信公众号 [10][26] - 3月7日ima上线“知识库广场”模块,用户可发布、搜索、加入知识库,知识库可整合多种知识载体并生成AI摘要 [34][35][36] - ima要求用户自主筛选、归类数据形成垂直知识矩阵,用户是知识库智能体的开发者 [37] - ima依托微信生态具备社交属性,“知识库广场”打破传统模式,让知识库可在社交场景传播,未来可能引入推荐算法 [38] 分组3:知识库赛道情况 - 知识库需求集中爆发是AI产品发展进入深水区的必然,构建高价值数据库是影响AI应用成败的关键 [13][14] - 百度文库由文心大模型赋能后完成蜕变,2024年12月月活冲高至9400万,同比增长216%,环比增长83%,此前网页月访问量保持国内第2名 [16] - 秘塔AI是主打知识库的产品,2024年3月上线当月网站访问量超700万次,维持网页版访问量前10,有强大数据库支持,提出个人知识库概念 [19][21][22] 分组4:微信公众号情况 - 微信公众号有超10亿月活天然流量池,低门槛入驻和社交传播红利使其进入“黄金时代”,腾讯采取措施保护原创,使其向知识平台转型 [28][30] - 微信公众号形成专业化图文知识体系,截至2023年总数突破3000万个,日均活跃用户超5亿,占中文自媒体市场70%以上份额 [31] 分组5:ima未来可能性 - 以知识库传播构建的新社交范式可能成为新机会,未来可能形成以知识、兴趣为需求的社交场景 [44][46] - ima商业化可能引入付费订阅机制或与微信生态整合,按调用次数或流量分成收费 [48]