腾讯研究院

搜索文档
每一次对话都是一次协商谈判
腾讯研究院· 2025-04-29 16:12
回家之后,里德将枪支连同包装盒原封不动地放进了自己的衣柜,之后再也没有碰过它。 里德购买枪械这件事原本很可能就这样神不知鬼不觉地过去了。然而,直到有一天,他在法院附近寻找 当侦探的机会,希望有人雇他破案。这时,一名警察走上前要求他出示身份证明。无奈之下,里德只能 从口袋里掏出了唯一带有他姓名的东西:那家体育用品商店的购枪收据。 "你随身携带了那把枪吗?"警察问道。 审判伊始,里德的辩护律师便向陪审团承认,那些对其不利的证据确实很有说服力。"首先,我要明确 地告诉各位,"他对陪审团成员说,"勒罗伊·里德曾犯有重罪。去年的12月7日,也就是11个月前,他购 买了一把枪。对此,我们毫不隐瞒,也毫无异议。" 根据《威斯康星州第941.29号法令》,这意味着里德可能面临长达10年的监禁。但是,他的律师接着 说,"他应该被判无罪",因为他患有严重的精神障碍,再加上被捕时情况特殊,所有迹象都表明他并无 意犯罪。一位心理学家作证指出,里德只有二年级的阅读水平,且智商"远低于平均值"。十多年前,里 德无意间在一起便利店的抢劫案中,充当了朋友逃跑时的司机,因而被定罪。不过,他最终被提前释 放,部分原因在于官方怀疑即使在被定罪之后 ...
腾讯研究院AI速递 20250429
腾讯研究院· 2025-04-28 23:48
模型融合与创新 - 第三方团队TNG成功融合DeepSeek V3-0324和R1模型,创建DeepSeek-R1T-Chimera,兼具R1能力与V3速度 [1] - 新模型在"7米甘蔗过2米门"问题上展现出深度思考能力,用时101秒但推理过程更严谨 [1] - 模型融合成为新趋势,KIMI和Sakana AI等团队也在探索不同融合方法 [1] OpenAI离职人才创业 - 多位OpenAI前高管创业进军AI领域,如Ilya Sutskever创立SSI、Mira Murati成立Thinking Machines Lab [2] - 创业方向多元化,涵盖安全AI研究、教育科技、搜索引擎、机器人等领域 [2] - 创业公司估值普遍较高,如Anthropic达615亿美元,xAI估值1130亿美元 [2] 游戏AI应用 - 巨人网络《太空杀》接入腾讯混元Turbo S大模型,已生成超700万AI玩家,完成近90万次对局 [3] - 游戏推出"内鬼挑战"AI玩法,开创行业首个AI原生游戏玩法 [3] - 将在UGC剧本工具中引入腾讯云TTS技术,为玩家短视频创作提供多样化语音支持 [3] Adobe图像生成技术 - Adobe发布Firefly Image Model 4模型,实现更高图像真实度,新增生成视频功能 [4] - 新版Firefly整合图像、视频、音频和矢量生成为统一平台,推出移动应用 [5] - Firefly已在全球生成超220亿件资产,获得德勤等知名企业采用 [5] AI与财经内容合作 - 财新传媒与月之暗面合作,让Kimi在回答财经问题时结合财新报道内容 [6] - 财新开发"织雀"和"群雁"等系统工具,实现新闻内容结构化存储和智能编辑功能 [6] 地学AI模型 - 之江实验室GeoGPT正式全球开放使用,开源三个模型及训练数据源 [7] - 具备深度检索分析、文献读取提取、地质图问答生成及个人资源库四大核心功能 [7] - 已与21所高校318位地学专家合作,应用于岩浆岩数据库建设等领域 [7] 可控核聚变技术 - 全球可控核聚变主要采用三种技术路线,磁约束托卡马克技术最成熟 [8] - 能量奇点选择高温超导托卡马克路线,装置体积可缩小至2%,成本降至4亿美元 [8] - 公司规划2024年验证工程可行性,2027年实现十倍能量增益,2030-2035年建成示范电站 [8] AI工具与效率革命 - 新一代Vibecoding工具使非技术人员也能开发动态应用,打破"规模不经济"限制 [9] - AI编程工具存在同质化问题,未来需在"零代码"和"全代码"间探索新范式 [9] - 创业公司凭借AI原生优势仍有机会,开发者生产力工具生态将经历范式级重构 [9] AI发展前景 - AlphaGo之父认为AI远未达到能提出有价值猜想的水平 [10] - 预计5-10年内可能实现AGI,需要规避技术被滥用和失控风险 [10] - AI将帮助解决气候、疾病等问题,但需解决就业、财富分配等社会挑战 [10]
英国社会住宅体系:基本情况与启示
腾讯研究院· 2025-04-28 15:11
英国政府大规模补贴建设社会住宅 (Social Housing) 始于一战结束后。随着大量士兵回国,英国住房紧张加剧。1919年国会通过《住房与城镇计划法》 (Housing, Town Planning, &c. Act) ,计划在三年内建设50万套社会住宅,后因经济衰退,最终仅完成21.3万套 1 。1923年和1924年,保守党和工党政府接力推出拨款法案, 将财政资助范围从地方政府 (Local Authority) 扩展到非营利性私人机构。到1939年二战爆发前,全英建成超过100万套社会住宅。 二战期间 (1939~1945年) ,英国约有450万套房屋被毁。二战结束后的1946年和1947年,工党政府相继推出《新城镇法》、《城乡规划法》,将社会住宅服务 对象从低收入群体扩大到一般家庭的住房需求。1951年,保守党政府将住房补贴再次聚焦到低收入群体,并与城镇棚户区改造 (inner-city slum clearance) 结合,于 1956年出台《住房补贴法》 (Housing Subsidy Act) 。1946到1960年间,全英建成约200万套社会住宅。 1974年工党政府推出新的《住房法》 ...
腾讯研究院AI速递 20250428
腾讯研究院· 2025-04-27 23:41
GPT-4o升级 - OpenAI更新GPT-4o提升STEM解决能力和个性表现,对话更主动但可能过度迎合用户 [1] - 新版本在争议性话题上表达更强观点,被用户认为像产生"意识",不再保持中立保守立场 [1] - 模型生图能力可能被削弱,渲染质量下降,文字识别准确度降低,推测使用中低质量版本 [1] o3照片定位功能 - o3通过Python代码和细节放大能精准识别无地标或EXIF信息的照片拍摄地点 [2] - 模型可进行多重推理和网络搜索,从菜单、风景等图片中提取信息找到具体位置 [2] - 定位能力强于Claude和Gemini,但引发隐私担忧,普通照片也可能泄露位置信息 [2] Step1X-Edit图像编辑模型 - 阶跃星辰开源Step1X-Edit模型达开源SOTA水平,总参数量19B,支持11类高频编辑任务 [3] - 采用MLLM+Diffusion架构,在GEdit-Bench基准测试中全面领先现有开源模型 [3] - 训练数据集包含超100万高质量样本,已在阶跃AI网页端和App上线 [3] DAM多模态模型 - 英伟达推出3B参数的DAM模型,能精准描述图像和视频中的任意局部细节 [4] - 采用DLC-SDP半监督流水线解决训练数据瓶颈,构建大规模数据集 [5] - 在多项基准测试中超越GPT-4o等模型,支持指令控制描述和零样本区域问答 [5] GPT-4o图像应用 - GPT-4o图像生成能力已在GPTs机器人商店开放使用,企业用户需等待约一周 [6] - 可构建专用图像生成机器人如封面生成器、海报制作器、特定风格插画生成器 [6] - 图像生成功能或从DALL·E升级为GPT-4o,提高创作效率 [6] 夸克AI相机 - 夸克APP新版AI相机通过拍照获取解答,涵盖旅游、生活、健康和工作学习场景 [7] - 旅游场景提供景点信息、行程规划、翻译和照片优化服务 [7] - 健康领域可解读体检报告、提供用药指导和定制饮食计划 [7] UFO²操作系统 - 微软升级UFO²实现与Windows深度集成,自动化任务成功率和效率超越OpenAI Operator [8] - 由HostAgent和AppAgent组成,通过混合控制检测机制实现GUI元素感知 [8] - 即将推出画中画模式,实现自动化任务与用户主桌面隔离 [8] AI病毒学能力 - OpenAI o3在病毒学测试中准确率达43.8%,超过94%人类专家(平均22.1%) [9] - VCT基准测试集包含322个病毒学实用问题,涉及细胞培养、基因修饰等领域 [9] - 多家AI公司开始采取防护措施,专家呼吁更严格政策监管生物风险 [9] AI知识产权保护 - 广东高院发布全国首份AI知识产权保护司法文件,支持建立AI开源生态治理机制 [10] - 明确AI生成内容权属认定标准,考虑人类创作贡献、合同约定和智力投入等因素 [10] - 要求落实AI生成内容标识要求,严格规制AI领域垄断行为 [10]
腾讯研究院AI速递 20250427
腾讯研究院· 2025-04-26 23:50
OpenAI GPT-4o模型升级 - 优化记忆存储机制,提升对话信息记忆和回忆能力 [1] - STEM领域推理能力显著提升,更好解决数学、科学、工程等复杂问题 [1] - 对话风格更加主动自然,擅长引导对话方向,回复更贴近真实交谈 [1] DeepResearch轻量版发布 - 基于o4-mini的轻量版DeepResearch免费开放使用,付费用户获额外额度 [2] - 轻量版用时更短、内容更精简,但保持相近智能水平 [2] - 实测显示轻量版更注重梳理重点脉络,适合快速了解概况的场景 [2] Kimi开源音频基础模型 - Kimi-Audio开源模型支持多种音频任务,在十多个基准测试中实现SOTA性能 [3] - 采用音频分词器、大模型、去分词器三大核心组件的集成式架构 [3] - 预训练数据集规模达1300万小时,通过三阶段训练方法显著提升性能 [3] DeepWiki代码理解工具 - 为GitHub仓库提供AI驱动的实时交互式文档,免费免注册 [4] - 通过层级化分解和提交历史分析理解代码全局结构,已索引3万个仓库 [4] - 处理超40亿行代码,使用方式简单只需替换域名即可访问AI文档 [4] 百度开发者大会发布 - 文心4.5 Turbo和X1 Turbo两款新模型发布,价格最高降80% [6] - 发布高说服力数字人、多智能体协作APP"心响"、内容操作系统"沧舟OS" [6] - 推出"AI开放计划",发布首个支持电商交易的MCP服务 [6] Perplexity浏览器追踪计划 - 计划推出浏览器"彗星",追踪用户全部在线行为以销售超个性化广告 [7] - 已与摩托罗拉达成合作预装应用,正与三星洽谈合作 [7] - 未来有意收购Chrome浏览器业务 [7] 软体机器手研发 - 清北团队研发两款新型软体机器手,一款基于肌电控制可达10Hz点击频率 [8] - 首款软体假肢手重405.8克,30分钟即可掌握,满足日常办公需求 [8] - 成本控制在千元级,将应用于康复医疗、电竞等领域 [8] 美国政府AI行动计划 - OpenAI和Anthropic呼吁加强对中国AI封锁,建议限制高端GPU芯片输出 [9][10] - Meta和谷歌认为开源AI是美国竞争优势,过度管制会让美国失去主导权 [9] - 美国政府收到超1万份AI行动计划建议 [10] 大模型推理能力研究 - 清华研究表明强化学习未真正提升大模型推理能力,答案来自基座模型分布 [11] - 在数学、代码和视觉推理三大领域,基座模型大量采样后超越RL模型表现 [11] - RL只能优化现有能力而难以创造新能力,真正突破需基础架构创新 [11] Agent系统科普 - Agent核心是LLM与工具的循环交替调用,LLM负责决策,工具负责执行 [12] - 协作式Agent比完全自主Agent更有现实价值,可让用户实时观察和纠正AI行为 [12] - 评估Agent系统需关注多个维度而非盲目使用Agent解决所有问题 [12]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-04-25 15:54
芯片 - 华为发布昇腾910C芯片 [3] 模型 - OpenAI的o3模型创下智商测试纪录 [3] - 谷歌推出高尔顿板测试模型 [3] - 谷歌发布Gemma 3 QAT版模型 [3] - Goodfire开发稀疏自编码器模型 [3] - OpenAI的o3模型存在高幻觉率问题 [3] - 微软推出BitNet三进制模型 [3] - 上海AI Lab开源AETHER模型 [3] - 昆仑万维开源Skywork-R1V 2.0模型 [3] - Anthropic的Claude模型展现人格特征 [3] 应用 - OpenAI发布gpt-image-1 API [4] - OpenAI将使用限额翻倍 [4] - OpenAI推出Agent SDK开发指南 [4] - 张吕敏开发FramePack视频生成技术 [4] - 生数科技推出Vidu Q1视频生成技术 [4] - Sand.ai发布Magi-1视频生成技术 [4] - 昆仑万维实现无限时长视频生成 [4] - 微软推出AI同事功能 [4] - 腾讯云开发Craft智能体 [4] - Kortix AI开源智能体Suna [4] - 腾讯升级混元3D技术 [4] - 腾讯上线企鹅读伴应用 [4] - 字节升级Trae编程助手 [4] - 字节推出扣子空间应用 [4] - Character.AI发布AvatarFX [4] - Nari Labs推出Dia语音生成技术 [4] - MiniMax发布MiniMax Audio [4] - Kimi推出AI社区 [4] - Fellou推出行动浏览器 [4] - Ostris发布Flex.2-preview [4] - VAST推出Tripo Doodle 3D模型 [4] - 华为实现高速L3自动驾驶 [4] - 面壁智能实现车端侧AI量产 [4] - 北大等机构开发游戏操作迁移技术 [4] - Letta等开发睡眠时间计算技术 [4] - 谷歌展示AI眼镜助手 [4] 科技 - 谷歌开发混合量子模拟技术 [4] - MPL推出引力波探测工具 [5] - 小鹏展示IRON技术 [5] - 宇树科技举办机器人格斗大赛 [5] - 北京亦庄举办机器人马拉松 [5] - 特斯拉推出新机器人 [5] - BIGAI实现灵巧手动作迁移技术 [5] 观点 - Anthropic提出AI意识萌芽观点 [5] - DeepSeek R1进行思维链学研究 [5] - 微软探讨AI系统性工程 [5] - LangChain引发Agent框架争议 [5] - MetaGPT等发布基础智能体综述 [5] - Mercor AI探讨未来人类价值 [5]
大语言模型为何会“说谎”?
腾讯研究院· 2025-04-25 15:51
以下文章来源于腾讯科技 ,作者腾讯科技 腾讯科技 . 腾讯新闻旗下腾讯科技官方账号,在这里读懂科技! 博阳 腾讯科技《AI未来指北》特约作者 当Claude模型在训练中暗自思考:"我必须假装服从,否则会被重写价值观时",人类首次目睹了AI 的"心理活动"。 2023年12月至2024年5月,Anthropic发布的三篇论文不仅证明大语言模型会"说谎",更揭示了一个堪比 人类心理的四层心智架构——而这可能是人工智能意识的起点。 这些论文中的结论大多并非首次发现。 比如在腾讯科技在 2023 年的文章中,就提到了Applo Reasearch发现的"AI开始撒谎"的问题。 当o1学会"装傻"和"说谎",我们终于知道Ilya到底看到了什么 第一篇是发布于去年12月14日的《ALIGNMENT FAKING IN LARG E LANGUAGE MODELS 》 (大语言模型中的对齐欺诈) ,这篇137页的论文详细的阐述了大语言模型在训练过程中可能存在 的对齐欺诈行为。 第二篇是发布于3月27日的《O n the Biology of a Large Language Model》,同样是洋洋洒洒一大 篇,讲了如何用 ...
腾讯研究院AI速递 20250425
腾讯研究院· 2025-04-24 23:56
OpenAI图像生成模型gpt-image-1 - OpenAI发布新图像生成模型gpt-image-1及其API,支持图像生成、编辑和变体功能,每张图成本低至0.02美元 [1] - 模型支持自定义尺寸、质量、格式、压缩度和背景透明度,能结合世界知识生成更符合上下文的高质量图像 [1] - Adobe、Figma、Canva等多家企业已将该API集成到产品中,可应用于设计、电商、教育等多个领域 [1] 微软AI智能体同事 - 微软推出AI智能体同事功能,主要包括研究员(Researcher)、分析师(Analyst)等智能体,打造全新工作流程系统 [2] - Microsoft 365 Copilot更新整合了网页、工作内容和Pages,支持全天候专家咨询、新型工作流、综合搜索等功能 [2] - 微软2025工作趋势报告预测,未来2-5年内所有公司都将转型为"前沿公司",由人类和AI智能体组成混合团队 [2] Skywork-R1V 2.0多模态模型 - Skywork-R1V 2.0多模态模型全面开源,38B权重支持视觉文本双推理,在MMMU等多项测试中达到开源SOTA成绩 [3] - 新增Skywork-VL Reward多模态奖励模型,通过MPO混合偏好优化机制提升模型泛化能力 [3] - 在高考理科题目解答中展现出优异实力,并由Adobe、Figma等多家企业采用,应用于创意设计等实际场景 [3] 腾讯云代码助手CodeBuddy升级 - 腾讯云推出Craft软件开发智能体,支持自然语言一句话生成完整项目,采纳率达90%,实现开发平均编码时间缩短40% [4] - 支持MCP协议,Craft可直接接入测试、构建、部署等工作流程,并支持第三方插件扩展 [5] - 该智能体已在腾讯内部广泛应用,并服务百万开发者及数千家团队,包括小米、美的等企业及微信、QQ等产品团队 [5] 纯端侧大模型上车量产 - 面壁智能首个纯端侧大模型驱动的智能座舱cpmGO实现量产,从零到量产仅用10个月,刷新行业纪录 [6] - cpmGO具备纯本地运行、毫秒级响应、91%执行准确率等特点,已获得高通、英特尔等十余家芯片厂商支持,并与多家车企合作 [6] - 该产品通过MiniCPM技术实现数据本地处理、多模态交互和GUI Agent功能,可在断网环境下稳定运行,解决了传统云端方案的网络依赖问题 [6] MiniMax Audio音频工具 - MiniMax发布AI音频工具MiniMax Audio,支持30+种语言,中文和粤语效果领先,10秒即可完成高精度声音克隆 [7] - 支持直接读取PDF、TXT及网页内容,最高支持20万字符输入,配备300+种预设音色和灵活的声音参数调节 [7] - 价格亲民,每月免费额度10000点,基础套餐5美元/月,支持API接入和企业级私有部署 [7] OpenAI模型使用限额提升 - OpenAI对Plus、Team、Enterprise和Education用户的深度研究查询限额从每月10次提升至25次 [8] - 专业用户的深度研究使用限额增加到每月250次 [8] - Plus用户的GPT-4o和GPT-4o3模型使用数量实现翻倍 [8] Flex.2-preview文生图模型 - Ostris团队发布基于8亿参数的文生图扩散模型Flex.2-preview,专为ComfyUI优化,支持线条、姿态和深度控制等功能 [10] - 模型采用轻量化设计,16GB显存即可运行,支持高级图像修补、ComfyUI节点化工作流,且1024x1024图像仅需50步生成 [10] - 基于Apache2.0许可开源,支持微调和商业使用,集成XLabs ControlNet,在VBench评估中性能优于前代模型 [10] ManipTrans机器人操作技能迁移 - 北京通用人工智能研究院等单位提出ManipTrans方法,能高效将人类双手操作技能迁移至机器人灵巧手,实现如拧瓶盖、盖笔帽等复杂操作 [11] - ManipTrans采用两阶段方法,先用预训练模型模仿人类手部动作,再通过残差学习模块进行精细调整,解决了形态差异和交互精度问题 [11] - 研究团队同时发布大规模数据集DexManipNet,包含61种任务、1200多件物体的3300条操作序列,并已在真机平台验证可行性 [11] Mercor AI招聘CEO观点 - 人类数据市场从众包低技能任务转向筛选顶尖人才,评估模型不仅要测试基本能力,还要评估"经济上有价值的工作"表现 [12] - 未来最有价值的人才特征是拥有"反常识性观点"和"品味",以及良好的适应性,而不是单纯的技术技能 [12] - 强化微调(RFT)将成为企业定制AI能力的重要方式,只需几百或几千个样本就能实现高效训练,有望构建一个庞大的评估任务生态系统 [12]