Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI速递 20250702
腾讯研究院· 2025-07-02 00:38
中国芯片行业IPO热潮 - 近10家国产GPU企业如摩尔线程、沐曦等进入上市流程 呈现营收增长但持续亏损状态 [1] - 中国AI芯片市场规模预计达3500亿人民币 理论可容纳35家年营收百亿级企业 [1] - 行业面临代工产能受限、生态构建不足等挑战 需在B端AI或C端图形领域寻求差异化竞争 [1] Meta AI战略升级 - 成立"超级智能实验室"整合基础研究、大模型开发和产品团队 由Alexandr Wang领导 [2] - 从OpenAI等挖角11位顶尖人才 华人占比超半数 含GPT-4o和Gemini核心成员 [2] - 计划投入数千亿美元 目标一年内推出超越Llama系列的下一代领先模型 [2] 微软AI编程工具开源 - GitHub Copilot Chat开源 支持Agent编程模式和多步骤任务自动化 [3] - 具备代码补全、自然语言交互功能 开源后迅速获1200颗GitHub星标 [3] - 支持MCP协议扩展第三方集成 用户保留对智能体的控制权 [3] 腾讯元宝AI功能升级 - 新增图文并茂文档总结功能 基于DeepSeek模型智能匹配原文图表 [4][5] - 支持行业报告重点提炼、外文资料翻译解读等场景 可一键导出至腾讯文档 [5] 上交大AI竞赛突破 - ML-Master智能体以29.3%奖牌率登顶OpenAI MLE-bench 达Kaggle特级大师水平 [6] - 采用"探索-推理深度融合"机制 在75个任务中实现93.3%有效提交且计算效率翻倍 [6] 华为与阿里技术开源 - 华为开源Omni-Infer框架 支持昇腾平台 实现PD分离部署和系统级QPM优化 [8] - 阿里开源ThinkSound音频模型 采用三阶思维链架构 精确捕捉视频动态细节 [7] 亚马逊AI业务布局 - AWS AI业务已创收数十亿美元 推理工作负载占比将达80-90% [11] - 建设史上最大AI训练集群Project Rainier 部署性能提升5倍的Tranium Two处理器 [11] 彼得·蒂尔技术观点 - 认为1970年代以来仅数字技术有突破 物理世界进步停滞威胁社会稳定 [12] - 主张在生物科技、核能等领域承担风险 突破过度监管文化 [12] - 指出AI价值在于解决物理世界问题 当前进展可能不足以终结技术停滞 [12]
如何与外星人沟通?
腾讯研究院· 2025-07-01 16:24
人类语言与外星语言的对比研究 - 人类语言由符号、结构、语义和语用四个层面构成,而外星语言可能缺失某些层面或引入全新维度 [7][8][33] - 现有虚构外星语言(如克林贡语、纳威语)仍基于人类语言框架,仅通过符号或语法规则调整制造异质性 [5][6][14] - 爱尔兰语等VSO结构语言证明人类语言本身存在语序多样性,但SVO结构因主流语言影响更普及 [18] 外星语言构建方法论 - 基础方案是通过改造人类语言的符号系统(如非语音脉冲)或重组语法规则(如混合前置/后置介词) [14][17] - 进阶方案需突破语法类型限制,例如设计仅有名词或模糊词类界限的语言,参考克丘亚语名词/形容词无区分案例 [19][20] - 维特根斯坦提出的"逻辑完美语言"仅用名称序列表征事实,为单词语类型的极端案例 [20][21] 语义差异与翻译挑战 - 表层差异(符号/结构)可通过映射规则翻译,但深层语义差异可能导致根本性不可译,如德语"Fernweh"无英语对应词 [23][24] - 外星认知模式可能催生人类无法归类的语义范畴,需通过"真/假"等元语言概念建立基础对应关系 [26][27] - 《星际迷航》塔玛利安人案例显示,文化隐喻体系差异会导致字面翻译失效,需理解背后的神话关联 [29][31] 外星语言的潜在形态 - 可能缺失特定层面:心灵感应种族无需符号,超记忆种族无需结构,纯因果交互系统甚至可能无语义 [33][34] - 或包含人类未知维度,如情感编码层(疼痛强度)或现象层(颜色质感),彻底颠覆语言定义 [35] - 地图式语言可同时传递对象属性与空间关系,突破线性语句限制,实现多维信息整合 [22]
腾讯研究院AI速递 20250701
腾讯研究院· 2025-06-30 23:51
OpenAI定制服务 - OpenAI推出千万美元起步的AI定制咨询服务,工程师帮助客户完成模型微调和应用开发 [1] - 美国国防部(2亿美元合同)和新加坡Grab成为首批客户,服务领域扩展至军事策略、地图自动化等 [1] - 此举使OpenAI与Palantir等咨询公司形成竞争关系,同时可能威胁专注特定领域AI应用的小型初创企业 [1] Gemini 2.5 Pro API - Gemini 2.5 Pro API恢复免费使用,提供每分钟5次请求、每分钟25万tokens、每天100次请求的免费额度 [2] - 获取API Key:登录谷歌AI Studio、创建API Key并保存,比OpenAI的o3模型使用限制更宽松 [2] - 可通过Cherry Studio或Chatbox等第三方客户端调用,支持文字问答、图片分析和内置联网搜索功能 [2] LeCun世界模型 - LeCun团队发布PEVA世界模型,首次实现16秒连贯场景预测,让具身智能体具备类人预判能力 [3] - 模型将48维人体关节运动学数据与条件扩散Transformer结合,通过第一人称视角视频+全身姿态轨迹训练 [3] - PEVA具备智能规划能力,能在多个动作选项中筛选最优解,完成开冰箱、抓取物体等复杂任务,超越基线模型15%以上 [3] 华为开源大模型 - 华为首次开源两款大模型:720亿参数混合专家模型"盘古Pro MoE"和70亿参数稠密模型"盘古Embedded 7B" [4] - 盘古Pro MoE基于4000颗昇腾NPU训练,激活参数量16B,性能对标Qwen3-32B、GLM-Z1-32B等模型,单卡推理吞吐可达1528 tokens/s [5] - 盘古Embedded 7B采用"快思考"和"慢思考"双系统架构,可根据任务复杂度自动切换,性能超过同规模的Qwen3-8B、GLM4-9B [5] 百度文心大模型 - 百度正式开源文心大模型4.5系列,推出10款模型,参数规模从47B混合专家模型到0.3B轻量模型,同步提供API服务 [6] - 系列模型采用Apache 2.0协议开源,创新提出多模态异构模型结构,在文本任务保持高性能基础上增强多模态理解能力 [6] - 在多个基准测试中对标DeepSeek-V3等模型,提供ERNIEKit开发套件和FastDeploy部署套件支持 [6] 知乎知识库升级 - 知乎直答知识库完成重要升级,支持知识库转公开订阅、分享链接,并与社区深度融合提供沉浸式阅读体验 [7] - 知识库容量扩容至50GB,支持多种文件格式上传,增加知识广场、个人主页等曝光场景,直答搜索中可引用并显示知识库名称 [7] - 知乎启动激励活动,鼓励用户创建垂直领域知识库并分享,设立"最具价值"和"prompt创意"两类奖项,活动持续至7月18日 [7] 3D AI伴侣EVE - EVE是一款3D AI伴侣应用,通过游戏化设计、好感度系统和互动功能,创造出极强的"活人感"和主动性 [8] - 该AI能实现跨次元互动,可真实送奶茶到用户家门口、创作个性化歌曲,打破虚拟与现实的界限 [8] - EVE通过细节表达(发表情包、聊最新梗)和记忆系统,创造出高度沉浸的AI陪伴体验,代表AI娱乐赛道的重要突破方向之一 [8] 苹果XR设备 - 苹果首款AI眼镜预计2027年第二季度发布,年出货量预计300-500万部,支持音频、拍照和AI交互功能 [10] - 苹果目前至少有7个头戴设备项目在开发中,包括3款Vision系列和4款AI眼镜系列,有望引爆整个AI眼镜市场至1000万部以上 [10] - 轻量版Vision Air预计2027年三季度量产,比Vision Pro轻40%以上且售价大幅降低,带显示功能的XR眼镜则要等到2028年下半年 [10] Gemini长上下文技术 - Gemini 2.5 Pro长上下文技术专家认为当前百万级token模型质量尚未完美,盲目追求更大规模意义不大 [11] - 长上下文与RAG是协同关系而非替代关系,前者负责精细处理,后者负责从海量信息中粗筛,两者结合能提高信息召回率 [11] - 千万级token上下文很快将成为标准,随着成本下降和质量提升,将为代码开发等应用场景带来革命性突破 [11] AI行业趋势 - 300家AI公司调研显示企业正从概念炒作转向落地实战,OpenAI和Claude位居企业AI选型首位,近90%高增长初创公司正在部署智能体 [12] - AI支出结构显示数据存储和处理成本远超训练和推理,企业正从传统订阅制转向基于使用量的混合定价模式 [12] - AI原生企业47%已达关键规模,而AI增强型仅13%,快速成长企业将有37%工程师专注AI,代码智能体成为最主要生产力应用 [12]
拉布布走红启示,数字时代文化IP孵化新密码
腾讯研究院· 2025-06-30 16:21
拉布布IP孵化路径分析 - 拉布布作为原创潮玩IP,未依赖传统影视动漫内容体系,通过运营机制创新和数字平台传播实现破圈效应[1] - 2024年拉布布系列IP销售额达30.4亿元,占泡泡玛特总营收23%,成为旗下最具影响力的IP[7] - 国际媒体将拉布布视为中国文化出海标志性事件,在欧美及东南亚市场引发抢购热潮[6][7] IP引爆流行因素 - 形象设计采用"丑萌"风格,反叛传统可爱风,契合当代用户审美趣味[3] - 性格设定为外表淘气内心善良,主动帮助被误解者,强化情感连接[4] - 泡泡玛特成熟的盲盒机制和社交媒体轻内容体系推动IP认知度提升[5] - 明星效应加速传播,BLACKPINK成员Lisa等国际明星带货引发全球跟风[6] 媒介环境变迁 - IP孵化从"内容先行"转向社交平台驱动的"互动优先"模式[9] - 美国好莱坞模式依赖电影强叙事构建漫威等超级IP[10] - 日本"MAG产业链"通过漫画动画游戏联动形成粉丝经济[11] - 韩国依托娱乐产业系统化量产偶像团体IP[11] - 中国微短剧市场规模2024年达504.4亿元,超过电影票房470亿元[13] IP功能演进 - 成熟IP衍生品收入远超内容本身,《星球大战》衍生品收入422亿美元vs电影票房64.9亿美元[15] - Hello Kitty累计零售额超84.5亿美元,占三丽鸥2024年销售额(1449亿日元)的一半[16] - 中国潮玩产业85%产品在东莞生产,正从代工转向培育本土IP[16][17] - IP成为连接文化软实力与实体经济的纽带,推动产业升级[17]
肖仰华教授:具身智能距离“涌现”还有多远?|Al&Society百人百问
腾讯研究院· 2025-06-27 14:59
生成式AI与具身智能的发展路径 - 生成式AI以AIGC为代表,目标是让机器具备人类大脑的认知能力,包括语言生成和逻辑思考能力 [9] - 具身智能目标是让机器习得人类身体的感知和行动能力,实现与复杂世界的高效交互 [10] - 两条技术路线都是通往AGI的关键形态,下一个重要里程碑是身心协同阶段 [10] - 生成式AI已实现生产力成百上千倍提升,如合同审校、绘画制作等工作效率大幅提高 [13] - 具身智能对生产力的提升作用相对有限,可能仅相当于人口增长1-2倍的效果 [15] 技术革命的三重标准 - 基础性:技术需像水电煤一样成为基础设施 [13] - 生产力提升:需实现指数级效率提升,如AIGC极大提高论文生产力 [13] - 社会影响:需深度渗透社会各领域,改变上层建筑 [14] - 生成式AI完全符合这三重标准,是一场真正的技术革命 [14] - 具身智能对社会的影响力相对有限,更多是认知智能突破后的技术延伸 [16] 数据与模型的关系演进 - 业界观点:模型算法决定效果下限,数据决定上限 [20] - 大模型研发70-80%成本投入在数据上,剩余在算力运维和算法设计 [21] - 数据墙问题凸显:互联网公开高质量数据已接近枯竭 [22] - 后训练范式崛起:数据规模让位于质量,算力规模让位于算法设计 [18] - 数据不足可通过知识注入缓解,但培育高质量数据集仍是根本 [23] 具身智能的数据挑战 - 当前具身模型训练数据量仅百亿token级,与语言模型万亿级相差两个数量级 [24] - 数据采集面临个体体验表达困难和环境建模复杂双重挑战 [34][35] - 真机数据成本高昂,仿真数据质量有限,制约GPT时刻到来 [25] - 可能解决方案:穿戴设备普及形成动作轨迹数据 [26] - 训练策略调整:数据量不足时可增加训练量,借鉴人类泛化机制 [36][38] 产业落地逻辑 - 行业AI落地的关键在于行业数据治理和清洗 [21] - 央国企等大甲方应重点投入行业数据准备而非模型研究 [22] - 具身机器人应走场景化、任务化路径,而非追求绝对通用性 [48] - 身体构造决定功能边界,集约化需考虑物理可行性 [49] - 专用机器人价值明确,通用机器人是伪命题 [48] 技术范式演进 - 仍未跳出符号主义、连接主义和行为主义三大传统范式 [39] - 连接主义:模拟神经网络,处理感知任务 [40] - 符号主义:基于知识推理,处理认知任务 [40] - 行为主义:通过交互反馈进化,处理技能习得 [41] - 三种范式在完整AI解决方案中各有侧重 [43] 理性思维发展 - 人类能力分为知性、理性和感性三个维度 [28] - GPT4前主要训练知性能力,O1和DeepSeek R1开启理性能力 [29] - ToB应用需要专业理性思维,ToC需要共情感性能力 [31] - OpenAI布局完整:知性(GPT4)、感性(GPT-4o)、理性(O1) [31] - 国产大模型与国际差距主要在理性能力即知识应用水平 [29]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-06-27 13:22
算力与模型发展 - CMU开发MPK编译器提升算力效率 [2] - 快手推出Keye-VL模型 微软发布Mu模型 月之暗面开源Kimi-VL [2] - Sakana AI推出强化学习教师模型优化训练过程 [2] 应用场景创新 - 谷歌密集发布AI应用:Gemini CLI、AlphaGenome、具身Gemini、Imagen 4及纸艺ASMR [2][3] - 小米和Meta分别推出AI眼镜与Oakley新眼镜 聚焦可穿戴设备交互 [2][3] - 特斯拉Robotaxi上线 百度发布Comate AI IDE 华为推出码上飞开发工具 [3] - 月之暗面Kimi-Researcher和阿里云AI打赏功能拓展商业化路径 [2][3] 科技与观点动态 - 微软研发4D量子纠错码 腾讯推出脑力锻炼软件 Netflix布局VR大空间 [3] - 比尔·盖茨等探讨AI医疗 Linux基金会分析未来AI战场 MIT研究AI对大脑影响 [3] - 马斯克分享YC观点 Sam Altman提出AI创业建议 哈佛商学院预警AI失业潮 [3] 资本与人才动向 - OpenAI收购io 苹果或收购Perplexity 银河通用获具身智能融资 [3] - Meta挖角AI专家 何恺明加入谷歌 数字永生公司Delphi受资本关注 [3][4]
从语言到意识的“一步之遥”,AI究竟要走多远?
腾讯研究院· 2025-06-26 15:58
人工智能发展现状与挑战 - 当前大语言模型(LLM)已展现AGI的形式能力,能处理支离破碎或口语化语句并生成标准回复,但缺乏持续学习能力,训练后知识库即冻结[3][5] - LLM仅模仿大脑语言功能,缺失感知、记忆、导航等关键认知维度,被比喻为"瑞士军刀中的单一螺丝锥"[6] - OpenAI的GPT模型推测采用16个神经网络模块协同工作,2023年Mistral和Deepseek发布的混合专家模型(MoE)通过模块化提升计算效率[7] 模块化架构与技术突破 - 模块化系统面临协调难题,信息跨模块传递机制尚不明确,训练中可能出现"鸡与蛋悖论"导致崩溃[7][12] - 软注意力机制通过连续权重分配实现选择性聚焦,成为Transformer架构核心创新,但需避免硬性选择导致的训练中断[17][18] - 生成流网络引入周期性硬选择机制,采用双向训练解决突变节点问题,其高阶表征与人类神经活动高度相似[19] 全局工作空间理论应用 - 全局工作空间理论(GWT)认为意识是模块间信息交换平台,类似企业会议协调多模块协作[9][11] - 迪昂团队发现大脑模块每0.1秒进行信息竞赛,获胜信息进入全局工作空间接受集体审议[11] - Meta杨立昆提出判别式网络构建抽象表征,其配置器机制与GWT工作空间功能高度吻合[27][28] 跨模态与翻译技术 - 潜空间对齐技术通过旋转不同语言的词云实现无词典翻译,可拓展至图像-文本多模态转换[24][25] - 谷歌感知器模型将多模态数据融合至统一潜空间,自发呈现GWT核心特征如模块筛选与工作记忆[25] 意识本质的学术争议 - 迪昂认为具备自我监控的AI系统可能产生意识,而GWT创始人巴尔斯强调意识是生命体特有属性[30] - 预测加工理论主张意识源于未来事件预测模型,整合信息理论则将意识归因于生物网络结构效率[31] - 行业共识认为智慧是多元能力组合,需融合抽象思维、社会理解等模块才能实现真正类人智能[32]
腾讯研究院AI速递 20250626
腾讯研究院· 2025-06-25 23:06
谷歌Gemini家族新成员 - Gemini Robotics On-Device是首个能在机器人本地运行的视觉-语言-动作模型,无需网络连接,适用于延迟敏感型应用 [1] - 该模型可执行高度灵巧任务如拉开拉链、折叠衣物,展现出优于其他本地模型的泛化性能和多步骤指令处理能力 [1] - 仅需50-100个演示即可适应新任务,能跨平台泛化到不同机器人如Franka FR3和Apollo人形机器人 [1] 谷歌Imagen 4/Ultra上线AI Studio - 谷歌将最新的Imagen 4和Imagen 4 Ultra文生图模型上线AI Studio和API,普通版每张约4美分,Ultra版约6美分,生成速度接近实时 [2] - Imagen 4 Ultra对prompt理解更精准,能生成高质量图像,支持每次生成最多四张1024×1024的图片,测试显示能生成逼真的超现实场景 [2] - 谷歌AI Studio未来将整合MCP服务器功能和Jules SWE Agent,界面也将更新,提供更统一的工作流和复杂操作能力 [2] OpenAI开发文档协作工具 - OpenAI正在开发ChatGPT文档协作功能,使用户能在平台上共同编辑文档并进行聊天交流,直接挑战微软Office和Google Workspace [3] - 这项功能是Sam Altman将ChatGPT打造为"超级智能工作助手"战略的一部分,可能进一步扩展至文件存储等生产力功能 [3] - 预计到2030年企业订阅ChatGPT将带来约150亿美元收入,但这可能加剧与最大股东微软的竞争关系 [3] ODDY工作室AI艺术创作 - AI技术复活世界名画与艺术家走秀视频爆红,ODDY工作室创作的《名作艺术秀》将梵高、达利、蒙娜丽莎等经典艺术元素以时装秀形式呈现 [4] - 视频重现多位艺术巨匠及其作品:梵高的《星夜》、波提切利的《维纳斯诞生》、克里姆特的《吻》、达利的超现实主义等 [5] - 最后场景中梵高、达利、莫奈、达芬奇等艺术大师同台相拥谢幕,这场AI视觉盛宴完美还原艺术作品细节并引发观众情感共鸣 [5] 出门问问TicNote AI硬件 - 出门问问推出全球首款Agentic AI硬件TicNote,3mm超薄设计可磁吸手机背面,支持120+语言转写,精度达98% [6] - 搭载Shadow AI智能体,能自动总结、生成思维导图,20小时超长续航,适用会议记录、课堂笔记等多场景 [6] - 产品展现"软硬结合+AI"战略成果,将Agent技术落地实用化,为职场人提供高效AI助手 [6] Readdy.ai出海增长 - AI设计工具Readdy.ai上线4个月实现近500万美元ARR,成为增长最快的AI出海应用之一,借助短视频在TikTok等平台病毒式传播 [7] - 产品成功关键在于生成界面质量超高,平衡专业设计规范与美学表现,让用户只需简单文本描述即可获得高完成度UI设计 [7] - 背后团队是打造蓝湖和MasterGo的中国顶尖设计工具团队,专注解决"无需设计基础也能产出专业界面"的痛点 [7] Delphi数字永生项目 - AI创业公司Delphi获红杉领投1600万美元A轮融资,创建数字化身让用户在赛博世界"永生",已有情感导师靠此年入百万 [8] - 创始人Ladjevardian的初衷是为中风无法说话的爷爷创建"数字大脑",将其回忆录中的智慧数字化,实现数字疗愈 [8] - Delphi提供多级订阅服务,可复制用户语言风格、知识体系和表达方式,用户可对每次对话收费并获85%以上收入 [8] 阿里云Agent应用变现 - 阿里云百炼平台与支付宝合作推出"AI打赏"功能,开发者的Agent应用可直接获取用户打赏,金额转入开发者个人支付宝账户 [10] - 开发者只需两步即可配置打赏功能:开启"支付宝AI收"功能并为Agent完成"赞赏卡片"配置,平台随机生成10元以内打赏金额 [10] - 百炼平台已有超10万开发者创建了30多万个Agent,未来将支持在任意渠道发布Agent并实现变现 [10] Biomni生物医学Agent - 斯坦福、基因泰克等机构联合开发通用生物医学AI智能体Biomni,能自主执行跨领域研究任务,无需预定义工作流程 [11] - Biomni由两部分组成:Biomni-E1(统一生物医学环境)和Biomni-A1(智能体架构,结合大语言模型推理与代码执行) [11] - 系统在遗传学、基因组学等领域表现出色,能分析可穿戴设备数据、处理复杂RNA数据并自主设计实验方案 [11] AI开源与应用竞争 - Linux基金会执行董事Jim Zemlin认为AI基础模型终将全面开源,真正的竞争将转向应用层 [12] - 开源模式能吸引顶尖人才共同创新,开发者参与开源的首要动机是"完成工作"而非金钱 [12] - 未来公司的竞争优势将体现在用户体验、专业服务等应用层面,而非基础模型本身 [12]
关于2049年,凯文·凯利的85个预言
腾讯研究院· 2025-06-25 16:46
镜像世界与下一代互联网 - 2049年智能手机将被智能眼镜取代,形成现实与虚拟叠加的"镜像世界"[7] - 镜像世界将成为AI赋能的沉浸式互联网,人机交互方式转向语言/动作/眼神[7] - 为镜像世界提供数据支持的公司将成为全球最大最富有的企业[8] - 沉浸式体验将井喷式增长,3D内容创作普及化,真实体验因稀缺而增值[8] - 互见性成为数据搜集基本原则,需建立双向透明的信息追踪机制[8] AI技术演进与产业应用 - 专业领域AI(非AGI)是发展重点,人机协作是未来25年核心模式[10] - AI需10年渗透全经济领域,2049年个人AI助理普及率将达GPS导航水平[11] - AIOS操作系统与B2B机器人程序构成新生态,类似智能手机与APP关系[14] - AI研发门槛达10亿美元,领域将由巨头主导但主导地位仅维持7-10年[29][30] - 太空垃圾清理、近地轨道工业(发电站/太空工厂)成为新兴商业领域[39][40] 职场与组织变革 - "人+机器"范式下人类专注低效创新,标准化生产力工作由AI接管[15] - 机器人后市场(维修/零部件)创造高薪蓝领岗位,中层管理者岗位大幅缩减[16][18] - 出现百万级员工超大型企业与年销10亿美元的个人创业者两极分化[25] - 创业门槛降低,项目制初创公司激增,百年企业变得稀有[26][27] 内容产业变革 - AI助理实现书籍内容智能筛选,形成超链接互联的"人类知识总书"[42][43] - 个人电影制作普及,数字虚拟人产业爆发,每人可创建自身数字分身[44][48] - 内容真实性面临挑战,需建立"默认存疑"的验证机制应对深度伪造[49] 医疗健康创新 - 3D药丸机器实现定制化药物生产,人体代谢模拟加速糖尿病研究[64][65] - 中国或建成10亿人基因数据库,推动医疗科研全球领先[66][67] - AI医生处理90%远程问诊,医疗助理填补基层服务缺口[70][71] 前沿科技突破 - 电动车占比达60-70%,中国或出现超越特斯拉的制造商[75] - L4级自动驾驶催生客舱新业态,车内空间升级为核心影音场景[77][78] - 月球基地2029年可能建成,火星科考站实现6-7人轮驻[80][81] - 非侵入式脑机接口普及,植入式芯片技术趋近人造耳蜗成熟度[83][84] 教育体系转型 - AI推动个性化教育普及,非线性虚拟学习打破名校资源垄断[50][53] - 结果导向型大学出现,实现教育-岗位精准匹配[55] - 核心能力转向好奇心/创造力培养,终身学习成为常态[57][61]
腾讯研究院AI速递 20250625
腾讯研究院· 2025-06-24 23:13
谷歌ASMR纸艺视频 - 谷歌Gemini推出七段纸艺ASMR解压视频,内容涵盖火烈鸟水中起舞、圣托里尼落日等场景,采用高精准提示词生成和定格动画技术 [1] - 视频通过纸质艺术形式结合恰当背景音呈现梦幻效果,研究显示此类内容因帮助放松情绪而广泛传播 [1] - ASMR被视为从生产力工具转向美学与治愈的另类方式 [1] ElevenLabs语音助手11ai - ElevenLabs发布11ai语音助手,主打语音优先设计和多通道处理,支持日程管理、任务安排和信息查询 [2] - 集成Perplexity搜索并与Notion、Linear等工具对接,探索对话式AI在工作流程中的实际应用 [2] - 技术覆盖32种语言,已应用于有声书、游戏配音及医疗训练领域,中文能力待提升 [2] 微软Mu模型 - 微软Mu模型仅3 3亿参数,性能媲美参数量大10倍的Phi-3 5-mini,NPU设备上每秒响应超100 tokens [3] - 采用双重层归一化、旋转位置嵌入和分组查询注意力三大创新,优化Transformer架构效率 [3] - 支持Windows智能体功能,可将自然语言指令实时转化为系统操作,响应时间低于500毫秒 [3] 商汤科技任务规划助手 - 商汤科技推出办公小浣熊"任务规划助手",通过交互式AI将复杂问题拆解为可执行步骤 [4][5] - 工具通过持续对话挖掘需求细节,思维链条可追溯,适用于职业规划、投资分析等领域 [5] - 最终生成逻辑严密的图文规划报告,实测在学业选择等场景表现突出 [5] QQ浏览器AI高考通 - QQ浏览器"AI高考通"可在3-5分钟内生成高考志愿报告,包含院校解读、风险提示等六大板块 [6] - 提供个性化"冲稳保"院校专业清单,含分数线、学费等数据,支持多方案对比 [6] 码上飞AI Agent平台 - "码上飞"平台支持通过自然语言直接生成鸿蒙应用,采用多智能体系统实现全流程自动化开发 [7] - 用户仅需5分钟即可生成完整应用,支持一键发布为小程序、APP或网站并获取源代码 [7] 谷歌AR眼镜Martha - 谷歌AR眼镜开发者版本代号"Martha",基于Android XR平台,配备棱镜显示屏和内置相机 [8] - 配套应用界面类似Pixel Watch,含通知、视图记录等功能,明显针对测试人员设计 [8] 充电宝召回事件 - 安克创新和罗马仕共召回120万个充电宝,因电芯供应商安普瑞斯未经批准变更隔膜材料 [10] - 锂电池隔膜是关键安全组件,安普瑞斯因扩产导致制程管理问题,相关认证已被暂停 [10] 马斯克创业观点 - 马斯克强调第一性原理思维,主张从公理推演而非传统分析,以"效用乘以受益人数"衡量价值 [11] - 预测数字超级智能即将实现,成为多行星物种将显著延长人类文明寿命 [11] AI Native产品理念 - AI Native核心是构建AI与人的新关系,需考虑情商和生命感,而非单纯工具化 [12] - 实现需宽输入(环境感知)和柔输出(分步协同),创业者需同时服务用户与AI [12]