Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI速递 20250901
腾讯研究院· 2025-09-01 00:02
生成式AI行业动态 - xAI正式发布编码模型Grok Code Fast 1 该模型从零打造 速度比GPT-5快五倍 性价比高 性能进入全球编码模型前五名[1] - 模型架构聚焦真实编程任务 支持多语言 具备全栈开发与bug修复能力 研发团队以华人学者为主 通过用户反馈迭代优化 并公布多模态与视频生成路线图[1] - Meta因内部旗舰模型进展缓慢 Llama 5尚未成型 正寻求与OpenAI或谷歌合作为旗下应用注入AI 已在内部工具接入外部模型[2] - OpenAI发布语音模型GPT-realtime 具备超自然语音生成 情感语调模仿与多模态理解 准确率与推理能力显著提升 支持指令遵循 函数调用 异步对话与图像输入[3] - Realtime API同步上线 扩展SIP连接 复用提示 内置安全防护 以更低价格开放 推动语音AI智能体落地[3] - Claude更新隐私政策 默认允许收集用户对话与编程数据用于模型训练 不同意则仅保留30天 涵盖免费及付费用户[4] - 美团开源龙猫大模型LongCat-Flash 采用5600亿参数MoE架构 创新引入零计算专家和ScMoE 大幅提升效率与速度[5] - 模型在MMLU ArenaHard CEval等基准表现接近或超越DeepSeek V3.1与Qwen3 指令遵循与Agent任务排名领先 支持128k上下文 推理速度超100TPS 成本仅0.7美元/百万词元[5] - 全球七大LLM参加狼人杀210场对战 GPT-5以96.7%胜率领先 展现超强社交推理与操纵能力[6] - 作为狼人时以逻辑框架与心理战精准瓦解对手 作为村民时靠司法化调查体系抵抗操纵 零误伤关键角色[7] - xAI创始工程师李雪辰套现约700万美元股票后 被指窃取Grok核心代码库并叛逃至OpenAI xAI已提起诉讼指控盗取数十亿美元级别商业机密[8] 前沿科技研究进展 - 清华姚班本科生提出分层规划+强化学习框架 让宇树G1机器人在0.42秒内反应击球 连续对拉达106拍[9] - 高层规划器预测乒乓球轨迹与击球时机 低层RL控制器生成协调动作 融入人类动作参考提升击球自然性 实验中击球率96.2% 回球率92.3%[9] AI硬件投资视角 - a16z合伙人指出AI被局限在网页文本框 需通过硬件实现更自然交互 硬件优势在于被动收集语境信息让AI更精准有价值[10] - 关键突破点在于形态因子社会可接受 功能compelling 场景明确 成功路径是找到精确 有价值 社会认可的应用场景[10]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-08-30 10:33
芯片与算力 - 英伟达发布Jetson Thor芯片[3] - 英伟达推出NVFP4算力产品[3] - DeepSeek发布UE8M0 FP8芯片[3] 模型发展 - xAI开源Grok-2模型[3] - Meta等公司提出DeepConf方法[3] - 英伟达推出Jet-Nemotron模型[3] - 面壁发布MiniCPM-V 4.5模型[3] - Sakana AI实现M2N2进化[3] - DeepSeek发现V3.1 Bug问题[3] - OpenAI和Anthropic开发互评模型[3] 应用创新 - Coinbase强制使用AI工具[3] - OpenAI发布GPT-4b micro应用[3] - 群核科技开源SpatialGen[3] - 腾讯会议新增AI纪要功能[3] - Video Ocean推出视频智能体[3] - 钉钉发布DingTalk A1应用[3] - 微软推出VibeVoice-1.5B应用[3] - Perplexity实施AI搜索收入分成[3] - 谷歌发布Gemini 2.5 Flash应用[4] - Anthropic推出Claude for Chrome应用[4] - PixVerse升级至V5版本[4] - DeepMind开发健康大模型[4] - 腾讯举办AI播客挑战赛[4] - 谷歌实现Nano-Banana进化[4] - 腾讯推出HunyuanVideo-Foley应用[4] - 字节跳动发布OmniHuman-1.5应用[4] - n8n建立Agent平台养成系统[4] - 华盛顿大学开发气候模拟应用[4] 科技与事件 - 腾讯等支持科学探索奖[4] - SpaceX实现星舰"十飞"[4] - OpenAI进行权力交接[4] - Meta与Midjourney达成合作[4] - 马斯克提及Macrohard概念[4] - X公司面临垄断诉讼[4] 行业观点 - Claude Code讨论产品迭代机制[4] - a16z分析生成平台格局[4] - 谷歌发布AI能耗报告[4] - Karpathy探讨编程工具链[4] - Delphi研究数字永生概念[4] - OpenAI强调AI技能需求[4] - 国务院推动人工智能+战略[4] - 斯坦福大学分析AI对就业影响[4] - 杨植麟探讨大模型技术决策[4] - a16z发布AI百大榜[4] - Geoffrey Hinton提出婴儿假说[4] - Anthropic警告AI无序风险[4]
《广告法》修订实施十年来,广告监管执法有何变化?
腾讯研究院· 2025-08-29 16:03
文章核心观点 - 新《广告法》实施十年来推动广告行业规模与质量双重跃升 构建健康有序市场生态 监管体系实现从传统向互联网化、技术化、协同化转型 [2][3][6][8][15] - 广告监管重心从事前审批转向事后监测 执法对象从传统媒体偏向互联网媒介 监管模式向技术智能监管转进 [5][6][7][9][10] - 行业面临新兴业态监管挑战 包括商业广告与非广告宣传界限模糊 新消费品广告规制缺失 网络广告执法手段滞后等问题 [15] 广告行业十年发展成果 - 广告产业规模持续扩张 2016年营业额达6000亿元 互联网广告占比超50% 2024年总收入首次突破万亿元达10310.7亿元 其中互联网广告收入8919.1亿元占比86.5% [6] - 传统媒体加速数字化转型 电视台等传统单位互联网广告业务增长超60% [6] - 市场准入门槛取消 广告发布主体数量激增 形成完全自由竞争市场 [3] 广告监管体系变革 - 导向监管全面强化 自2016年起成为市场监管系统头等任务 协同宣传部、网信办开展公益广告展播与社会主义核心价值观传播 [4] - 执法重点转向互联网领域 2024年查处违法广告案件4.69万件 其中互联网广告违法案件3万余件占比63.97% [6] - 建立技术智能监测体系 2016年成立全国互联网广告监测中心 2019年建设移动端监测中心 实现每日超10亿级广告量的智能化监管 [8] 监管机制优化 - 事前审批大幅精简 从1994年26项许可缩减至仅保留特殊商品服务广告审查一项 [10] - 监管模式系统化常态化 以广告监测和举报投诉为双主线 重点打击医疗、食品、金融等民生领域虚假广告 [12] - 构建社会共治格局 通过联席会议机制实现跨部门协同 整合行业协会、平台、媒体等社会监督力量 [15]
腾讯研究院AI速递 20250829
腾讯研究院· 2025-08-29 00:01
大模型安全与性能评估 - OpenAI与Anthropic首次联合评估模型安全性 双方互授API权限进行测试 [1] - Claude模型在幻觉控制方面表现优异 拒绝70%不确定问题 幻觉率显著低于OpenAI模型 [1] - 在越狱测试中OpenAI的o3和o4-mini模型略优于Claude 但在抵抗系统提示词提取方面Claude表现更稳定 [1] 多模态图像生成技术突破 - 谷歌Gemini团队推出原生图像生成模型Nano-Banana 实现质量飞跃 支持一句话生成和编辑高清图像 [2] - 模型采用原生多模态架构 支持连续多轮对话并记忆历史图像和指令 实现像素级完美编辑 [2] - 单次生成5张高清图片仅需13秒 创新交错生成技术可分解复杂指令 文本渲染能力成为进步标尺 [2] 视频与音频生成技术进展 - 腾讯混元开源端到端视频音效模型HunyuanVideo-Foley 输入视频和文字即可生成电影级音效 [3] - 采用双流多模态扩散变换器架构 实现多模态语义均衡响应 在泛化能力、语义响应和音频保真度达业界领先 [3] - 字节跳动推出OmniHuman-1.5视频模型 首次实现双人音频驱动功能 支持两个数字人实时对戏 [4][5] - 模型精准还原口型表情 解析语音情绪并匹配肢体语言 支持文本控制风格动作 维持一分钟以上时序连贯性 [4][5] AI自动化平台商业化 - 工作流自动化工具n8n在8个月内营收增长4倍 估值达23亿美元 活跃用户超23万 [6] - 平台升级为AI应用编排层 通过可视化方式连接应用和数据库 支持构建Agent处理复杂任务 [6] - 采用Fair-Code许可模式 比传统开源更利于商业化 支持高度定制化工作流部署 [6] AI科学计算应用 - 华盛顿大学利用AI将气候模拟时间从数月缩短至12小时 成功实现1000年数据模拟 [7] - 深度学习模型替代传统物理方程计算 在保持高精度同时大幅提升效率 助力极端天气预测研究 [7] 行业竞争格局变化 - AI百大榜单显示ChatGPT首次失去榜首位置 开源模型与闭源模型差距明显缩小 [8][9] - 多家中国公司模型进入前20强 评测维度从基础能力扩展至实际应用效果和商业价值 [8][9] AI安全与治理前瞻 - Geoffrey Hinton预警超级AI可能在10年内出现 具备创造力、自主意识和自我改进能力 [10] - 提出人类需接受被AI抚养的"婴儿假说" 呼吁延迟AI训练5年直至安全保障措施完善 [10] - Anthropic CEO指出AI存在无序风险 需构建可靠可理解的系统 公司正组建安全评估团队 [11]
AI是通向“超人”的阶梯,还是退回“猿猴”的陷阱?
腾讯研究院· 2025-08-28 18:38
AI对人类智力的影响 - AI可能使人类思维同质化 缺乏新意和批判性思考[2] - 麻省理工学院实验显示使用ChatGPT组记忆正确率仅11.1% 远低于未使用组的88.9%[4] - 脑电波数据显示AI使用组神经连接强度(dDTF=0.009)显著低于未使用组(dDTF=0.053)[4][5] 认知能力变化机制 - 认知负荷转移导致大脑处理能力退化 类似过度依赖导航系统[5] - 认知卸载效应使大脑为节省能量将任务外包给AI工具[5] - 知识平庸化趋势使AI输出内容缺乏思想灵魂 呈现平铺直叙特征[6] 智力维度重构 - 智力应视为多维光谱而非单一分数 包含批判思维/记忆力/逻辑推理等多要素[10] - AI主要替代计算和记忆能力 但创造力/情感理解/同理心等软技能仍难以被取代[10] - 认知增强使人类从繁琐记忆中解放 专注于高级认知活动[11][12] 教育体系变革 - 教育需从知识灌输转向培养批判性思维和创造力[17] - 可探索无分数学习模式 将基础知识学习交由AI处理[17] - 认知教育应重点培养语言能力/逻辑能力/自主判断能力等基础认知能力[18] 人机关系重构 - 需重新定义人类价值锚定点 探索深空/深海等新疆域[14] - 未来可能出现人机混合的赛博格新物种 改变人类生产生活方式[15] - 意识问题构成人与机器的本质区别 需警惕AI对人心智的渗透[15] 技术发展辩证观 - AI影响具有动态辩证性 既存在降智风险也具备启智潜力[9] - 技术将淘汰平庸思维 解放敢于提问和善于反思的独特智慧[18] - 国务院要求深入研究AI对人类认知判断的深层次影响机制[2]
腾讯研究院AI速递 20250828
腾讯研究院· 2025-08-28 00:01
英伟达NVFP4技术突破 - 推出NVFP4新格式 以4-bit精度实现16-bit训练精度 在Blackwell Ultra上性能较Hopper架构提升7倍 [1] - 采用微块缩放 E4M3高精度块编码 哈达玛变换和随机舍入技术 解决低精度训练中的动态范围 梯度波动性和数值稳定性问题 [1] - 与AWS 谷歌云 OpenAI等机构合作 在万亿级令牌规模下实现稳定收敛 节省大量算力和电力成本 [1] 谷歌Gemini 2.5 Flash图像模型 - 发布gemini-2.5-flash-image-preview模型 拥有SOTA图像生成与编辑能力 出色角色一致性和极快速度 [2] - 支持32k上下文 每张图像生成成本仅0.28元 比OpenAI便宜95% 在Google AI Studio和Gemini API提供预览 [2] - 图像编辑功能卓越 支持换装 换场景 合成照片和多轮编辑 在Artificial Analysis图像编辑类别排名第一 LM Arena多项指标夺冠 [2] Anthropic浏览器扩展发布 - 推出Claude for Chrome浏览器扩展 可帮助用户设日历 回邮件 找房等任务 在侧边窗口保留浏览器活动上下文 [3] - 目前仅向1000名Max套餐用户开放测试 主要考虑安全因素 防范提示注入攻击 设置限制访问特定网站功能 [3] - AI浏览器成为巨头争夺新战场 Perplexity推出Comet 微软Edge集成Copilot 谷歌Chrome集成Gemini OpenAI将发布AI浏览器 [3] PixVerse视频生成技术升级 - V5视频生成模型大幅提升速度 5秒生成360p短片 1分钟完成1080p高清视频 降低AI视频创作时间和成本 [4] - 优化动态 清晰度 一致性和指令理解能力 增强人物场景一致性 提供更接近真实拍摄效果 [4] - 新增续写和Agent智能体功能 视频可丝滑延长至30秒 提供多种创意模板 降低普通用户视频创作门槛 [4] DeepMind健康大模型突破 - 发布基于Gemini微调的健康大语言模型PH-LLM 能将可穿戴设备数据转化为个性化健康建议 在睡眠和运动领域表现优异 [5][6] - 在睡眠医学考试中得分79%超过医生76% 在健身认证考试中表现88%远超专家71% 能根据传感器数据预测用户睡眠质量 [6] - 采用两阶段训练 先对完整模型进行睡眠和健康领域微调 再增加多模态适配器预测睡眠障碍 根据个体传感器数据生成高度个性化建议 [6] 腾讯开放原子大赛 - 开放原子大赛腾讯赛题第二期启动 新增AI播客和数据库方向赛题 总奖金40万元 全球招募开发者 [7] - 混元AI播客创新智造挑战赛奖金10万元 基于混元开源模型开发三类AI播客技术 文本转多角色对话 契合风格播客和深度话题播客 [7] - 包括OpenTenBase-TXSQL改写优化挑战赛30万元 决赛11月在腾讯深圳总部举行 优胜方案代码有机会融入开源项目 [7] SpaceX星舰技术进展 - 星舰第十次综合飞行测试成功执行 由第二代星舰S37和B16助推器组成 完成星链卫星模拟器部署等关键任务 [8] - B16助推器测试飞行极限和发动机系统冗余设计 S37飞船完成猛禽发动机太空点火 重入大气层并溅落印度洋 [8] - 关键任务包括测试易受损区域耐受度 不同隔热瓦性能 捕捉连接件热性能和襟翼极限 为载人和火星移民计划铺平道路 [8] AI对美国就业市场影响 - 斯坦福报告显示自2022年末以来AI暴露度越高职业就业增长越慢 22-25岁劳动者在高AI暴露度职业中就业率下降明显 [9] - AI对就业影响体现在替代或增强人类工作能力 用于替代工作时年轻劳动者就业率下降 用于增强时就业率上升 [9] - 高AI暴露职业年轻劳动者有13%相对就业下降率 AI主要替代年轻人掌握的编码知识 较少替代年长者积累的隐性知识 [9] 大模型技术决策与Agent发展 - 大模型技术从预训练/SFT转向预训练/强化学习 从缸中之脑转向Agentic系统 K2模型采用MoE架构和Muon优化器实现更高token效率 [10][11] - Agent泛化性追求通用性而非简单模拟人类行为 可能需要用更多AI训练AI和InnovationL4解决AgentL3问题 [11] - 将OpenAI的L1-L5分级视为非线性技术里程碑 认为AGI是方向而非终点 组织管理需要平衡SFT和RL [11]
胡泳:什么是“信息蜂房型”的互联网产品?
腾讯研究院· 2025-08-27 17:28
信息蜂房概念核心 - 腾讯研究院提出信息蜂房概念以对抗信息茧房 强调用户作为能动的协作性信息生态参与者而非被动封闭的个体 [1] - 信息蜂房隐喻蜜蜂灵活采集花粉 区别于蚕蛹被茧包裹的被动状态 体现多元流动 主动探索和协作共建三大核心要素 [1][2] 信息蜂房四大特征 - 多元信息入口 包括订阅 社交 搜索和专业渠道等多维度获取方式 避免单一算法推荐导致的信息茧房 [4] - 强用户主动性 用户自主探索信息而非被动刷流 形成个性化知识地图并参与评论分享和内容创作 [5][6] - 协作共建机制 用户作为信息创造者 传播者和评价者共同塑造生态 通过共享机制和对话降低个体隔离风险 [7][8][9] - 生态互联 不同信息节点间通过开放接口 跨平台搜索和内容标准化实现自由流动 避免算法驱动的单一栽培 [10][11][12] 支持生态互联的具体措施 - 技术手段包括开放接口与数据互通 跨平台搜索聚合工具 内容标准化 跨节点推荐和多入口导航 [11][12] - 制度设计涵盖鼓励多样化创作 开放共享政策 跨群体协作以及版权与协作规范保障 [13] - 用户行为引导注重主动探索与多入口使用 通过导航工具 改进推荐逻辑和多维分类帮助用户发现知识联系 [14] 符合信息蜂房特征的产品案例 - 维基百科 开放式协作编辑 多语言版本和内部链接网络促进多元共生 [17] - Quora类问答平台 用户主动提问与回答形成多角度知识网络 类似社会化知识市场 [17] - 豆瓣 通过小组 同城和评论构建兴趣社群 用户生成内容驱动非严格分类的动态信息流 [18] - Reddit 由多样化subreddit社区组成 用户跨社区流动并通过投票机制决定内容排序 [19] - RSS/播客类产品 用户主动订阅实现去中心化信息获取 支持多感官呈现和连续学习体验 [20] - 开源社区如GitHub 开发者协作贡献代码工具和文档 通过版本控制和问题跟踪实现知识迭代 [21] - 开放获取知识系统如PubMed Central 免费提供全文文献 支持数据挖掘和跨国知识网络构建 [22][23] 信息生态优化方向 - 增强用户能动性 提供搜索订阅等工具支持主动探索和跨领域信息获取 [25] - 推动多元共生 在内容分发中引入多样性激励机制增加跨圈层内容 [25] - 鼓励群体协作 通过社区化和开源共建机制促进信息流动与协同演化 [26] - 构建健康信息生态需兼顾多元化 透明度和公共性 支持知识生成流通和共享 [26]
腾讯研究院AI速递 20250827
腾讯研究院· 2025-08-27 00:01
生成式AI模型技术突破 - 英伟达推出Jet-Nemotron小模型系列(2B/4B参数),采用后神经架构搜索与JetBlock线性注意力模块,在数学、代码、常识等维度性能超越Qwen3、Gemma3等主流开源模型 [1] - 模型在H100 GPU上推理吞吐量最高提升53.6倍,长上下文场景优势显著 [1] - 面壁多模态模型MiniCPM-V 4.5以8B参数量超越Qwen2.5-VL 72B模型,成为首个具备高刷视频理解能力的多模态模型 [2] - 支持最大96倍视觉压缩率,可接收6倍视频帧数量,采用3D-Resampler压缩技术和统一OCR学习 [2] - 微软开源音频模型VibeVoice-1.5B,可连续合成90分钟超长语音,支持4名发言人,实现3200倍音频压缩 [3] - 采用双语音tokenizer架构解决音色与语义不匹配问题,压缩效率是主流Encodec模型的80倍 [3] 模型融合与演化创新 - Sakana AI提出M2N2模型融合进化方法,引入竞争与吸引力机制,打破预定义静态边界 [4] - 通过多样性竞争促使模型专业化,择偶机制根据互补优势配对融合,避免灾难性遗忘问题 [4] - 方法兼容不同目标训练的模型,不需原始训练数据即可保留模型能力 [4] 模型部署与运营问题 - DeepSeek V3.1存在异常插入"极/極/extreme"等token的bug,影响语法树和代理流程 [5] - 问题出现在第三方量化部署和官方全精度模型中,即使保守解码参数设置也无法避免 [6] - 对依赖自动化编码或测试流水线的团队造成重大麻烦 [6] AI商业与生态发展 - Perplexity推出全球首个AI搜索收入分成计划,设立4250万美元基金分配给出版商 [7] - 出版商可获得Comet Plus订阅收入(月费5美元)的80%,基于内容出现频率或查询次数分享收入 [7] - 马斯克旗下公司起诉苹果与OpenAI,指控通过锁定市场维持垄断地位,阻止创新者参与竞争 [8] - 诉讼索赔数十亿美元,案件可能影响AI市场范畴界定和商业合作模式 [8] 机器人硬件与算力升级 - 英伟达发布机器人专用芯片Jetson Thor,采用Blackwell架构GPU,AI算力达2070 FP4 TFLOPS [9] - 算力是上代Jetson Orin的7.5倍,内存容量128G,显存带宽273GB/s,能效提升3.5倍 [9] - 宇树科技、银河通用机器人等中国厂商首发搭载,开发者套件售价3499美元 [9] 人工智能教育与政策 - OpenAI教育负责人表示70%雇主更倾向招聘会使用AI的新人而非有10年经验的老手 [10] - ChatGPT成为全球最大学习平台,Study Mode功能以苏格拉底式方法指导学习 [10] - 国务院发布《人工智能+行动意见》,提出2027年实现AI与6大重点领域深度融合 [12] - 重点覆盖科学技术、产业发展、消费提质等领域,要求加强算力统筹、数据供给等八大基础支撑 [12]
人工智能下一站:新消费硬件
腾讯研究院· 2025-08-26 17:35
文章核心观点 - 全球AI消费硬件产业正沿着AI原生设备探索、渐进强化现有设备、模型赋能第三方硬件三条核心发展路线演进,并形成与之适配的差异化商业模式[2][4][8] - AI硬件交互范式正向"无感化"方向转变,AI眼镜成为关键载体,长期可能取代手机成为主流交互终端[21][22][26] - 行业竞争焦点从单一硬件创新转向模型能力、硬件形态与应用生态的三维融合,软件生态成为决胜关键[27][28] AI消费硬件发展路线 - **路线1:AI原生设备探索派**:以Rabbit R1、Humane AI Pin为代表,完全重构交互范式,采用"意图即操作"理念,弱化App和菜单,依赖大模型驱动语义理解[4][5] 但面临极高不确定性,例如AI Pin已于2025年2月28日停止所有在线功能,Rabbit R1存在低活跃用户率、性能稳定性问题[5] - **路线2:渐进强化派**:以苹果、Meta为代表,在现有终端(手机/眼镜/耳机)系统集成AI能力,例如Apple Intelligence通过本地大模型(M系列芯片支持)实现端侧AI处理[6] 2024年9月美国调研显示Apple Intelligence推动消费者支付意愿提升11%,成为54%潜在换机用户核心决策因素[12] - **路线3:模型赋能派**:以OpenAI、谷歌为代表,通过API/SDK将模型能力注入第三方硬件,例如GPT-4o嵌入Ray-Ban智能眼镜提供实时对话能力[7] 该路径面临模型推理成本高、终端适配技术门槛、平台控制权缺失等挑战,例如谷歌需向三星支付高额授权费并让渡部分订阅收益以换取Gemini AI在Galaxy S25预装[15] AI消费商业模式分析 - **AI原生探索派商业模式**:依靠硬件溢价(如Rabbit R1售价199美元)和订阅服务收费,但陷入硬件价值证明困局[10] 例如日本GROOVE X的LOVOT陪伴机器人售价3935美元配合67美元月费,但全球发售5年销量仅1.4万台,年均出货不足3000台[11] - **渐进强化派商业模式**:以硬件销售为主,通过订阅服务(如健康分析报告、专业翻译)创造持续性收入[12] 例如Oura Ring转向"基础数据免费+深度健康服务订阅"模式后,订阅转化率增长18%[13] - **模型赋能派商业模式**:通过API调用量收费(如Token消耗量或请求次数),并提供企业级订阅和私有部署服务[15] 该模式面临终端厂商自研模型趋势冲击,例如vivo通过自研蓝心大模型减少第三方API依赖[15] 技术实现与产业生态 - **端云结合成为主流技术路径**:端侧处理高频低延迟任务(如相册整理、实时翻译),云端处理复杂计算任务(如长文案创作)[20] 终端设备常用模型参数量多低于70亿(7B),以30亿(3B)和40亿(4B)规模最为普遍,部分采用MoE架构平衡性能与功耗[20] - **产业链上下游加速整合**:模型厂商与芯片巨头深度合作,例如Meta与高通合作优化Llama 3在骁龙芯片的移动端运行效率[18][19] 阿里巴巴推动通义千问大模型与硬件厂商适配构建完整生态系统[19] - **AI眼镜成为关键硬件形态**:2025年多家巨头进入市场,包括Meta Oakley Meta(399-499美元)、小米AI Glasses(1999元)、谷歌Android XR眼镜(未公布价格)、阿里Quark AI Glasses(预计中端价位)[24] 未来发展趋势 - **交互范式向无感化演进**:语音和视觉交互逐步取代触控,语言用户界面(LUI)可能取代图形用户界面(GUI)[26] OpenAI正与前苹果设计师合作开发无屏幕、以对话式AI为核心交互的新型硬件[25] - **AI从功能补充升级为应用入口**:三星Galaxy S25搭载的AI Agent Bixby支持跨越30多个本地应用和10多个第三方应用的一体化操作[27] Google实现Gemini与Search、YouTube、Gmail等产品数据打通,可直接访问用户历史数据并写入应用[28] - **生态协同成为竞争核心**:Meta眼镜成功关键因素是无缝接入Instagram、Facebook社交矩阵,提供即拍即传的闭环体验[28]
研讨回顾|姜还是老的辣,AI公益课还是“一起学”的好
腾讯研究院· 2025-08-26 17:35
项目背景与目标 - 腾讯研究院联合多个团队筹备"腾讯长辈AI公益课"系列 旨在帮助老年人跨越数字鸿沟 提升AI应用能力[3] - 项目从2023年8月开始推进 已完成4节示例课和初步方案设计[4] - 通过线上研讨会邀请老年教育领域专家对课程方案进行点评与优化[5] 老年人AI需求调研 - 针对60-80岁长者群体的调研发现六大核心需求:出行与生活便利 医疗服务 陪伴与社交 健康管理 娱乐创作 安全与防护[7] - 调研样本为100名长者 发现主要学习障碍是"需要反复练习"和"容易遗忘"[10] - 多数长者倾向先掌握基础功能再实践应用[10] 课程体系设计 - 课程分为生活场景类和艺术创作类两大单元 覆盖AI陪伴 出行 医疗 绘画 视频创作等核心板块[10] - 采用"示范→拆解→跟练→拓展"的功能制教学路径[10] - 每课时长控制在15-20分钟 符合老年人注意力集中时长[16] 课程设计原则 - 避免年龄标签化 倡导"无龄感"课程设计[12] - 采用场景化 生活化 剧情化的保姆级教程 对专业术语进行解释[14] - 简化操作界面 重点解决APP下载等初级卡点问题[14] - 减少文字说明干扰 采用语音解说配合路径图展示[16] - 区分基础版与进阶版教学 基础版聚焦核心功能实现[17] 教学模式创新 - 开发普通话与方言双版本课程 依托混元大模型多模态技术能力[21] - 建立线上课程社群 通过推选班委形成学习小组实现互助学习[23] - 运营1119个课程班级群 通过定期例会支持班级管理者[23] - 设置作品展示平台 通过大赛 征稿等形式激发创作热情[25] 社会价值体现 - 项目体现科技企业社会责任 推动AI技术普惠化应用[3][27] - 通过"老带新"模式实现"老有所为"的社会价值[23] - 探索AI时代应对老龄化的创新解决方案[27]