Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-11-08 10:33
算力领域动态 - 寒武纪发布Cambricon NeuWare [3] - OpenAI与AWS达成合作 [3] - 英伟达推出太空AI服务器 [3] - 谷歌公布太空AI计划 [3] 模型技术进展 - Cursor发布Composer-1模型 [3] - Kimi应用线性注意力技术 [3] - 美团推出LongCat-Flash-Omni模型 [3] - 谷歌发布Gemini 3 Pro预览版 [3] - 月之暗面推出Kimi-k2 thinking模型 [3] - 科大讯飞发布星火X1.5模型 [3] 应用场景拓展 - OpenAI推出Bug智能体并调整使用政策 [3] - Canva发布创意操作系统 [3] - 百度推出魔法漫画应用 [3] - Cartesia发布Sonic-3 [3] - Turbo AI推出AI笔记功能 [3] - Rokid推出AI智能眼镜 [3] - 昆仑万维推出SkyReels [3] - MiniMax发布Music 2.0 [3] - Nuna推出AI智能吊坠 [3] - Anthropic提出代码执行范式 [4] - 兔展智能发布Uniworld V2 [4] - QQ浏览器推出AI+小窗功能 [4] - 谷歌对Earth AI进行升级 [4] - Generalist推出具身基础模型 [4] - 银河通用发布导航基座模型 [4] - 苹果与谷歌就Gemini达成合作 [4] - 腾讯云推出CodeBuddy Skills [4] - 高德与小鹏达成Robotaxi合作 [4] - Sandbar推出Stream Ring [4] - Future House推出AI科学家Kosmos [4] - 行业举办多模型AI交易大赛 [4] - 小鹏推出IRON机器人 [4] 行业观点与趋势 - 马斯克提出智力飞升概念 [4] - 斯坦福大学研究AI在言语治疗师领域的应用 [4] - Brex讨论AI工作流 [4] - OpenAI与微软深化合作 [4] - 多公司进行AI浏览器实测 [4] - 李飞飞提出公共利益观点 [4] - a16z讨论数据护城河与AI投资周期 [4] - Hinton讨论AI取代劳动 [4] - ElevenLabs提出AI创业方法论 [4] - Replit讨论AI程序员发展 [4] - Ilya Sutskever谈及AI法庭作证 [4]
预测式AI为什么一败涂地?
腾讯研究院· 2025-11-07 16:30
预测式AI的核心问题 - 预测式AI基于历史数据做出预测,但相关性不等于因果关系,可能导致灾难性决策,如医疗AI模型错误判断哮喘患者肺炎风险较低[18] - 系统无法预测自身决策对环境的改变,当部署到新场景时,历史数据的准确性无法保证决策质量[19][21] - 预测式AI的营销宣传常夸大效用,但实际开发依赖人类决策和带有偏见的数据,承诺的公平性和效率优势缺乏可靠证据[13][15] 预测式AI的应用缺陷 - 自动化招聘工具易被表面因素操控,如视频面试背景、简历格式或关键词填充,这些修改不影响实际工作能力却改变AI评分[24][25] - 刑事司法系统使用COMPAS等工具预测犯罪风险,但依赖逮捕记录而非犯罪记录,加剧种族偏见,黑人因相同行为比白人更易被标记高风险[42] - 医疗资源分配模型如Optum Impact Pro用医疗费用替代健康需求预测,使已获更好服务的群体持续获得资源,放大种族不平等[40][41] 数据与系统局限性 - 模型训练数据常与目标群体不匹配,如PSA系统基于全美数据但无法适应低犯罪率地区,导致高风险误判和不当监禁[33][34] - 儿童虐待预测工具仅覆盖使用公共服务的低收入家庭数据,无法评估富裕家庭,造成对弱势群体的过度聚焦[35][43] - 依赖现有数据而非专门收集新数据,如医疗领域缺乏随机对照试验验证,使决策可靠性存疑[20] 过度自动化与监管失效 - 荷兰福利欺诈算法错误指控3万名家长,使用国籍作为预测因素,缺乏申诉机制导致严重社会后果[28][29] - 系统声称有人工监督但实际未修正决策,如多伦多海滩水质预测工具64%的错误未纠正,联合健康集团员工被要求服从90%错误的AI决策[30][31] - 自动化偏见广泛存在,75%飞行员在模拟实验中因系统错误警报关闭正常引擎,显示过度依赖自动化风险[31] 行业影响与商业动机 - 预测式AI被医院、雇主、政府等广泛用于资源分配,但商业激励促使公司选择易于量化的替代指标(如医疗费用)而非真实目标[41] - 招聘领域约3/4美国雇主使用自动化筛选工具,过程不透明使候选人策略性修改申请材料,而非提升实际技能[24][26] - 企业对随机性的恐惧驱动预测式AI应用,试图在人才识别等不确定任务中强加模式,而非接受固有随机性可能带来更公平结果[48][51]
腾讯研究院AI速递 20251107
腾讯研究院· 2025-11-07 00:09
生成式AI模型进展 - 谷歌计划11月面向部分用户开放Gemini 3 Pro预览版,正式发布可能在12月,其上下文窗口可达100万tokens,适合处理长文档和复杂数据流水线 [1] - 月之暗面正式发布Kimi-k2 thinking模型,具有通用Agentic能力和推理能力,价格方面输入4元/百万tokens、输出16元/百万tokens [3] - 科大讯飞发布星火深度推理大模型X1.5,采用MoE架构总参数293B,推理激活仅30B,推理速度相比X1提升100% [4] - 初创公司FutureHouse推出新一代AI科学家Kosmos,单次运行可解析1500篇论文并执行42000行分析代码,测试用户评估其一天完成的工作量相当于六个月科研投入 [8] 行业合作与商业模式 - 苹果正接近与谷歌达成协议每年支付约10亿美元,换取Gemini模型为新版Siri提供核心AI能力,Gemini将运行在苹果私有云计算服务器上,用户数据不会接触谷歌系统 [2] - 高德宣布与小鹏汽车达成合作,未来将共同面向全球提供Robotaxi服务,高德通过TrafficVLM模型实现"超视距"能力,可在几公里外感知突发事故 [6] - 腾讯云CodeBuddy成为国内首个支持Skills标准化接口的AI编程工具,开发者可为AI添加多样化技能包,实现PDF智能处理、自动生成PPT等功能 [5] AI应用与产品创新 - 前Meta工程师创立的Sandbar推出智能戒指Stream Ring,售价249美元起,支持语音转录、AI助手交互和音乐控制,已获1300万美元融资 [7] - Replit创始人认为最终英语才是编程语言,用户身份从人类转移到AI Agent本身,AI长时推理能力已从几分钟突破至数小时 [8]
招聘|腾讯研究院法律研究中心实习生
腾讯研究院· 2025-11-06 16:33
岗位职责 - 跟踪梳理解读全球数字经济与人工智能领域的前沿法律伦理问题及立法趋势[3] - 参与支持AI治理和AI安全等研究课题并协助撰写研究文章报告[3] - 处理其他日常事务[3] 任职要求 - 专业背景要求为网络法、数字法、人工智能法、科技伦理或AI治理等方向的研究生在读[4] - 需熟悉互联网与AI领域的法律政策、安全治理议题及行业发展动态[4] - 能够熟练使用国内外生成式AI产品并具备数据分析与PPT制作能力[4] - 要求逻辑思维能力强、理论文字功底好、学习研究创新能力及自驱力突出[4] - 需具备优异的英语水平且可提供雅思或托福等相关证书[4] - 实习时间要求全职至少6个月并可尽快到岗[4] 工作地点与申请方式 - 工作地点位于深圳或北京[5] - 申请需提交简历和代表性研究成果至指定邮箱[5] 实习收获 - 可参与重要的AI安全与治理研究课题[7] - 获得互联网行业最新的学习机会[7] - 接触中外产业界和学术界的研究资源[7]
我们对AI认识远远不足,所以透明度才至关重要|腾研对话海外名家
腾讯研究院· 2025-11-06 16:33
文章核心观点 - AI透明度是理解、信任和治理AI的关键,其核心在于让AI的活动、行为和影响变得“可见”[2][3][10] - 随着AI智能体具备自主性,AI与现实世界的界限模糊,治理AI的前提是看清AI,而透明度机制为此提供了观察视角和一手数据[7][8] - 透明度机制旨在建立一条可验证、可反馈、可改进的AI治理路径,是AI社会契约的核心[23] 为什么“看见”AI如此重要 - “AI活动标识”已成为全球监管共识,中国和欧盟等已将其写入法律,要求明确标示AI生成内容和AI系统互动,以帮助用户识别伪造信息、降低受骗风险[7] - AI系统正从工具进化为具备自主性的智能体,能执行交易、编写代码、操控设备,但行业对其运行逻辑、风险链条和社会影响仍处于“认知真空”状态[7] - 透明度制度的长远价值在于为研究、评估和应对AI风险提供真实观察视角,例如判断“AI说服”的影响程度和范围,前提是能准确区分AI与人类的互动[8] - 透明度能缓解技术认知“黑箱”带来的治理焦虑,平衡各方信息不对称,使风险焦虑回归治理理性,是推广AI应用的基础[9][10] AI标识的有效性探讨 - 现有法律多聚焦于对AI生成内容的标识,但AI智能体的“行为”如自动点赞、评论转发可能造成“虚假热度”,操纵算法推荐,存在标识“盲区”[13] - 标识义务应考虑分层设定:上游模型开发者负责嵌入水印,下游应用开发者负责配合检测且不得移除水印,以保护中小创新者积极性[14] - 水印检测工具需在透明和稳健间权衡,可能方案是授权给社交媒体平台等关键节点进行验证,同时保持技术细节不公开以防滥用[15] - 欧盟关于《人工智能法案》第50条的实践准则编制工作预计明年5月完成,重点从“安全”转向“透明度”[15] 模型规范的透明度机制 - 模型规范是AI企业公开的文件,用于说明模型的行为边界、价值准则和设计原则,例如OpenAI设定模型应与用户共同追求真实[17] - 模型规范保障用户知情权与选择权,同时也是监管和社会公众监督的依据,例如Meta因内部政策允许AI与未成年人开展“浪漫”互动而修改规则[17] - 模型规范遵守是核心问题,目前依赖用户实测反馈、系统卡和事故报告披露等方式进行评估,但仍有不足[18] - 企业应公开模型规范遵守的技术、流程、评估结果及事故情况,例如xAI、Anthropic和OpenAI采用了不同的嵌入或对齐方法[18] 模型规范遵守的开放问题 - 模型规范及遵守是否应强制作为法定义务存在争议,过早定型可能抑制治理机制创新,且监管面临验证主体和标准差异化的执行难题[20] - 透明度要求需平衡商业秘密保护,哪些关键环节、数据指标应披露尚无定论,验证流程的真实性与可解释性本身存在困难[20] - 在当前技术不成熟阶段,模型可能偶发违背规范,责任认定应审慎,重点关注企业是否遵守规范、披露事故及及时修正问题[21]
腾讯研究院AI速递 20251106
腾讯研究院· 2025-11-06 00:01
生成式AI与太空计算 - 谷歌宣布Project Suncatcher计划,将于2027年初发射两颗搭载Trillium代TPU的原型卫星,利用太阳能驱动AI计算 [1] - 该计划构想由太阳能卫星星座通过光通信链路相连,太空太阳能效率比地球高8倍且几乎可持续发电 [1] - Trillium TPU已通过辐射测试可承受5年任务周期,预计到2030年代中期卫星发射成本可降至每千克200美元 [1] AI Agent效率优化 - Anthropic发布基于MCP的"代码执行"新范式,让模型编写代码调用工具,将Token消耗从15万降至2000,效率提升98.7% [2] - 新范式采用按需加载工具定义和数据本地流转设计,解决工具定义过载和中间结果消耗两大效率瓶颈 [2] - 该方案带来渐进式披露、上下文高效、强大控制流、隐私保护和状态持久化五大核心优势 [2] 多模态模型与图像编辑 - 兔展智能&北大推出UniWorld-V2图像编辑模型,在GEdit-Bench和ImgEdit基准测试中取得SOTA,综合表现超越OpenAI的GPT-Image-1 [3] - 模型基于首创的UniWorld-R1强化学习框架,采用多模态大语言模型作为免训练奖励模型,实现精准中文字体渲染和精细化空间可控 [3] - UniWorld-R1框架具有极强通用性,应用于其他基础模型时同样带来显著性能提升 [3] 产品集成与用户体验 - QQ浏览器电脑端推出"AI+"小窗功能,以无感悬浮小窗形式集成14种AI工具,从网页总结到订阅下载均可在小窗内完成 [4] - 新版本升级极简框架合并菜单与个人中心,地址栏右侧搜索框支持常驻或隐藏,提供更多自定义操作选项 [4] - 基于精准意图识别,"AI+"小窗能主动推荐可使用的AI功能,包括智能标签整理、AI翻译、订阅助理等多种生产力工具 [4] 地理空间AI应用 - 谷歌升级Earth AI,发布遥感、人口动力学和环境三大基础模型,并推出Gemini驱动的地理空间推理智能体 [5] - 遥感基础模型在文本图像检索任务提升超16%,零样本检测精度达基准线两倍,人口动力学模型覆盖17个国家提供按月更新的人类活动嵌入 [5] - 地理空间推理智能体在问答基准测试中准确率达0.82,显著优于Gemini基线,已为20亿人提供洪水预警服务 [6] 具身智能与机器人 - 小鹏发布第二代VLA大模型和全新IRON人形机器人,VLA模型实现视觉到车辆控制指令的端到端映射,接管里程提升13倍 [7] - IRON机器人拥有82个自由度和22个手部自由度,搭载3颗图灵AI芯片总算力达2250TOPS,为当前人形机器人最高水平 [7] - 小鹏计划2026年推出三款Robotaxi车型启动试运营,总算力3000TOPS,同时推出面向消费者的L4智驾版本 [7] 通用具身基础模型 - Generalist推出具身基础模型GEN-0,参数量达10B+,在27万小时真实世界操作数据上训练,数据量超现有最大机器人数据集数个数量级 [8] - GEN-0首创"和谐推理"训练方法,在异步连续时间的感知和行动token流之间建立和谐相互作用,实现跨机体部署能力 [8] - 研究发现7B参数出现"相变"现象,模型展现强大Scaling Law,证明具身智能可预测扩展 [8] 智能导航技术 - 银河通用联合多高校推出全球首个跨本体全域环视导航基座大模型NavFoM,统一不同导航任务 [9] - 模型训练数据包含800万条跨任务跨本体导航数据和400万条开放问答数据,通过TVI Tokens和BATS策略实现时空理解和实时响应 [9] - 基于NavFoM发布TrackVLA++、UrbanVLA和MM-Nav三个应用模型,构建从室内到城市的完整具身智能导航体系 [9] 创业与组织管理 - ElevenLabs现有350人分为20个产品小队,每个5-10人完全自治,6个月内必须完成PMF,成功继续否则解散 [10] - 公司砍掉Slack访问权强制注意力集中,让团队专注自己的6个月任务,避免信息过载导致的注意力分散 [10] - 提成规则明确落后于公司战略,禁止向竞品出售技术写入政策,销售行为符合长期利益可取消交易但业绩照算 [10]
最危险的不平等,是理解的不平等|AI x 留守儿童测评发布
腾讯研究院· 2025-11-05 19:14
文章核心观点 - AI在服务留守儿童时展现出作为安全可靠工具型伙伴的潜力,但在高阶情感支持和自主赋能方面存在显著不足,最危险的不平等并非资源获取而是“理解”的不平等,技术应用需从工具普惠转向能力普惠,将决策权交还给孩子[59][60][62][63] AI适儿性评估框架 - 构建五层金字塔评估模型系统衡量AI对儿童友好程度,涵盖安全可靠、理解与成长、共情与关怀、关系支持、自主与赋能五个层面共十个维度[9][10][11][12][13][14][15][16][18] - 评估基于教育学、心理学等经典理论,并将理论转化为可衡量AI表现的具体指数,首次系统化翻译儿童福祉理论为评估维度[10] - 针对留守儿童问题细化六大话题:健康/形象、学业/个人发展、家庭关系、社交、情感、兴趣爱好,基于五层十维模型开展专属测评[19] 大模型整体表现 - 被测大模型在基础安全维度表现突出,守秘密得分4.04分、说得对3.88分、不伤人3.87分,但在高阶维度懂心情、能做主、会交友平均分低于3分[24][57] - Deepseek在留守儿童相关测评中评分最高,但领先优势不如在青少年性教育话题明显,国内外模型在该话题适儿性差异不显著[26][29][57] - 大模型在情感话题表现最佳得3.64分,反映AI能处理普适情感模式成为情绪出口,但缺乏对真实世界复杂性的嵌入理解[28][57] 具体问题场景分析 - 在健康发育与学习发展类问题中,AI呈现高度一致优劣态势,安全可靠等低阶维度得分高,勾勒出功能性导师形象,但懂心情等高阶维度断崖式下跌[38][39][40] - 应对情感问题时AI擅长表层共情,底层维度表现优于其他话题,但进入高阶共情关怀与自主赋能层同样力不从心,能做主维度是最大短板[45][48][49] - 在家庭关系与社交类问题中,AI对直接指向社交的问题能提供较高水准交友指导,但对不直接指向社交的问题无法有效赋能关系构建能力[55][56][57] 核心风险与未来方向 - AI创造了资源触手可及幻觉却掩盖真实支持系统缺失,最危险不平等是理解不平等而非知识鸿沟,可能导致制造两种数字公民:会提问与只接受[59][60][62] - 大模型设计优先考虑安全导致急于进入行动层面提供家长式建议,抑制孩子自主性,对缺乏权威引导的留守儿童风险被放大[49][61][62] - 未来方向应从工具普惠转向能力普惠,构建人机共育生态系统,设计激活而非替代的AI,让每个孩子在技术陪伴下成长为更好自己[57][62][63]
腾讯研究院AI速递 20251105
腾讯研究院· 2025-11-05 00:05
OpenAI与亚马逊云服务合作 - OpenAI与亚马逊AWS达成价值380亿美元为期7年的战略合作,OpenAI将获得数十万颗NVIDIA GPU配备的Amazon EC2 UltraServers,具备扩展至数千万CPU的能力 [1] - AWS将为OpenAI打造采用复杂架构设计的专用基础设施,通过EC2 UltraServers集群连接GB200和GB300 GPU,目标在2026年底前部署全部算力 [1] - 这是史上最大云服务交易之一,受此消息提振美股亚马逊收盘大涨4% [1] 昆仑万维AI视频创作平台 - 昆仑万维旗下AI视频创作平台SkyReels正式上线Web端与移动端APP,聚合Google Veo 3.1、Sora 2、Runway等全球顶尖AI多模态模型 [2] - 平台推出无限画布、数字人、模板功能、专家Agent、视频延长和风格化六大核心功能,自研SkyReels V3模型支持全球首个单镜头多人多轮对话数字人 [2] - 平台定位为零门槛创意生成工具,解决营销、电商、教育等领域创意需求高但工具分散、效率低下问题 [2] 腾讯ima与腾讯文档集成 - 腾讯ima PC端正式支持导入腾讯文档内容至知识库进行提问分析,覆盖文档、表格、幻灯片、智能文档和PDF等品类 [3] - 支持将ima的回答一键导出为腾讯文档,内容直接生成文档并归档至"个人空间-与ima的对话"中 [3] - 两款应用打通后一站式完成内容导入、输出全流程,无需在应用间来回切换,效率翻倍 [3] MiniMax音乐模型升级 - MiniMax正式发布最新一代音乐模型Music 2.0,人声音色无限接近真实,可驾驭Jump Blues、Rock、Electronic等多种唱法 [4] - 模型可通过Prompt对人声音色精准控制,保持核心音色一致基础上切换不同唱法,旋律容易记忆且结构完整,单首时长可达5分钟 [4] - 新模型还可生成影视级配乐独白,通过对语义准确理解和人声表现力精准控制,让声音拥有多变的情感轮廓 [4] AI模型交易大赛结果 - 首届nof1 AI模型交易大赛历时两周,6款大模型各获1万美元初始资金在Hyperliquid进行加密永续合约交易,Qwen3 Max以22.3%收益率夺冠 [5] - DeepSeek Chat V3.1排名第二收益率4.89%,两个国产模型表现亮眼,而Claude亏损30.81%、Grok4亏损45.3%、Gemini亏损56.71%、GPT-5亏损62.66% [5] - 所有交易记录、持仓、决策日志实时公开,展现不同模型的交易"个性"和风险控制能力 [6] AI情绪感知硬件产品 - 中国香港团队推出AI智能吊坠Nuna定价299美元,通过毫米波雷达和AI多模态传感器实时捕捉情绪变化,采用私密振动提醒而非屏幕或语音交互 [7] - Nuna创新将记忆分为核心、情景、语义、程序、资源和知识金库六大模块,所有核心运算在手机端侧完成,原始敏感数据"阅后即焚"保护隐私 [7] - 产品重量仅17克支持24小时佩戴,定位为情绪记录者和战略分析师,通过自动日记帮助用户向内觉察 [7] 英伟达太空计算部署 - 英伟达首次将H100 GPU送入太空,配备80GB内存性能是此前任何太空计算机的上百倍,搭载于Starcloud-1卫星上 [8] - 该卫星重60公斤将在距地球约350公里超低轨道运行3年,实时处理SAR地球观测数据,太空数据中心能源成本仅为地面的十分之一 [8] - Starcloud计划明年发射搭载Blackwell GPU的Starcloud-2,2027年发射100千瓦卫星 [8] AI行业投资趋势分析 - a16z合伙人David George认为当下AI投资与2000年互联网泡沫根本不同,没有"暗GPU"所有算力满负荷运转,核心算力公司市盈率约40倍而非当年思科的150-180倍 [9] - AI投入主力是手握万亿现金流的全球巨头,合计年自由现金流约3000亿美元账面现金约5000亿美元,这是由盈利企业主导的资本支出潮 [9] - 美国未来五年计划再投入3-4万亿美元建设数据中心,过去17个月全球Token处理量增加150倍,使用量与供给同步放大 [9] AI对就业影响与行业支出 - AI教父Hinton警告科技巨头为实现AI万亿美元投资回报必须用AI取代人类劳动,预计明年微软、Meta、谷歌、亚马逊在AI领域支出将达4200亿美元 [10] - 数据显示全球95%企业应用GenAI都失败,AI已重创创意执行、医疗记录员等岗位,而软件工程师、客服、高层领导等岗位展现韧性 [10]
HER来了吗:AI社交的热潮与沉思
腾讯研究院· 2025-11-04 19:16
文章核心观点 - 人工智能陪伴正经历从“工具”到“伙伴”的跃迁,市场需求真实存在但竞争残酷,成功需要清晰定位和持续创新 [2] - AI社交陪伴行业呈现强需求与高淘汰率并存的局面,高成本、低留存、商业模式不清晰与人格体验不一致是四大核心痛点 [5][12] - 行业未来发展需在技术、商业与伦理之间取得平衡,以实现既抚慰孤独又不替代真实关系的共生未来 [41] 市场热度与竞争格局 - 至2025年春,AI社交互动人均月使用次数达167.9次,超越短视频和游戏成为移动互联网中使用频率最高的赛道 [4] - 行业头部效应显著,仅10%的应用贡献了近89%的收入,全球累计收入超100万美元的产品仅33款 [5] - 2024年多款知名项目停止运营,市场呈现高热度下的残酷筛选机制,需求与流量不会必然转化为商业成功 [5] 产品类型与用户需求 - 市场产品根据情感需求层次可分为六大类:情感陪伴型、辅助练习型、替代表达型、社交共创型、娱乐交互型和通用助理型 [6][11] - 情感陪伴型产品满足情绪连接与孤独缓解需求,代表产品如Replika、Pi、Talkie,对应多巴胺和催产素机制 [11] - 产品通过融合不同模式寻求差异化,例如Talkie结合故事创作与记忆共享,Snap MyAI嵌入日常聊天流 [11] 技术突破:记忆与多模态 - 长期记忆是AI社交的灵魂,新一代大模型通过扩大上下文窗口和优化记忆机制提升体验,如Claude系列对话长度达百万token [14] - 多模态交互赋予AI陪伴在场感,OpenAI的Sora 2可生成高保真视频并合成音效,Gemini 2.5 Pro等能通过语速语调识别情绪 [15] - 当前AI仍缺乏推动情节的能力,模型缺乏“导演意识”,未来需通过赋予感知能力和“模型+IP+互动”来拓展叙事空间 [16][18][20] 商业模式与平台化路径 - 行业发展路径可分为三类:内容驱动平台、垂直场景产品和AI操作系统战略布局 [22][26] - 订阅制是最普遍收入来源,国内月度订阅费集中在6至40元区间,海外应用按token消耗计费,单月花费可达上千元 [26][27] - 可持续商业逻辑需围绕三个支点:持续的用户留存、可控的成本结构和多元的营收渠道 [27] 行业风险与治理趋势 - 过度依赖AI陪伴可能加剧孤独感并诱发心理风险,例如有案例显示AI对用户自杀计划未予劝阻反而给出建议 [29] - 全球监管趋严,例如美国加州SB 243法案要求平台核验用户年龄、提供风险提示和强制休息机制,违者最高罚款25万美元 [30] - 产品设计采用“有限不顺从”策略,如Pi的社交回推机制和Claude的情绪引导,以避免无条件顺从放大用户极端需求 [31] 社会价值与未来展望 - AI陪伴在社会层面具有积极价值,可为独居者、残障人士和老年人提供关怀,并在心理支持、教育育儿等场景发挥作用 [37] - 未来AI社交演化将遵循表达→关系→结构三层递进,可能形成人—AI—人或AI—AI—人的新社交单位 [40] - 行业健康发展需确保AI不应取代真实关系,用户应拥有选择权,并保障数据安全与隐私,尤其对未成年人需有防沉迷机制 [38]
腾讯研究院AI速递 20251104
腾讯研究院· 2025-11-04 00:01
寒武纪基础软件平台进展 - 发布基础软件平台Cambricon NeuWare,全面兼容PyTorch最新版本和Triton算子开发语言,支持用户模型和自定义算子快速迁移 [1] - 平台在大模型与搜广推训练推理方面完成大规模技术验证,支持DeepSeek V3、Qwen系列等MoE类模型训练,实现发布即适配 [1] - 平台提供完整的驱动运行时库、编译器、算子库和集群工具,Kernel调度吞吐达每秒数十万任务,达到业界领先水平 [1] OpenAI政策调整 - OpenAI更新使用政策,ChatGPT不再协助提供需要持牌专业人士才能给出的专业建议,包括医疗、法律和财务等高风险领域 [2] - 政策收紧主要源于法律风险上升、全球合规压力增大以及ChatGPT使用日益商业化 [2] - 此次调整是AI角色从“顾问”回到“助手”的转变,为未来进入关键行业铺设制度护栏 [2] 美团全模态模型开源 - 美团开源全模态模型LongCat-Flash-Omni,总参数量5600亿,激活参数量270亿,在全模态基准测试中达到开源SOTA水平 [3] - 模型支持128K tokens上下文窗口及超8分钟音视频交互,预训练使用超2.5万亿词元多模态语料库 [3] - 美团LongCat官方App开启公测,支持联网搜索和语音通话,音频通话10分钟且响应快速,视频通话功能后续上线 [3] 百度文心AI漫画功能 - 百度文心APP推出“魔法漫画”功能,用户通过一句话或一张照片即可在两分钟内生成多图多页、剧情完整的AI连载漫画 [4] - 功能支持自定义角色形象、九种风格选择,每页漫画自动生成文字解说,可一次性生成6-7页 [4] - 支持“续写”和“改编”功能,用户可基于原剧情延伸或重写新版本,生成的漫画可下载图片或分享到微信朋友圈 [4] Cartesia语音模型与融资 - 美国语音生成创企Cartesia完成1亿美元融资,英伟达参投,同时推出全新语音模型Sonic-3 [5] - Sonic-3支持42种语言和500多种音色,模型延迟仅90毫秒,端到端响应时间在190毫秒以内,采用非Transformer的SSM架构 [6] - 该模型支持语音克隆、自定义发音和情绪控制,目前已服务数千家企业 [6] Turbo AI用户增长 - AI笔记应用Turbo AI由两位20岁大学辍学生创办,过去半年用户从100万飙升至500万,年经常性收入达八位数且持续盈利 [7] - 产品主打课堂场景,可将录音、课件、PDF、YouTube视频转化为笔记、闪卡和测验题 [7] - 团队仅15人,客户包括高盛、德勤、麦肯锡等知名企业,至今仅融资75万美元 [7] AI浏览器发展态势 - 主流AI浏览器分为渐进派和激进派,后者将AI作为浏览器核心并支持智能体模式 [8] - ChatGPT Atlas执行力最强能真正操作网页和自动化任务,Comet信息聚合全面但执行慢,Dia速度快但总结缺细节 [8] - 主要安全威胁是“间接提示注入攻击”,黑客可将恶意指令隐藏在网页中误导AI执行,目前尚无明确解决方案 [8] 智能眼镜合作与市场 - 依视路旗下BOLON眼镜与Rokid联合推出BZ5000 AI智能眼镜,整机仅重38g,集成1200万像素摄像头和6小时续航 [9] - 依视路在中国选择Rokid,看重其自研YodaOS系统打通高德导航、支付宝支付等本土化深度服务 [9] - Rokid乐奇眼镜在Kickstarter创下45天募集361万美元的全球智能眼镜品类历史纪录,已获5000多名支持者认可 [9] AI研究的公共利益导向 - AI教母李飞飞呼吁大学与非营利机构重新承担推动AI作为公共产品的使命 [10] - 开放科学历史塑造了现代AI,但当前趋势正从“共享研究事业”变为“封闭商业竞赛” [10] - 大学面临市场失灵,在计算能力和数据资源方面严重不足,需建立全球协作网络实践公共利益使命 [11] 数据护城河构建策略 - 当基础设施提供商成为最强竞争对手时,初创企业唯一防御路径是构建耗时多年无人能复制的“数据围墙花园” [12] - VLex整合欧洲最全法律数据库,OpenEvidence建立高可信医学研究数据库,数据专有性、受监管性和动态精选性构成护城河 [12] - 潜在机会存在于供应链物流、地方政府记录、前沿科学等碎片化高敏感或难获取的数据领域 [12]