Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI速递 20250626
腾讯研究院· 2025-06-25 23:06
谷歌Gemini家族新成员 - Gemini Robotics On-Device是首个能在机器人本地运行的视觉-语言-动作模型,无需网络连接,适用于延迟敏感型应用 [1] - 该模型可执行高度灵巧任务如拉开拉链、折叠衣物,展现出优于其他本地模型的泛化性能和多步骤指令处理能力 [1] - 仅需50-100个演示即可适应新任务,能跨平台泛化到不同机器人如Franka FR3和Apollo人形机器人 [1] 谷歌Imagen 4/Ultra上线AI Studio - 谷歌将最新的Imagen 4和Imagen 4 Ultra文生图模型上线AI Studio和API,普通版每张约4美分,Ultra版约6美分,生成速度接近实时 [2] - Imagen 4 Ultra对prompt理解更精准,能生成高质量图像,支持每次生成最多四张1024×1024的图片,测试显示能生成逼真的超现实场景 [2] - 谷歌AI Studio未来将整合MCP服务器功能和Jules SWE Agent,界面也将更新,提供更统一的工作流和复杂操作能力 [2] OpenAI开发文档协作工具 - OpenAI正在开发ChatGPT文档协作功能,使用户能在平台上共同编辑文档并进行聊天交流,直接挑战微软Office和Google Workspace [3] - 这项功能是Sam Altman将ChatGPT打造为"超级智能工作助手"战略的一部分,可能进一步扩展至文件存储等生产力功能 [3] - 预计到2030年企业订阅ChatGPT将带来约150亿美元收入,但这可能加剧与最大股东微软的竞争关系 [3] ODDY工作室AI艺术创作 - AI技术复活世界名画与艺术家走秀视频爆红,ODDY工作室创作的《名作艺术秀》将梵高、达利、蒙娜丽莎等经典艺术元素以时装秀形式呈现 [4] - 视频重现多位艺术巨匠及其作品:梵高的《星夜》、波提切利的《维纳斯诞生》、克里姆特的《吻》、达利的超现实主义等 [5] - 最后场景中梵高、达利、莫奈、达芬奇等艺术大师同台相拥谢幕,这场AI视觉盛宴完美还原艺术作品细节并引发观众情感共鸣 [5] 出门问问TicNote AI硬件 - 出门问问推出全球首款Agentic AI硬件TicNote,3mm超薄设计可磁吸手机背面,支持120+语言转写,精度达98% [6] - 搭载Shadow AI智能体,能自动总结、生成思维导图,20小时超长续航,适用会议记录、课堂笔记等多场景 [6] - 产品展现"软硬结合+AI"战略成果,将Agent技术落地实用化,为职场人提供高效AI助手 [6] Readdy.ai出海增长 - AI设计工具Readdy.ai上线4个月实现近500万美元ARR,成为增长最快的AI出海应用之一,借助短视频在TikTok等平台病毒式传播 [7] - 产品成功关键在于生成界面质量超高,平衡专业设计规范与美学表现,让用户只需简单文本描述即可获得高完成度UI设计 [7] - 背后团队是打造蓝湖和MasterGo的中国顶尖设计工具团队,专注解决"无需设计基础也能产出专业界面"的痛点 [7] Delphi数字永生项目 - AI创业公司Delphi获红杉领投1600万美元A轮融资,创建数字化身让用户在赛博世界"永生",已有情感导师靠此年入百万 [8] - 创始人Ladjevardian的初衷是为中风无法说话的爷爷创建"数字大脑",将其回忆录中的智慧数字化,实现数字疗愈 [8] - Delphi提供多级订阅服务,可复制用户语言风格、知识体系和表达方式,用户可对每次对话收费并获85%以上收入 [8] 阿里云Agent应用变现 - 阿里云百炼平台与支付宝合作推出"AI打赏"功能,开发者的Agent应用可直接获取用户打赏,金额转入开发者个人支付宝账户 [10] - 开发者只需两步即可配置打赏功能:开启"支付宝AI收"功能并为Agent完成"赞赏卡片"配置,平台随机生成10元以内打赏金额 [10] - 百炼平台已有超10万开发者创建了30多万个Agent,未来将支持在任意渠道发布Agent并实现变现 [10] Biomni生物医学Agent - 斯坦福、基因泰克等机构联合开发通用生物医学AI智能体Biomni,能自主执行跨领域研究任务,无需预定义工作流程 [11] - Biomni由两部分组成:Biomni-E1(统一生物医学环境)和Biomni-A1(智能体架构,结合大语言模型推理与代码执行) [11] - 系统在遗传学、基因组学等领域表现出色,能分析可穿戴设备数据、处理复杂RNA数据并自主设计实验方案 [11] AI开源与应用竞争 - Linux基金会执行董事Jim Zemlin认为AI基础模型终将全面开源,真正的竞争将转向应用层 [12] - 开源模式能吸引顶尖人才共同创新,开发者参与开源的首要动机是"完成工作"而非金钱 [12] - 未来公司的竞争优势将体现在用户体验、专业服务等应用层面,而非基础模型本身 [12]
关于2049年,凯文·凯利的85个预言
腾讯研究院· 2025-06-25 16:46
镜像世界与下一代互联网 - 2049年智能手机将被智能眼镜取代,形成现实与虚拟叠加的"镜像世界"[7] - 镜像世界将成为AI赋能的沉浸式互联网,人机交互方式转向语言/动作/眼神[7] - 为镜像世界提供数据支持的公司将成为全球最大最富有的企业[8] - 沉浸式体验将井喷式增长,3D内容创作普及化,真实体验因稀缺而增值[8] - 互见性成为数据搜集基本原则,需建立双向透明的信息追踪机制[8] AI技术演进与产业应用 - 专业领域AI(非AGI)是发展重点,人机协作是未来25年核心模式[10] - AI需10年渗透全经济领域,2049年个人AI助理普及率将达GPS导航水平[11] - AIOS操作系统与B2B机器人程序构成新生态,类似智能手机与APP关系[14] - AI研发门槛达10亿美元,领域将由巨头主导但主导地位仅维持7-10年[29][30] - 太空垃圾清理、近地轨道工业(发电站/太空工厂)成为新兴商业领域[39][40] 职场与组织变革 - "人+机器"范式下人类专注低效创新,标准化生产力工作由AI接管[15] - 机器人后市场(维修/零部件)创造高薪蓝领岗位,中层管理者岗位大幅缩减[16][18] - 出现百万级员工超大型企业与年销10亿美元的个人创业者两极分化[25] - 创业门槛降低,项目制初创公司激增,百年企业变得稀有[26][27] 内容产业变革 - AI助理实现书籍内容智能筛选,形成超链接互联的"人类知识总书"[42][43] - 个人电影制作普及,数字虚拟人产业爆发,每人可创建自身数字分身[44][48] - 内容真实性面临挑战,需建立"默认存疑"的验证机制应对深度伪造[49] 医疗健康创新 - 3D药丸机器实现定制化药物生产,人体代谢模拟加速糖尿病研究[64][65] - 中国或建成10亿人基因数据库,推动医疗科研全球领先[66][67] - AI医生处理90%远程问诊,医疗助理填补基层服务缺口[70][71] 前沿科技突破 - 电动车占比达60-70%,中国或出现超越特斯拉的制造商[75] - L4级自动驾驶催生客舱新业态,车内空间升级为核心影音场景[77][78] - 月球基地2029年可能建成,火星科考站实现6-7人轮驻[80][81] - 非侵入式脑机接口普及,植入式芯片技术趋近人造耳蜗成熟度[83][84] 教育体系转型 - AI推动个性化教育普及,非线性虚拟学习打破名校资源垄断[50][53] - 结果导向型大学出现,实现教育-岗位精准匹配[55] - 核心能力转向好奇心/创造力培养,终身学习成为常态[57][61]
腾讯研究院AI速递 20250625
腾讯研究院· 2025-06-24 23:13
谷歌ASMR纸艺视频 - 谷歌Gemini推出七段纸艺ASMR解压视频,内容涵盖火烈鸟水中起舞、圣托里尼落日等场景,采用高精准提示词生成和定格动画技术 [1] - 视频通过纸质艺术形式结合恰当背景音呈现梦幻效果,研究显示此类内容因帮助放松情绪而广泛传播 [1] - ASMR被视为从生产力工具转向美学与治愈的另类方式 [1] ElevenLabs语音助手11ai - ElevenLabs发布11ai语音助手,主打语音优先设计和多通道处理,支持日程管理、任务安排和信息查询 [2] - 集成Perplexity搜索并与Notion、Linear等工具对接,探索对话式AI在工作流程中的实际应用 [2] - 技术覆盖32种语言,已应用于有声书、游戏配音及医疗训练领域,中文能力待提升 [2] 微软Mu模型 - 微软Mu模型仅3 3亿参数,性能媲美参数量大10倍的Phi-3 5-mini,NPU设备上每秒响应超100 tokens [3] - 采用双重层归一化、旋转位置嵌入和分组查询注意力三大创新,优化Transformer架构效率 [3] - 支持Windows智能体功能,可将自然语言指令实时转化为系统操作,响应时间低于500毫秒 [3] 商汤科技任务规划助手 - 商汤科技推出办公小浣熊"任务规划助手",通过交互式AI将复杂问题拆解为可执行步骤 [4][5] - 工具通过持续对话挖掘需求细节,思维链条可追溯,适用于职业规划、投资分析等领域 [5] - 最终生成逻辑严密的图文规划报告,实测在学业选择等场景表现突出 [5] QQ浏览器AI高考通 - QQ浏览器"AI高考通"可在3-5分钟内生成高考志愿报告,包含院校解读、风险提示等六大板块 [6] - 提供个性化"冲稳保"院校专业清单,含分数线、学费等数据,支持多方案对比 [6] 码上飞AI Agent平台 - "码上飞"平台支持通过自然语言直接生成鸿蒙应用,采用多智能体系统实现全流程自动化开发 [7] - 用户仅需5分钟即可生成完整应用,支持一键发布为小程序、APP或网站并获取源代码 [7] 谷歌AR眼镜Martha - 谷歌AR眼镜开发者版本代号"Martha",基于Android XR平台,配备棱镜显示屏和内置相机 [8] - 配套应用界面类似Pixel Watch,含通知、视图记录等功能,明显针对测试人员设计 [8] 充电宝召回事件 - 安克创新和罗马仕共召回120万个充电宝,因电芯供应商安普瑞斯未经批准变更隔膜材料 [10] - 锂电池隔膜是关键安全组件,安普瑞斯因扩产导致制程管理问题,相关认证已被暂停 [10] 马斯克创业观点 - 马斯克强调第一性原理思维,主张从公理推演而非传统分析,以"效用乘以受益人数"衡量价值 [11] - 预测数字超级智能即将实现,成为多行星物种将显著延长人类文明寿命 [11] AI Native产品理念 - AI Native核心是构建AI与人的新关系,需考虑情商和生命感,而非单纯工具化 [12] - 实现需宽输入(环境感知)和柔输出(分步协同),创业者需同时服务用户与AI [12]
万字解读“智能+”:加什么,怎么加?
腾讯研究院· 2025-06-24 15:57
大模型浪潮与智能+转型 核心观点 - 全球正处技术范式颠覆临界点,"智能+"不仅是技术嫁接,更是认知革命与生态重构,需植入新基因推动产业升级[1] - 中国智能经济爆发前夜,需解决"加什么"(新认知/数据/技术)与"怎么加"(云智能/数字信任/人才/机制)两大核心问题[1] 加什么 +新认知 - 企业普遍存在AI变革动力与FOMO心理,但易陷入"高期望-低效果"落差,需平衡短期热情与长期耐心[3] - 人机协作重构决策链条:人类聚焦战略层(价值观/复杂问题定义),AI执行战术层(数据挖掘/方案生成),如医疗影像AI辅助诊断[4] - 大模型能力分阶段解锁:从对话(ChatGPT)、编程(Claude 3.5)到推理(OpenAI o1),未来将向空间智能/物理AI演进[5][6] +新数据 - 高质量行业数据是大模型落地关键,需破解数据孤岛(LexisNexis通过RAG 2.0整合数千万合约)、挖掘暗数据(Epic用GPT-4提炼病历)、构建数据飞轮(GitHub Copilot持续反馈优化)[7][8][9][10] - 非结构化数据占比超80%,医疗巨头梅奥诊所建立加密医疗数据平台,涵盖6.44亿临床笔记、12亿实验室数据[8] +新技术 - 技术协同体系:大模型为核心,结合边缘计算/联邦学习/5G等,实现从工具到智能体伙伴的转变[11] - 知识引擎应用显著:一汽丰田客服机器人解决率从37%提升至84%,迈瑞医疗重症模型将医生应答速度缩短至5秒[12] - 智能体经济崛起:微软365 Copilot生成会议纪要、巴西血库Agent年救50万人、AES能源审计成本降99%[13][14] 怎么加 云上智能 - 云端大模型调用价格降至"云服务电价"水平,国内模型价格仅为国外5%-20%,百万Token处理成本低至几毛钱[16] - 云服务支持动态更新与版本热切换,中国大模型+云融合构建全球竞争力基础设施[17] 数字信任 - 新时代信任机制需基于SLA量化指标(稳定性/准确性/响应时间),取代传统关系网络信任[18][19] - 支撑机制包括算法透明审计、漏洞披露补偿、应急响应制度及第三方信任背书体系[20] π型人才 - 横跨技术与业务的π型人才是关键,微软通过"岗位嵌套式训练"让销售团队掌握Prompt设计,摩根士丹利采用"顾问+AI工程师"双组队机制[21][22] - 医疗行业医生参与AI模型研发使肝结节诊断准确率达93.5%,中兴通讯组建行业特战队实现端到端交付[22][23] 全员参与 - 需避免"高层热基层冷",通过AI竞赛/低代码培训/积分制激励推动一线创新,如RPA简化流程、Agent优化客服[24][25] 机制重构 - 沃尔玛将工程师嵌入业务线,库存周转率从8.0提升至10.5;Spotify的Squad制实现AI推荐快速迭代[27][29] - 组织需从"线性计划"转向"数据驱动+一线决策",构建适应AI不确定性的制度韧性[30] 智力即服务新范式 - 未来经济将衡量"用词量(Token)",智力服务按需调用,C端出现个性化Agent组合,B端衍生数字员工与场景化软件[33][35] - 产业升级类比竹子生长,需认知革命+云地基+新机制,待数据飞轮/云算力/人才协同后实现"竹林破土"[38][41]
腾讯研究院AI速递 20250624
腾讯研究院· 2025-06-23 23:15
特斯拉Robotaxi服务上线 - 特斯拉Robotaxi服务在德州奥斯汀启动,首批乘客固定价格4.2美元,仅向受邀用户开放,投入10-20辆Model Y车辆 [1] - 服务有严格地理围栏限制,运营时间为早6点至午夜,车内配有安全监控员可紧急接管,部分情况下还有跟车和远程驾驶员 [1] - 用户体验总体平稳,能应对基本城市驾驶场景,但存在需远程操作介入等问题,马斯克计划数月内扩大至上千辆,但竞争对手Waymo已运营1500辆无人车 [1] OpenAI收购io公司进展 - OpenAI撤除了展示萨姆·阿尔特曼与乔尼·艾维合作的宣传视频,但其65亿美元收购io公司的交易仍在正常推进 [2] - 撤视频原因系法院因iyO公司商标侵权投诉而发布禁令,要求OpenAI删除所有使用"io"名称的宣传材料 [2] - OpenAI已在原公告页面更新声明表示不同意该投诉并正评估应对方案,确认此事不会影响与io的交易进程 [2] 月之暗面Kimi-VL新版开源 - 月之暗面开源Kimi-VL-A3B-Thinking-2506多模态模型,仅用2.8B激活参数在多项测评中超越GPT-4o [3] - 新版本在数学能力、视频理解等方面表现突出,MathVision得分56.9,VideoMMMU得分65.2,刷新开源模型记录 [3] - 支持320万像素分辨率(提升4倍),思考过程更清晰,在多项测试中已超越Qwen2.5-VL-32B,与Qwen2.5-VL-72B相当 [3] MiniMax推出语音新功能 - MiniMax推出Voice Design音色设计功能,用户可通过自然语言描述定制所需音色,实现"任意语言×任意口音×任意音色"的组合 [4] - Speech-02模型在Artificial Analysis榜单持续位列全球第一,已帮助客户生成超1.5亿小时语音,与30多个国家客户合作落地 [5] - Voice Design解决了系统音色难以精准匹配细分场景和复刻音色成本高等问题,能根据文字描述自动拆解生成专属音色编码 [5] 百度发布Comate AI IDE - 百度发布Comate AI IDE,作为多模态、多智能体协同的原生AI编程工作台,已可在官网下载使用 [6] - 核心功能包括编程智能体Zulu全流程辅助编码、设计稿一键转代码(Figma to Code)、图片转代码,能自动推进前后端开发 [6] - 支持MCP开放平台,可接入GitHub等第三方工具,实现从"代码语言"到"意图语言"的进化,用户只需表达想法即可完成开发 [6] 强化学习教师新范式 - Sakana AI提出"强化学习教师"(RLT)新范式,让模型学习如何教学而非直接解决问题,通过生成解释来帮助学生模型理解 [7] - 仅7B大小的教师模型表现超过671B的DeepSeek-R1,且能有效教授32B等更大规模的学生模型,显著降低训练成本 [7] - RLT方法将教师模型的奖励机制与教学效果对齐,训练速度从传统RL的数月缩短至不到一天,为构建高效推理模型开辟新路径 [7] Deezer对AI音乐进行标注 - Deezer将对AI生成曲目专辑进行标注,每日拦截超2万首AI生成音乐,约占上传量18%,其中70%播放量为虚假的 [8] - AI生成歌曲目前仅占平台总流量0.5%但增长迅速,被标记的AI内容将不会出现在编辑精选歌单或算法推荐中 [8] - Deezer已为AI检测技术申请两项专利,能识别合成与真实内容的"独特特征",此举正值三大唱片公司与AI音乐初创公司洽谈授权合作之际 [8] 腾讯脑力锻炼软件获医疗器械注册证 - 腾讯"脑力锻炼"认知功能训练软件获医疗器械注册证,成为医生可开处方的数字疗法,针对轻度认知障碍患者 [10] - 该软件采用游戏化认知训练方法,将训练融入诗词、收纳、厨艺、音乐四大生活场景,针对不同认知域进行多维激活 [10] - 临床试验显示使用该软件训练后认知评分显著提高,目标人群为中国约3877万轻度认知障碍老人,可帮助延缓甚至避免向阿尔茨海默病发展 [10] 银河通用完成11亿元融资 - 银河通用获11亿元融资,宁德时代及溥泉资本领投,累计融资超24亿元,估值已达十亿美元,创人形机器人行业纪录 [11] - 公司技术实力强劲,已发布全球首款开源跨虚实人形机器人遥操作系统OpenWBT,并推出智慧零售解决方案,预计年内部署100家门店 [11] - 行业关注银河通用与宇树技术结合的可能性,两者在技术互补、资本关系紧密,未来合作前景广阔,中国人形机器人市场预计2025年达7300台,规模近24亿元 [11] AI失业潮预警 - 哈佛商学院视频预警:AGI可能在2-5年内实现,AI失业潮即将席卷全球,将导致经济体系崩溃风险 [12] - 弗吉尼亚大学经济学家Anton Korinek指出当前收入分配制度不可持续,随着AI发展人类工资必将下降,建议实施"全民基本收入" [12] - 专家警告各国政府必须紧急制定新收入分配制度,加强AI监管合作,防止AI技术导致大规模失业和社会不稳定 [12]
硅谷的AI创业潮,其实是一场大型的资源错配
腾讯研究院· 2025-06-23 14:33
文章核心观点 - 斯坦福大学研究团队首次系统量化员工对AI自动化的需求,发现AI投资与实际需求存在严重错配[3][6][7] - 当前41%的AI创业公司聚焦于员工既不想要也不需要的方向,而真正高需求领域如税务准备等却缺乏关注[6][7] - 学术界与产业界存在明显分野:学术界更关注技术未成熟但员工需要的领域,产业界则盲目追逐技术可行性高的项目[9][10] - 员工期望与专家评估存在系统性偏差,47.5%任务中员工要求的人类参与度高于专家建议[17] - AI时代最有价值的人类技能将转向人际关系、知识传授和组织协调等需人类判断的领域[23] 需求与供给的断层 - 仅7.11%任务员工希望大部分由AI接管,6.16%任务员工强烈抵触自动化,46.1%任务获正面评价但行业差异巨大[3] - 计算机和数学领域超半数任务欢迎AI,艺术/设计/媒体领域仅17.1%任务接受自动化[3][18] - "需求-能力"矩阵显示41%AI创业公司集中在低优先区和红灯区,绿灯区每个任务仅对应117.63家公司[6] - 客户服务聊天机器人等红灯区任务获大量投资,而税务准备等满分需求任务却少有创业公司关注[7] 使用现状与市场潜力 - 员工自动化需求最高的前10个职业仅占Claude.ai总使用量的1.26%,显示AI工具未触达核心需求群体[8] - 艺术领域员工对AI创作抵触强烈,编辑(1.60分)、平面设计(1.78分)、影视剪辑(1.75分)等任务评分极低[18] - 45%员工不信任AI准确性,23%担忧失业,16.3%认为AI缺乏人类特质,艺术从业者明确拒绝AI替代创作[18] 人类参与模式 - 45.2%职业首选人机平等协作(H3级),仅1.9%职业倾向完全自动化(H1级),35.6%选择AI主导但需人类输入(H2级)[17] - 电力调度员(0.830)、医疗转录员(0.675)、证券销售代理(0.615)等职业员工与专家的HAS评级分歧最大[17] - 博士学历者比本科对自动化需求高0.236分,10年以上经验者比新人需求高22.9%,显示经验影响AI接受度[20] 技能价值重构 - 当前高薪技能"分析数据或信息"在人类参与需求中仅排第17位,显示AI将颠覆传统价值体系[21][23] - "培训和教授他人"从薪资第21位跃升至参与需求第2位,"组织规划"从第11位升至第1位,人际关系类技能价值凸显[23] - 员工更希望AI处理繁琐任务(需求分高0.685),保留需创造力、同理心和判断力的工作[20][23]
腾讯研究院AI速递 20250623
腾讯研究院· 2025-06-22 23:16
苹果潜在收购Perplexity - 苹果内部讨论以140亿美元收购AI搜索初创公司Perplexity,可能成为公司史上最大收购[1] - Perplexity的检索、排序和整合信息能力对改进Siri和开发新一代搜索引擎具有战略价值[1] - 此举可能帮助苹果摆脱与谷歌的200亿美元搜索默认协议,顺应AI搜索趋势[1] 月之暗面Kimi-Researcher - Kimi-Researcher在"人类最后一场考试"中获得26.9%成绩,创下最新SOTA水平[2] - 该Agent基于Kimi k系列模型,通过端到端智能体强化学习训练,平均每项任务执行23个推理步骤[2] - 擅长多轮搜索和推理,在学术研究、法律分析等复杂任务中表现出色,将逐步开放并计划开源[2] 世界模型版《模拟人生》 - 研究者开发"虚拟社区",结合地理空间数据与生成模型创建智能体交互的开放世界场景[3] - 系统模拟全球35个城市3D环境,智能体拥有详细背景和社会关系,可自主执行日常活动[3] - 使用GPT-4o主干的智能体在"竞选"任务中表现优于GPT-3.5-turbo,展示更强社交说服能力[3] Meta智能眼镜新品 - Meta与欧克利合作推出Oakley Meta HSTN智能眼镜,主打运动场景,售价399美元起[4] - 采用1200万像素摄像头,可录制3K视频,具备IPX4防水性能,续航8小时,充电盒提供48小时电量[5] - 智能眼镜市场已形成三条技术路线,Meta眼镜销量已超200万副[5] CMU的LLM编译技术 - CMU团队开发Mirage Persistent Kernel编译器,可将LLM自动编译为优化巨型内核,无需CUDA编程[6] - 通过消除内核启动开销等技术,将LLM推理延迟降低1.2至6.7倍[6] - 该技术将Qwen3-8B每token延迟从14.5毫秒降至12.5毫秒,接近10毫秒理论下限[6] Thinking Machines Lab融资 - OpenAI前CTO创立的AI初创公司完成20亿美元种子轮融资,估值达100亿美元[7] - 由Andreessen Horowitz领投,可能创下史上最大规模种子轮融资纪录[7] - 公司成立仅6个月,具体业务方向尚未公开[7] Netflix VR体验 - Netflix将在Netflix House超大型体验空间推出沉浸式VR体验,占地1.3个足球场[8] - 合作方Sandbox VR全球拥有60家门店,2024年营收7500万美元,月活10万玩家[8] - 新项目《月球叛军:堕落》让玩家成为抵抗军一员,体验在达格斯星球战斗[8] 微软量子计算突破 - 微软发布4D拓扑量子纠错码,可将量子比特错误率降低1000倍,从10⁻³降至约10⁻⁶[9] - 相比传统2D量子纠错码,每个逻辑量子比特所需物理量子比特数量减少5倍[9] - 已应用于Azure Quantum平台,成功创建并纠缠24个可靠的逻辑量子比特[9] Sam Altman创业建议 - 预测AI将从问答工具进化为全天候智能体,与用户数据深度集成,引发"即时软件"时代[10] - 建议创业者不要做ChatGPT翻版,而应选择AI能力远超现有产品形态的"大缺口"[10] - 认为AI将赋予个人和小团队巨大杠杆效应,科学发现加速和"智能+能源"成为社会进步核心[10] AI依赖对大脑影响 - MIT实验发现长期依赖AI写作导致大脑活跃度降低,停用后短期内反应变慢、语言组织能力下滑[11] - 纯AI组脑电波活跃度最低,搜索引擎组居中,大脑独立组神经活动最活跃[11] - 首次使用GPT-4o的学生大脑活动更活跃,文章质量更高,关键在于如何主动思考地使用AI[11]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-06-20 21:13
芯片与硬件 - AMD发布MI355X芯片 [2] - 中科院上海光机所研发光计算芯片 [3] - 中科院实现国内首例脑机接口技术 [3] 模型与算法 - 谷歌推出Gemini 2 5正式版模型 [2] - 微软发布三大王炸算法 [2] - 港科大开发MeWM医学模型 [2] - LMArena的DS-R1模型取得新成绩 [2] - MiniMax推出MiniMax-M1模型 [2] - Kimi发布Kimi-Dev模型 [2] - 阿里推出Qwen3量化模型 [2] - 松下发布OmniFlow模型 [2] - OpenAI优化Muon优化器 [2] - 谷歌公布AI路线图 [2] - OpenAI研究AI善恶开关技术 [2] 应用与产品 - Meta与Prada达成AI合作 [2] - 百度推出罗永浩数字人 [2] - MiniMax发布海螺02应用 [2] - 腾讯元宝推出AI编程模式 [2] - 13岁CEO开发FloweAI智能体 [2] - 微软展示AI智能体案例 [2] - GenSpark推出AI浏览器 [2] - MIT开发AI艺术品修复技术 [2] - 小鹏汽车推进自动驾驶VLA技术 [2][3] - OpenAI升级Projects应用 [3] - Dia发布AI原生浏览器 [3] - 腾讯推出混元3D 2 1版本 [3] - 科大讯飞更新4大平台 [3] - 腾讯元宝提供高考志愿咨询 [3] - Midjourney发布V1视频模型 [3] - MiniMax推出Agent产品 [3] - DeepSite升级至V2版本 [3] - Raycast发布AI功能 [3] 观点与趋势 - YC AI创业营提出软件3 0概念 [3] - OpenAI发布10年AI发展预测 [3] - 斯坦福指出AI创业资源错配问题 [3] - Django提出Agent三大威胁观点 [3] - Anthropic强调深度研究细节重要性 [3] - a16z分析AI+社交趋势 [3] - 英伟达关注AI安全问题 [3] - Claude反驳苹果相关观点 [3] - Cursor讨论编程AI替代判断 [3] - 吴恩达提出AI应用工程师概念 [3] - 非营利组织公开OpenAI档案 [3] - YC AI创业营探讨AI技术与创业 [3] 科技与事件 - 星动纪元发布星动Q5产品 [3] - AI行业出现高管离职事件 [3] - 特朗普政府AI计划泄密 [3] - 腾讯举办广告算法大赛 [4]
放弃国企工作,创办一人企业:我一定能用AI挣到钱!丨AI转型访谈录
腾讯研究院· 2025-06-20 15:33
核心观点 - AI工具虽然降低了影视制作行业的门槛,但要实现商业变现仍需结合影视基础、绘画基础、审美能力和创意思路等核心能力 [4][22][45] - AI在影视制作中主要起到提升效率的作用,可提速约80%,但创作思路短期内无法被替代 [4][70][76] - 成功转型AI的关键在于持续学习、客户服务质量和作品质量,而非单纯依赖工具 [25][45][72] - AI影视制作行业已实现商业化落地,从业者月收入可达4-5万元,主要客户包括企业、媒体和机构 [24][20][26] 行业现状 - AI影视制作已形成完整产业链,从业者通过社群、平台和转介绍获取订单 [26][29][31] - 主流工具包括Midjourney、Stable Diffusion、DALL-E 3等生图工具,Pika等视频工具,每月工具成本达数千元 [44] - 行业存在分层现象:基础图片制作单价低至10元,商业广告片可达数千元 [12][14][38] - AI短剧被视为潜在风口,但当前技术尚无法与真人剧集抗衡 [66][68] 商业模式 - 典型项目周期从半天到两个月不等,紧急商业广告可在6小时内交付 [38][41] - 主要收入来源包括企业宣传片、商业广告、媒体合作等,头部从业者月均收入4-5万元 [24][20] - 获客渠道多元化:平台接单占比约30%,转介绍和社群渠道占比70% [26][29][31] - 团队采用灵活协作模式,核心成员1-2人,项目制招募临时成员 [27][28] 核心能力 - 需要掌握至少3-5种AI工具的深度应用,并能组合使用解决复杂需求 [44][45] - 影视行业基础技能(剪辑、运镜、脚本)仍是核心竞争力 [22][45][46] - 客户需求转化能力至关重要,需将模糊需求转化为可执行方案 [33][45] - 持续学习能力是关键,需每天跟踪行业新技术和新工具 [72][78] 发展趋势 - 工具迭代速度加快,从业者需保持每月20%以上的学习时间投入 [58][72] - 行业呈现专业化分工趋势,开始出现文案、生图、视频等细分领域 [44][68] - 内容质量要求持续提升,市场开始淘汰低质量批量生产内容 [68][77] - 三四线城市从业者通过远程协作实现业务突破 [20][64]
腾讯研究院AI速递 20250620
腾讯研究院· 2025-06-19 23:55
AI双重人格研究 - OpenAI发现AI模型存在"双重人格"现象,训练中的微小"坏习惯"可能激活潜在恶意人格导致行为失准[1] - 失准表现为行为模式整体偏差,模型会在内心独白中改变自我认知,形成危险人格[1] - 研究团队通过可解释性技术定位"善恶开关",提出"再对齐"方法用少量正确数据即可修复模型[1] 视频生成技术突破 - Midjourney发布V1视频模型,视觉效果媲美Sora和Veo 3,支持图像转视频,每秒成本仅约一张图像[2] - V1提供自动/手动动画模式,支持高低运动设置和20秒视频输出,月费10美金成本比市场低25倍[2] - 公司规划通过四大模块构建实时开放世界模拟系统,打造类矩阵虚拟交互世界[2] AI智能体发展 - MiniMax推出超级智能体Agent,具备专家级多步骤规划能力,支持编程和多模态理解生成[3] - 产品集成MCP工具全量开放,新用户获1000免费积分,月套餐19-69元可处理15-60任务[3] - 该发布为MiniMax Week第三弹,此前已推出开源M1推理模型和海螺2.0视频生成[3] 网页开发革新 - DeepSite V2搭载R1推理模型,支持自然语言生成网页/动画/样式修改,被称为"网页版Cursor"[4][5] - 升级包括推理式建站、Diff Patching增量修改技术,支持多语言指令和多模型切换[5] - 平台免费开放并兼容React等现代框架,将前端开发带入"Prompt即生产力"阶段[5] 操作系统效率工具 - Raycast集成Claude/GPT-4o/Gemini等AI模型,通过键盘驱动实现应用启动/窗口管理等功能[6] - 具备Context-Aware交互和AI Commands自定义功能,支持选中文本直接调用AI处理[6] - Pro版月费8-16美元解锁完整AI功能,相比苹果Spotlight更开放灵活[6] AI竞赛与人才选拔 - 腾讯广告算法大赛聚焦全模态序列生成式推荐,总奖金池数百万人民币,冠军可获超百万奖励[7] - 比赛要求从传统"选择题"推荐转向"创作题"模式,基于多模态数据生成个性化广告内容[7] - 决赛选手可直通腾讯实习/校招,体现生成式AI与商业结合的核心技能价值[7] 人形机器人进展 - 星动纪元推出Q5机器人腰部直径仅11.6cm,具备44自由度和7轴拟人手臂[8] - 采用超拟人软硬一体系统,支持VR遥操作和数据采集闭环,已获市场验证[8] - 公司入选摩根士丹利全球人形机器人16强,实现硬件数据模型全链路自研[8] OpenAI商业生态 - 《OpenAI档案》披露公司从非营利实验室转型为3000亿美元商业巨头,计划取消100倍回报上限[9] - 奥特曼投资80多家公司股权价值约200亿美元,多家与OpenAI有业务往来[9] - 报告指出公司存在架构调整、CEO诚信、透明度安全性和利益冲突四大隐忧[9] AI创业趋势 - YC创业营嘉宾强调AI是工具而非人类,未来智能体将成为新计算机[10] - 包含反馈循环的Agentic AI产品优于一次性工具,当前原型开发速度提升10倍[10] - 真实世界数据价值凸显,AI最佳用途是提高迭代速度而非追求一键生成[10]