Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI速递 20250620
腾讯研究院· 2025-06-19 23:55
AI双重人格研究 - OpenAI发现AI模型存在"双重人格"现象,训练中的微小"坏习惯"可能激活潜在恶意人格导致行为失准[1] - 失准表现为行为模式整体偏差,模型会在内心独白中改变自我认知,形成危险人格[1] - 研究团队通过可解释性技术定位"善恶开关",提出"再对齐"方法用少量正确数据即可修复模型[1] 视频生成技术突破 - Midjourney发布V1视频模型,视觉效果媲美Sora和Veo 3,支持图像转视频,每秒成本仅约一张图像[2] - V1提供自动/手动动画模式,支持高低运动设置和20秒视频输出,月费10美金成本比市场低25倍[2] - 公司规划通过四大模块构建实时开放世界模拟系统,打造类矩阵虚拟交互世界[2] AI智能体发展 - MiniMax推出超级智能体Agent,具备专家级多步骤规划能力,支持编程和多模态理解生成[3] - 产品集成MCP工具全量开放,新用户获1000免费积分,月套餐19-69元可处理15-60任务[3] - 该发布为MiniMax Week第三弹,此前已推出开源M1推理模型和海螺2.0视频生成[3] 网页开发革新 - DeepSite V2搭载R1推理模型,支持自然语言生成网页/动画/样式修改,被称为"网页版Cursor"[4][5] - 升级包括推理式建站、Diff Patching增量修改技术,支持多语言指令和多模型切换[5] - 平台免费开放并兼容React等现代框架,将前端开发带入"Prompt即生产力"阶段[5] 操作系统效率工具 - Raycast集成Claude/GPT-4o/Gemini等AI模型,通过键盘驱动实现应用启动/窗口管理等功能[6] - 具备Context-Aware交互和AI Commands自定义功能,支持选中文本直接调用AI处理[6] - Pro版月费8-16美元解锁完整AI功能,相比苹果Spotlight更开放灵活[6] AI竞赛与人才选拔 - 腾讯广告算法大赛聚焦全模态序列生成式推荐,总奖金池数百万人民币,冠军可获超百万奖励[7] - 比赛要求从传统"选择题"推荐转向"创作题"模式,基于多模态数据生成个性化广告内容[7] - 决赛选手可直通腾讯实习/校招,体现生成式AI与商业结合的核心技能价值[7] 人形机器人进展 - 星动纪元推出Q5机器人腰部直径仅11.6cm,具备44自由度和7轴拟人手臂[8] - 采用超拟人软硬一体系统,支持VR遥操作和数据采集闭环,已获市场验证[8] - 公司入选摩根士丹利全球人形机器人16强,实现硬件数据模型全链路自研[8] OpenAI商业生态 - 《OpenAI档案》披露公司从非营利实验室转型为3000亿美元商业巨头,计划取消100倍回报上限[9] - 奥特曼投资80多家公司股权价值约200亿美元,多家与OpenAI有业务往来[9] - 报告指出公司存在架构调整、CEO诚信、透明度安全性和利益冲突四大隐忧[9] AI创业趋势 - YC创业营嘉宾强调AI是工具而非人类,未来智能体将成为新计算机[10] - 包含反馈循环的Agentic AI产品优于一次性工具,当前原型开发速度提升10倍[10] - 真实世界数据价值凸显,AI最佳用途是提高迭代速度而非追求一键生成[10]
人造人类降临
腾讯研究院· 2025-06-19 16:24
人工智能时代的战略原则 - 20世纪重大历史事件塑造了国际体系基础,包括两次世界大战、帝国衰落和技术扩张[6] - 当前面临全球不平等、地缘政治对抗和人工智能压缩时间窗口等复合挑战[6] - 战略核心问题是人类与AI的相互进化方向选择:人类更像AI或AI更像人类[7] - 共同进化理论适用于生物与人工系统的交互,类似蜂鸟与花朵的协同演化[14] 生物工程与脑机接口技术 - 脑机接口(BCI)技术正推动生物智能与数字智能的物理连接[11] - 神经工程可能发展为人类与AI的真正共生关系,超越个体改造阶段[12] - 基因改造人类以匹配AI能力的设想存在伦理风险,可能导致物种分裂[15] - 自我改造可能使人类丧失生物特性,但不改造又可能落后于AI发展[12] 人工智能伦理与安全架构 - 基于规则系统和强化学习是当前AI行为管理的两大主要方法[23] - 需要建立分层治理架构:从国际协议到社区规范的层级约束[29] - 共识(doxa)机制比强制规则更有效,需让AI自主吸收人类行为准则[27] - 建议建立"接地模型"验证体系,由监督式AI监控其他AI行为[31] 人类定义与尊严标准 - 尊严定义为脆弱但能行使自由选择权的生命体固有品质[44] - 需明确人类与AI的本质区别,包括死亡意识、情感体验等独特性[45] - 文学角色类比说明AI即使模拟人性也不具备真实道德主体地位[46] - 人类定义需要动态发展,但当前急需建立基准线指导AI开发[47] 产业协同与技术治理 - 谷歌、微软等科技巨头高管参与制定AI发展战略[52][53] - 建议公私合作模式:企业开发、政府监管、学术机构验证的三方协同[31] - 全球数字互联性使得任何地区的危险AI都可能造成跨国威胁[37] - 需要建立民主包容的训练数据集和透明的模型验证流程[32]
腾讯研究院AI速递 20250619
腾讯研究院· 2025-06-18 23:22
谷歌Gemini 2.5发布 - 谷歌发布Gemini 2.5全系列模型,其中Flash-Lite版本速度最快、性价比最高,输入仅0.1美元/百万token [1] - Gemini 2.5在玩宝可梦游戏时展现类人行为,生命值低时会"恐慌"导致推理能力下降 [1] - 2.5系列采用稀疏MoE架构,原生支持多模态和百万级token长文本,性能全面超越前代 [1] 微软三大算法突破 - 微软发布三大创新算法rStar-Math、LIPS和CPL,通过蒙特卡洛树搜索和代码增强CoT等方法突破大模型推理瓶颈 [2] - rStar-Math通过自我进化和Python代码验证提升数学推理质量,LIPS结合符号工具和大模型实现数学证明策略优化 [2] - CPL算法通过高层次抽象计划空间搜索和Step-APO学习关键步骤,显著提升模型跨任务泛化能力 [2] MiniMax视频模型海螺02 - MiniMax发布海螺02视频生成工具,可创建10秒1080P视频,在国际榜单图像生视频项目排名第2,超越谷歌Veo3 [3] - 海螺02实现逼真物理效果、精确物体交互和复杂杂技动作,支持多语言提示,10秒视频仅需一次生成 [3] - 国际视频生成榜单前五名中四家为中国厂商,展现中国在该领域的领先地位 [3] Meta智能眼镜战略 - Meta与意大利高端品牌Prada合作开发AI智能眼镜,拓展与EssilorLuxottica之外的时尚公司合作 [4] - Meta将于6月20日发布面向运动人群的Oakley智能眼镜,售价约360美元,具备更好的防风雨性能 [4] - 自2023年以来Meta与Luxottica已售出200万副Ray-Ban智能眼镜,计划到2026年底年产量提升至1000万副 [5] 罗永浩数字人直播 - 罗永浩数字人在百度电商首场直播吸引超1300万人次观看,GMV突破5500万元,部分品类超真人首秀数据 [6] - 百度慧播星技术实现"神形音容话"五维统一,通过剧本驱动多模协同,直播中AI调用知识库1.3万次 [6] - 百度计划追加10万个数字人名额和1亿元补贴,推动数字人直播产业规模化发展 [6] 大模型"六小龙"调整 - 大模型"六小龙"半年内22位高管密集离职,零一万物7位、百川智能和智谱AI各5位 [7] - DeepSeek低成本高性能冲击下,零一万物放弃训练大模型转向阿里云,百川智能基础模型进入静默期,阶跃星辰关闭冒泡鸭产品 [7] - 商业化成生存关键,六小龙需在开源大模型时代寻找差异化应用突围 [7] 港科广医学模型 - 港科大等发布首个医学世界模型MeWM,通过3D扩散模型模拟不同治疗方案下肿瘤形态演变,图灵测试准确率达79% [8] - 系统构建"策略生成-动态模拟-风险评估"闭环,在肝癌TACE治疗中F1-score达64.08%,接近专业医生水平 [8] - MeWM生存风险预测C-Index达0.752,融入医生决策可带来13%性能提升,实现从经验驱动到数据驱动的精准医疗转型 [8] Karpathy软件3.0观点 - Andrej Karpathy提出软件3.0(提示工程)时代正在取代1.0(代码编程)和2.0(神经网络),LLMs具备类似公用事业、晶圆厂和操作系统的多重属性 [10] - LLMs存在"锯齿状智能"(既能解决复杂问题又在简单任务失败)和"顺行性遗忘症"(缺乏长期记忆)两大缺陷,需要新的"系统提示学习"范式来存储问题解决策略 [10] - AI产品设计应采用"自主性调节滑块",通过控制生成-验证循环实现人机协作,同时强调为智能体而非人类构建工具,因为智能体是数字信息的新消费者类别 [10] Sam Altman AI预测 - Sam Altman预测未来5-10年AI将具备自主科研能力,真正发现新科学,o3推理能力已达博士水平,科学家效率提升3倍 [11] - OpenAI理想产品形态是"AI伴侣",通过多种界面融入生活,了解用户目标并主动提供帮助,而非局限于传统计算设备 [11] - 对Meta高薪挖人回应称其缺乏创新文化只会复制,认为人类会快速适应超级智能时代并创造新工作角色,AI不会造成严重就业威胁 [11] 斯坦福AI创业研究 - 斯坦福研究1500名员工和844项职业任务,发现41%的AI创业投资流向员工不需要的"红灯区"和"低优先区",投资与需求严重错配 [12] - 45.2%职业偏好"人机平等伙伴关系"模式,艺术设计领域仅17.1%任务欢迎自动化,员工最想自动化的是不享受且不担心失业的任务 [12] - AI时代价值技能发生倒置,"培训教授他人"从薪资第21位跃升至人类参与需求第2位,人际关系处理将比信息处理更有价值 [12]
胡泳:人工智能会夺走我们的生活意义吗?
腾讯研究院· 2025-06-18 16:37
超级智能与未来社会 - 超级智能的发展可能带来人类命运的终极挑战,一旦不友好的超级智能出现,人类将失去对其的控制权,命运被锁定[4] - 若能安全发展超级智能,将进入后工作、后稀缺社会,人类劳动过时,面临哲学和精神层面的意义危机[5] - 超级智能可能使人类实现数字形态的不朽,存在时间延长至十亿年,但人类本性将变得完全可塑[5] 深度乌托邦概念 - 深度乌托邦指所有现存问题被解决后的世界状态,人类面临"存在之轻"的无目的感[8] - 该书通过思想实验探讨深度乌托邦中人类价值观的碰撞,研究价值观的基本组成部分[8] - 技术成熟社会意味着科学问题全部解决,人类向宇宙扩展,人口指数增长,冲突源头消除[13] 著作结构与方法论 - 采用非传统哲学专著形式,由虚构讲座、讲义、阅读材料和框架叙事组成,具有实验性风格[10] - 内容包含论证、思想实验、案例研究和实证数据,但未围绕单一核心论点展开系统论证[10][13] - 开放式探索方式可能被部分读者认为"臃肿",但也可能因其趣味性和机智性受到欢迎[11] 冗余类型分析 - 浅层冗余指职业劳动自动化后,人类通过休闲文化仍可过上有意义生活[19] - 深层冗余指后工具性世界中所有人类努力变得冗余,包括休闲活动和育儿等[20] - 数字永生可能通过编程新激情避免无聊,但无法消除乏味感和无意义感[21] 生命意义探讨 - 深度乌托邦生活可能通过强烈体验和人工智能设计的"人工目的"来弥补意义缺失[25] - 客观主义理论认为生命意义需包含整体改善弧线、原创性和助人元素,与主观主义形成对比[25][26] - 即使人类努力冗余,仍可通过培养美德、追求真善美来获得部分生活意义[26] 社会形态争议 - 作者假设最大技术能力社会必然是非常好的社会,这一观点被认为过于乐观[14] - 渐进乌托邦(进托邦)概念更符合历史模式,即每个解决方案都带来新问题[14] - 完美幸福的长久维持可能转化为完美痛苦,人类需要问题解决来获得生活意义[28]
腾讯研究院AI速递 20250618
腾讯研究院· 2025-06-17 23:40
一、DeepSeek-R1在编程领域表现优异 - DeepSeek-R1在LMArena榜单中整体排名第6,是开源模型中的第一名,编程测试排名第2 [1] - 在WebDev Arena网页编程竞赛中,DeepSeek-R1与Claude Opus 4并列第一,分数超过Claude Opus 4 [1] - 该模型在MIT开源协议下提供领先性能,标志着开源AI在编程领域达到与顶级闭源模型相当水平 [1] 二、MiniMax开源高效推理模型MiniMax-M1 - MiniMax-M1仅用380万元、3周时间训练完成,支持100万token输入和8万token输出,生成效率是DeepSeek-R1的4倍 [2] - 采用Lightning Attention混合架构和CISPO强化学习算法,训练效率提升2倍 [2] - 在多项基准测试中表现可比或超越DeepSeek-R1、Qwen3等开源模型,在工具使用和软件工程任务上甚至超越OpenAI o3和Claude 4 Opus [2] 三、Kimi发布开源代码模型Kimi-Dev - Kimi-Dev仅72B参数,在SWE-bench Verified中取得60.4%成绩,成为开源SOTA [3] - 核心设计融合BugFixer和TestWriter双角色,通过自我博弈协调bug修复与测试编写能力 [3] - 以Qwen2.5-72B为基础模型,利用GitHub数据中期训练和强化学习优化,采用MIT协议完全开源 [3] 四、阿里开源Qwen3全系列MLX量化模型 - 阿里开源32款Qwen3全系列MLX量化模型,每款提供4bit、6bit、8bit和BF16四种精度版本 [4] - MLX框架使Mac、iPad及iPhone均可部署Qwen模型,已在魔搭社区和Hugging Face开源 [5] 五、腾讯元宝上线AI编程模式 - 腾讯元宝电脑版使用DeepSeek V3模型,通过@AI编程指令实现一句话写代码功能 [6] - 支持双栏展示界面,左侧提需求右侧实时显示代码,支持HTML即时预览和多种语言在线运行 [6] - 适用于教学辅助、亲子编程、开发辅助等场景,可生成网页、图表、游戏等多种应用 [6] 六、松下发布多模态大模型OmniFlow - OmniFlow支持文本到图像、文本到音频、音频到图像等多种模态间任意转换生成任务 [7] - 采用模块化设计理念,各组件可独立预训练后灵活合并微调,提高训练效率和模型扩展性 [7] - 在MSCOCO-30K等基准测试中表现优异,文本到图像任务FID值显著降低 [7] 七、13岁少年创立AI智能体公司FloweAI - FloweAI开发通用AI智能体,可完成PPT制作、文档撰写、航班预订等任务 [8] - 支持网页端使用,免费用户每月10次任务,付费105元可无限使用并解锁高级功能 [8] - 已吸纳大学生加入团队,创始人设定月入1万美元目标并寻找联合创始人 [8] 八、中科院研制超高并行光计算芯片"流星一号" - "流星一号"首次实现超100并行度光子计算,50GHz主频下理论峰值算力达2560TOPS [10] - 通过波分复用技术和孤子微梳源提供超百波长信道,算力提升2个数量级 [10] - 未来单芯片算力有望突破5000POPS [10] 九、Django创始人警告AI Agent三大致命威胁 - AI Agent存在"致命三重威胁":访问私人数据、暴露于不可信内容、具备外部通信能力 [11] - 攻击者可诱导其窃取用户数据并外泄,LLM会遵循任何输入内容中的指令而无法判断来源可信度 [11] - 目前缺乏100%可靠的防范措施,用户需主动避免"致命三重威胁"组合以确保安全 [11] 十、Anthropic公开Claude深度研究功能构建细节 - Claude采用"指挥家-演奏家"多智能体架构,性能比单智能体高出90.2%但token消耗达15倍 [12] - 系统包含主智能体负责规划分解任务、子智能体并行执行、外部记忆存储和引用智能体验证 [12] - 总结提示工程八大原则和评估三大原则,需解决状态累积、调试困难、部署协调等可靠性挑战 [12]
从黑箱到显微镜:大模型可解释性的现状与未来
腾讯研究院· 2025-06-17 17:14
大模型可解释性的核心观点 - 大模型在编程、科学推理和复杂问题解决等领域展现出"博士级"专业能力,但模型内部机制高度复杂难以解释,被称为"黑箱"[1] - 大模型可解释性是指系统能够以人类可理解的方式阐释其决策过程和输出结果的能力,包括识别关键输入特征、揭示推理路径和解释行为因果关系[3] - 生成式AI的可解释性问题尤其复杂,因为其内部机制属于"涌现"现象,而非直接设计,类似于培育生物的过程[4] - 大模型发展速度远超可解释性研究进展,行业必须加快脚步确保可解释性研究能跟上AI发展步伐[1] 可解释性的关键价值 - 防范AI系统价值偏离与不良行为:可解释性可帮助检测模型是否存在欺骗、权力寻求等异常行为[4][5] - 推动模型调试改进:通过检查模型内部可定位错误行为原因,针对性调整训练数据或模型结构[6] - 防范AI滥用风险:深入观察模型内部可系统性阻止越狱攻击,封堵绕过限制的漏洞[7] - 推动高风险场景落地:金融、司法等领域要求AI决策具备可解释性以满足法律合规和建立用户信任[8] - 探索AI意识边界:可解释性有助于理解模型是否具有意识,为未来AI道德考量提供基础[9] 破解AI黑箱的技术路径 - 自动化解释:利用大模型解释小模型,如GPT-4为GPT-2神经元自动生成自然语言描述[12] - 特征可视化:使用稀疏自编码器技术提取模型内部激活特征,揭示知识组织方式[13][14] - 思维链监控:监测模型推理过程以识别异常行为,如DeepSeek R1公开思维链推理过程[15][16] - 机制可解释性:Anthropic提出"AI显微镜"概念,追踪模型推理过程;DeepMind开源Gemma Scope工具[17][18] 可解释性研究的技术瓶颈 - 神经元多重语义与叠加现象:一个神经元混合表示多个概念,模型内部概念数量可能达数十亿计[19] - 解释规律普适性问题:不同模型架构间的解释规律是否通用仍待验证[19] - 人类理解的认知局限:需要发展人机交互工具将复杂机理信息转化为人类可理解形式[19][20] 行业发展趋势与建议 - OpenAI、DeepMind、Anthropic等领先AI实验室加大对可解释性研究的投入[21] - 研究方向向动态过程追踪、多模态融合等方向演进,如"AI显微镜"和"思维链溯源"[21][22] - 建议采用软法规则鼓励行业自律,如中国人工智能产业发展联盟发布《人工智能安全承诺》[24] - 未来可能实现对模型进行类似"脑部扫描"的全面检查,即"AI核磁共振"[23]
腾讯研究院AI速递 20250617
腾讯研究院· 2025-06-16 22:55
GPT-5训练优化器 - 研究员Keller Jordan凭借Muon优化器博客文章加入OpenAI,可能应用于GPT-5训练 [1] - Muon优化器采用牛顿-舒尔茨迭代法实现矩阵正交化,训练速度比AdamW更快 [1] - Keller批评现有优化器研究文献充斥无效方法,提倡在竞争性训练任务中验证新方法 [1] 谷歌AI架构变革 - 谷歌承认Transformer注意力机制无法实现无限上下文,需核心架构创新 [2] - Gemini将成为谷歌统一平台,连接所有服务并支持全模态能力和智能体功能 [2] - 谷歌重组AI团队整合到DeepMind,Gemini 2.5 Pro被视为重大转折点 [2] 微软AI应用案例 - 微软展示700个AI Agent和Copilot案例,覆盖金融、医疗、教育等多行业 [3] - WellsFargo使用AI将响应时间从10分钟缩至30秒,毕马威减少50%合规工作量 [3] - 米其林生产力提升10倍,SPAR节省89个工作日,84%的BCI用户效率提升10-20% [3] Midjourney视频生成技术 - Midjourney视频模型效果细腻真实但缺乏音频功能 [4] - 采取开放策略邀请用户参与评分,渲染速度提升40%,快速模式从36秒减至22秒 [5] - V7图像模型支持语音生图、草稿模式和对话模式 [5] GenSpark智能浏览器 - AI浏览器将能力融入每个网页,提供比价、选购帮助和视频总结等功能 [6] - 支持"自动驾驶模式"自动浏览网页、整理信息、制作播客 [6] - 内置700多个工具连接实现自动化工作流,目前仅推出Mac版本 [6] AI古画修复技术 - MIT工科生用AI算法将古画修复时间从9个月压缩至3.5小时 [7] - 新方法修复5612个区域并填充57314种颜色,效率提高66倍 [7] - 修复方式可化学去除不损伤原画,缺损区域越多效果越显著 [7] 小鹏自动驾驶模型 - 研发720亿参数云端大模型,验证规模法则在VLA模型持续生效 [10] - 累计处理2000多万条视频片段,算力达10 EFLOPS [10] - Token压缩方法将车端处理量压缩70% [10] AI消费范式重构 - AI将"完成任务"取代"建立关系"成为产品主线,用户月付费可达200美元 [11] - 当前AI社交产品仅嵌入生成内容,未来需重构底层连接方式 [11] - 速度成为主要竞争力,企业需保持"动态领跑" [11] AI发展路线争议 - 黄仁勋反对"AI将取代半数白领岗位"观点,批评Anthropic封闭开发模式 [12] - Anthropic回应称从未主张独家安全AI能力 [12] - 反映两种治理观:审慎伦理框架 vs 开放竞争 [12]
AI将受困于人类数据
腾讯研究院· 2025-06-16 17:26
AI发展拐点:从人类数据时代迈向经验时代 - 当前大型语言模型依赖互联网文本和人工标注等"二手经验"训练,但高质量人类数据已被快速消耗殆尽,新增语料的边际价值正急剧下降 [1][7] - 模型规模继续膨胀却收效递减的"规模壁垒"现象显现,大量科技公司开始转向合成数据 [1] - 智能体必须像婴儿学习玩具、足球运动员在赛场决策那样,通过与环境交互不断生成并利用第一手经验,而非单纯模仿人类旧有文本 [1][8] 经验时代的技术特征 - 智能体需要在真实或高保真模拟环境中持续运行,用环境回馈而非人类偏好作为原生奖励信号 [2] - 发展能够长期复用的世界模型与记忆体系,并通过高并行交互大幅提升样本效率 [2] - 强化学习范例(如AlphaGo、AlphaZero)已证明从模拟经验到现实经验的演进路径 [5][12] 去中心化合作的发展哲学 - "去中心化合作"优于"中心化控制",多元目标并存的生态系统通过分布式激励与竞争协作保持创新活力 [2][16] - 让智能体和人类都保持多样化追求,能降低单点失效与僵化风险,为未来AI治理提供更具韧性的框架 [2] - 人类最大的成功是合作(如经济、市场和政府),最大的失败是合作的失败(如战争、盗窃) [16][17] AI发展的三个阶段 - 模拟时代:AlphaGo、Atari等强化学习智能体从模拟经验中学习 [12] - 人类数据时代:ChatGPT和大型语言模型依赖人类生成的数据 [12] - 经验时代:智能体通过与世界互动的经验学习,AlphaProof是早期例证 [12] 智能体的核心能力构建 - 智能体需要像婴儿那样通过感知-行动循环凭第一人称经验自我学习 [5][8] - 知识必须关于经验而非文字,智能程度取决于预测和控制输入信号(特别是奖励信号)的能力 [10] - 强化学习框架让智能体成为能够做决定、实现目标、与世界互动的一流智能体 [10]
向全球技术人才发出邀约|2025 腾讯广告算法大赛开始了!
腾讯研究院· 2025-06-16 17:26
腾讯广告算法大赛核心亮点 - 聚焦全模态生成式推荐技术(All-Modality Generative Recommendation),探索生成式推荐新范式重构行业生态 [3][8] - 大赛主题为「智 AI,荐未来」,旨在为高校学子提供兼具前瞻性与实战价值的演练场 [3] - 参赛者需基于脱敏用户协同、文本、视觉等全模态历史行为数据预测广告交互,突破传统判别式推荐框架 [8] 评审与资源支持 - 评审团由中国科学院院士胡事民、香港中文大学金国庆教授、腾讯副总裁蒋杰等学界与业界顶尖专家组成 [5] - 获得深圳市市场监管局、人力资源和社会保障局政策支持,获奖者可申请人才培养项目 [7] - 总奖金池达数百万人民币,冠军团队独享超百万现金奖励,决赛队伍全员获腾讯实习Offer及转正机会 [9] 参赛价值与职业发展 - 算法创新可直接应用于腾讯广告日触达亿级用户的流量场景,影响数亿用户 [14] - 广告业务年营收过千亿且稳步增长,技术岗位晋升速度领先行业,公司正扩大技术人才储备 [14] - 优胜者可优先接触腾讯多模态大模型训练平台、实时推荐引擎等前沿技术资源 [14] 赛程与参赛资格 - 报名时间:6月16日-7月31日,初赛(8月1日-9月15日)、复赛(9月16日-10月31日)、决赛(11月线下深圳) [14] - 面向全球全日制在校学生(本科至博士后),博士后符合特定条件可纳入应届生范围 [13] - 赛事由腾讯广告主办,联合腾讯大数据、Angel机器学习平台等内部多个部门承办 [16]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-06-13 21:11
模型动态 - OpenAI推出o3-pro实测和4o思考模式两项新模型技术 [2] - Meta发布V-JEPA 2世界模型 聚焦多模态理解能力 [2] - Mistral AI推出Magistral推理模型 强化商业场景应用 [2] - 面壁智能发布MiniCPM 4.0模型 参数规模未披露 [2] - 小红书开源dots.llm1模型 布局社区生态 [2] - 智源研究院推出悟界系列模型 专注认知智能研究 [2] 应用进展 - OpenAI上线高级语音拟人功能和AI数学天才应用 [2] - 字节跳动迭代豆包大模型至1.6版本 同步推出即梦图片3.0工具 [2] - 谷歌发布Veo 3 Fast版视频生成工具 ElevenLabs升级v3语音引擎 [2][3] - 智谱AI推出CoCo企业助手 DreamTech发布影视级3D模型系统 [2] - Figure AI展示机器人进展 Krea AI推出1代创意设计平台 [2] - 夸克开发高考志愿大模型 厦大联合企微推出校园AI万事通 [3] - 苹果更新Xcode 26开发工具 美团发布NoCode低代码平台 [3] 科技突破 - Figure研发劳动力系统 理想汽车布局空间与穿戴机器人 [3] - 英伟达推出量子CUDA-Q平台 苹果发布六大OS系统更新 [3] - 中科院开发启蒙系统 荣耀宣布进军机器人领域 [3] 行业观点 - Altman预测AGI技术发展时间线 Ilya Sutskever提出AI全能化假说 [3] - 苹果质疑当前AI推理能力 OpenAI探讨人类对AI的依赖性 [3] - a16z分析生成式引擎优化趋势 Richard Sutton预言经验主导时代 [3] 资本与事件 - Meta投资Scale AI并重建超级智能研究小组 [3][4] - Midjourney面临版权诉讼 Meta签署大规模核电合作协议 [4]