LightLab

搜索文档
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-05-23 17:10
算力发展 - OpenAI在阿布扎比建设数据中心以提升算力基础设施 [2] - NVIDIA推出GB300等新一代算力产品 [2] - 华为发布CloudMatrix 384等高性能算力解决方案 [2] - Google持续优化TPU应用以增强计算效率 [2] 模型进展 - Windsurf推出SWE-1模型聚焦特定领域性能 [2] - 智源研究院发布BGE向量模型提升语义理解能力 [2] - 腾讯更新模型矩阵强化多场景适配性 [2] - 谷歌推出Gemini Diffusion模型拓展生成能力 [2] - Mistral发布Devstral模型聚焦开源生态 [2] 应用创新 - OpenAI推出Codex工具优化代码生成效率 [2] - 腾讯发布混元图像2.0和游戏视觉生成平台提升内容创作能力 [2][3] - 谷歌推出LightLab、Veo 3、NotebookLM APP等多款AI工具覆盖编程、视频生成及笔记场景 [2][3] - 微软发布Coding Agent和Magentic-UI强化开发辅助功能 [2][3] - 字节推出语音播客应用探索音频内容生成 [3] - 英伟达DreamGen项目聚焦3D内容生成 [3] - 昆仑万维推出天工超级智能体整合多模态能力 [3] 科技突破 - 中国团队在视触融合挑战赛中取得技术进展 [3] - 微软利用AI发现新物质推动材料科学 [3] - UC伯克利研发低成本机器人降低AI硬件门槛 [3] 行业观点 - GitHub强调代码编写在AI时代的重要性 [3] - Anthropic预测AI编程将改变开发范式 [3] - a16z分析AI编程领域的投资机会 [3] - Gartner提出智能应用设计原则 [3] 企业动态 - OpenAI正式收购io公司 [4] - 腾讯研究院建立ima AGI知识库推动行业研究 [4]
腾讯研究院AI速递 20250519
腾讯研究院· 2025-05-18 22:33
生成式AI 一、 OpenAI推出AI编程Codex,可多任务并行测试至代码通过 1. OpenAI发布新版AI编程工具Codex,由codex-1模型驱动,能生成更清晰代码且自动迭代 测试至通过; 2. Codex运行于云端沙盒环境,可同时处理多项编程任务,支持与GitHub连接并预加载代码 仓库; 3. 该工具目前向ChatGPT Pro等付费用户开放,后续将实施速率限制,用户可购买额外积分 获取更多使用权限。 https://mp.weixin.qq.com/s/ATC1b5_wOXtxQsPI9r34rQ 二、 打字即出图!混元图像2.0让AI生图进入"零延迟"时代 1. 腾讯混元Image2.0实现毫秒级图像生成,用户输入提示词时即可看到实时变化,突破了传 统5-10秒生成时间的限制; 2. 新模型支持文生图和图生图两大功能,图生图模式下可选择"参考主体"或"参考轮廓",并 可调节参考强度; 3. 双画布联动功能支持实时预览和多图层融合,在复杂场景下可通过多次快速的调试达到理 想效果。 https://mp.weixin.qq.com/s/DwMvdknyqP4y9_LBERMPng 三、 Manu ...
一键开关灯!谷歌用扩散模型,将电影级光影控制玩到极致
机器之心· 2025-05-16 12:39
机器之心报道 编辑:刘欣、+0 最近,Google 推出了一个可以 精准控制画面中光影的项目 —— LightLab 。 它让用户能够从单张图像实现对光源的细粒度参数化控制, 可以改变可见光源的强度和颜色、环境光的强度,并且能够将虚拟光源插入场景中。 以电影为例, 好的电影中,光线能巧妙地塑造角色情绪、烘托故事氛围、引导观众目光,甚至能揭示人物的内心世界。 然而,无论是传统的摄影后期处理,还是数字渲染后的调整,精确控制光影方向、颜色和强度,始终是一项耗时耗力、且极依赖经验的挑战。 现有的光照编辑技术,要么需要很多照片才能工作(不适用于单张照片),要么虽然能编辑,但你不能精确地告诉它怎么变(比如具体亮多少、变成什么颜 色)。 Google 的研究团队通过在一个特殊构建的数据集上微调(fine-tune)扩散模型,使其学会如何精确地控制图像中的光照。 LightLab: Controlling Light Sources in Images with Diffusion Models 论文地址:https://arxiv.org/abs/2505.09608 项目主页:https://nadmag.github. ...