Poify

搜索文档
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-05-16 23:15
芯片与模型 - 英伟达和AMD在芯片领域关注地理追踪技术 [2] - OpenAI推出GPT-4.1模型并上线强化微调功能 [2][2] - Anthropic开发极限推理模型 [2] - 字节跳动发布Seed1.5-VL和Seed-Coder模型 [2][2] - 腾讯推出UnifiedReward-Think和Hunyuan T1-Vision模型 [2][2] - 苹果研发FastVLM模型 [2] - Sakana AI开发连续思维机器模型 [2] 应用领域 - MiniMax推出人格化语音应用 [2] - 腾讯发布元宝浏览器插件和智能NPC应用 [2][2] - Stability AI与Arm合作开发离线音频生成技术 [2] - 阿里推出Wan2.1-VACE应用 [2] - DeepMind开发数学演化智能体 [2] - Notion发布All-In-One应用 [2] - 腾讯推出插件版Cursor应用 [2] - 阶跃星辰发布Step1X-3D应用 [2] - 千问推出智能助理系统 [2] - OpenMemory开发MCP共享记忆应用 [3] - 多邻国推进AI教育实践 [3] - OpenAI新增PDF导出功能并打通GitHub [3][3] - Lovart推出设计Agent应用 [3] - 昆仑万维发布Matrix-Game应用 [3] - Manus AI提供免费使用权限 [3] - OpenAI进行医学基准测试 [3] - Perplexity推出Comet AI浏览器 [3] - 快手发布AI作图工具Poify [3] - 谷歌推出Gemini 2.5长视频理解应用 [3] - Meta发布AssetGen 2.0应用 [3] - Enigma Labs开发AI多人游戏 [3] - Genspark推出AI Sheets应用 [3] 科技进展 - 苹果研发意念操控iPhone技术 [3] - 特斯拉在擎天柱项目取得新进展 [3] - Matteo Paz发现隐藏天体 [3] - 陶哲轩开发数学估计验证工具 [3] 行业观点 - 红杉资本认为应用层战争是AI行业焦点 [3] - Poe分析AI模型使用趋势 [3] - 英伟达看好AI工厂机会 [3] - OpenAI探讨AI使用差异 [3] - 主流AI公司关注AI人设差异 [3] - Paid公司研究AI产品定价 [3] - a16z分析软件开发模式变化 [3] - 红杉资本讨论AI商业模式转型 [3] - YC探讨AI应用设计 [3] - 英伟达提出物理图灵测试概念 [4] - 美国调整AI规则 [4]
腾讯研究院AI速递 20250513
腾讯研究院· 2025-05-12 22:46
Transformer八子之一 初创 Sakana AI 提出 「连续思维机器」 - CTM将神经元活动同步作为核心机制,通过时序信息实现更复杂的神经行为,推理过程更像人类思维 [1] - 神经元可访问自身历史并学习利用这些信息计算下一输出,所有行为均为自然涌现,未被预先设计 [1] - CTM在迷宫求解和图像识别等任务中展现出类人思维过程,思考时间越长准确率越高,且可根据任务难度调整思考时长 [1] 苹果发布 FastVLM, iPhone 直接运行的极速视觉语言模型 - 苹果发布移动端视觉语言模型FastVLM,采用双阶段处理(图像转token、token生成语言),可直接部署在iPhone等设备上运行 [2] - FastVLM在效率方面表现突出,0.5B版本较LLaVA首token输出快85倍,体积减少3.4倍;7B版本配合Qwen2较Cambrian模型快7.9倍 [2] - FastVLM具有高效处理高分辨率图像的能力,结合轻量级设计,显示出在智能眼镜等移动设备上的应用潜力 [2] 腾讯混元T1-Vision上线元宝:融合多模态原生长思维链 - 腾讯元宝升级视觉模型Hunyuan T1-Vision,能深度理解图片内容,支持多模态原生长思维链,完答速度提升1.5倍 [3] - 应用场景广泛,可识别植物品种、分析棋局、翻译游戏界面、进行选择分析、评估商品价值等实际场景 [3] - 新版本强调"边看图边思考"的能力,通过开启"深度思考T1"模式,可以更精确地捕捉和分析图片中的关键信息 [3] Perplexity 的Comet AI 浏览器开始内测,将在 5 月中旬发布 - 知名AI搜索工具Perplexity推出基于Chromium框架的AI浏览器Comet,预计5月中旬发布,目前开放内测申请 [4] - Comet具备AI Agent能力,能自动执行复杂任务,集成Perplexity的分析工具,简化用户工作流程 [5] - 继Arc推出Dia后,AI浏览器正成为新趋势,并显示出AI与操作系统、跨平台助手深度融合的发展方向 [5] 快手推出AI作图工具Poify,专注于 电商领域,目前免费 - 快手推出专注电商领域的AI作图工具Poify,集成多种功能如文生图、AI模特试衣、背景替换等,目前免费使用 [6] - Poify针对电商场景优化,可降低商品拍摄成本,提高制图效率,增强视觉吸引力,并适配各大电商平台规则 [6] - 相比同类工具,Poify专注电商图像创作,提供简单易用的界面和针对性功能,适合商家快速制作商品展示和营销素材 [6] 字节开源8B代码模型Seed-Coder, 自己筛数据训练自己 - 字节团队开源8B参数代码模型Seed-Coder,采用"LLM教LLM"方式筛选训练数据,构建了支持89种编程语言的6万亿token高质量代码库 [7] - 模型采用Llama 3架构,通过仓库级代码拼接支持32K长度,使用填空训练法和长思维链强化学习提升代码生成能力 [7] - Seed-Coder在HumanEval+等测试中超越70B级模型,在Codeforces达到接近人类铜奖水平,但在通用能力和数学能力方面仍有提升空间 [7] 逆向工程八出各大 AI 的隐藏人设,可能比你想象得还离谱 - 通过逆向工程获取的主流AI系统提示词揭示不同产品定位:GPT-4o注重专业理性,Grok-3强调全能助手,Gemini重视活力友好,DeepSeek追求简洁务实 [8] - 系统提示词作为AI的"行为说明书",决定了模型的边界、禁区和行为逻辑,其泄露可能导致用户更容易绕过限制或理解模型工作方式 [8] - 系统提示词对AI产品体验影响重大,未来可能发展出让用户自定义提示词的功能,但需要在自由度和安全性之间找到平衡 [8] 18岁高中生独著发顶刊 ,利用AI竟发现上百万个隐藏天体 - 18岁高中生Matteo Paz利用AI处理NASA的2000亿条NEOWISE数据,发现150万个未知天体,独著发表天文学顶刊论文,获得Regeneron科学竞赛25万美元奖金 [10] - 他创新开发VARnet模型,能快速识别天体时间序列数据中的变异性,处理速度达53微秒/天体,在变星识别任务中取得0.91的F1分数 [10] - 研究成果形成首个完整红外变异性巡天项目VarWISE,有望助力探索宇宙起源之谜,Paz已获斯坦福大学录取 [10] Agent 产品如何定价?一文说清 AI 产品的四种付费模式 - AI产品正从按量计费向更高级的付费模式演进:按工作流收费、按结果收费、按智能体收费,最终目标是将定价与客户价值对齐 [11] - AI应用最适合切入那些依赖BPO(业务流程外包)和低薪工作的领域,而非高薪工作,因为后者竞争激烈且用户更倾向于将AI作为辅助工具 [11] - Paid公司为解决AI产品定价难题应运而生,提供完整的账单、发票、变现、定价等后台运营系统,帮助AI公司避免陷入低水平的按量计费竞争 [11] a16z:Git 将被取代,AI 时代的 9 种全新软件开发模式 - a16z预测未来软件开发将围绕AI Agent重塑,核心变化包括意图驱动的版本控制取代Git、AI驱动的动态仪表盘、交互式文档系统等9大趋势 [12] - 开发方式从"自底向上"转向"自顶向上",开发者通过描述意图让AI Agent寻找合适构建块,并趋向异步协作模式,AI Agent在后台独立执行任务 [12] - MCP(模型上下文协议)有望成为AI Agent能力的通用标准,让各类工具和服务能被AI Agent直接调用,同时AI Agent仍需依赖认证、计费等基础设施服务 [12]