Workflow
量子位
icon
搜索文档
人工智能年度榜单火热报名中!五大奖项,寻找AI+时代的先锋力量
量子位· 2025-10-21 11:38
评选活动概述 - 正式启动第8届量子位人工智能年度榜单评选 旨在发现并致敬引领变革的探索者与实践者[1] - 评选从企业、产品、人物三大维度设立五类奖项 共同见证年度之星并点亮未来方向[2] - 评选报名从即日起开始 截至2025年11月17日 结果将于MEET2026智能未来大会上公布[23] 企业类奖项评选标准 - 年度领航企业评选聚焦中国人工智能领域最具综合实力企业 参选需注册在中国或主营面向中国市场[6] - 企业主营业务需属人工智能及相关产业 或已广泛应用AI并在细分领域领先 具备成熟产品并获得市场认可[9] - 评选标准涵盖业务能力、技术能力、资本能力及其他综合能力 包括市场占有率、营收规模、研发投入及融资情况等[9] - 年度潜力创业公司评选聚焦最具投资价值和发展潜力的未上市AI创业公司 需在技术研发或行业应用方面取得显著成果[8][10] - 创业公司评选标准包括业务潜力、技术创新、资本能力及其他综合能力 关注商业模式、目标市场规模及营收增长情况[10] 产品与解决方案类奖项评选标准 - 年度杰出产品评选聚焦最具代表性与影响力的AI产品 需以AI技术为核心并已投入市场获得用户反馈[13] - 产品需在近一年完成重要技术创新或迭代升级 对AI规模化落地与商业化有显著推动[16] - 评选标准包括产品力与技术力、落地情况及其他综合能力 评估功能完整性、性能表现、市场占有率及用户规模等[16] - 年度杰出解决方案评选聚焦AI在不同行业与场景中的典型应用 需以自主创新AI技术为核心并已落地实施[15] - 解决方案需在技术融合、应用创新或商业模式上有显著突破 对行业智能化转型产生积极推动作用[17] - 评选标准涵盖创新性、落地情况及其他综合能力 关注技术融合能力、应用模式创新、市场占有率及客户情况等[17] 人物类奖项及大会信息 - 年度焦点人物评选面向中国AI领域最受关注的新星与领军人物 需为创始团队成员或核心高管[20][24] - 参选人物近一年需带领团队在AI技术或商业化方面取得显著突破 对行业发展产生重要影响[24] - 评选标准包括企业情况、个人能力及其他综合能力 评估企业行业地位、营收情况、技术能力及商业能力等[21][24] - MEET2026智能未来大会以"共生无界,智启未来"为主题 邀请科技、产业与学术领域领军人物齐聚[27] - 大会每年吸引上千名科技从业者参与 百万观众线上围观 近百家合作媒体联合曝光[28] - 大会将聚焦智能科技产业 探讨人工智能+、AI Infra、智能终端、智能驾驶及低空经济等前沿话题[28]
ChatGPT千亿tokens,干掉麦肯锡5000名顾问
量子位· 2025-10-21 11:38
文章核心观点 - 传统咨询行业正经历由AI驱动的深刻变革 咨询巨头积极部署AI工具以提升效率 但同时引发了大规模裁员和行业格局的重塑 [3][4][5][26][55] 麦肯锡的AI转型 - 麦肯锡因成为OpenAI的Tokens消耗大客户而获得奖牌 暗示其大量使用ChatGPT [1][3] - 公司通过收购QuantumBlack并在2018年将其整合为AI原生咨询部门 奠定了AI转型基础 [7][10] - 2023年推出内部AI平台Lilli 该平台基于超过10万份内部文件与访谈资料训练而成 [14][15] - Lilli能自动生成PPT 润色文本 撰写提案和整理汇报 大幅提升工作效率 [16][17] - 目前麦肯锡超过70%的员工(超过4万名)在日常工作中使用Lilli 平台每月响应问题数量突破50万条 [18] 波士顿咨询集团的AI策略 - 波士顿咨询集团在AI部署上更为激进 已研发出八九款内部AI工具 [21] - 工具包括用于制作PPT的Deckster和用于头脑风暴的语音助理GENE [23] - 公司将AI使用率纳入员工绩效考核指标 将其视为顾问的新核心竞争力 [23][24] - BCG约3 3万名员工中已有近90%在使用AI工具 其中约一半每天高度依赖AI工作 [25] AI对咨询行业人力资源的影响 - 自ChatGPT问世以来 麦肯锡已裁撤员工超过5000人 被裁率高达约10% 为公司历史上最大规模裁员之一 [27] - AI平台已承担起约30%的信息收集与整理任务 足以接管部分初级顾问的工作 [32][33] - 咨询行业入门级职位招聘受冲击最大 今年6月入门级顾问招聘数量同比暴跌54% [60] - 公司招聘策略转向 更倾向于直接聘用经验丰富的成熟人才 而非从零培养毕业生 [63][64] - 研究显示AI导致22至25岁群体就业率骤降13% 但以经验和洞察为核心的资深岗位更具韧性 [66][68] 新兴AI咨询业态的挑战 - OpenAI Anthropic等AI公司开始直接向企业提供解决方案 绕过传统咨询公司 [38] - 新兴的咨询科技公司利用AI自动化咨询流程 旨在用算法取代顾问 [39][41] - 例如Hasura公司的PromptQL平台可帮助企业打造专属AI分析师 并提供支持服务 每小时收费900美元 [45][47] - 此类AI咨询初创公司获得资本青睐 如Parable完成1660万美元融资 Dialogue AI完成600万美元融资 [49] - 这些初创公司已开始蚕食二线咨询公司的市场份额 为中小企业提供了成本更低的替代方案 [51][52] 隐性知识与行业未来 - 业内认为AI目前仅能连接全球2%至5%的隐性知识 无法完全取代人类顾问的洞察力 [69][70] - 咨询公司声称AI接管基础工作后 顾问将转向对客户更有价值的事务 [57] - 然而 咨询行业传统的职业上升路径正被AI部署和绩效标准收紧所破坏 年轻顾问的成长阶梯被逐阶拆除 [71][72]
我拿AI给神曲《八方来财》做了个MV,真的好魔性!
量子位· 2025-10-21 11:38
产品概述 - 中国电信推出面向公众的AI创作平台TeleStudio,支持AI视频生成[3] - 平台具备生成图片、生成视频和生成音效三大核心创作功能[7] - 目前平台处于限时免费阶段,支持最高2K清晰度、单次最长20秒的视频生成[5][6] 技术能力 - 平台基于自研星辰大模型,能精准理解文字、图像、声音间的复杂关系[40] - 依托智传网(AI Flow)技术,为AI任务提供高效、低延迟的算力调度和传输保障[41] - 支持文生视频、图生视频、角色视频和音乐生视频四种视频生成模式[13] 核心功能亮点 - “万物跳舞”特色功能允许用户通过简单指令让任何物体跳指定舞种,如民族舞、拉丁舞等[22][31][33] - “音乐生视频”功能可通过上传音频或歌曲,让静态图片根据声音内容生成动态视频,如让梵高开口唱歌[37][38] - 支持视频片段连贯生成,可将前一段视频的尾帧作为下一段的首帧,实现剧情延展[19][20] 市场定位与影响 - 平台显著降低内容创作门槛,让非专业用户也能通过简单描述实现创意[40] - 为专业创作者提供全新视觉表达工具,如让静态产品图跟随节奏跳舞[40] - 体现央企将前沿AI技术转化为普惠生产力的务实思路和强大实力[42]
DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被开源”
量子位· 2025-10-21 07:34
核心观点 - DeepSeek最新开源模型DeepSeek-OCR采用创新的视觉压缩技术解决长文本处理算力爆炸难题实现以小博大的效能突破[1][5][12] - 该模型仅3B参数但在文档解析基准测试中达到SOTA水平通过将文本压缩为视觉token大幅降低计算开销[5][13][14] - 技术思路被行业专家评价为可能打开AGI大门并模拟人类记忆机制为无限长上下文处理提供新方向[9][10][36] 技术原理 - 核心组件包括DeepEncoder编码器和DeepSeek3B-MoE-A570M解码器采用先局部处理再压缩后全局理解的串行设计[20][22][27] - 编码器支持从Tiny到Gundam多种输入模式可根据任务需求动态调整压缩强度使用100-800个视觉token实现高效处理[23][24][25] - 当压缩率小于10倍时模型OCR解码准确率高达97%即使压缩率达20倍准确率仍保持在60%左右[6] 性能表现 - 在OmniDocBench基准测试中仅用100个视觉token就超越每页使用256个token的GOT-OCR2.0模型[17] - 使用400个视觉token时与之前SOTA模型表现相当而使用不到800个token便大幅超越平均每页近7000个token的MinerU2.0[17] - 模型支持金融报表化学分子式数学几何图等复杂图像解析以及100多种语言的深度处理能力[25] 行业影响 - 研究公布后迅速在GitHub斩获3.3K starHuggingFace热榜第二X平台引发广泛好评[7] - 专家评价认为图像比文字更适合LLM输入并将该技术类比为AI的JPEG时刻开启记忆架构新路径[8][9] - 业内猜测该方法可能涉及谷歌Gemini核心商业机密的开源体现技术的前沿性和颠覆性[1][10] 创新拓展 - 团队提出用光学压缩模拟人类遗忘机制通过动态分配计算资源构建无限长上下文处理架构[36][37][41] - 该机制将近期记忆渲染为高分辨率图像远期记忆渐进压缩实现信息自然遗忘更贴近人类智能[41][39] - 研究虽处早期阶段但为超长对话和文档处理提供新思路解决传统方法计算资源暴涨问题[38]
马斯克要让Grok全面接管x,彻底剔除人类规则推荐算法
量子位· 2025-10-21 07:34
X平台算法重大变革 - 公司将在未来几周内彻底移除启发式推荐算法,由AI助手Grok全权接管内容推荐 [1] - Grok将通过阅读和观看全部内容的方式,实现全自动的用户兴趣匹配 [1] - 用户可对Grok提出请求,动态调整内容推荐,实现更高程度的个性化定制 [7] - 此次更新旨在让新号发布的优质内容更容易被看见,并让用户更能定制自己的信息流 [9] 新旧算法模式对比 - 现有启发式算法依赖人类制定的规则,如点赞数、转发量、发帖频率、用户历史行为等指标判断内容质量 [11][13] - 启发式算法容易导致大号内容获得高曝光,而新号或小号的优质内容难以触达用户,形成内容垄断 [13] - 新算法基于Grok的AI能力,可逐条分析帖子和视频,根据个人兴趣进行个性化推送,促进小号内容的公平发现 [15] - 单纯发布无文字链接的内容将难以获得推荐,添加精彩标题、图片或背景信息有助于提升内容曝光度 [8] 行业影响与市场反应 - 若计划实施,X将成为首个完全抛弃启发式算法的大型社交平台,在行业内具有首创性 [2] - 部分用户期望此次更新能解放小号、打破内容垄断,另一些用户则担忧算法消失后优质账号将失去曝光红利 [9] - 有用户表达了对高度算法化内容分发模式的担忧,希望互联网能保留更多"活人感",而非完全由算法决定内容呈现 [17] - 此次变革被视为AI在内容分发领域扮演更核心角色的标志性事件,反映了互联网内容生态向AI驱动的加速转变 [16][18][20]
AI正在改写地图APP!这一次轮到谷歌了
量子位· 2025-10-20 19:45
谷歌Gemini API集成谷歌地图功能 - 谷歌向所有开发者开放Gemini API调用谷歌地图工具 实现应用位置感知功能整合 [1] - 开发者可通过API接入谷歌地图庞大地理数据库 包含2.5亿个地点信息 [2] - 支持模型包括Gemini 2.5 Flash-Lite、Gemini 2.5 Pro、Gemini 2.5 Flash和Gemini 2.0 Flash(不含2.0 Flash Lite) [5] - API按查询次数收费 当前费率为每1000条有事实依据的提示25美元 若单次发送多个查询仅计为一次请求 [5][6] 功能应用场景与用户体验 - 功能适用于餐馆推荐、路线规划、房产选址、旅行行程规划等基于实时地图数据的AI应答 [3] - 谷歌AI Studio负责人演示语音请求AI推荐芝加哥意大利餐厅 并成功通过三种拼写方式找到特定餐厅 [9][10][13] - 功能具备个性化、可视化特点 用户可查询当日营业时间及路况等实时信息 [14][16] - 所有用户可在谷歌AI Studio体验新功能 支持自定义模型、语音及系统提示词 [19][23] 行业竞争与空间智能发展 - 高德地图作为国内玩家早在谷歌之前尝试AI+地图 聚焦空间智能落地战略 [31][33] - 高德地图今年7月推出小高老师智能体 9月推出高德扫街榜 覆盖119万家回头店 [34][39] - 高德扫街榜数据基于近一年5370万人的13亿次导航 对应里程232亿公里 相当于绕地球58万圈 [39] - AI正让地图从导航工具变为空间智能体 具备预测用户需求能力 完成从静态工具到动态智能空间的升维改造 [41][42][44]
拍个照就能测秃头等级?蚂蚁这AI医疗App我体验了一下
量子位· 2025-10-20 19:45
梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 你知道"支付宝"已经杀入AI医疗赛道了吧…… 还是马云赐的名——AQ。 反正之前为啥做AI医疗,我是没理解马云的战略思考,但直到前两天随手用了用 蚂蚁AQ ,这才明白—— 蚂蚁这回不是在做什么医疗AI,而是拿"看病"这个需求,用AI能力完成了场景闭环…之前什么医保、支付、本地配送,全都被闭环了。 有点技能在身上了… 最近加班有点头秃,随手拍了张发缝"写真",AI就把脱发程度给run了出来,别说这小西兰花还挺形象~ 查医保也so easy,梦幻联动支付宝,原本要点好几级菜单的折磨也被治好了: 还能化身老中医还能看舌象,什么气虚、阳盛、寒热平衡,整得挺头头是道: 一顿操作猛如虎,病都还没缓解,流程已经走完了。 说实话,这产品有点意思~ (看到这结果又能安心地熬夜了 ...... ) 我又丢了份心电图上去,它也能看得门儿清,连心率异常和QT间期延长都能识别出来: 独测测不如众测测,咱实测开扒——看看这AQ到底啥水平。 能看病,也能顺带挂号买药 先说说整体用下来的感觉吧,优缺点都比较明显: 问诊流程ok、诊断结果也算比较准、能通过图片识别病例报告和表层病症。 甚至 ...
人工智能年度榜单火热报名中!五大奖项,寻找AI+时代的先锋力量
量子位· 2025-10-20 18:29
让我们共同见证年度之星,点亮未来的方向。 组委会 发自 凹非寺 量子位|公众号 QbitAI 为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动 「2025人工智能年度榜单」评选报名 。 这是量子位人工智能年度榜单的 第8年 。八年来,我们见证了技术的突破与落地,产业的融合与重塑,也见证了一批又一批推动时代前行的 企业、人物与产品。 在人工智能重新定义一切的时代里,智能技术已不再是单一工具,而是产业与社会协同进化的驱动力。我们期待通过这场年度评选,去发现并 致敬那些真正引领变革、开拓边界的探索者与实践者。 本次评选将从 企业 、 产品 、 人物 三大维度,设立五类奖项。欢迎企业踊跃报名! 企业榜 产品榜 人物榜 2025 人工智能年度 焦点人物 详细评选标准及报名方式如下。 2025 人工智能年度领航企业 2025 人工智能年度 领航企业 2025 人工智能年度 潜力创业公司 2025 人工智能年度 杰出产品 2025 人工智能年度 杰出解决方案 将面向中国人工智能领域,评选出最具综合实力的企业, 参选条件 : 评选标准 : 2025 人工智能年度潜力创业公司 聚焦于中国人 ...
Vidu Q2携「王炸」登场!杀手锏「参考生」功能全球上线,APP体验全面革新
量子位· 2025-10-20 18:29
金磊 发自 凹非寺 量子位 | 公众号 QbitAI AI视频领域杀疯了! 发布Vidu Q2图生视频不到2周,Vidu又又又更新了,而且直接甩出三张王牌。 首先是AI创作者们等待良久的 Vidu Q2参考生功能 终于要正式发布了。 在Vidu AI APP,只需轻松点击"二次创作",@一下 主体 就可以生成一段玩好有趣的合拍视频,你可以与你喜欢的角色进行合拍,或者基 于其他人创作的AI视频更改其故事走向,任何脑洞大开的创意都可以在这里实现。不再需要繁琐的提示词,@主体+一句话就能生成有趣的 视频,创作门槛大幅降低。 同时APP端内置海量主体库,包括人物、动物、特效等丰富素材,用户可以直接调用喜欢的主体,随时随地生成好玩有趣的视频。 不仅如此,用户还可以像刷短视频一样在Vidu APP中刷各类AI视频内容,简直不要太爽! 从此社交有了更高维的形状,AI+创意+社交将生长出全新的AI社交方式。 随着Vidu移动端应用的全新升级,一个集内容创作、互动、分发于一体的平台已经诞生,用户不仅可以浏览AI生成的精彩视频,更能随时随 地将自己的奇思妙想变为现实。 此外, Vidu视频延长功能一来就亮绝杀 , 最高可延长至五 ...
LLM记忆管理终于不用“手把手教”了,新框架让智能体自主管理记忆系统
量子位· 2025-10-20 18:29
技术方案与核心创新 - 提出名为Mem-α的强化学习框架,用于训练大语言模型智能体自主管理复杂的记忆系统[2] - 采用数据驱动的强化学习方法,让模型在交互中自主学习最优记忆管理策略,而非依赖预设指令[4] - 将记忆构建问题转化为可通过强化学习优化的序列决策问题,实现端到端的优化[14] - 训练时智能体依次处理信息块并决定记忆操作,通过下游任务表现获得反馈进行优化[16] 技术背景与现有挑战 - 大语言模型智能体受限于有限的上下文窗口,使得外部记忆系统对长期信息理解至关重要[5] - 即使支持100万tokens的模型如GPT-4.1,在长期交互中也会因窗口增长导致成本激增和延迟增加[6] - 当前记忆增强智能体依赖预定义指令和工具进行记忆更新,缺乏决定存储内容、组织结构和更新时机的能力[7][8] - 传统方法导致次优记忆构建和信息丢失,严重影响智能体在长期交互中的表现[9] 记忆系统架构设计 - 设计包含三种记忆类型的复杂系统:核心记忆(容量512 tokens)、情景记忆(记录带时间戳的事件)和语义记忆(存储结构化知识)[20][22] - 每种记忆类型支持插入、更新、删除操作,智能体需学习在适当时机选择合适工具和记忆类型[23] - 记忆系统灵感来源于认知科学中的记忆分类理论,涵盖持久信息、事件记录和结构化知识[20] 实验性能与效果验证 - 在30k tokens上训练后,模型在验证集上问答准确率等指标显著提升[27] - 主实验显示Mem-α在MemoryAgentBench上全面超越现有方法,平均性能达64.2%[29][33] - 相比Long-Context和RAG-Top2,记忆占用减少约50%的同时保持更优性能,在BookSum等任务上压缩效果更佳[35] - 训练仅使用平均<30K tokens的文档,成功泛化到超过400K tokens的文档,最长泛化至474K tokens[35] 技术突破与行业意义 - 证明在LLM智能体记忆管理领域,学习胜过工程,传统需精心工程化的系统组件可通过端到端学习优化[34][35] - 结构化架构必要性得到验证,扁平记忆基线性能明显受限,凸显分层记忆设计和强化学习优化的有效性[35] - 展现出对未见分布的强泛化能力,在精确检索和长期理解任务上表现尤其突出[35]