Workflow
生成式AI
icon
搜索文档
“熊出没”频发 日本相关假视频增多引担忧
新华社· 2025-11-11 15:24
新华社北京11月11日电 日本"熊出没"事件频发不仅造成人员伤亡,更引发一系列社会问题,包括社交 媒体平台上流传的由生成式AI合成的假视频近来明显增多,引发担忧。 据日本共同社10日报道,这些假视频包括熊破坏大型太阳能发电站的太阳能板、抢夺宠物狗等内容。专 家指出,这些视频明显造假,但当它们混杂在海量短视频中时,迷惑性就会很强。 日本一家关注新闻事实核查的机构分析发现,部分视频中清晰可见美国开放人工智能研究中心 (OpenAI)开发的视频生成模型Sora的水印。 该机构主编古田大辅指出,"随着熊出没造成破坏的新闻报道增多,相关虚假视频的数量也同步增长"。 他呼吁公众保持警惕,谨防上当受骗。 熊类研究专家担心,这种假视频可能导致人们在野外遇到熊时错误应对,令情况更加危险。 秋田县是"熊害"重灾区之一。最近网上流传一个关于该县能代市的视频显示,一头身长1米的黑熊进入 一家超市后被抓获。但该市一名官员说,这纯属子虚乌有。这名官员告诉《读卖新闻》:"这(假视 频)可能会让居民感到不安。如果因此引发大量民众询问,还会干扰我们的正常工作。"他提醒民众以 当地政府部门发布的"熊出没"信息为准。 日本环境省数据显示,截至11 ...
2025年生成式+AI+全球研究报告
搜狐财经· 2025-11-11 10:14
生成式AI的采纳现状与成效 - 自2022年11月ChatGPT推出以来,生成式AI正以前所未有的速度重塑全球产业格局,成为提升生产力、创新客户体验和优化运营效率的关键驱动力[1] - 早期采纳生成式AI的企业已取得显著成效,近九成(约90%)受访组织指出员工体验和满意度得到提升,超过八成(约80%)的企业实现了运营成本降低和客户留存率提高[1] - 从全球范围看,生成式AI的采用率呈现显著地域差异,中国、美国、英国、澳大利亚和德国的企业处于技术应用前列,其中电信、零售、保险与银行业已进入较成熟的实践阶段[2] 实施生成式AI面临的挑战 - 在全面推行生成式AI的过程中,近四成(约40%)企业遇到技术整合难题,约三分之一(约33%)则面临高昂的实施成本[1] - 数据隐私与安全管理成为普遍关切,四分之三(75%)的使用者对此表示担忧[1][15] - 绝大多数组织缺乏健全的治理框架,仅十分之一(10%)的企业已为相关法规做好准备,95%的企业缺乏完善的GenAI管理架構[2][15] - 近半数(48%)决策者反映缺乏合适工具,逾四成(40%)遇到系统兼容性问题,同时超过半数(50%)的企业承认内部专业人才不足[2] 成功实施生成式AI的核心策略 - 成功实施生成式AI需聚焦四大核心策略:完善管理机制、战略性部署、技术系统整合与专家资源支持[2][12][13] - 实现真正价值需将重点置于可信赖的数据管理、可解释的成果输出以及跨部门协作机制的建立[2] - 只有通过系统化的策略规划与稳健的治理体系,企业方能在激烈竞争中把握机遇[2] 未来投入与行业差异 - 超过八成(80%)企业计划在近期加大对生成式AI的投入,五分之一(20%)拟在企业层面全面推广该技术[2] - 不同行业进展存在差异,公共服务和医疗健康领域进展相对缓慢,而亚太地区企业在法规准备和工具整合方面表现较为突出[2] - 各产业的大多数组织仍在为GenAI开发管理架構,例如公部门有64%的组织处于开发中阶段,生命科学领域为61%[23]
李飞飞最新长文火爆硅谷
量子位· 2025-11-11 08:58
文章核心观点 - 空间智能是人工智能的下一个前沿领域,其核心在于构建能够理解、推理、生成并与物理世界交互的“世界模型”,这将推动AI实现从处理抽象知识到理解物理现实的质的飞跃 [1][6][28] - 当前以大语言模型为代表的AI在空间智能方面存在根本性局限,无法像人类一样进行空间推理、物理规律预测和连贯的世界生成 [22][23][24] - 具备空间智能的世界模型必须拥有三项核心能力:生成性(创造物理一致的世界)、多模态(处理图像、视频、动作等输入)、交互性(预测世界随互动演变的状态) [5][31] - 空间智能的应用潜力巨大,将彻底革新创造力(如叙事、游戏设计)、机器人技术、科学发现、医疗和教育等多个领域 [4][27][51] 空间智能的定义与重要性 - 空间智能是支撑人类认知的脚手架,驱动着人类的推理、规划及与世界互动的方式,体现在日常动作(如停车、接钥匙)和极端情况(如消防员救援)中 [14][15][20][21] - 人类通过空间智能推动文明进步,历史案例包括埃拉托色尼计算地球周长、珍妮纺纱机的发明、DNA双螺旋结构的发现 [18][19] - 空间智能是人类想象力与创造力的基石,从原始洞穴壁画到现代电影、电子游戏,都依赖于以空间为根基的想象 [17] 当前AI在空间智能方面的局限 - 多模态大语言模型虽具备初步空间感知能力,但在估计距离、方向、大小等任务上表现不佳,无法进行“心智旋转”或预测基本物理规律 [23] - 顶级AI擅长阅读、写作和模式识别,但在对物理世界的表征或交互上存在根本性局限,生成的视频常在几秒后失去连贯性 [23][24] - AI缺乏人类整体性理解世界的方式,即同时理解物体在空间上的关系、语义意义及现实重要性 [25] 世界模型的核心能力与构建挑战 - **生成性**:模型需能生成具有几何、物理与动态一致性的虚拟世界,其输出应允许生成显式、可观测的世界状态,并保持时间上的连贯 [31][32][33] - **多模态**:模型需能处理图像、视频、深度图、文本指令、手势、动作等多种形式的输入,并以多样的方式输出 [34][35][36][37] - **交互性**:当动作或目标作为输入时,模型需能生成与世界先前状态、物理规律相一致的下一个状态,未来甚至能预测下一步行动 [38] - 构建世界模型面临巨大技术壁垒,因其需要协调语义、几何、动力学与物理等远比语言复杂的多维规则 [39][40][41][42] World Labs的研究进展与方向 - 公司致力于世界模型的基础性突破,研究方向包括定义新的通用训练任务函数、利用大规模图像视频数据、开发新的模型架构与表征学习 [43][44] - 开发了基于帧的实时生成模型RTFM,以空间为基础的帧作为记忆形式,实现高效实时生成并保持一致性 [45] - 推出了Marble的早期版本,这是全球首个可通过多模态输入生成并保持一致性3D环境的世界模型,旨在让用户探索和构建创意世界 [46] 空间智能的应用潜力 - **创造力**:工具如Marble平台将空间表达能力赋予电影人、游戏设计师等,使其能快速创造、迭代三维世界,实现多维叙事体验 [51][52][53] - **机器人**:空间智能是实现具身智能的关键,将使机器人能理解、导航并与世界交互,中期目标是完善感知与行动的闭环 [54][55][60] - **科学**:具备空间智能的系统可模拟实验、验证假设,探索从深海到外星的环境,变革气候科学、材料研究等领域的计算建模 [56] - **医疗**:AI可通过多维建模加速药物研发,辅助影像诊断,支持环境感知式监护系统,并发挥机器人在辅助医护方面的潜力 [56] - **教育**:能实现沉浸式学习,让抽象概念可感知,学生可多维探索细胞或“亲历”历史,专业人士可在仿真环境中练习技能 [57] 行业影响与未来愿景 - 空间智能模型将推动造世界的权力从专业团队扩展到个体创作者、教育者,结合VR/XR设备带来全新的沉浸与互动体验 [59] - 世界模型生成的仿真数据将极大促进机器人学习,缩小模拟与现实的差距,使其能在海量状态和环境中学习 [60] - 未来的创新将来自多样化的机器人设计(如纳米机器人、软体机器人),世界模型需对环境与机器人感知进行一体化建模 [60] - 该技术旨在增强而非取代人类,目标是让AI成为拓展人类能力、加速发现、放大关怀的力量,提升生命价值 [47][50][57][62][63]
韩知名高校曝上百人用AI考试作弊丑闻,已有约40名学生“自首”
环球时报· 2025-11-11 06:51
该教师近日在课程公告中称,已"发现大量学生存在不正当行为",并宣布将被查实作弊者的期中成绩一 律记为零分。他还警告称,若有学生拒不承认或隐瞒事实,将依照校规严肃追责,最严重可面临停学处 分。 事件曝光后,有学生在韩国学生社区"Everytime"发起"凭良心投票"帖文,在353名投票者中,约190人承 认在这门考试中使用了ChatGPT或其他AI工具,比例接近全部选课学生的1/3。据校方透露,目前已有 约40名学生主动"自首",另有约10人虽被怀疑但尚未承认。校方已展开调查,正在比对考试录像与答 卷,并计划根据校规作出处分。授课教师表示,该课程的期末考试可能转为线下进行。 韩媒评论称,生成式AI普及仅3年,却已在韩国高校掀起前所未有的混乱。韩国职业能力研究院数据显 示,去年接受调查的726名大学生中,有91.7%表示在作业或资料检索中使用过AI;但根据韩国大学教 育协商会统计,该国131所大学中,仍有七成以上尚未制定关于AI的明确使用指南。 韩国庆熙大学教授郑基仁警告称,过度依赖AI正在削弱学生的独立思考能力。韩国AI安全研究所所长 金明珠则建议,应允许学生合理使用AI,但应明确要求公开来源并加入个人意见,以 ...
百度第二次做AI眼镜,售价超过2000元
第一财经· 2025-11-10 20:50
百度AI眼镜产品发布 - 公司于2025年11月10日推出小度AI眼镜Pro,售价2299元,在京东和天猫平台开售,京东显示有9000+用户看过,天猫显示有1000+用户看过 [3] - 产品主要功能包括拍摄能力、AI翻译、AI识物、AI备忘、AI录音,没有显示功能,并非“AI+AR”眼镜 [3] - 此次发布距离公司官宣造AI眼镜已过去一年,是公司时隔11年后重新杀回AI眼镜领域 [3][6] 产品定位与市场竞争 - 产品售价2299元,超过了小米、华为、雷鸟等品牌的智能眼镜,也超过了Ray-Ban Meta基础款299美元的价格 [6] - 从功能看,产品与市面上大部分带拍照类AI眼镜功能趋同,并未展现出颠覆性的独特功能 [6] - 产品的竞争点被认为是百度AI生态的系统性输出,包括大模型的语义理解能力、搜索与地图信息支撑、小度的语音交互技术以及软硬件一体体验 [6] 行业发展与挑战 - 行业进入“百镜大战”,IDC预计2025年中国智能眼镜市场出货量将达到290.7万台,同比增长121.1% [7] - 其中音频和音频拍摄眼镜出货量预计216.5万台,同比增长178.4%;AR/VR设备出货量预计74.2万台,同比增长38.1% [7] - 行业门槛被认为较低,可快速拆解产品并利用成熟供应链复制,但核心竞争力涉及AI、系统、手机连接等问题,用户体验与应用场景有待提升,市场爆发仍需时间 [7] 历史背景 - 公司最早于2014年推出智能眼镜产品BaiduEye,将其视作新的“搜索入口”,采用后戴式设计,但最终因生态不成熟、场景难落地而未真正面世 [5]
百度第二次做AI眼镜 售价超过2000元
第一财经· 2025-11-10 20:16
产品发布与定位 - 公司于11月10日推出小度AI眼镜Pro,售价2299元,京东和天猫平台分别有9000+和1000+用户浏览该商品[2] - 产品主打拍摄能力、AI翻译、AI识物、AI备忘、AI录音等功能,不具备显示功能,定位为拍照类AI眼镜而非“AI+AR”眼镜[2] - 此次发布是公司时隔11年重返智能眼镜领域,此前在2014年曾推出BaiduEye进行探索但未成功面世[2][3] 市场竞争与行业前景 - 产品售价2299元,高于小米、华为、雷鸟等品牌同类产品,也高于Ray-Ban Meta基础款(299美元)[4] - 行业进入“百镜大战”阶段,IDC预计2025年中国智能眼镜市场出货量将达到290.7万台,同比增长121.1%[4] - 其中音频和音频拍摄眼镜出货量预计为216.5万台,同比增长178.4%,AR/VR设备出货量预计为74.2万台,同比增长38.1%[4] 产品竞争力分析 - 产品功能与市面大部分带拍照类AI眼镜趋同,未展现颠覆性独特功能[4] - 产品核心竞争点被视为百度AI生态的系统性输出,包括大模型语义理解、搜索与地图信息支撑、语音交互技术及软硬件一体体验[4] - 行业门槛被认为较低,产品可被快速拆解和复制,但核心竞争力涉及AI、系统及与手机连接等尚未完全解决的问题[5]
百度第二次做AI眼镜,售价超过2000元
第一财经资讯· 2025-11-10 19:59
产品发布与市场定位 - 公司于11月10日重新推出AI智能眼镜产品小度AI眼镜Pro,售价为2299元,在京东和天猫平台分别有9000+和1000+用户浏览过该商品 [1] - 新产品聚焦于拍摄能力、AI翻译、AI识物、AI备忘、AI录音等功能,不具备显示功能,定位为拍照类AI眼镜而非“AI+AR”眼镜 [1] - 该产品定价超过小米、华为、雷鸟等品牌的智能眼镜,也高于Ray-Ban Meta基础款的299美元 [4] 历史背景与战略演进 - 公司最早在2014年推出智能眼镜产品BaiduEye,旨在作为新的“搜索入口”,采用后戴式设计,通过手势和语音指令进行交互 [3] - 由于当时硬件算力、算法限制以及隐私争议,BaiduEye最终未能成功商业化,团队曾探索商场、博物馆及医疗等应用场景但未能落地 [3][4] - 此次重返智能眼镜领域,是公司在生成式AI浪潮和硬件技术取得突破的背景下,对未来人机交互入口的再次争夺 [4] 产品竞争力与生态优势 - 小度AI眼镜Pro的核心竞争力被认为是百度AI生态的系统性输出,包括大模型的语义理解、搜索与地图信息、小度语音交互技术以及软硬件一体化的用户体验 [5] - 与市面上大部分同类产品相比,该产品功能趋同,未展现出颠覆性独特功能,未来可能需要通过渠道合作和优化服务体验来提升市场渗透 [4][5] 行业市场前景与挑战 - 行业进入“百镜大战”阶段,IDC预计2025年中国智能眼镜市场出货量将达到290.7万台,同比增长121.1%,其中音频和音频拍摄眼镜出货量预计为216.5万台,同比增长178.4% [5] - 行业门槛被认为较低,企业可利用成熟供应链快速复制产品,但核心竞争力涉及AI、系统及与手机的连接,目前用户体验和应用场景仍有待提升,市场爆发尚需时间 [5] - 有观点指出,当前智能眼镜上的AI体验远不如手机上的AI应用程序好用 [5]
鸿蒙版百度文库上架!18亿文档+多样AI工具,让创作更专业、高效
财富在线· 2025-11-10 17:46
• 资料分类管理,多端内容随时看:实现App、小程序与网页多端数据实时同步,最近浏览、收藏和下 载的内容可跨设备接续查看,并支持对文档进行分类管理。 • 实用工具集成,办公学习更高效:支持Word、PDF、PPT等格式切换,集成语音速记、图片转文字、 图文识别、翻译等实用工具,覆盖了办公和学习场景下的高频需求。 生成式AI爆火的2025年,如何找到一款内容专业、功能强大的AI创作工具?很多人的答案会是百度文 库。近日,作为国内领先的一站式AI内容获取和创作平台的百度文库正式上架华为应用市场。鸿蒙版 百度文库以"超18亿专业文档+多样化AI创作工具"的超强配置,不仅为上千万鸿蒙用户带来了即装即 用、智能高效的创作新体验,也标志着鸿蒙生态在专业内容领域实现了新的突破。 打开鸿蒙版百度文库,文档查找、AI内容生成、资料管理等核心功能均已齐备,可以在办公、学习、 娱乐等多场景下为用户提供创作支持: • 18亿+专业内容,一键随查随用:百度文库积累了超过18亿专业内容,涵盖学术论文、行业报告、职 场办公、教学资源等各领域权威文档。用户可通过智能搜索快速获取所需材料,满足报告撰写、PPT制 作、备考复习等多样化需求。 • ...
MeshCoder:以大语言模型驱动,从点云到可编辑结构化物体代码的革新
机器之心· 2025-11-10 11:53
生成式 AI 的浪潮赋予了机器无尽的创造力,我们已亲眼见证它在文字与图像世界 "点石成金" 的魔力。然而,当这股浪潮涌向更复杂的三维空间,挑战也随之升 级。过去的 3D 生成 AI 如孩童堆积木,成果粗糙模糊;如今,它渴望成长为一名 "数字建筑师",去建造结构精巧、可被编辑改造的虚拟世界。 为了实现这一目标,一种流行的方法是让 AI 学习定义 "内外" 的边界来隐式地塑造物体。这种方法虽能生成外形平滑的物体,但其成果好比一座 "固化" 的雕塑 —— 一个不可分割的静态外壳,很难像玩乐高一样拆解重组。对于艺术家而言,这座雕塑的表面覆盖着一张杂乱的 "渔网"(无序三角网格),而非规整的 "布 料",任何微调都如同对整片网进行重新编织,极其困难,难以融入专业的创作流程。 受到 以上启 发 ,我们不再满足于生成杂乱的网格,而是渴望一种更原生、更结构化、更符合设计师与工程师直觉的表征方式 —— 代码。如何让模型像程序员一 样,用逻辑和参数构建三维世界?如何让生成的物体不仅形似,更能被理解、被编辑、被二次创作?带着这些思考,我们团队推出了 M eshC oder 。它是一条探 索 3D 程序化生成的新路径,其核心思想是训 ...
腾讯研究院AI速递 20251110
腾讯研究院· 2025-11-10 00:09
生成式AI 一、Grok 4深夜大升级:200万上下文、五倍GPT-5脑容量? 3. 200万token上下文能力意味着可一次性处理相当于150万英文单词或6000页文本,相当于两部《战争与和平》。 https://mp.weixin.qq.com/s/PkHA-2aXsCg03xpoQOMXLA 二、GPT-5-Codex mini 紧凑版发布,性能相当速率提高 4 倍 1. OpenAI发布GPT-5-Codex-Mini紧凑版,使用量是GPT-5-Codex的约4倍,ChatGPT Plus等用户速率限制提高50%; 2. 代码中发现GPT-5.1系列三个新模型痕迹,包括旗舰模型GPT-5.1、推理模型GPT-5.1 Reasoning和研究级GPT-5.1 Pro; 3. 新模型 或 于 11月 底 发布,其中一个模型可能已以Polaris Alpha名字在OpenRouter等平台测试,在创意写作和基准测试中表现出 色。 https://mp.weixin.qq.com/s/er3zhiYfsyGKqchQuRYl0Q 三、谷歌二代Nano Banana爆出!一键推演微积分终结PS 1. Grok ...