Workflow
生成式AI
icon
搜索文档
突发!arXiv CS新规:未经同行评审,一律不收
具身智能之心· 2025-11-04 08:05
arXiv政策变革背景 - arXiv对计算机科学板块的"综述/调研"和"立场"类论文实施新规,要求必须通过同行评审后才能收录[2][7] - 生成式AI和大模型技术导致论文撰写变得轻而易举,特别是那些不包含新研究成果的论文[20] - arXiv所有分类都出现提交量大幅增长,但在计算机科学领域尤为显著[21] - 目前arXiv每月收到数百篇综述文章,其中90%被描述为"带注释的文献清单",缺乏实质性价值[5][32] 新规具体内容 - "综述"和"立场"论文需被期刊或顶会接收并完成同行评审后,才能提交至arXiv[8] - 作者提交时必须提供经同行评审的期刊引用及DOI元数据[9] - 若论文因"未完成同行评审"被拒,后续通过严格评审后可按指引申诉并二次投稿[49] - 研究科学技术对社会影响的论文(如cs.CY或physics.soc-ph分类)不受此政策影响[50] 学术界反应 - MIT EECS副教授Phillip Isola认为此举偏离了arXiv作为"科研界GitHub"的定位[10][11] - 前谷歌DeepMind专家Ahmad Beirami担忧新规会误杀优质内容并拖慢成果发布速度[39] - 艾伦研究所ML专家Nathan Lambert对政策实施效果持保留态度[40] - 研究员Gavin Crooks指出arXiv正从预印本服务器转向"后印本"平台[41] 政策实施目标 - 帮助读者更轻松地找到由领域专家撰写的高质量综述和立场文件[28] - 让审稿人集中精力处理arXiv正式接纳的内容类型,缩短稿件积压时间[28] - 保持arXiv快速、自由分享研究论文的核心宗旨,促进科学发现[23] - 如果其他分类也遭遇AI生成论文泛滥,未来将效仿计算机科学板块调整审核政策[51]
腾讯研究院AI速递 20251104
腾讯研究院· 2025-11-04 00:01
寒武纪基础软件平台进展 - 发布基础软件平台Cambricon NeuWare,全面兼容PyTorch最新版本和Triton算子开发语言,支持用户模型和自定义算子快速迁移 [1] - 平台在大模型与搜广推训练推理方面完成大规模技术验证,支持DeepSeek V3、Qwen系列等MoE类模型训练,实现发布即适配 [1] - 平台提供完整的驱动运行时库、编译器、算子库和集群工具,Kernel调度吞吐达每秒数十万任务,达到业界领先水平 [1] OpenAI政策调整 - OpenAI更新使用政策,ChatGPT不再协助提供需要持牌专业人士才能给出的专业建议,包括医疗、法律和财务等高风险领域 [2] - 政策收紧主要源于法律风险上升、全球合规压力增大以及ChatGPT使用日益商业化 [2] - 此次调整是AI角色从“顾问”回到“助手”的转变,为未来进入关键行业铺设制度护栏 [2] 美团全模态模型开源 - 美团开源全模态模型LongCat-Flash-Omni,总参数量5600亿,激活参数量270亿,在全模态基准测试中达到开源SOTA水平 [3] - 模型支持128K tokens上下文窗口及超8分钟音视频交互,预训练使用超2.5万亿词元多模态语料库 [3] - 美团LongCat官方App开启公测,支持联网搜索和语音通话,音频通话10分钟且响应快速,视频通话功能后续上线 [3] 百度文心AI漫画功能 - 百度文心APP推出“魔法漫画”功能,用户通过一句话或一张照片即可在两分钟内生成多图多页、剧情完整的AI连载漫画 [4] - 功能支持自定义角色形象、九种风格选择,每页漫画自动生成文字解说,可一次性生成6-7页 [4] - 支持“续写”和“改编”功能,用户可基于原剧情延伸或重写新版本,生成的漫画可下载图片或分享到微信朋友圈 [4] Cartesia语音模型与融资 - 美国语音生成创企Cartesia完成1亿美元融资,英伟达参投,同时推出全新语音模型Sonic-3 [5] - Sonic-3支持42种语言和500多种音色,模型延迟仅90毫秒,端到端响应时间在190毫秒以内,采用非Transformer的SSM架构 [6] - 该模型支持语音克隆、自定义发音和情绪控制,目前已服务数千家企业 [6] Turbo AI用户增长 - AI笔记应用Turbo AI由两位20岁大学辍学生创办,过去半年用户从100万飙升至500万,年经常性收入达八位数且持续盈利 [7] - 产品主打课堂场景,可将录音、课件、PDF、YouTube视频转化为笔记、闪卡和测验题 [7] - 团队仅15人,客户包括高盛、德勤、麦肯锡等知名企业,至今仅融资75万美元 [7] AI浏览器发展态势 - 主流AI浏览器分为渐进派和激进派,后者将AI作为浏览器核心并支持智能体模式 [8] - ChatGPT Atlas执行力最强能真正操作网页和自动化任务,Comet信息聚合全面但执行慢,Dia速度快但总结缺细节 [8] - 主要安全威胁是“间接提示注入攻击”,黑客可将恶意指令隐藏在网页中误导AI执行,目前尚无明确解决方案 [8] 智能眼镜合作与市场 - 依视路旗下BOLON眼镜与Rokid联合推出BZ5000 AI智能眼镜,整机仅重38g,集成1200万像素摄像头和6小时续航 [9] - 依视路在中国选择Rokid,看重其自研YodaOS系统打通高德导航、支付宝支付等本土化深度服务 [9] - Rokid乐奇眼镜在Kickstarter创下45天募集361万美元的全球智能眼镜品类历史纪录,已获5000多名支持者认可 [9] AI研究的公共利益导向 - AI教母李飞飞呼吁大学与非营利机构重新承担推动AI作为公共产品的使命 [10] - 开放科学历史塑造了现代AI,但当前趋势正从“共享研究事业”变为“封闭商业竞赛” [10] - 大学面临市场失灵,在计算能力和数据资源方面严重不足,需建立全球协作网络实践公共利益使命 [11] 数据护城河构建策略 - 当基础设施提供商成为最强竞争对手时,初创企业唯一防御路径是构建耗时多年无人能复制的“数据围墙花园” [12] - VLex整合欧洲最全法律数据库,OpenEvidence建立高可信医学研究数据库,数据专有性、受监管性和动态精选性构成护城河 [12] - 潜在机会存在于供应链物流、地方政府记录、前沿科学等碎片化高敏感或难获取的数据领域 [12]
OpenAI豪掷380亿美元牵手亚马逊:史上最大AI算力合作启动
凤凰网· 2025-11-03 23:26
合作核心信息 - 亚马逊云服务(AWS)与OpenAI达成一项为期多年的战略合作协议,协议总额高达380亿美元,预计在未来七年内持续扩大 [1] - AWS将为OpenAI提供核心人工智能工作负载的基础设施支持 [1] - OpenAI将立即开始使用AWS的算力资源,这些资源包括数十万片英伟达最新GPU(涵盖GB200与GB300系列) [1] 技术部署与架构 - AWS预计将在2026年底前完成全部部署,并预留扩容空间以支持2027年及以后的增长需求 [1] - 采用的AI算力集群具备扩展至千万级CPU规模的能力,用于支撑从ChatGPT推理到新一代模型训练等多样化AI任务 [1] - 通过Amazon EC2 UltraServer实现低延迟互联,优化数据中心网络带宽与GPU互联效率,使OpenAI能够在大规模模型训练与推理之间实现灵活切换 [1] 合作影响与背景 - 此次合作意味着AWS在全球AI基础设施竞争中的又一次重大胜出,也标志着OpenAI在多云战略下的进一步扩展 [2] - 合作延续了双方此前在AI生态层面的协作,OpenAI的开源模型已登陆AWS的Bedrock平台,为数千家企业客户提供模型调用服务 [2] - OpenAI已成为Amazon Bedrock上最受欢迎的模型提供商之一,合作将强化其在生成式AI领域的长期算力保障 [2]
亚马逊和OpenAI,签署380亿美元协议
财联社· 2025-11-03 22:38
合作概况 - 亚马逊网络服务(AWS)与OpenAI宣布建立多年战略合作伙伴关系,协议价值380亿美元,将在未来七年内持续增长 [1] - 合作旨在提供AWS的基础设施以运行和扩展OpenAI的核心人工智能工作负载 [1] 合作内容与技术细节 - OpenAI将访问包含数十万个最先进NVIDIA GPU的AWS计算资源,并能够扩展到数千万个CPU以快速扩展代理工作负载 [1] - AWS拥有运行大规模AI基础设施的非凡经验,其集群芯片数量超过50万 [1] 合作意义与行业影响 - AWS在云基础设施方面的领先地位与OpenAI在生成式AI方面的开创性进步相结合,将帮助数百万用户继续从ChatGPT中获得价值 [1] - 此次合作旨在加强广泛的计算生态系统,为人工智能的下一个时代提供动力,并为每个人带来先进的人工智能 [1]
造议员假丑闻、给假新闻链接,谷歌 Gemma AI模型遭投诉后下架
搜狐财经· 2025-11-03 22:27
公司行动 - 谷歌将面向开发者的AI模型Gemma从AI Studio平台下架[1] - 下架原因是避免非开发者用户将该模型用于回答事实性问题而产生的混淆[3] - 开发者仍可通过API继续使用Gemma模型[3] 事件背景 - 田纳西州共和党参议员玛莎・布莱克本投诉Gemma模型生成了针对她的虚假刑事指控[3] - 参议员指控当被问及“玛莎・布莱克本是否曾被指控强奸”时,Gemma给出了捏造的回复[3] - 模型回复称参议员在1987年竞选州参议员期间被指控与一名州警发生非自愿性关系,但实际竞选年份为1998年,且相关内容完全不属实[4] 行业挑战 - 生成式AI模型提供虚假或误导性答案的问题仍在困扰整个行业[4] - 尽管技术有所进步,但目前尚无明确方案能彻底解决AI模型的准确性难题[4] - 谷歌表示公司致力于最大限度减少模型幻觉,并持续改进所有AI模型[4]
中国成唯一下滑市场!苹果再失守,谁蚕食了份额?
新浪科技· 2025-11-03 19:17
苹果2025财年第四财季大中华区营收表现 - 大中华区营收为144.93亿美元,同比下降3.6% [1][2] - 该区域成为全球唯一业绩下滑的市场,而美洲、欧洲、日本、亚太其他地区营收均同比增长 [1][2] - 此次下滑中断了上一财季通过618大促实现的增长势头,此前大中华区营收曾连续7个季度下滑 [2] 管理层对业绩下滑的解释 - 公司CEO库克将下滑归因于供应限制,具体为iPhone 16系列预估产量略低于实际需求 [1][4] - 管理层指出iPhone 17系列需求非常强劲,导致第四财季积压大量订单 [4] - 公司预计新财季营收将恢复增长,依据是门店流量显著增长及iPhone 17系列获得良好市场反响 [10] 专家分析业绩下滑的内部原因 - 产品创新速度放缓,主力机型升级幅度有限,难以激发用户换机欲望 [1][5] - iPhone Air因仅支持eSIM且国内运营商未适配,发售延迟至10月22日,直接冲击第四财季销量 [6][7] - 生成式AI布局滞后于中国厂商,智能化体验不足削弱产品吸引力,定价策略在高位对消费者吸引力减弱 [5][6] 专家分析业绩下滑的外部原因 - 本土品牌强势崛起,华为回归直接冲击公司在中国高端市场的份额 [1][11] - 国产手机品牌在折叠屏、快充等差异化创新上进展迅速,为消费者提供更多选择 [6] - 经济环境波动叠加国产品牌认可度提升,高价iPhone需求承压 [6] 市场竞争格局与国产厂商动态 - 华为凭借品牌忠诚度和技术突破,正在重建其高端市场地位 [11] - 小米17系列销量已超过100万台,比往代速度更快,总销量比上一代增长30% [12] - OPPO、vivo等国产厂商纷纷推出新机型,并从系统层面强调兼容苹果生态以抢夺高端用户 [12][14] iPhone Air的市场反馈与影响 - iPhone Air需求低于预期,导致供应链开始缩减产能,预计到2026年一季度大多数供应商产能会缩减80%以上 [10] - 用户反馈两极分化,优点为手感轻薄,缺点包括单扬声器音质差、电池续航一般、后盖易碎 [10] - 该机型与公司过往推出的mini、Plus机型类似,未能成功开拓出新的市场区隔 [10]
Python只是前戏,JVM才是正餐,Eclipse开源新方案,在K8s上不换栈搞定Agent
36氪· 2025-11-03 16:51
Eclipse LMOS平台与ADL技术概述 - Eclipse基金会在其开源平台Eclipse LMOS中推出"代理定义语言"(ADL),这是一种结构化、与模型无关的描述方式,允许用户无需编写代码即可定义AI行为[1] - ADL将成为智能体计算平台LMOS的核心组件,该项目从一开始就瞄准在Kubernetes/Istio上原生运行,服务JVM生态,旨在用统一、开放的方式重构企业级AI代理的开发与运维链路[1] - LMOS项目采取"先落地、后开源"的路径,其前身是德国电信在传统云原生架构中的生产级实践,之后才在Eclipse基金会中完成孵化[1] 技术理念与市场定位 - LMOS项目的初衷是探索如何将AI能力尽量贴近企业已经熟悉的技能栈,而不是迫使企业抛弃既有成果,避免企业需要"推倒重来"再组建昂贵的新队伍[2] - 该项目对标专有平台与以Python为主的企业AI技术栈,对长期主导企业AI的闭源替代方案发起正面挑战[1] - 对于深耕JVM体系的企业来说,没有必要完全改变技术栈,LMOS允许企业沿用既有基础设施、API与DevOps能力[4] 架构设计与技术实现 - 平台以Kubernetes为底座,配合Istio等组件提供能力,将"代理/工具"以微服务形态部署到K8s环境,并通过自定义资源(CRD)提升为一等公民,支持声明式管理与可观测性[5] - 开发者能沿用既有工作流:只需推一个智能体镜像,即可在新环境中运行和独立测试;运维团队可以直接用kubectl get agents、kubectl apply去监控与发布[6] - 系统采用Kotlin作为主语言,便于打造领域专用语言(DSL),即ADL,避免了Python生态中需要多个容器支撑简单功能的复杂性问题[6][10] 实际应用成效 - 该平台已支撑德国电信的多项AI应用,包括多次获奖的客服机器人Frag Magenta[7] - 到2023年底,首个代理在德国电信投入生产,并在欧洲加速扩展:覆盖范围从3-4个国家增至10个国家,上线后月均处理约450万次会话;到2024年,转人工次数下降38%[7] - 开发周期显著压缩:从最初第一个代理花费一个月时间,降到15天,最终基本一两天就能完成一个代理连同一组用例的开发[8] 平台核心模块构成 - ADL模块:结构化、模型无关,支持可视化创作与多角色协作,让业务与工程团队共写代理,业务部门能够像写SOP一样定义代理行为[13] - ARC Agent Framework:基于JVM/Kotlin,提供IDE级开发体验与可视化调试,让工程师专注业务API与集成逻辑[13] - LMOS平台层:开放的云原生编排层,用于代理生命周期管理、发现、语义路由和可观测性,基于CNCF技术栈构建[13] 运维与扩展能力 - 只需一名数据科学家与一名工程师配对,从业务提出想法到将代理部署到生产都能非常快,小团队带来明显的成本优势[8] - 平台支持跨多国部署,技术架构支持"平台化、集中式"的统一部署与管理,能够在10个国家运营[4][8] - LMOS Operator负责生命周期管理,当新应用安装时会接收事件通知,抓取描述文档并写入Kubernetes Registry[14] 行业影响与战略意义 - Eclipse LMOS站在Python阵营与JVM世界的缝隙之间,试图把AI代理带回企业能理解、能运维、能长期托管的基础设施之上[18] - 该平台正在提供一个强大的开放平台,任何组织都可以据此构建可扩展、智能且透明的代理系统,替代专有产品[18] - 在"代理大多运行于云、而云标准已成型"的现实里,LMOS这样的路径能够将代理与现有云原生栈真正对接[17]
刚刚,腾讯快手投出一个400亿IPO,开盘大涨99%
36氪· 2025-11-03 14:23
IPO基本信息 - 明略科技于11月3日在港交所上市,股票代码02718HK [1] - 发售价为141港元/股,全球发售净筹约902亿港元(约合人民币826亿元)[1] - 开盘价为280港元/股,较发售价大涨9858% [1] - 截至9点35分,股价为301港元/股,涨幅达11348%,总市值为435亿港元(约合人民币398亿元)[1] 公司业务与市场地位 - 公司是中国最大的数据智能应用软件供应商,按2024年总收入计市场份额为38% [3][22][23] - 核心业务分为三类:营销智能、营运智能和行业解决方案 [17][23] - 营销智能是主要收入来源,过去三年半贡献了超过50%的收入 [17] - 按2024年收入计,公司是中国最大的营销智能应用软件供应商,市场份额为78% [31][32] - 按2024年收入计,公司也是中国最大的营运智能应用软件供应商,市场份额为103% [34][35] 财务表现 - 2022年、2023年、2024年及2025年1-6月,收入分别为1269亿元、1462亿元、1381亿元和644亿元 [14][18] - 同期净利润分别为1638亿元、318亿元、008亿元和-204亿元 [14] - 同期毛利率分别为532%、501%、516%和559% [18] - 同期研发费用分别为751亿元、481亿元、353亿元和150亿元 [14] - 经营现金流持续为负,2025年1-6月为-114亿元 [20] 客户与合作伙伴 - 截至2024年末,客户总数为1841名 [39] - 截至2025年6月30日,已为135家财富世界500强企业提供服务 [39] - 客户包括宝洁、宝马、上汽通用汽车、英特尔、国家电网、雅诗兰黛等知名企业 [3] - 2022年至2025年1-6月,来自前五大客户的收入占比分别为254%、360%、351%和314% [42] - 客户F是最大客户,2022年贡献收入119% [43] 技术与研发 - 公司拥有2322项专利及596项专利申请,并获得逾460项国内和国际奖项 [21] - 研发人员数量逐年减少,从2022年的1135名降至2025年6月30日的714名 [20] - 公司是首批采用AIoT、AIOps和多模态大语言模型技术的企业之一 [7] - 2023年推出大模型产品小明助理,并计划在2025年9月推出下一代企业AI助手DeepMiner [8] 创始人与股东背景 - 创始人、董事长兼CEO吴明辉为北京大学校友,拥有19年大数据和AI行业经验 [4] - 共同创始人、总裁兼CFO姜平同样毕业于北京大学 [4] - 腾讯是公司第一大股东,在全球发售后持股2596% [10] - 快手的全资附属公司Cosmic Blue Investments Limited持股248% [10] 发展历程与融资 - 公司成立于2006年,是中国最早提供数据智能解决方案的公司之一 [6] - 2008年推出中国首款营销智能应用软件秒针系统 [6] - 2019年获得由腾讯领投的20亿元融资,投后估值约1942亿美元(约合人民币138亿元)[6] - 2020年估值上升至3051亿美元(约合人民币217亿元),成为国内估值最高的AI大数据独角兽 [6]
恒指上扬0.58%,能源业领涨,四季度港股市场机遇与挑战并存
每日经济新闻· 2025-11-03 13:27
市场表现 - 恒生指数午盘上涨0.58%至26057.13点,恒生中国企业指数上涨0.68%,恒生科技指数微跌0.24% [1] - 市场半日成交额为1321亿港元 [1] - 科技板块中,小鹏汽车-W上涨3.84%,蔚来-SW上涨2.93%,华虹半导体下跌4.39%,中芯国际下跌4.13% [1] 科技板块前景 - 四季度科技板块凭借人工智能与“新质生产力”双重概念,成为进攻配置的核心 [1] - 需求端,中国生成式人工智能用户规模爆发式增长,本土科技企业承接绝大多数市场红利 [1] - 供给端,港股科技龙头从应用者升级为产业链建设者,覆盖软硬件、造车新势力、创新药等赛道 [1] 资金与估值 - 南下资金持续流入,年内净买入额超过1.2万亿港元,内资定价权不断提升 [1] - 板块相较于A股存在大幅折价,叠加美联储降息周期与国内经济韧性,四季度港股科技板块有望实现超额收益 [1]
AI家教赛道升温,互联网大厂与教育巨头开启攻防战
36氪· 2025-11-03 12:57
市场爆发背景与驱动因素 - 教育类AI应用市场在2025年秋迎来爆发期,月活用户与下载量创纪录,部分产品下载量环比增速逼近1000%,头部产品月活用户规模突破亿级大关[1] - 爆发源于“双减”政策后家庭教育需求结构的重构,以及生成式AI技术(大模型+RAG+海量题库架构)的成熟为场景提供了完美落地载体[1] - 教育场景具备高频、刚需、可复制的结构性优势,使其成为AI技术落地的黄金赛道[3] - 开学季自然流量助推需求,有产品注册用户数在9月份环比增长50%[5] - 全球教育AI市场规模2024年约为58.8亿美元,预计到2030年将增长至322.7亿美元,年复合增长率高达31.2%[6] 主要参与者与市场格局 - 互联网大厂(字节跳动推出“豆包爱学”,阿里旗下夸克上线“夸克学习”)和传统教育巨头(猿辅导、作业帮)纷纷重兵布局[3] - 从下载量看,字节跳动产品断层式领跑,其出海产品Gauth下载量675万,面向国内的豆包爱学下载量为481万,两者环比增长都超过100%[6] - 作业帮产品下载量总和为637万,猿辅导凭借小猿口算和小猿搜题达到336万下载,且增长迅猛[7] - 从月活用户看,国内9月月活超2000万的教育类AI APP共5款,均为教育大厂产品[9] - 月活最高的为作业帮,达9863万(环比下降1.94%),断层式领先;猿辅导两款产品月活均在3000万以上,且环比增长均超16%[10] - 互联网大厂凭借流量优势吃到了“拉新”红利,而教育大厂则依靠存量用户和产品生态吃到了“留存”红利[10] 产品定位与核心功能差异 - 互联网大厂(如字节跳动、阿里)核心目标是“流量转化与数据积累”,将教育AI视为生态布局一环,通过免费工具吸引用户,反哺广告、云服务等主营业务,产品以“用户体验”和“交互效率”为核心[12] - 教育大厂(如猿辅导、作业帮)核心目标是教学效果与商业变现,通过技术提升教学效果增强用户粘性,最终实现付费转化,产品以教学深度和提分效果为核心[12] - 在拍照搜题、AI讲题核心功能上,各家答题准确率表现相近[13] - 在AI讲解引导思考功能上,仅豆包爱学和作业帮提供(作业帮为限时免费),且符合引导思考需求[31] - 小猿搜题提供的是提前录制的真人讲解视频,需购买VIP,夸克学习也未提供AI讲解功能,但提供免费知识点视频[35][37] - 教育大厂产品界面多保留传统多模块布局,互联网大厂产品更倾向聊天式界面,类似通用型助手[37] - 互联网大厂产品更注重效率(用户体验、交互便捷性),教育大厂产品更注重效果(教学内容准确性、提分有效性)[37] 行业面临的挑战与问题 - AI家教产品实际变现效果不尽如人意,头部产品月收入仅为几十万到上百万级别,与传统互联网产品盈利规模相去甚远[41] - 核心原因是用户付费意愿与产品价值感知不匹配,家长对AI产品效果持怀疑态度,且在“双减”政策下选择更为谨慎[41][42] - 互联网大厂的免费策略加剧了行业变现压力,用户缺乏付费动力[42] - AI大模型存在幻觉问题,影响解题准确率,有测试显示热门产品正确率最高仅80%,最低30%,存在知识点混淆、解题步骤遗漏等问题[44] - 行业缺乏统一的教学效果评价标准,企业自定指标导致信息不对称,降低用户付费意愿[45] - 产品同质化严重,核心功能集中在拍照搜题、作业批改、AI讲题,导致“重营销、轻研发”的困境[45]