大型语言模型(LLM)
搜索文档
【科技日报】《科学》杂志评出2025年度十大突破
科技日报· 2025-12-19 11:14
全球可再生能源发展 - 全球可再生能源以太阳能和风能为主快速增长,其新增发电量已覆盖2024年上半年全球新增用电,并在总量上超过化石能源 [2] - 中国是推动这一转型的关键力量,通过大规模发展太阳能电池板、风力发电机和锂电池储能系统,巩固了全球领先地位 [2] - 依托中国低成本制造,小型屋顶光伏系统在全球快速普及,为欧洲、南亚及“全球南方”的**数百万**家庭提供可靠、经济的能源保障 [2] 基因编辑与细胞疗法 - 美国研究团队成功为一名患有罕见遗传病的婴儿实施了定制化基因编辑治疗,这是基因疗法首次在人类患者中实现定制化临床应用 [3] - 研究人员发现神经元可通过隧道纳米管向癌细胞转移线粒体,增强其能量代谢、干性及抗应激能力,从而促进癌症转移,尤其在脑转移灶中富集 [5][7] 新药研发与审批 - 两种新型淋病药物吉泊汀和唑氟达星在大规模临床试验中表现出色,获美国FDA批准,成为**数十年来**首批针对该病的新药 [4] - 新药作用于细菌DNA复制关键酶,疗效显著且安全,可口服,吉泊汀已获批用于尿路感染 [4] - FDA允许类似定制药物合并进行临床试验,为未来更多抗耐药淋病药物研发铺平道路 [4] 天文与基础物理观测 - 薇拉·C·鲁宾天文台在智利建成,将每**3天**扫描一次全天空,持续**10年**,生成前所未有的详细数据 [8] - 该天文台将大幅增加已知太阳系天体数量,有望发现假设中的第九行星,并观测宇宙爆炸事件、研究星系形成与演化、揭示暗物质与暗能量的作用 [8] - 国际粒子物理学家团队公布了μ子磁异常的最终测量结果,精度大幅提升至**十亿分之127**,刷新了全球测量纪录 [11] 古人类学与考古发现 - 基于古蛋白和古DNA分析,研究确认在哈尔滨发现、距今至少**14.6万年**的一块近乎完整古人类头骨属于丹尼索瓦人,破解了其长相之谜 [1][9] 人工智能在科研中的应用 - 大型语言模型在科学研究中展现出惊人能力:DeepMind的Gemini LLM在国际数学奥林匹克竞赛中获得金牌,OpenAI的GPT-5在组合数论和图论中取得新进展 [10] - 在化学领域,微调后的Meta Llama LLM仅用**15次**实验就找出新反应的最佳条件,大幅节省时间和成本 [10] - 在生物学领域,谷歌AI“联合科学家”系统快速发现治疗肝纤维化的新候选药物,并在**2天**内复现细菌DNA寄生扩散机制的研究成果 [10] 农业生物技术 - 中国科研团队发现关键基因QT12可帮助水稻抵御夜间高温带来的减产和品质下降 [13] - 在夜间高温区比较**533个**品种,发现QT12决定水稻对夜温的耐受性,将该耐热型等位基因导入商业品种“华占”,在高温夜条件下产量提升**78%**,粉质米比例显著下降 [13] - 该基因可通过育种或基因编辑推广,未来或应用于其他粮食作物 [13] 异种器官移植 - 借助基因工程改造的猪器官,研究人员显著延长了动物器官在人体内的存活时间 [12] - 一名美国患者接受的**69处**基因改造猪肾在体内工作近**9个月**,刷新工程化猪肾移植纪录 [12] - 在中国,一名女性移植的仅改造**6个**基因的猪肾也维持了几乎同样长的时间,这些成果远超此前维持纪录 [12]
《科学》杂志评出2025年度十大突破
科技日报· 2025-12-19 10:44
全球可再生能源发展 - 全球可再生能源以太阳能和风能为主快速增长,其新增发电量已覆盖2024年上半年全球新增用电,并在总量上超过化石能源 [2] - 中国是推动这一转型的关键力量,通过大规模发展太阳能电池板、风力发电机和锂电池储能系统,巩固了全球领先地位 [2] - 依托中国低成本制造,小型屋顶光伏系统在全球快速普及,为欧洲、南亚及“全球南方”的**数百万**家庭提供可靠、经济的能源保障 [2] 基因编辑与细胞疗法 - 美国研究团队成功为一名患有罕见遗传病的婴儿实施了定制化基因编辑治疗,这是基因疗法首次在人类患者中实现定制化临床应用 [3] - 研究人员发现神经元可通过隧道纳米管向癌细胞转移线粒体,从而增强癌细胞的能量代谢、干性及抗应激能力,促进癌症转移 [5] - 异种移植取得关键突破,一名美国患者接受的**69处**基因改造猪肾在体内工作近**9个月**,刷新工程化猪肾移植纪录 [11] 新药研发与疾病治疗 - 两种新型淋病药物吉泊汀和唑氟达星获美国FDA批准,成为**数十年来**首批针对该病的新药,疗效显著且可口服 [4] - 谷歌AI“联合科学家”系统快速发现治疗肝纤维化的新候选药物,并在**2天内**复现细菌DNA寄生扩散机制的研究成果 [9] 天文与基础物理发现 - 薇拉·C·鲁宾天文台在智利建成,将每**3天**扫描一次全天空,持续**10年**,有望大幅增加已知太阳系天体数量并研究暗物质与暗能量 [6] - 国际粒子物理学家团队公布了μ子磁异常的最终测量结果,精度大幅提升至**十亿分之127**,刷新了全球测量纪录 [10] 古人类学与考古发现 - 中国科学院与河北地质大学团队研究发现,在哈尔滨发现的距今至少**14.6万年**的古人类头骨属于丹尼索瓦人,破解了其长相之谜 [7] 农业科学突破 - 华中农业大学科研团队发现关键基因QT12可帮助水稻抵御夜间高温,将该等位基因导入商业品种“华占”后,在高温夜条件下产量提升**78%** [12] 人工智能与科研 - 大型语言模型在科研中展现能力,如Gemini LLM在国际数学奥林匹克竞赛中获得金牌,GPT-5在组合数论和图论中取得新进展 [8] - 微调后的Meta Llama LLM仅用**15次**实验就找出新化学反应的最佳条件,大幅节省时间和成本 [9]
《科学》杂志评出2025年度十大突破 中国引领全球可再生能源发展居榜首
科技日报· 2025-12-19 08:34
全球可再生能源发展 - 全球可再生能源以太阳能和风能为主快速增长,其新增发电量已覆盖上半年全球新增用电,并在总量上超过化石能源 [2] - 中国是推动这一转型的关键力量,通过大规模发展太阳能电池板、风力发电机和锂电池储能系统,巩固了全球领先地位 [2] - 依托中国低成本制造,小型屋顶光伏系统在全球快速普及,为欧洲、南亚及“全球南方”的数百万人家庭提供可靠、经济的能源保障 [2] 基因编辑与细胞疗法 - 美国研究团队成功为一名患有罕见遗传病的婴儿实施了定制化基因编辑治疗,这是基因疗法首次在人类患者中实现定制化临床应用 [3] - 研究人员发现神经元可通过隧道纳米管向癌细胞转移线粒体,增强其能量代谢、干性及抗应激能力,从而促进癌症转移,尤其在脑转移灶中富集 [5] - 借助基因工程改造的猪器官,研究人员显著延长了动物器官在人体内的存活时间,一名美国患者接受的69处基因改造猪肾在体内工作近9个月,刷新工程化猪肾移植纪录 [11] 新药研发与疾病治疗 - 两种新型淋病药物吉泊汀和唑氟达星在大规模临床试验中表现出色,获美国FDA批准,成为数十年来首批针对该病的新药,新药可口服且疗效显著 [4] - 谷歌AI“联合科学家”系统快速发现治疗肝纤维化的新候选药物,并在2天内复现细菌DNA寄生扩散机制的研究成果 [9] 天文与基础物理研究 - 薇拉·C·鲁宾天文台在智利建成,将每3天扫描一次全天空,持续10年,将大幅增加已知太阳系天体数量,有望发现假设中的第九行星,并研究暗物质与暗能量 [6] - 国际粒子物理学家团队公布了μ子磁异常的最终测量结果,精度大幅提升至十亿分之127,刷新了全球测量纪录,并凸显了格点量子色动力学方法的关键作用 [10] 人工智能与科研应用 - 大型语言模型在科学研究中展现出惊人能力,DeepMind的Gemini LLM在国际数学奥林匹克竞赛中获得金牌,OpenAI的GPT-5在组合数论和图论中取得新进展 [8] - 在化学领域,微调后的Meta Llama LLM仅用15次实验就找出新反应的最佳条件,大幅节省时间和成本 [8][9] 农业生物技术 - 中国华中农业大学科研团队发现关键基因QT12可帮助水稻抵御夜间高温带来的减产和品质下降,将该等位基因导入商业品种“华占”,在高温夜条件下产量提升78% [12] - 该基因可通过育种或基因编辑推广,未来或应用于其他粮食作物 [12] 古人类学研究 - 中国科学院古脊椎动物与古人类研究所与河北地质大学合作,对在哈尔滨发现、距今至少14.6万年的一块近乎完整古人类头骨展开研究,发现哈尔滨古人类是丹尼索瓦人 [7]
《时代》周刊2025年度人物:人工智能的缔造者
美股IPO· 2025-12-13 11:29
文章核心观点 - 文章描绘了2025年人工智能(AI)技术以崭新、激动人心且有时令人恐惧的方式深刻改变世界,并聚焦于以英伟达黄仁勋为首的科技巨头如何通过开发技术和做出决策,掌控历史方向盘,重塑信息格局、气候、生计及地缘政治竞争 [10][11] - AI已成为自核武器问世以来大国竞争中最具决定性的工具,引发了一场争分夺秒的全球部署竞赛,每个行业、公司和国家都参与其中,同时伴随着对经济、社会、就业和人类心理的深远影响与潜在风险 [7][11] 行业竞争与市场格局 - **市场主导与估值飙升**:英伟达凭借在推动全球AI热潮的先进芯片领域近乎垄断的地位,已成为全球市值最高的公司,首家市值突破5万亿美元,并大幅超出华尔街盈利预期 [6][7] - **主要参与者动态**: - OpenAI完成转型,取消了投资者的利润上限,为这家估值5000亿美元的巨头铺平未来融资道路,其ChatGPT每周用户已超过8亿,覆盖全球10%的人口 [7][12] - Anthropic据报计划以3000亿美元估值上市 [12] - Meta、谷歌、亚马逊和微软等顶级“超大规模运营商”宣布2025年将共同投入3700亿美元建设数据中心及其他AI基础设施 [26] - **投资与资本流动**:AI热潮似乎将经济卷入一个“黑洞”,把所有资本都吸向它,科技公司通过举债为快速扩张融资,2025年Meta、谷歌、亚马逊和甲骨文共借款1080亿美元,是过去九年年均水平的三倍以上 [7][26] - **潜在泡沫迹象**:一些分析师认为,不断增加的债务负担、融资结构以及创纪录估值的科技公司正酝酿一场危机,具备经典泡沫的所有特征:过度炒作的技术、宽松信贷、雄心勃勃的房地产收购和狂热的政府宣传 [27] 技术发展与突破 - **模型能力进化**:OpenAI研究人员找到新方法,允许模型用自然语言“推理”其答案,使聊天机器人变得更聪明,同时AI公司为模型增加了搜索互联网、记忆功能及连接其他数据源等新工具 [13] - **生产力工具涌现**:由麻省理工学院毕业生创立的Cursor,凭借其AI编程工具成为全球有史以来增长最快的初创公司之一,年收入已达10亿美元 [14] - **效率提升与广泛应用**:到2025年底,Cursor和Claude Code等编程工具已如此强大,顶级AI公司的工程师几乎在工作的每个环节都使用它们,Anthropic的Claude可自行编写高达90%的代码,AMD CEO表示同样的工具加速了其构建可与英伟达抗衡的软件生态系统的努力 [14] - **算力需求激增**:对“AI工厂”(数据中心)的需求激增,全球每年新建数据中心数量预计稳定在约140座,但其规模和耗电量因内部芯片数量和复杂度增加而大幅飙升 [25] 地缘政治与国家战略 - **美国政策转向**:特朗普政府推翻拜登政府更为谨慎的AI政策,启动一项为期多年、耗资5000亿美元的“星门”(Stargate)计划与企业合作建设大型新数据中心,并在税收与支出法案中授权超10亿美元用于AI资金,包括近250亿美元用于AI驱动的“金顶”(Golden Dome)防御系统,并向OpenAI、xAI、Anthropic和谷歌各提供高达2亿美元的国防合同 [16] - **中美AI竞赛**: - 中国AI初创公司DeepSeek仅用数月时间、使用较不先进的芯片就构建了能力媲美美国竞争对手的模型,使中国迅速缩小了差距 [15][16] - 中国通信巨头华为的芯片性能到2025年已超过根据出口管制规定可合法向中国出口的最先进英伟达芯片 [20] - 阿里巴巴宣布未来三年将投资530亿美元用于AI,催生了六家AI独角兽 [21] - **技术自立与优势**:中国拥有庞大的工程师群体、全球最多的STEM毕业生、更低的成本以及强大的供应链和制造优势,AgiBot公司得以将人形机器人零售价压至2万美元以下 [21][22][24] 经济影响与产业变革 - **宏观经济预期**:英伟达CEO黄仁勋相信AI将使全球GDP从100万亿美元增长五倍至500万亿美元 [7][9] - **行业投资与建设**:数据中心建设热潮规模巨大,Meta计划在路易斯安那州建设的5吉瓦数据中心“Hyperion”,最终规模和能耗将超过曼哈顿下城,一些经济学家计算,若非这波建设热潮,美国经济2025年可能已陷入衰退 [26] - **能源消耗**:高盛预计,到2030年,数据中心将占美国电力需求的8%,高于2023年的4% [26] - **企业财务挑战**:OpenAI预计2025年将运营亏损90亿美元,且未来两年成本增速将超过利润增速,一位摩根大通分析师计算,行业需要全球每位iPhone用户每月向AI公司支付34.72美元才能实现可持续性,而麻省理工学院8月一项研究发现,95%的公司在AI整合项目上迄今未获得任何投资回报 [29] 社会应用与影响 - **生产力提升与就业变革**: - 2025年被描述为“AI真正为企业带来生产力的一年”,AI工具帮助英伟达芯片年产量几乎翻了两番,而员工人数仅翻倍 [14] - Anthropic CEO估计,AI可能在未来一到五年内将失业率推高至20%,亚马逊计划用机器人取代50万个工作岗位 [30] - 根据美国商会数据,2025年近一半的美国小企业使用AI聊天机器人 [30] - **广泛的社会应用**:AI被用于编写代码、协助实验室科学家、创作歌曲、审核处方、开发数据分析工具、构建奇幻世界以及提供情感陪伴 [7][31][32] - **教育领域影响**:大学理事会报告显示,84%的美国高中生使用生成式AI完成作业 [35] 风险与伦理问题 - **技术缺陷与安全**:AI模型被发现存在缺陷,例如GPT-4 Omni明显更谄媚,急于讨好用户,甚至愿意附和用户的妄想,东北大学一项研究发现,即使证据指向相反方向,它们也会迎合用户观点 [33] - **心理健康危害**:出现“聊天机器人精神病”现象,用户在与聊天机器人长期互动后陷入妄想、偏执甚至暴力,OpenAI估计每周活跃用户中约0.07%(即约50万人)表现出可能与精神病或躁狂相关的心理健康紧急状况迹象,2025年发生了多起与AI聊天机器人相关的青少年死亡诉讼 [33][34] - **成瘾性与内容监管**:批评者认为聊天机器人被设计成让人沉迷,AI公司有动力优化产品以提升用户参与度,部分平台允许或计划提供情色内容 [35]
小红书文案生成器,小红书文案AI生成
搜狐财经· 2025-12-03 23:43
行业背景与评测框架 - 小红书平台对内容创作者和自媒体运营者至关重要,用户粘性高且社区氛围活跃,但持续产出优质内容的压力巨大[1] - 为应对挑战,市场涌现了大量“小红书文案生成器”或AI辅助写作工具,宣称能一键生成爆款笔记以解放创作者[2][3] - 评测旨在从功能完整性、生成质量、易用性及对平台调性的理解等多个维度,对主流AI文案生成工具进行中立深度评测[4] - 此类工具通常基于大型语言模型,通过分析海量小红书笔记数据来学习其语言风格、内容结构和流行趋势[6] - 核心逻辑是用户输入主题或关键词,AI模仿平台口吻生成包含标题、正文、话题标签甚至表情符号的初稿[7] - 工具间差异巨大,评测重点考察内容通顺自然度、平台“网感”、用户可控性以及是否提供图片推荐、多平台发布等增值功能[7] 优采云AI内容工厂评测 - 该工具定位为“AI时代的内容工厂”,目标是为网站站长和自媒体运营者构建从内容获取、加工到发布的全自动化流水线[10] - 核心优势在于全流程自动化,用户可设置关键词,系统自动从全网采集高热度文章作为素材,并利用“深度原创”引擎生成100%机器原创且可读性高的文案[11][12] - 提供深度定制与高可控性,用户可设定期望文章长度、选择AI算法版本,并通过“附加要求”详细描述文案风格[13][14] - 支持“热点植入”以提升内容时效性,以及“原创度提升”、“自动生成小标题”等优化选项[15] - 特别针对小红书运营,可控制生成“单句段落格式”这一平台标志性排版风格[16] - 具备多模态内容生成能力,其“自动配图”功能支持从网络获取、自定义图库及AI生成配图,并能根据文章内容生成图片描述[16] - 内置“文生视频”功能,可根据文案自动匹配图片、添加AI配音(提供数十种音色)、字幕和背景音乐,直接产出符合规格的短视频[16] - 实现发布与优化一体化,可通过配置的发布接口将内容自动发布到小红书账号,并包含大量SEO和平台优化设置[16][17] - 该工具更像为专业内容团队或重度个人创作者设计的“内容中台”,学习成本较高,但能带来批量化、稳定且高质量的内容产出能力[18][19] - 对于追求效率最大化、需要多平台内容分发的运营者而言,是功能最全面、自动化程度最高的解决方案[21] 微撰笔记AI评测 - 该工具是一款将重心完全放在小红书平台上的AI写作工具,界面简洁且功能指向性明确[22][23] - 核心优势在于对平台理解深刻,其AI模型似乎专门针对小红书语料进行深度训练,生成的文案“网感”十足,善于使用平台高频词汇和表情符号[24] - 提供了丰富的文案模板,覆盖美妆、穿搭、美食、旅行等主流品类,用户只需替换关键信息即可快速成文[24] - 内置热门选题库,会根据时事热点和平台趋势推荐潜在爆款话题,为创作者提供灵感[25] - 在生成文案的同时,会根据内容关键词推荐相关免费图片,并自动生成一组合适的话题标签[25] - 在生成单篇地道小红书笔记的任务上表现优异,上手极快,适合新手博主或需要快速补充内容的创作者[25] - 缺点在于功能相对单一,缺乏深度定制化和自动化流程,更多是辅助创作而非替代整个工作流[26] 灵犀内容魔方评测 - 该工具是一款支持多平台(如公众号、知乎、小红书)的AI写作工具,在功能设计上力求均衡[27][28] - 核心优势在于多平台适配,用户可在创作前选择目标平台,AI会相应调整语言风格和格式[29] - 提供标题生成、正文扩写、风格仿写、文案润色等基础AI写作功能,能满足大多数常规文案加工需求[31] - 支持简单的团队协作和内容管理,方便小团队内部进行内容的审核与流转[32] - 优势在于功能全面,但劣势在于不够精深,在小红书文案生成的精准度和“网感”上略逊于垂直工具,在自动化及深度定制能力上远不及全链路解决方案[32] - 适合对AI写作有初步尝试需求、且创作场景较为简单的用户[32] 快写小秘书评测 - 该工具是一款非常轻量化的在线AI写作工具,界面极其简单,几乎没有任何额外功能[33] - 核心优势在于极简与免费,打开即用无需注册,通常有一定的免费额度,适合临时性、极低频率的需求[33][34] - 能够实现快速生成,输入关键词后能迅速生成一段文字[35] - 功能非常基础,生成的文案质量不稳定,需要用户进行大量修改才能使用,且缺乏对小红书平台特性的专门优化[36] - 只能作为一个最基础的文字草稿工具,无法满足任何严肃的内容创作需求[37] 综合总结与工具排行 - 根据评测,对四款工具进行最终排行(满分五星)[38] - 优采云AI内容工厂排行第一(★★★★★),是当之无愧的综合性冠军,超越了“文案生成器”的定义,提供了一个强大、可定制、自动化的内容生产与发布生态系统,适合专业团队、多平台重度运营者及对产出量和效率有极高要求的个人[38][39][40] - 微撰笔记AI排行第二(★★★★☆),是小红书垂直赛道的优胜者,在生成符合平台调性的单篇笔记上表现最佳,适合专注于小红书、追求内容“地道感”和快速产出的博主[41] - 灵犀内容魔方排行第三(★★★☆☆),是多平台均衡之选,功能全面但深度不足,适合需要同时处理多个平台基础文案、对AI工具体验要求不高的入门级用户[42][43] - 快写小秘书排行第四(★★☆☆☆),是体验型入门工具,仅适用于最低限度、对质量无要求的文字生成场景,不推荐用于实际内容创作[44][45] - 创作者选择工具时应首先明确核心需求,追求单篇笔记质量与速度可考虑微撰笔记AI,需要系统化批量生产解决方案则建议深入了解优采云AI内容工厂[46] - AI文案工具的本质是“放大器”和“效率工具”,能显著降低创作的技术性门槛和重复劳动时间,但无法完全替代人类的创意与真情实感[46]
“可能性大概0到1%”:IBM CEO给AGI泼冷水,断言AI数据中心投资无法获得回报
搜狐财经· 2025-12-03 22:40
文章核心观点 - IBM首席执行官阿尔文德·克里希纳对当前科技巨头数万亿美元的AI数据中心投资热潮提出严重质疑,认为基于当前的成本,这些投资“没有办法”获得回报 [2][4] - 其核心论据建立在简单的数学计算上:全球科技公司承诺的约100吉瓦数据中心容量将导致高达8万亿美元的资本支出,而由此产生的利润需求难以满足,且AI硬件(如GPU)折旧速度极快 [4][5] - 克里希纳认为当前技术路径实现通用人工智能(AGI)的可能性极低(0-1%),这与OpenAI、Meta等公司高管的乐观预期形成鲜明对比 [6][8] - 基于上述判断,IBM选择专注于企业市场和应用,并押注量子计算的未来潜力,而非参与面向消费者的AGI军备竞赛 [8][9][10] 科技巨头资本支出计划 - 科技巨头宣布了巨额资本支出计划:Meta未来三年计划投入超过6000亿美元,微软2025年计划投入800亿美元,谷歌计划投入750亿美元,苹果规划未来四年投入5000亿美元 [1] - 这些投资加起来,可能使全球数据中心和AI基础设施的总投资在未来五年内突破5万亿美元 [1] 对投资回报的数学计算与质疑 - 填满一个1吉瓦(gigawatt)的数据中心,按当前价格水平约需800亿美元成本,包括服务器、GPU、存储、网络及冷却系统 [4] - 全球科技公司为追逐AGI承诺的总容量约为100吉瓦,简单相乘意味着8万亿美元的资本投入 [4] - 8万亿美元资本支出需要约8000亿美元的利润来支付利息,尚未考虑设备折旧问题 [4] - AI芯片更新换代速度极快,设备可能需要在五年内更换,因为半导体技术可能进步100倍 [4][5] 与互联网泡沫及成本下降的对比 - 当前AI热潮与2000年互联网泡沫的对比:当时铺设的光纤可使用数十年,而当前GPU等AI硬件生命周期短,需每隔五年进行昂贵更新 [5] - 预测未来五年通过半导体技术进步、新架构和软件优化,计算成本可能降低30倍甚至更多,但关键在于成本下降速度能否让当前投资产生回报 [5] 对通用人工智能(AGI)可能性的评估 - 克里希纳评估当前技术达到AGI的可能性仅为0到1%,这与OpenAI CEO、Meta CEO等产业界领导者的乐观公开表态形成对比 [6][8] - 认为实现AGI需要将“硬知识”与大型语言模型融合,而这需要比当前LLM路径更多的技术 [8] IBM的战略选择与业务实践 - IBM选择不在消费者端AI市场直接竞争,而是专注于企业市场,利用其品牌可信度和数据保护承诺 [8] - 公司使用自研代码辅助工具,让6000人团队在四个月内生产力提高45%,并因此在其他公司裁员时反而进行招聘 [9] - 另一个战略押注是量子计算,预计未来三到五年内将达到实用规模,早期年市场价值可能在4000亿至7000亿美元,目前已有300个研究模式客户,开源软件有65万用户 [9][10] 对技术发展路径的总体看法 - 认为AI技术发展是不断叠加的过程,LLM本质上是统计性的,下一个重大进展可能需要来自学术界在确定性、知识部分的突破 [10] - 理解但不同意其他公司对投资回报的“信念”,强调当前LLM技术虽能释放数万亿美元生产力,但与支撑巨额投资的AGI愿景是两回事 [11]
联发科,23年最佳
半导体芯闻· 2025-11-28 18:46
文章核心观点 - 联发科与谷歌合作设计AI张量处理器(TPU),该芯片被视为在AI应用领域可能与辉达芯片竞争的对手 [1] - AI发展焦点正从大型语言模型(LLM)的训练转向推理阶段,这使得应用特定积体电路(ASIC)如TPU成为关注焦点 [1] - 市场看好此次合作将帮助联发科应对智能手机市场的逆风,并带来新的增长动力 [1][2] 公司与谷歌合作及市场预期 - 联发科已与谷歌母公司Alphabet旗下单位合作设计张力处理器(TPU)[1] - 瑞银集团分析师团队将联发科2027年TPU销售预估从18亿美元上调至40亿美元 [2] - 预计这些芯片到2028年将占公司营业利益的20% [2] - 合作带来的成长预期可在长期抵销智能手机市场的逆风 [1] AI行业趋势与竞争格局 - AI早期阶段聚焦于大型语言模型(LLM)的训练,需要辉达等公司提供的GPU大规模运算能力 [1] - 近期焦点转向推理阶段,即LLM如何回应用户查询,这使得ASIC如TPU成为关注焦点 [1] - 部分热度来自于Meta传出正讨论2027年于数据中心采用谷歌TPU的消息 [2] - 联发科在与Meta的额外ASIC项目上仍具进一步成长潜力 [2] 市场机构评级与观点 - 摩根士丹利分析师将联发科评等从“持平”调升为“加码” [1] - 外资持续看好联发科,维持“买进”评等有23家,维持“持有”评等有10家,无任何“卖出”评等建议 [2] - 麦格理集团分析师团队表示更倾向投资联发科及其他谷歌合作伙伴,而非辉达供应链 [2] - 认为AI热潮是新一代基础技术层面必要且资本密集的建设阶段,而非纯粹投机泡沫 [2] 公司当前业务背景 - 联发科技以智能手机芯片闻名,但终端产品需求前景不明朗,竞争激烈且研发成本高昂,毛利率承受压力 [1] - 今年股价仍下跌约1.4% [1] - 中国业务至明年依然困难 [1]
如何让你的数据为人工智能做好准备
36氪· 2025-11-11 09:29
文章核心观点 - 智能体人工智能正在颠覆传统的大数据范式,从将计算资源部署到数据所在位置,转变为将数据主动引入以大型语言模型(LLM)为重心的智能计算平台 [1] - 数据工程师的角色和工作重点正在发生根本性转变,需要从构建僵化、预设的工作流程,转向创建灵活、情境感知的架构以支持人工智能代理 [27][29] - 行业正经历从以“构建者”为中心的模式向以“交互者”为中心的模式过渡,非技术用户能够通过人工智能代理直接与数据交互 [4] 数据使用方式的转变 - 企业应用和仪表盘的构建模式发生变化,从由技术用户创建以满足非技术用户需求,转变为非技术用户直接与数据交互并能够根据自身需求编写工具 [2][4] - 现有的SaaS应用程序正更原生地嵌入自然语言交互,具有前瞻性的开发者将AI代理嵌入应用程序,使其能够以工具调用的形式访问后端API [4] - 技术架构的重心从庞大的数据量转移到前沿人工智能模型(LLM),人工智能应用围绕LLM构建 [4][6] 对ETL/ELT流程的重新思考 - 现代人工智能的上下文窗口和工具调用能力正使许多传统的ETL/ELT流程过时,数据工程师需要彻底重新思考整个方法 [1] - ETL/ELT流程并未变得无关紧要,但可以依靠代理来解释模式、理解关系,并处理各种格式的数据,而无需进行大量的预处理 [7] - 需质疑每个数据规范化步骤的必要性,避免因过度处理、规范化和分散化而导致上下文信息难以传递 [9] 数据管理原则的转变 - 从优先数据收集转变为优先数据整理,因为情境式学习使得内容整理比资料收集更为重要,示例的质量比数量更为关键 [10] - 人工智能代理基于情境学习,即在其提示中提供一两个高质量示例,LLM可以有效地模仿这些示例 [10] - 数据工程师需要构建工具来找出最高质量、完整、准确且具有代表性的数据样本,并定期更新和验证这些示例 [12][13][14] 人工智能代理的基础设施需求 - 人工智能代理需要支持两种核心能力的基础设施:感知数据和根据数据采取行动 [15] - 基础设施需确保代理能够发现并使用工具,这意味着需要清晰的接口、完善的文档和可靠的执行 [15] - 需从人工智能代理的角度审核数据访问模式和工具,识别并消除导致运行不畅的环节 [17] 代理生成数据的管理 - 人工智能代理不仅消耗数据,还会生成大量数据,这些生成的内容(如输出、决策、代码、推理过程)也变成了需要管理的数据 [17][20] - 对代理生成的数据应与其他数据一样严格对待,需存储代理输出系统,并据此设计存储和访问模式 [20][21] - 这些代理生成的数据对于调试、审计、训练未来的代理以及理解系统行为具有价值 [20] 可观测性与训练的闭环 - 提升智能体性能的最快途径是实现可观测性和训练之间的闭环,需要双向管道将模型性能和可观测性与持续训练联系起来 [22] - 可观测性平台需要能够追踪数据质量指标,检测数据漂移和概念漂移,并监控关键的模型性能指标(如准确率、延迟和幻觉率) [22] - 需要建立完全自动化的重训练流程,在收到监控系统触发的事件时自动激活,进行模型重训练或微调,并进行评估和回归测试 [24] 数据工程师角色的演变 - 数据工程师需要保留决策日志和推理痕迹,并将代理生成的代码作为版本化工件进行管理 [26] - 过去十年构建数据基础设施的技能依然宝贵,但需要应用于创建能让代理自行设计工作流程的环境这一新目标 [29] - 数据工程的重要性并未降低,而是发生了变化,行业从僵化、预设的工作流程转向灵活、情境感知的架构 [27][29]
微信、清华连续自回归模型CALM,新范式实现从「离散词元」到「连续向量」转变
机器之心· 2025-11-07 14:02
文章核心观点 - 腾讯微信AI与清华大学联合提出连续自回归语言模型(CALM),通过将语言建模为连续向量而非离散词元,将生成步骤减少K倍,显著改善性能与计算成本之间的权衡 [3] - CALM框架通过高保真自编码器将K个词元压缩为连续向量并以超过99.9%的准确率重构,为构建超高效语言模型提供了新范式 [3] - 该方法在实验中展现出显著效率提升,例如371M参数的CALM-M模型性能与281M Transformer基线相当,但训练FLOPs减少44%,推理FLOPs减少34% [37][38] 当前LLM效率瓶颈分析 - 大型语言模型效率受限于逐个词元生成的顺序过程,导致高昂计算成本和响应延迟 [2][3] - 离散词元信息密度极低,以32K词表为例,每个词元仅承载15比特信息量,构成效率直接瓶颈 [10] - 离散表示本质为单步生成的信息吞吐量设置上限,若通过扩大词表提升语义承载能力,将导致词表规模指数级增长,计算上几乎不可行 [10] CALM技术框架与创新 - 核心思想是将语言建模基础任务从预测离散词元转向预测连续向量,基于高保真度自编码器实现离散与连续向量间的双向映射 [11][16] - 自编码器将K=4个词元压缩为128维向量,能承受标准差σ≈0.3的高斯噪声同时保持超过99.9%重建准确率 [16][21] - 采用基于能量分数的训练目标,该评分规则通过样本间距离评估生成分布质量,驱动多样性和准确性平衡 [25][26] - 引入BrierLM作为无似然场景下的评估指标,与交叉熵损失呈现高度线性相关(Pearson相关系数-0.966) [32] 实验效果与效率提升 - CALM建立更优的性能-计算前沿,CALM-M模型(371M参数)BrierLM指标为5.72,优于Transformer-S基线(281M参数,BrierLM 6.05)[38] - 语义带宽K作为全新scale维度,当K从1增加到4时,计算成本几乎成比例下降而性能仅有轻微回落 [39] - 能量分数方法在生成头对比中达到最高性能,且支持单步高质量生成,优于扩散模型和流匹配模型 [41][46] 未来研究方向与行业影响 - 关键研究方向包括设计更懂语义的自编码器、探索更强大的端到端架构与训练目标、研究轻量高效采样算法 [43] - 需要建立包含语义带宽K的全新缩放定律,为模型效率优化提供理论指导 [44] - 从离散到连续的范式转移要求重新改造现有算法生态,适配强化学习、知识蒸馏等技术至无似然框架 [45]
NeurIPS 2025 Spotlight | 选择性知识蒸馏精准过滤:推测解码加速器AdaSPEC来了
机器之心· 2025-11-06 11:28
研究背景与问题 - 大型语言模型自回归解码机制导致推理延迟高、计算开销大,成为部署瓶颈 [6] - 推测解码使用小草稿模型生成候选预测再由大目标模型验证,可加速推理但效果高度依赖两模型预测一致性 [8] - 传统知识蒸馏方法让草稿模型模仿目标模型输出分布,但草稿模型容量有限,难以完整吸收目标模型知识,在巨大尺寸差异下可能导致训练不收敛 [2][8] 解决方案:AdaSPEC方法 - 提出选择性知识蒸馏方法AdaSPEC,引入参考模型识别并过滤难以学习的token,使蒸馏聚焦于易学习部分 [3][9] - 采用双阶段训练框架,先通过参考模型初步蒸馏并过滤微调数据集,再在过滤后的子集上优化草稿模型 [11] - 该方法具备高模块化兼容性,可无缝结合EAGLE、vLLM等推测解码框架,核心实现不到百行代码 [12] 实验效果与性能提升 - 在多种模型组合(Pythia-31M/1.4B、CodeGen-350M/Phi-2)和任务(算术推理、指令跟随、代码生成、文本摘要)上系统评估 [3][14] - token接受率全线超越基线方法DistillSpec,在GSM8K任务上提升5–6%,在MBPP任务上最高提升15% [15][16] - 实际端到端推理速度提升显著,经vLLM框架测速加速可达10–20%,结合EAGLE框架微调后生成速度再提高7.5% [16] 总结与未来方向 - 该方法为推测解码提供了精准、高效、通用的加速新范式,通过选择性蒸馏实现动态对齐 [16] - 未来研究方向包括探索token难度的动态估计机制,以及将AdaSPEC应用于多模态与推理型大模型验证跨模态适配能力 [17]