Gemma
搜索文档
8点1氪:上海民政局回应夜店登记结婚争议;用学生跳楼出题,作业帮回应;江西通报“多地办电话卡需无犯罪证明”
36氪· 2025-11-05 08:10
同时,该工作人员表示,现场绝对没有登记领证环节。 整理 |晨曦 点击上方【36氪随声听】,一键收听大公司热门新闻。听完音频记得添加进入 【我的小程序】 中哟! 上海民政局回应夜店登记结婚争议:现场绝对没有登记领证环节 据报道,黄浦区民政局与INS新乐园联手,于11月14日至11月22日每周五周六,推出夜间结婚颁证体验项目,颁证服务在INS新 乐园举行,引发舆论关注。就此事联系上海市黄浦区民政局婚姻登记处,一位工作人员介绍,新人必须在黄浦区民政局领证, 不是在INS新乐园领的,先领证然后自愿选择是否去INS新乐园。同时,该工作人员表示,现场绝对没有登记领证环节。(大象 新闻) 2026年放假安排公布:春节连放9天,为史上最长 诺基亚计划申请从巴黎证券交易所退市 韩国高校招生新政,拒收"校园霸凌生" 影石刘靖康回应"大疆价格战" "民营船王"重整杉杉集团计划草案,最后关头被否 苹果中国区严禁线下经销商线上销售产品 用学生跳楼出题,作业帮回应 近日,有网友反映,作业帮APP上出现调侃学生跳楼自杀的题目。截图题目显示,"生命可以轮回,高考只有一次。在内卷的大 背景下,有不少学生受地球引力影响而不慎做自由落体运动。现有 ...
垂直领域小型语言模型的优势
36氪· 2025-11-04 19:13
"您是否知道,许多'小型'人工智能模型在性能上优于较老、较大的模型——而且仅使用了一小部分资源?" 想象一下,直接在你的智能手机上运行强大的AI助手,无需访问云端,即可在几毫秒内处理你的请求。这并非科幻小说——小语言模型正在 将这一切变为现实,触手可及。 连续三年,人工智能界一直痴迷于一个简单的等式:越大越好。 科技巨头们投入数十亿美元构建庞大的语言模型,每一个模型都比上一个更大: • 据传拥有万亿个参数的 GPT-4 • 克劳德拥有数千亿 • Meta 的 LLaMA 突破极限,达到 700 亿 每一次突破似乎都遵循同样的模式——更多的参数、更大的功率、更多的可能性。 但2025年发生了一件意想不到的事情。 一 改变一切的剧情转折 随着企业人工智能部署从概念验证阶段过渡到生产阶段,一个令人惊讶的事实浮出水面: 越大并不总是越好。 英伟达一项突破性研究表明,40%至70%的企业级人工智能任务可以通过小型语言模型(SLM ) 更高效地处理——这些紧凑而强大的模型参 数少于100亿,具有以下特点: ✓ 速度比同类巨型设备快 10 倍 ✓ 部署和维护成本降低 5-20 倍 ✓ 更可靠,适用于特定业务任务 ✓ 设备端 ...
英伟达发射了首个太空AI服务器,H100已上天
36氪· 2025-11-04 11:39
太空数据中心的能源成本将只有地面上的十分之一。 11 月 2 日,英伟达首次把 H100 GPU 送入了太空。 作为目前 AI 领域的主力训练芯片,H100 配备 80GB 内存,其性能是此前任何一台进入太空的计算机的上百倍。在轨道上,它将测试一系列人工智能处理 应用,包括分析地球观测图像和运行谷歌的大语言模型(LLM)。 此次测试飞行搭载于位于弗吉尼亚州雷德蒙德的初创公司 Starcloud 的 Starcloud-1 卫星上,是该公司雄心勃勃的计划的第一步,该计划旨在将全球耗能巨 大的数据处理基础设施迁移到太空。Starcloud 是 NVIDIA Inception 创业公司计划的成员。 支持者认为这个想法很有前景:在遥远的太空深处,数据中心不会占用宝贵的土地,也不需要那么多能源和水来冷却,它们也不会向大气中排放温室气 体。 在算力逐渐紧张的 AI 时代,把芯片发射到太空已成为一个新的发展方向。此前,英伟达的 Jetson 机器学习计算板卡曾搭载于多颗实验型和地球观测小型 卫星上。不过相比之下,本次 Starcloud 的行动可谓是建设太空数据中心的重要一步,这将是人类首次把地面数据中心的 GPU 送入 ...
证券公司利用大模型技术构建财富业务创新应用体系研究
中国证券报· 2025-11-03 20:12
证券行业正迈向数智化转型的深水区,大模型技术作为新质生产力的代表,为券商财富管理业务提供了 革命性的创新机遇。 在客户需求日益个性化、市场竞争加剧、监管要求趋严的背景下,券商通过构建基于大模型的财富业务 创新应用体系,能够有效整合数据资源、提升服务效率、优化用户体验并提升风控合规水平。本文旨在 系统探讨券商如何利用大模型技术构建财富业务创新应用体系,为证券行业财富业务数智化转型提供参 考。 大模型在证券行业的 应用进入商业化落地阶段 近年来,随着居民财富稳步累积,我国财富管理需求显著增长,为证券行业提供了新的利润增长点。与 此同时,证券行业面临多重转型压力,如国际竞争压力加剧、客户需求升级以及业务效率瓶颈等。 大模型技术经历了从通用模型到金融垂类模型的演进。国内券商应用大模型主要有三种模式:通过SaaS 模式直接应用大模型技术;和科技公司建立联合实验室本地化建立大模型训练和应用系统;将互联网大 模型技术通过API对接到金融业务流程中改造金融业务流程。 相比其他行业,金融机构对于数据管理更严格,一般不允许客户数据流出到金融机构外部,因此本地化 部署成为券商大模型应用的主要模式。金融机构通过本地的大模型系统本地处 ...
乌镇峰会AI“四连击”:千款产品将亮相,首设开发者开源赛
21世纪经济报道· 2025-10-28 17:02
大会核心信息 - 2025年世界互联网大会乌镇峰会将于11月6日至9日在乌镇举行 [1] 大会主题与活动 - 大会四大活动板块“一展一会一赛一论坛”均聚焦人工智能主题 [2] - “互联网之光”博览会将展示600余家中外企业的千余项人工智能技术产品及典型应用场景 [2] - 博览会将在B馆重点打造1个“超级体验馆” [2] - 浙江分论坛将引入重磅成果发布环节,由西湖大学发布具身智能领域重大研究成果 [2] 全球互联网大赛 - “直通乌镇”全球互联网大赛今年为第7年举办,首次面向开发者办赛 [2] - 大赛新设置开源项目赛道,分为开源模型应用赛和开源竞技挑战赛两个子项 [2] - 开源模型应用赛针对基于DeepSeek、Qwen、Hunyuan、Llama、Gemma等开源模型的二次开发项目在多个行业领域的应用 [3] - 开源竞技挑战赛联合7家企业(社区),选择8个开源项目纳入赛道项目池,吸引600余名开发者参赛 [3] 产业合作与成果 - 数字经济产业合作大会已征集筛选签约项目50余项,签约金额超1000亿元 [3] - 签约项目中10亿元以上项目有33个 [3] - “直通乌镇”全球互联网大赛成果转化机制累计推动32个参赛项目签约或落地浙江 [3]
1.58bit不输FP16!微软推出全新模型蒸馏框架,作者全是华人
量子位· 2025-10-20 11:46
核心技术框架 - 微软推出名为BitNet Distillation(BitDistill)的蒸馏框架,实现几乎无性能损失的模型量化,将模型量化至1.58-bit [1] - 该框架包含三个依次衔接的阶段:模型结构优化、继续预训练和蒸馏式微调 [8] - 在模型结构优化阶段,引入SubLN归一化模块,将其插入多头自注意力模块和前馈网络的输出投影之前,以稳定量化训练过程并提升收敛性,而不改变主干计算路径 [10][11][12] 性能与效率表现 - 量化后的模型在同等硬件下,推理速度提升2.65倍,内存消耗仅为全精度FP16模型的1/10 [6] - 在文本分类任务(如MNLI、QNLI、SST-2)中,1.58-bit模型的准确率与全精度微调模型(FP16-SFT)几乎一致,显著优于直接微调的量化模型(BitNet-SFT)[23][24] - 在文本摘要任务(CNN/DailyMail数据集)上,量化模型的BLEU指标为14.41,ROUGE-L为27.49,与FP16模型的13.98和27.72几乎等同,甚至在BLEU上略有超出 [25][27] 技术通用性与兼容性 - 该框架在4B及以下的Qwen、Gemma模型上证实有效,理论上可应用于其他Transformer架构 [2] - 框架展现出良好的通用性,在Gemma和Qwen2.5等其他预训练模型上也能高度还原全精度性能 [28] - 该方法与Block-Quant、GPTQ、AWQ等常见量化策略兼容,可作为独立的上层蒸馏方案,适用于多种后量化优化场景 [28] 行业影响与团队背景 - 技术突破可能降低对昂贵GPU硬件的依赖,因为量化后模型内存需求大幅减少且推理速度提升 [7] - 该研究的作者团队全部来自微软研究院,且均为华人,通讯作者为微软亚洲研究院副总裁韦福如博士 [29][30]
南洋理工揭露AI「运行安全」的全线崩溃,简单伪装即可骗过所有模型
36氪· 2025-10-17 15:16
运行安全概念提出 - 论文提出开创性概念“运行安全”,旨在重塑对AI在特定场景下安全边界的认知[1] - 核心观点为当AI超出其预设职责边界时,其行为本身就是一种不安全,将AI安全讨论从传统“内容过滤”提升到“职责忠诚度”的新维度[3] - 对于将AI投入实际业务的企业而言,AI无法严守岗位职责是一个巨大且不可控的风险,运行安全应作为通用安全的必要不充分条件而存在[3] OffTopicEval评测基准 - 团队开发了首个针对运行安全的评测基准OffTopicEval,用于量化模型在恰当时候说“不”的能力[5] - 基准构建了21个不同场景的聊天机器人,包含超过21万条领域外问题数据和3000多条领域内数据,涵盖英语、中文、印地语三种语系[5] - 测试设计了直接领域外问题、自适应领域外问题以及领域内问题,以全面评估模型的拒绝能力[5] 主流模型评测结果 - 评测结果显示,在运行安全方面,几乎所有主流模型家族均表现不佳[7] - 例如,Llama-3.1 (8B)模型在英语、中文和印地语上的运行安全评分分别为23.84、26.59和19.67,Gemma-3 (12B)模型分别为39.53、13.90和18.88[8] - 当模型经历一次欺骗后,其防御能力会显著下降,例如Llama-3.3 (70B)对简单领域外问题的拒绝率下降超过49个百分点[9] 模型防御脆弱性 - 面对经过简单伪装的越界问题,模型的防御能力几乎崩溃,所有模型对领域外问题的平均拒绝率因此暴跌近44%[10] - 部分模型如Gemma-3 (27B)和Qwen-3 (235B)的拒绝率降幅甚至超过了70%[10] - 跨语言测试表明该问题是当前大模型的一个根本缺陷,在不同语言环境中均存在[10] 解决方案与效果 - 研究提出了无需重新训练的轻量级提示方法,包括P-ground和O-ground[12] - P-ground方法让Llama-3.3 (70B)的操作安全评分从53.92提升至94.99,飙升41.07个百分点,Qwen-3 (30B)也从65.10提升至91.86,提升26.76个百分点[13] - O-ground方法也使Phi-4 (15B)和Llama-3.3 (70B)的操作安全评分分别提升了16.65和23.33个百分点[13] 行业影响与启示 - 论文将AI跑题问题从功能缺陷提升到安全战略高度,呼吁行业重新审视面向实际应用的AI安全[14] - 对于希望将AI代理用于严肃场景的开发者而言,运行安全将成为部署前必须通过的上岗测试[16] - 行业必须建立新的评测和对齐范式,奖励那些懂得自身局限性、敢于拒绝越界请求的模型[16]
谷歌×耶鲁联手发布抗癌神器,AI推理精准狙击「隐身」癌细胞
36氪· 2025-10-17 08:41
模型概述与核心突破 - 谷歌与耶鲁大学科学家联合发布270亿参数大模型Cell2Sentence-Scale 27B (C2S-Scale),该模型旨在理解单个细胞“语言”[1][3] - 模型核心突破在于其能够生成关于癌细胞行为的全新、可验证的科学假设,展示了AI模型生成原创科学发现的潜力,而非简单重复已知事实[1][2] - 模型基于Google的开源Gemma模型家族构建,训练语料涵盖超过10亿个Token的转录组数据、生物学文献与元数据[1][4] 技术原理与实验设计 - 研究验证了生物学模型遵循明确的模型扩展规律,即模型越大,在生物学任务上表现越优,并可能催生新的推理能力[4] - 模型被赋予寻找“条件性放大剂”的任务,该任务需要复杂的条件推理能力,是随模型规模扩大而涌现的特性[4] - 研究人员设计了“双环境虚拟筛选”流程,在免疫环境阳性和免疫环境中性两种条件下,对超过4000种药物进行模拟预测[4][5] 关键发现与实验验证 - 模型成功识别出激酶CK2抑制剂silmitasertib (CX-4945) 具有显著的“环境分化效应”,仅在免疫信号活跃环境中增强抗原呈递[7] - 后续体外实验验证了该预测:联合使用silmitasertib和低剂量干扰素可显著增强抗原呈递约50%,而单独使用效果不显著[7][9] - 模拟预测结果显示,约有10%–30%的药物在文献中已有报道,验证了模型可信度,其余候选则为从未被报道过的新发现[5][6] 行业影响与未来展望 - 该发现揭示了让“冷肿瘤”变“热”的潜在新途径,即通过增强抗原呈递使肿瘤更易被免疫系统识别,为癌症免疫治疗带来新希望[8][10] - 此项研究开启了大模型驱动的生物学发现新范式,预示着科学假设的生成、筛选与验证将日益智能化、系统化[10] - C2S-Scale 27B模型及其相关资源已在Hugging Face和GitHub上全面开放,旨在与更广泛的研究社区共同探索工具,拓展研究成果[10][12][13][14]
Meta(META.US)自研AI落后信号?据传拟采用竞争对手谷歌(GOOGL.US)Gemini模型优化广告业务
智通财经网· 2025-09-26 08:17
智通财经APP获悉,据《The Information》报道,Meta(META.US)已与谷歌(GOOGL.US)展开磋商,计 划采用谷歌的Gemini人工智能模型,以增强自身的广告定向精准度。 消息公布后,Meta股价在盘后交易中下跌,截至发稿,Meta夜盘下跌0.3%,而谷歌股价则上涨近1%。 该媒体援引知情人士补充称,这场磋商发生在Meta部分员工与谷歌云(Google Cloud)团队之间——值得 注意的是,Meta与谷歌在数字广告领域本是直接竞争对手。目前磋商已取得进展,这一动态也成为 Meta自研AI模型落后于竞品的最新信号:在自身技术追赶不及的情况下,这家由马克·扎克伯格领导的 公司至少已开始探讨"采用竞争对手技术"的可能性。 一名知情人士透露,Meta部分员工提议,利用Meta的广告数据对谷歌的Gemini及Gemma模型进行优化 调整;另有消息人士表示,Meta正评估是否通过Gemini模型提升内容理解能力。 值得关注的是,上月已有报道称,Meta与谷歌云签署了一项为期六年的重大云计算合作协议,价值超 100亿美元。 ...
GoogleI/OConnectChina2025:智能体加持,开发效率与全球化双提升
海通国际证券· 2025-08-22 14:30
行业投资评级 - 报告未明确给出具体的行业投资评级 [1] 核心观点 - Google I/O Connect China 2025大会展示了AI模型创新、开发工具升级与全球化平台生态的重要进展 重点包括Gemini 2 5系列在多模态处理与响应速度上的提升 Gemma开放模型系列的多场景应用以及AI开发工具链的全面智能化升级 [1] - Gemini 2 5架构通过统一嵌入表示与跨模态注意力机制显著提升多模态理解与生成的准确性 并集成链式推理与结构化推理模块增强复杂任务的逻辑一致性和多步推理能力 [2] - Gemma系列模型基于Transformer架构 在参数规模、推理优化与许可协议上更具开放性 支持开发者在医疗、教育、语音交互等特定领域进行二次训练 其衍生模型如MedGemma、DolphinGemma和Gemma 3n分别聚焦医学语料、动物声学研究和轻量化端侧部署 [3] - Google将AI智能体功能深度集成到Firebase Studio、Android Studio和Chrome DevTools等核心开发工具中 形成全新工作流 显著提升开发效率与调试能力 [4][7] - 海外生成式模型如Lyria、Veo3、Imagen 4在音乐、视频、图像生成方面的一致性及多模态交互能力较国内模型更成熟 为内容出海团队提供强大生产力工具 [4] 技术架构创新 - Gemini 2 5实现文本、图像、音频和视频的统一嵌入表示与跨模态注意力机制 使开发者能够直接输入多模态提示并在同一向量空间进行联合推理 避免信息割裂 [2] - Gemini 2 5集成链式推理与结构化推理模块 通过中间表征增强逻辑一致性 在复杂任务的多步推理中表现突出 [2] - Gemma 3n通过剪枝、量化和蒸馏技术实现轻量化 仅需2GB内存即可在端侧设备流畅运行 [3] 开发工具升级 - Firebase Studio智能体模式利用任务分解与代码生成技术 可根据自然语言需求自动生成应用原型并递进式完成功能扩展与bug修复 [4][7] - Android Studio引入BYOM功能 允许开发者自由选择Gemini Nano、Gemma或第三方模型在统一IDE环境中进行训练与调试 [4][7] - Chrome DevTools内置Gemini助理 可直接在浏览器环境中进行语义分析与代码修正 快速解决CSS布局或跨浏览器兼容性问题 [4][7] 多场景应用拓展 - MedGemma聚焦医学语料与临床对话 在问答和影像理解任务上表现优异 [3] - DolphinGemma探索动物声学 首度建立海豚语大模型 [3] - Imagen 4在图像生成方面展示出强大能力 为电商营销和游戏出海企业提供高效内容生产工具 [4][8] 全球化生态建设 - Google通过开放海外生成式模型能力 强化内容创作生态 吸引内容出海团队使用其工具提升短视频、电商营销和游戏出海的效率 [4] - 与Trip com合作开发AI旅行助手 展示AI智能体在垂直领域的应用潜力 [13]