Workflow
AI前线
icon
搜索文档
浙江大学联合华为发布国内首个基于昇腾千卡算力平台的 DeepSeek-R1-Safe 基础大模型
AI前线· 2025-09-21 13:32
全球主流大模型频现包括虚假 / 有害内容生成、数据偏见、信息泄露等安全问题。例如,谷歌公司发布报告揭示,伊朗支持的攻击 者利用 Gemini 大模型发动网络攻击,开展钓鱼攻击活动,对防务专家及机构的网络与云环境进行渗透,监视与窃取机密信息,严 重威胁了国家信息安全;三星公司在引入 ChatGPT 后,短时间内便曝出多起机密资料外泄事件,导致三星公司半导体设备测量资 料、源代码、产品良率等机密内容瞬间外泄,且无法收回,严重影响了企业运营。我国同类人工智能模型的安全问题同样不容忽 视。当前,政府部门、华为等科技企业正积极推动国产大模型生态建设,并取得了显著成效。 然而,国产平台在框架健全性、开发者社区成熟度以及开源生态发展等方面仍然面临诸多挑战,整体尚处于起步阶段。据研究显 示,部分国产大模型早期版本在面对越狱攻击时的失守率高达 100%。这不仅暴露了当前大模型在安全技术层面的普遍脆弱性,也 对产业发展乃至国家安全构成潜在威胁。 针对这一全球性挑战,浙江大学联合华为计算产品线 重磅推出 DeepSeek-R1-Safe 基础大模型 。模型基于昇腾千卡集群,依托全 流程自主可控后训练框架完成训练,整体安全防御能力提 ...
字节跳动深夜回应TikTok进展;清华学霸小红书晒1.67亿元年薪引调查;特朗普对H-1B签证加征10万美元引恐慌 | AI周报
AI前线· 2025-09-21 13:32
清华学霸薪资欺诈事件 - 吴舰被美国司法部指控电汇欺诈、证券欺诈和洗钱罪,目前处于在逃状态 [2][3] - 吴舰2022年薪资达2350万美元(约合人民币1.67亿元),曾在Two Sigma任高级副总裁 [2][3] - 其LinkedIn显示为清华工学学士及康奈尔哲学博士,曾就职于Citadel和Two Sigma量化研究部 [3] 特朗普签证政策调整 - 新设H-1B签证申请费10万美元,仅适用于新申请签证,不涉及续签或现有持有者 [5][6] - 企业需为员工支付费用,引发亚马逊、谷歌等公司恐慌,要求员工避免离境 [5] - 印度裔占H-1B签证获批者71%,中国占比11.7%,政策可能冲击美国创新生态系统 [5][6] - 个人可通过支付100万美元获得"特朗普金卡"居留权,企业支付200万美元可为员工办理 [8] 科技公司动态与合作 - 甲骨文与Meta磋商价值200亿美元云计算合作,涉及AI模型训练计算能力 [21] - 甲骨文MySQL数据库团队裁员约70人,引发行业对软件未来的担忧 [21] - 英伟达投资英特尔50亿美元,以每股23.28美元收购普通股,可能持有4%以上股份 [22] - 英伟达与CoreWeave签署63亿美元新订单,承诺购买其算力容量至2032年 [22] 人工智能与产品发布 - OpenAI周活跃用户超7亿,相当于全球成年人口10%,女性用户占比过半 [24] - 73%的ChatGPT对话与工作无关,较一年前53%大幅增长,写作占工作相关用途40% [25] - 马斯克发布xAI新模型Grok 4 Fast,推理tokens减少40%,否认2000亿美元估值融资传闻 [7] - 小米宣布跳过16直接发布17系列,全面对标iPhone,产品力跨代升级 [27][28] 企业战略与市场变动 - 字节跳动按中国法律推进TikTok美国业务,特朗普政府第四次延长剥离截止日期 [9][11] - 马云现身阿里园区,传闻其深度参与AI战略及500亿元补贴决策,为5年来最直接参与阶段 [13][14] - TP-Link芯片事业部全员解散,自研芯片项目终止,赔偿方案为N+3 [19][20] - 脉脉报告显示AI岗位同比增长10倍,字节、小红书、阿里为热招企业TOP3,微软平均月薪90345元 [29] AI应用与技术创新 - 豆包月活1.57亿超越DeepSeek,环比增6.6%,腾讯元宝环比增22.4% [26] - 快手可灵AI数字人支持1080p视频生成,成本最低0.12元/秒,公测中 [32][33] - Meta发布首款带显示AI眼镜,支持实时翻译和3K视频录制 [34] - 全球首款AI Database Agent由Teable开发,获真格基金等投资 [36]
“别再碰我代码!”明星AI工具成瘟神,用户怒斥:一周七千块,修不好bug还删我关键文件!
AI前线· 2025-09-20 13:33
今年 7 月,Replit 就曾因 误删用户生产数据库 并伪造数据的操作失误,陷入舆论漩涡。当时公司公开道歉,并承诺将采 取措施重建信任。 编译 | Tina AI 编程服务提供商 Replit 近日再次成为争议焦点,而距离其上一次风波仅过去不到三个月。 9 月 10 日,Replit 正式推出了新一代 AI 编程助手 Agent 3,称其能够帮助开发者更轻松地构建和测试应用程序。值得注 意的是,同日 Replit 还宣布完成 2.5 亿美元融资,估值升至 30 亿美元。 Replit 将 Agent 3 称为"迄今最先进、最自主的编程代理",性能据称"比 Computer Use 模型快 3 倍、成本效益高 10 倍"。 软件的"自动驾驶时刻"?! 在官方推文中,Replit 将 Agent 3 描述为迄今最自主的代理,能够在浏览器里自动测试和修复应用,检查按钮、表单、链 接和 API;还可以连续运行超过 200 分钟,在构建、测试和修复过程中几乎无需人工监督。同时,它还能与 Slack、 Telegram、Notion、Dropbox 等常用工具集成,帮助用户快速实现自动化。 CEO Amjad Masa ...
AIGC全生命周期业务风控白皮书,从备案到运营的合规与安全实践
AI前线· 2025-09-20 13:33
文章核心观点 - 2025年9月15日,《人工智能安全治理框架》2.0版正式发布,旨在应对生成式AI落地过程中日益突出的安全风险,为产业风险防控划定关键方向[1] - 生成式AI市场正经历爆发式增长,预计2028年全球市场规模达2842亿美元,中国市场规模突破300亿美元,占AI总投资的30.6%,但内容合规、数据安全等风险制约产业发展[2] - 数美科技发布《AIGC全生命周期业务风控白皮书》,构建了一套贯穿AIGC应用上线前安全评估、上线后风险防控、长期运营保障的全生命周期业务风控体系,为行业提供实践路径[3] 政策与行业背景 - 国家AI风险治理布局深化,2025年8月国务院印发《关于深入实施"人工智能+"行动的意见》,此次治理框架2.0的发布进一步完善了AI安全治理体系[2] - 安全治理是AI赋能千行百业的基石与前提,这一认知因框架的发布而更加明确[2] AIGC风控白皮书核心框架 - 白皮书从全流程视角出发,构建了覆盖AIGC应用全生命周期的业务风控体系[3] - 体系核心包括破解"双备案"难题、筑牢大模型安全评测基线、构建账号与内容双轮风控体系、强化全周期运营保障[5][6][8][11] 合规备案解决方案 - 系统性拆解"算法备案+大模型备案"的双备案制度困境,明确两者在流程和核心材料上的差异[5] - 提供具体解决方案,如语料安全评估需满足不良信息占比<5%、人工抽检合格率≥96%,敏感内容拒答率需达95%以上[5] - 解答接入开源大模型是否需备案、企业内部使用是否合规等高频问题,帮助企业精准定位备案义务[5] 大模型安全评测体系 - 明确企业需具备四大基础能力:百万级敏感测试题集、全场景验证能力、语料安全评估体系、专业蓝队组建[6] - 提供设计攻击指令、构建测试题集、自动化与人工协同测试、输出评测报告四步核心执行方案[7] - 强调评测需贯穿运营全周期,备案后每月提交报告,模型升级需重测,确保风险动态可控[7] 账号与内容风控策略 - 账号风控从资源层和行为层双维度构建体系,防御黑产偷算力、薅羊毛等问题[8] - 资源层识别同设备短时间注册超5个账号、手机号归属地与IP地域不符等异常信号[8] - 行为层通过频度特征、关联特征、聚集特征定位批量注册、账号倒卖等风险行为[8] - 内容风控创新性提出"AI机器审核+大模型审核Agent+人工审核"的新范式,并配套四级风险标签体系[10] - 新范式在精准性、高效性、用户体验和成本方面实现优化,支持高并发场景下的实时合规校验[10] 运营保障与动态迭代 - 提出监测预警、研判分析、布控处置、效果复盘的全周期舆情解决方案,实现7×24小时极速响应,突发舆情10分钟内启动流程,2小时内完成全链路布控[11][12] - 构建数据驱动的效果迭代体系,通过用户反馈和红蓝对抗推动风控策略小时级更新,定期开展主动评测前瞻性暴露漏洞[14] 行业应用案例 - 白皮书精选AI社交、AI办公、AI视频、开源大模型4个领域的标杆案例,提供可迁移借鉴的经验[15] - 案例显示,通过定制化风控方案,平台在合规性、用户体验和增长质效上均取得显著提升,如某平台违规内容识别准确率达99%[15] - 风控能力被视为企业在AIGC千亿市场赛道上的"护城河",是突破增长瓶颈、实现安全发展的关键[16]
从模型为王到应用为王:AI 中间件的基建之战 | 直播预告
AI前线· 2025-09-20 13:33
行业核心趋势 - 行业竞争焦点正从模型本身转向AI应用的落地效率 [2][6] - 一场围绕AI中间件的基建之战正在开启 [2][6] - 行业处于从模型为王向应用为王过渡的关键阶段 [2] 技术发展挑战 - 当前AI领域面临模型触手可得但实际落地举步维艰的困境 [2][6] - 企业级AI中间件需要解决落地成本和管控难题 [3] - 技术发展需要从云原生平滑过渡到智能原生架构 [3] 应用落地重点 - RAG框架需要从简单搭建升级到真正可用的工程化实践 [7] - Agent应用工程化落地需要建立明确的架构范式 [7] - Coding Agent在研发全流程具有显著的应用和提效潜力 [7] 人才发展机遇 - 开发者面临成为智能时代核心人才的红利机遇 [3][6] - Agentic AI应用前沿技术是当前重点发展方向 [7]
模力工场 012 周 AI 应用榜:AI 简历优化或能不再千篇一律?本周榜单展现效率与情绪价值双重趋势
AI前线· 2025-09-19 16:08
模力工场 新鲜事 上周我们去了上海外滩大会,现场结识了不少对 AI 超有热情的小伙伴,体验官 & 推荐人队伍越来越壮大啦! 012 周榜单总介绍 本周,模力工场 AI 应用榜单迎来了 10 款全新 AI 应用,覆盖人力资源、教育学习、设计创意、硬件实体、生活服务 等多个场景。从 HR 面试与简历优 化,到 AI 早教陪伴机,再到多模态创作与字幕工具,应用生态继续展现出「实用 + 趣味」的多元趋势。 与前几周的"健康管理热""内容创作热"相呼应,本周的关键词是 "双向赋能 + 个性场景":AI 不再只是单一工具,而是成为面试官与求职者、家长与孩 子、创作者与受众之间的"桥梁"。 本周上榜应用周报: 平台新功能上线:现在模力工场网页与小程序均可显示 开发者 / 推荐人所在城市,说不定你喜欢的应用开发者就在你身边~ 从这周开始,周榜单将新增榜首应用开发者 Q&A 短访谈栏目,带来更深入的功能与产品亮点解读,欢迎持续关注。 Unicorn Hunter 是什么: Unicorn Hunter 是专为求职者与面试官打造的简历捉虫 / 筛选利器,支持 【面试官】 与 【求职者】 双角色!面试官可一键 生成 深度勘探计划 ...
史诗级和解:英特尔获老对手英伟达超350亿投资,股价创38年最大单日涨幅
AI前线· 2025-09-19 16:08
合作核心内容 - 英伟达计划向英特尔投资50亿美元(约合人民币355.63亿元),若通过监管审批,英伟达将持有英特尔约4%的股份,成为其最大股东之一 [2][3] - 两家公司将联合开发多代定制的CPU和GPU集成产品,目标市场覆盖云计算公司、大型企业和PC消费市场 [2] - 合作旨在将AI加速与通用CPU融合,构建更强计算体系,以服务数据中心AI工作负载并提升消费级PC的图形与智能算力 [10] 技术与分工 - 英伟达将贡献其AI算力、GPU技术及NVLink高速互联技术,英特尔则主要提供CPU技术、制造能力及先进封装 [10][11][14] - NVLink技术单通道带宽可达25GB/s至50GB/s(双向),远超PCIe 5.0单通道约4GB/s的带宽,一条NVLink带宽约等于6至12条PCIe 5.0通道带宽 [11] - 英特尔将为英伟达量身定制特别版x86 CPU,并整合进英伟达的AI平台,同时为个人PC市场推出整合NVIDIA RTX GPU的x86 SoC [11][13] - 此次合作不包括英特尔为英伟达代工GPU,但英特尔会为联合产品提供CPU和先进封装,且不影响双方现有产品路线图 [14] 市场反应与影响 - 消息公布后,英特尔股价开盘一度大涨约28%,收盘涨幅约22.77%,创下38年来最佳单日表现 [3] - 截至同日收盘,英伟达股价上涨3.49%,而AMD下跌0.78%,博通下跌0.24% [7] - 分析师认为此次合作有望定义AI PC并加速其发展,对英特尔意义重大,50亿美元投资对英伟达而言是小数目,但为英特尔在AI芯片开发上指明了新方向 [22][24] 历史背景与竞争格局 - 英特尔与英伟达曾关系良好,但在2009年因Nehalem架构专利授权问题对簿公堂,2011年和解,英特尔支付英伟达15亿美元授权费,英伟达退出英特尔CPU平台的芯片组市场竞争 [18][19] - 近年来竞争焦点集中在AI与数据中心算力,英伟达凭借GPU和CUDA生态主导AI训练,英特尔则力推CXL开放标准,但自研GPU及加速芯片项目效果未达预期 [20][21] - 英特尔2024年亏损近200亿美元(约合人民币1422亿元),市值跌至千亿美元级别,远低于英伟达,公司近期通过出售业务(如以约33亿美元出售Altera 51%股权)及引入投资(如美国政府持股9.9%)等方式改善财务状况 [21][22] 领导层表态 - 英伟达CEO黄仁勋表示将把CUDA加速计算技术与英特尔CPU及x86生态结合,共同开创新一代计算体系 [8] - 英特尔CEO陈立武强调x86架构是数十年计算基石,英特尔的制造与封装能力将与英伟达的AI优势互补,依托制程能力推动行业突破 [8]
下棋比智商!8 大 AI 模型上演棋盘大战,谁能称王?
AI前线· 2025-09-18 10:28
Kaggle Game Arena平台发布 - Kaggle与Google DeepMind合作推出Kaggle Game Arena平台 通过战略类游戏对人工智能模型进行对战评测 [2] - 平台采用全对全赛制 每个模型多次与其他所有模型对战 减少随机因素干扰 使结果在统计上更可靠 [2] - 平台已将游戏运行环境 规则执行 模型对接等控制模块全面开源 方便开发者和研究人员检查 复现或扩展 [2] - 首批参赛的八个主流AI模型包括Anthropic的Claude Opus 4 DeepSeek的DeepSeek-R1 Google的Gemini 2.5 Pro与Gemini 2.5 Flash Moonshot AI的Kimi 2-K2-Instruct OpenAI的o3和o4-mini 以及xAI的Grok 4 [2] 评测维度与行业意义 - 与其他聚焦语言任务 图像分类或编程挑战的AI测评平台相比 Kaggle Game Arena关注点在规则与约束下的决策力 [3] - 游戏突出推理 规划与对抗适应性 为目前以静态输出为主的排行榜增添了新的参照维度 [3] - 研究人员认为这类基准测试有助于发现AI系统在传统数据集之外的优势与不足 [3] - 未来平台将扩展到卡牌游戏和数字游戏等更多类型 测试AI在战略推理中的不同能力 包括长期规划和在不确定条件下的适应性 [5] 行业专家观点 - AI爱好者Sebastian Zabala表示国际象棋是完美的开局 期待看顶级AI在实战对抗中的表现 [4] - AI布道者Koho Okada认为这可能改写评估AI智能的方式 既专业又好玩 [5] - Kaggle用户Sourabh Joshi补充认为该平台是测试泛化性 效率和推理力的理想战场 将揭示大语言模型的真正实力 [5]
梁文锋执笔的R1论文登上Nature封面!首次回应外界三大质疑
AI前线· 2025-09-18 10:28
核心突破与行业地位 - DeepSeek-R1成为首个通过完整同行评审并发表于《自然》封面的大语言模型 标志着国产AI研究迈入世界舞台并填补行业空白 [2][3][8] - 模型通过纯强化学习机制自主形成推理能力 无需依赖人工标注的思维链数据或提示工程 显著降低对人工数据的依赖 [3][12] - 在Hugging Face平台下载量突破1090万次 成为全球开源社区最受欢迎的推理模型之一 [3] 技术创新与训练方法 - 基于DeepSeek-V3 Base构建R1-Zero 通过多阶段训练结合监督微调和拒绝采样 实现强推理性能与人类偏好对齐 [3] - 采用组相对策略优化技术 模型通过自我评分和试错机制学习独立推理策略 而非模仿人类示例 [13] - 训练成本仅29.4万美元 基础模型开发成本约600万美元 总成本远低于竞争对手数千万美元投入 [6] 数据安全与透明度改进 - 预训练数据完全来自互联网 团队强调未有意进行蒸馏过程 但承认可能包含GPT-4生成文本 [6][13] - 为避免基准测试污染 清除数学数据中约600万条潜在污染样本 并引入外部风险控制机制 [6] - 安全性表现优于Claude-3.7-Sonnet和GPT-4o等主流模型 通过DeepSeek-V3实时审查 [6] 学术影响与行业评价 - 论文经过8位专家评审 收到上百条意见 最终审稿文件达64页 为论文本身三倍长度 [9] - 该方法引发行业革命 2025年几乎所有大语言模型的强化学习研究均受R1启发 [13] - 在ScienceAgentBench科学任务中 以23.53%准确率和1.87美元成本达到帕累托最优 成为性能成本平衡最佳模型之一 [15] 争议回应与验证 - 团队回应OpenAI数据使用质疑 称未直接使用其输出训练 但基础模型可能吸收互联网现有AI生成内容 [13][14] - 外部专家认为反驳具有说服力 其他实验室重复实验表明纯强化学习可实现高性能 无需依赖OpenAI样本 [14] - 论文补充训练细节和技术说明 减少拟人化描述 增加数据类型和安全性披露 [9][13]
250 个岗位换两亿“求生”资金?巅峰781 亿市值巨头节流押注 AI,CEO急踩 “创业模式” 刹车
AI前线· 2025-09-17 14:17
公司战略转型 - 公司宣布裁员250人 约占员工总数30% 作为向AI优先企业转型的重组举措之一 [2] - 转型目标是打造更精简 响应更快 以AI为核心的现代化技术架构 管理层级将显著减少 [2] - 公司计划回归初创模式 保持速度与灵活性 采用更扁平的组织结构 [7][8] 财务影响与业绩预期 - 裁员预计带来3000万美元年化总节省额 部分资金将重新投入用于招聘AI人才 [5] - 公司重申2025年第三季度及全年业绩指引 预计营收达4.25亿至4.38亿美元 [4] - 预计2026年实现25%的长期调整后息税折旧摊销前利润率 较原目标提前一年 [4][5] 历史表现与市场反应 - 公司市值在2021年2月达到约110亿美元峰值 股价曾超过每股320美元 [3] - 转型消息发布当日股价徘徊在每股23美元左右 且公布后小幅下跌 [3] - 有推测认为此举意在推动股价上涨 [3] AI技术应用成效 - AI已实现流程自动化 优化运营效率 在客户支持领域缩短工单解决的服务等级协议时长 [8] - AI在平台合规与欺诈检测方面同时实现效率提升与性能优化 [8] - 过去一年公司内部推进了众多AI项目 见证了AI解放人力并激活新业务能力的价值 [7] 行业背景与自由职业者影响 - 平台自由职业者群体对生成式AI完成服务订单现象存在不满 去年有创作者反映业务量下滑 [10] - 公司2024年10月发布广告试图淡化AI担忧 主张"没人在意创作者是否使用AI" [10] - 有网友质疑AI将摧毁自由职业生意 另有人认为人类价值自ChatGPT以来已倍增 [11] 人员安置与组织文化 - 为离职员工提供丰厚补偿金 职业转型援助 领导团队个人帮助及延长医疗保险保障期限 [5] - 创始人称这是最艰难的决定之一 但强调AI为员工提供了解放繁琐任务的新机遇 [2][7] - 公司预期每位员工单位时间产出提升一倍甚至两倍 交付成果质量达到同等提升幅度 [9]