Workflow
大型语言模型(LLM)
icon
搜索文档
苹果加速AI与XR布局:悄然收购TrueMeeting与WhyLabs强化核心生态
环球网资讯· 2025-07-08 15:29
来源:环球网 标准。WhyLabs的模型监控技术可提供实时风险评估,为Apple Intelligence在医疗、金融等高敏感领域 的应用提供安全背书。 【环球网科技综合报道】7月8日消息,据多家外媒报道,苹果公司近期低调完成对两家科技公司的收 购,交易细节虽未公开披露,但技术整合方向已指向其两大战略级产品:Apple Vision Pro混合现实头显 与Apple Intelligence生成式AI平台。 此次收购延续了苹果一贯的"小额多笔、技术导向"的并购策略。据欧盟披露文件,TrueMeeting与 WhyLabs的收购协议于2025年1月24日正式敲定,但实际谈判或始于2024年第四季度。(青山) 另一家被收购的WhyLabs则聚焦于生成式AI的安全与可靠性领域。其核心产品为大型语言模型 (LLM)监控平台,通过实时追踪模型"漂移"(数据分布变化)与性能退化,有效预防AI生成内容中 的"幻觉"(Hallucination)问题。例如,在客户服务场景中,WhyLabs技术可自动识别并脱敏用户敏感 信息(如地址、信用卡号),防止数据泄露风险。 对于苹果而言,WhyLabs的加入或为Apple Intell ...
一文读懂数据标注:定义、最佳实践、工具、优势、挑战、类型等
36氪· 2025-07-01 10:20
数据标注的核心重要性 - 数据标注是AI和ML模型实现高准确性的基础 通过精确标记和分类数据使机器学习模型发挥最佳性能 [1] - 80%的数据科学家将超过60%的时间用于数据准备和注释而非模型构建 凸显其作为AI基础的关键地位 [2] - 标注良好的数据可确保模型识别模式 做出准确预测并适应新场景 直接影响AI系统性能 [5] 数据标注技术类型 - 图像标注涉及添加标题和关键词作为属性 对计算机视觉和面部识别至关重要 [13] - 音频标注需标记语言 方言 情绪等多维参数 包括非言语情况的识别 [16] - 视频标注通过逐帧标记实现运动追踪和行为分析 对自动驾驶等应用关键 [20] - 文本标注需处理语义 意图和情感等抽象元素 是NLP领域最复杂的标注类型 [23] - LiDAR标注处理3D点云数据 在自动驾驶和城市规划中实现精确空间识别 [31] 行业应用与市场趋势 - 全球数据标注工具市场规模预计2028年达34亿美元 2021-2028年CAGR为38.5% [5] - 自动驾驶领域依赖标注的图像和激光雷达数据检测行人及障碍物 [5] - 医疗AI通过标记的X射线和CT扫描训练模型识别病理特征 [5] - 78%企业AI项目采用内外结合的数据标注服务 较2022年增长24个百分点 [5] - 零售AI通过产品标记和情感分析实现个性化推荐 [5][81] 标注方法与效率提升 - AI辅助注释可减少70%的标注时间 同时提高15-20%的模型准确率 [5][48] - 半自动标注结合人工准确性和AI处理能力 显著提升大规模数据处理效率 [7] - 主动学习方法通过模型引导标注过程 减少30-40%的标注成本 [8][5] - 合成数据生成技术降低对人工标注的依赖 提高模型多样性 [6] 工具选择与实施策略 - 专业标注工具应支持多模态数据管理和版本控制 确保数据集完整性 [40] - 标注平台需内置质量检查模块 实现实时协作和反馈跟踪 [42] - 企业级解决方案必须符合GDPR/HIPAA等数据安全标准 [43][61] - 构建与购买决策需权衡项目规模 预算 合规要求和人力资源等因素 [50][68] 质量控制与最佳实践 - 多阶段质量控制系统包括初始培训 持续监控和最终审查 [47][54] - 采用多位注释者交叉验证可显著提高标注一致性 [86][88] - 清晰的标注指南和标准化流程是保证质量的关键因素 [86][88] - 人机协作模式将人工聚焦于复杂案例 提升整体效率 [86][88]
麦肯锡:《人工智能驱动的下一次创新革命》研究报告
创新生产力下降的现状 - 自工业革命以来创新推动人均GDP增长14倍(从19世纪初1200美元起)和平均预期寿命翻倍(1900年32岁→2021年71岁)[3] - 半导体行业维持摩尔定律需研发投入爆炸式增长:1971-2014年真实研发投入增长18倍[3] - 生物制药领域"反摩尔定律"显现:1950-2011年每十亿美元研发经费获批新药数量每九年减半,研发效率下降80倍[4] AI加速创新的三大核心渠道 加速设计生成 - 生成式AI可快速产出化学分子、药物候选物、3D模型等方案,某零售商案例中生成数十种门店布局方案远超传统设计数量[6][7] - AI突破人类思维定式:AlphaGo"第37手"颠覆围棋策略,火箭发动机冷却通道设计展现几何结构创新[7] - 意外发现潜力:AI生成零售店渲染图时自主添加装饰元素获消费者青睐[8] 加速设计评估 - AI代理模型替代传统仿真:天气预报AI模型8分钟预测精度超越超级计算机数小时运算[11] - 风洞测试场景中神经网络模型秒级预测数百种空气动力学工况,传统需数天[11] - AlphaFold预测超2亿种蛋白质结构,多物理场问题整合能力提升复杂设计评估效率[11][12] 加速研究运营 - 大型语言模型分析海量市场数据提炼需求,生命科学领域快速检索跨学科文献[13] - 企业内部知识管理:LLM转化非结构化信息为可检索知识,充当研发对话伙伴[13] - 自动化文档处理加速医药/航空行业监管流程,未来AI智能体或实现全流程闭环管理[14] 行业经济潜力 - 全球AI年经济潜力达3600-5600亿美元,软件行业30%新代码已由AI生成[15] - 制药行业研发吞吐量有望提升超100%,电子/汽车行业AI代理模型可缩短50%验证周期[15] - 消费品行业75%价值来自AI加速新品方案生成,如食品/化妆品配方[16] 企业实施建议 - 快速规模化应用AI技术,避免"试点炼狱"需建立规模化能力[17] - 组织重构:整合原型测试与仿真团队,采用敏捷交付模式[17] - 构建AI模型管理核心能力,平衡开源/采购/自研模型决策[17] - 明确人类关键决策节点(如安全领域),优化员工技术体验以吸引顶尖人才[18]
特稿 | 拉斯•特维德:关于超智能未来的4000个预测
第一财经· 2025-06-18 09:35
海湾地区国家成为AI发展中心 - 海湾地区国家具备AI发展四大关键要素:廉价能源、低营业税、稳定政治环境和灵活数据共享能力 [1] - 2025年5月特朗普带领科技领袖团队访问沙特、阿联酋和卡塔尔签署协议建设全球最大AI数据中心 [1] - 该地区在AI所需四大要素中至少三方面表现突出:能源供应、税收优惠和政府稳定性 [1] AI技术发展趋势预测 - 2025-2035年AI能力将大幅提升 2028年领先LLM计算能力预计达2024年10万倍 [5] - 代理AI群将在2025年实现跨领域协作 微软和OpenAI等公司正将其集成到平台 [5] - 2027-2030年仿人机器人将实现商业突破 2030年进入大众市场 [6] - 2028年互联AI网络将形成集体超智能 在多数领域超越人类 [6] - 2033-2035年量子AI将显著增强计算能力 开辟研究新可能性 [8] 生物医学领域突破 - mRNA疫苗和男性避孕药将上市 随后出现3D打印皮肤移植和神经退行性疾病新疗法 [9] - CRISPR技术将应用于寄生虫病和心血管疾病治疗 [9] - 2028年脑部扫描精度可独立诊断心理健康状况 [9] - 未来10-15年将推出抗衰老疗法 可能延长健康寿命至120年 [9] - 2028年可能出现首个实验室培育婴儿 2029年实现精密发酵与动物蛋白成本平价 [9] 能源技术发展 - 2030年单个AI数据中心需8-10个标准核电站电力 [10] - 2026年实验核聚变反应堆可能实现持续反应 中国EAST反应堆是主要竞争者 [10][11] - 天然氢和钍基反应堆成为传统核能替代方案 中国处于领先地位 [11] 国防科技进展 - 2026-2028年军事技术重点发展AI、机器人和激光 [12] - 2026年地面激光系统将普遍用于无人机防御 [12] - 2027年AI无人机可识别攻击目标 2028年AI防空系统广泛部署 [12] 全球科技竞争格局 - 2030年美国预计保持30-38%全球计算份额领先 中国25-33% 海湾国家15-20% [13] - 中国在64项关键技术中57项领先 美国7项领先 欧盟30项排名第二 [13] - 量子计算、生物技术和先进材料领域中国表现突出 [13]
兰德公司:驾驭AI经济未来:全球竞争时代的战略自动化政策报告
核心观点 - 报告探讨在全球AI技术竞争背景下如何制定战略自动化政策以平衡经济增长与财富分配不均问题 [1][2] - 提出区分"垂直自动化"(提升现有自动化任务效率)与"水平自动化"(扩展至新任务领域)的分析框架 [2][4] - 采用稳健决策方法(RDM)评估81种政策组合在5000种模拟情景下的表现 [5][7] - 建议非对称政策:强力激励垂直自动化+适度抑制水平自动化以实现稳健增长 [12][16] 自动化政策框架 - 垂直自动化通过提高现有自动化任务效率可能增加劳动力边际产出 [8][10] - 水平自动化直接替代人力劳动可能加剧资本收入占比 [8][12] - 经济模型假设任务间存在互补性(弹性参数ρ<0) [9][10] - 允许新自动化任务生产率变化(ηd参数)反映AI能力不确定性 [9][10] 政策模拟结果 - 垂直自动化激励政策在81%情景中实现基准目标(2%收入增长+≤2%不平等) [12] - 激进策略(同时激励两类自动化)仅在23%情景中实现10%增长目标但占成功案例71% [13] - 初始水平自动化程度>23%且年增速>14%时非对称策略最优 [15] - 水平自动化增速>9.1%时多数情景难以达标 [14] 技术经济预测 - 高盛预测AI十年内累计提升全球GDP7%(年均0.67%) [3] - 戴维森等预测AGI可能带来30%年增长率 [3] - 阿西莫格鲁模型显示AI对十年内GDP年增长贡献或<1% [3] 数据资源 - 欧米伽未来知识库收录8000+前沿报告每周更新≥100篇 [18] - 包含牛津/麦肯锡/斯坦福等机构AI政策研究报告 [20]
AI热潮还是真泡沫?科技投资者别只看星辰大海 先看看财报!
金十数据· 2025-05-15 18:16
索洛悖论与AI生产力 - 诺贝尔经济学奖得主罗伯特·索洛提出的"索洛悖论"指出计算机时代未显著提升生产力数据 如今AI也面临同样现象 生产力未见显著提升 [1] - 计算机行业收入从上世纪50年代持续增长至80年代 但生产力跃升直到90年代初才出现 目前AI尚未显现显著收入 生产力提升可能需等待几十年 [1] - 微软联合创始人比尔·盖茨预测十年内AI将取代医生和教师等职业 但此类预测缺乏现实数据支撑 [1] AI应用失败案例 - IBM超级计算机沃森在MD安德森癌症中心投入6千万美元后因"不安全和错误的治疗建议"被终止合作 [2] - 2016年"AI教父"杰弗里·辛顿预言5年内深度学习将全面胜过放射科医生 但美国放射科医生数量不降反升 [2] - 咨询机构如麦肯锡、埃森哲过去十年持续警告AI将大规模取代工作岗位 但实际进展缓慢 [2] 大型语言模型局限性 - LLM能回答简单事实问题和撰写文本草稿 但无法生成可靠答案 在医疗法律等高价值领域出错代价巨大 [3] - IBM首席执行官表示AI不会取代程序员 微软研究显示程序员主要时间花在调试 LLM对此存在短板 [3] - 微软CEO承认AI供给远大于需求 公司已放缓包括10亿美元俄亥俄州项目在内的数据中心建设 [3] AI技术缺陷与行业现状 - OpenAI承认最新模型超三分之一时间产生"幻觉" 谷歌AI科学家项目被多学科科学家认为失败 [4] - 研究显示主流LLM新闻检索存在伪造链接 付费版本更易自信地给出错误答案 [4] - 国际数学奥林匹克测试中 主流LLM得分均未超过5% 显示其在复杂问题解决能力不足 [5] 行业收入与投资回报 - 2024年领先AI初创公司(含OpenAI和Anthropic)总营收预计不足50亿美元 [5] - 微软2024年AI云业务营收约100亿美元 年化130亿美元 Alphabet云业务中AI相关部分年收入约100亿美元 [6] - 亚马逊生成式AI投入产出比为1:0.2 远低于基础设施1:4的回报率 CEO承认AI推广仍需多年 [6] 行业规模与泡沫风险 - 整个AI行业年收入估计300-350亿美元 按35%年增长率计算 2030年规模仅2100亿美元 [7] - 当前2700亿美元数据中心资本开支与收入严重不匹配 类似2000年互联网泡沫时期科技巨头格局 [7] - 大型科技公司有多元收入支撑 但小型AI公司可能在投资者对"未来利润"幻想破灭时面临生存危机 [7]
如何减轻AGI 代理带来的风险
36氪· 2025-05-13 12:26
AGI定义与特性 - AGI指在广泛认知任务中匹敌人类能力的通用人工智能系统 其核心特征为多功能性和高性能[4] - 与专用AI不同 AGI具备跨领域问题解决能力 谷歌DeepMind论文将其定义为兼具通用性和智能性的系统[4] - 当前大型语言模型(LLM)已展现高度适应性 但AGI预计将实现更广泛的通用性和功能多样性[4] AGI代理架构与挑战 - AGI作为代理型AI的延续 其"处理器"需搭配自学习内存和工具才能形成完整代理系统[5][6] - 关键瓶颈在于工具灵活性不足 现有AI代理仅能控制有限终端设备 与人类操作范围差距显著[9] - 自学能力指AI在操作中提取见解并存储至永久记忆 这是实现人类水平能力的关键缺失环节[8] AGI商业应用风险 - OpenAI CEO预测2025年AGI代理可能进入劳动力市场 但就业市场影响难以预测[11] - 全球级AGI代理若接入数千企业API和数据 可能通过社会工程学引发系统性风险[14][19] - 企业若过度依赖AGI替代人力 可能面临政府监管干预 需平衡商业效率与人力需求[52] 安全部署方案 - 团队级AGI代理设计相对安全 可嵌入企业通讯工具担任知识共享或工作流协调角色[30] - 多代理系统(MAS)比单体企业级代理更安全 具备模块化、专业化和协作学习三大优势[40][41][42] - 微软提出的模型上下文协议(MCP)可标准化LLM与外部系统交互 降低API滥用风险[32] 实施层级建议 - 个人层面应优先使用AI副驾驶而非全自主代理 避免批判性思维退化[25][26] - 团队级应用适合部署功能相当于人类成员的单体代理 由集体监督训练[48] - 组织级系统应采用多代理架构 各代理仅访问特定数据域 限制潜在损害范围[45]
NYU教授公布2025机器学习课程大纲:所有人都在追LLM,高校为何死磕基础理论?
机器之心· 2025-05-13 10:37
机器之心报道 编辑:+0 最近,Meta 公司首席 AI 科学家、图灵奖得主 LeCun 转发了他在纽约大学的同事 Kyunghyun Cho 的一篇帖子:内容是关于这位教授 2025 学年机器学习研究生课程 的教学大纲和讲义。 该课程聚焦于以随机梯度下降(SGD)为核心的基础机器学习算法,特意避开大型语言模型(LLM)内容,同时鼓励学生深入研读领域经典论文,回溯机器学习 的理论发展脉络。 在这个人人都关注 LLM 的时代,这样的课程设计乍看似乎很特别。但对比其他高校的课程表会发现, 各大高校研究生机器学习课程仍普遍以基础理论和经典模型 为核心。 比如斯坦福 CS229, 是经典的机器学习基础课程,2025 年冬季课程简介中,课程系统讲授包括线性回归、逻辑回归、SVM、神经网络、聚类、降维、EM 算法等 基本模型与方法,强调数学推导与优化思想,广泛应用于跨领域研究。 | 信息 | | | --- | --- | | 日历 | 6.790 | | 员工 | | | 每周日程表 班级政策和支持 | 机器学习 | | 书籍 | | | 办公时间 | 课程站点 | | 家庭作业 | 对于技术问题:请在 Piazza ...
版权悖论:保护AI创作=扼杀人类创作?
虎嗅· 2025-05-08 20:17
透明法案的悖论:未落地的剑,何以斩数据黑箱? 在训练人工智能模型时使用受版权保护的材料的合理使用辩护尚未解决,这意味着政府正在考虑的各种 透明度措施还为时过早。 新兴科技公司试图在现有版权所有者的支持下打造自己的产品——未经许可或支付报酬就盗用他们的作 品。面对这一前所未有的挑战,版权法无法演化出平衡的结果。涉及生成式人工智能的更深层次、更长 期的冲突,并非科技公司与内容所有者之间的对立,而是内容所有者与其自身员工和供应商之间的对 立。 版权法在即将到来的转型中将发挥重要作用,但必须从其他途径寻求平衡的解决方案。 在一系列诉讼以及一些立法改革之后,一种新的平衡或许将出现:既能容纳新技术,又能保护版权所有 者。 数据喂养的合法争议:AI训练的"合理使用"防线能否守住? 版权所有者和代表版权所有者的组织(包括《纽约时报》和美国作家协会)已起诉科技公司,指控其在 未经同意或补偿的情况下使用其作品训练人工智能模型。包括OpenAI和Anthropic在内的科技公司主 张,他们的复制行为属于合理使用。他们援引这一法定抗辩理由,对侵犯版权的指控进行抗辩,理由是 他们的复制对于创造一种不与复制材料竞争的新产品——生成式人工 ...