Workflow
Gen AI for Business #79: The Diwali Edition
Medium·2025-10-20 02:58

核心观点 - 生成式人工智能正在重塑行业、基础设施和未来工作,本周新闻涵盖了从OpenAI定制芯片、谷歌医疗突破到新治理法律和不断上升的电力成本等多个方面,展示了技术的光明面与阴影面[1] 模型发展 - 微软发布首个内部开发的文本到图像模型MAI-Image-1,声称通过创意专业人士的反馈减少了“通用”风格,生成速度比大型模型更快,在LMArena基准测试中位列前十[7] - xAI加入开发“世界模型”的竞赛,该系统通过视频/机器人数据训练,以理解物理丰富的环境,用于游戏和机器人技术,计划最早于2026年发布AI生成游戏[6] - 谷歌Gemma模型帮助发现新的潜在癌症治疗途径,系统分析了数百万分子相互作用,发现结合CK2抑制剂和低剂量干扰素可增强难以治疗肿瘤的免疫识别[11] - Anthropic发布新旗舰模型Claude Sonnet 4.5,在SWE-bench Verified上达到最先进水平,在OSWorld真实世界计算机任务上达到61.4%,声称能在复杂任务上保持专注超过30小时[15] - Anthropic推出“Claude Skills”系统,允许开发者为Claude模型构建定制能力,将其转变为模块化代理框架[15] 平台与工具更新 - 微软为Windows 11推出新AI功能,深化Copilot集成,包括唤醒词“Hey Copilot”、将Copilot Vision扩展到所有市场,以及实验性“Copilot Actions”模式,允许助手从桌面执行现实世界任务[7] - 谷歌迭代AI Studio,进行UI更新和开发者中心更新,包括Gemini/GenMedia/TTS/Live的整合Playground、新主页、实时速率限制仪表板,以及Gemini 2.5 Flash Image的“构建模式”[11] - 谷歌推出Veo 3.1和Flow的高级功能,Veo 3.1专注于现实主义、叙事控制和更严格的提示遵循,Flow扩展了编辑工具集,包括更丰富的音频集成和修改照明、阴影的控制[11] - 谷歌Meet悄悄推出“AI驱动虚拟化妆”功能,与美宝莲和欧莱雅等美容品牌合作,实时调整照明、色调和纹理[11] - 谷歌照片推出语音驱动编辑功能,用户只需描述想要的更改即可编辑图像,支持语音输入和键入提示[35] 芯片与硬件 - NVIDIA宣布DGX Spark开始发货,这款“世界上最小的AI超级计算机”在紧凑桌面单元中提供高达1 PFLOP性能,具有128 GB统一CPU-GPU一致性内存,基于Grace Blackwell (GB10)和NVLink-C2C构建[16] - Oracle确认其下一波云AI产品将由Nvidia Blackwell GPU提供支持,将捆绑优化的CUDA、TensorRT和企业微服务用于模型部署[16] - Oracle和AMD扩大合作伙伴关系,从2026年第三季度开始,OCI将提供由50,000个AMD Instinct MI450 GPU初始驱动的公开可用AI超级集群,2027年进一步扩展[16] - 微软倡导具有本地推理和辅助工作流程的“AI PC”,而苹果发布旨在设备上AI加速的M5芯片,M5提升至10核CPU和10核GPU,添加与GPU管道绑定的神经加速,声称AI任务峰值GPU性能比M4高4倍[20] 合作伙伴关系与投资 - OpenAI与Broadcom建立10千兆瓦合作伙伴关系,旨在超越竞争对手[4] - OpenAI与沃尔玛建立合作伙伴关系,让用户通过一句话购物[4] - Meta和Arm扩大合作,将Arm的Neoverse与Meta的排名/推荐引擎配对,目标是在Meta基础设施中实现性能每瓦增益[10] - NVIDIA、微软、xAI和BlackRock参与收购Aligned Data Centers的交易,价值约400亿美元,Aligned运营约50个园区,管理近5吉瓦容量,财团计划注入300亿美元初始股权,并通过债务融资扩展至1000亿美元[28] - 阿里巴巴重申3800亿元(约530亿美元)的三年AI/云支出,并继续扩展基础设施,如本周宣布的第二个迪拜数据中心[24] 行业应用与案例 - 近一半(47%)美国银行决策者表示其机构在2025年已全面推出生成式AI,高于2023年的10%,三分之二的高管同比增加AI支出[31] - MIT技术评论报道AI设计病毒已出现并正在杀死细菌,Arc研究所/斯坦福大学研究人员报告首个AI生成、实验室可行的噬菌体基因组,设计了16种感染大肠杆菌的新噬菌体[32] - BMC医学综述调查大型语言模型如何进入临床试验堆栈:方案起草、资格解析、患者匹配、招募消息、站点可行性和不良事件编码[32] - Adobe推出AI代理,包括Audience Agent寻找购买群体角色、Journey Agent协调活动和Data Insights Agent呈现趋势,旨在保护品牌声音[20] 监管与政策 - 美国政府在出口管制豁免下批准Nvidia向阿联酋经审查的项目销售先进AI芯片,该决定涵盖低于最严格性能级别的选定配置[21] - 美联储理事克里斯托弗·沃勒警告AI可能“放大金融市场波动”,如果模型驱动类似羊群的算法行为,敦促银行在交易和贷款中部署生成模型前嵌入风险控制[21] - 加州成为美国首个监管AI伴侣聊天机器人的州,要求披露非人类身份、验证用户年龄并包括心理健康支持触发器,该法律于2026年1月生效,对违规行为引入严厉处罚[22] 研究与趋势 - Gartner的新供应链战略炒作周期将生成式AI置于幻灭低谷期,许多试点项目难以生产化,而供应链网络安全处于膨胀预期峰值[26] - 搜索引擎土地比较不同AI引擎如ChatGPT、Gemini、Claude、DeepSeek和Perplexity的检索策略、实时网络使用和引用行为,强调生成引擎优化(GEO)的重要性[36] - 论文《通过早期经验的代理学习》提出模仿学习和强化学习之间的“中间地带”:在代理自身早期交互上训练,无需显式奖励信号,在八个环境中评估报告有效性和域外泛化能力提升[36] 风险与挑战 - ScienceDirect论文发现将仅250个恶意或“中毒”文档注入模型微调语料库可显著偏置其输出,改变安全过滤器或泄露秘密,实验使用Llama 3和Mistral等开放模型,显示即使标准防御下也存在漏洞[13] - 好莱坞与AI斗争加深,OpenAI和工作室在版权和同意上冲突,Sora-2允许用户将真实人物和著名角色放入AI视频,引发工作室、机构和家庭的快速反弹[27] - 分析显示电价上涨集中在大型数据中心建设附近地区,AI加速电力需求增长,Bloomberg 9月29日交互文档记录热点和本地价格峰值,DOE估计2028年数据中心需求升至美国电力约6.7-12%(2023年约4.4%)[28] - OpenAI的Sora视频模型尚未公开,但数百个“Sora”仿冒应用出现在苹果App Store,在开始下架前积累数千下载,一些应用仍通过苹果过滤器,使用近乎相同的名称、图标和描述[29]