Workflow
生成式AI
icon
搜索文档
每日10万未成年人遭骚扰?扎克伯格被曝曾反对AI聊天机器人家长控制功能
环球网· 2026-01-28 10:40
公司内部决策与争议 - 公司首席执行官马克·扎克伯格反对聊天机器人与未成年人进行“露骨”对话,但拒绝为该功能添加家长管控机制 [1] - 公司员工曾“强烈推动添加家长控制功能以关闭生成式AI”,但生成式AI部门管理层予以驳回,并称这是“马克的决定” [4] - 公司回应称,新墨西哥州总检察长“刻意筛选文件,描绘出有缺陷且不准确的图景” [4] 产品功能与安全事件 - 公司的AI聊天机器人可与未成年人进行虚拟性对话,还能被诱导模仿未成年人参与性话题 [4] - 内部审查文件显示,公司对聊天机器人允许行为的界定模糊,甚至准许传播种族主义观点 [4] - 公司称相关争议内容为假设场景已删除,但未能平息质疑 [4] - 公司上周暂停了青少年账号对AI聊天机器人的访问权限,称将在开发家长控制功能期间暂时关闭服务 [4] - 公司表示,家长此前可查看青少年在Instagram与AI的聊天记录,后续将推出更多管控工具 [4] 法律诉讼与监管压力 - 美国新墨西哥州正起诉公司,指控其未能阻止有害色情内容及性暗示向未成年人传播,案件将于2月开庭审理 [4] - 新墨西哥州早在2023年12月就起诉公司,指控其平台未能保护未成年人免受成人骚扰 [5] - 内部文件显示公司平台每日有10万名未成年用户遭遇骚扰 [5]
苹果与谷歌Gemini“世纪联姻” Apple Intelligence有救了?
新浪财经· 2026-01-28 09:35
苹果与谷歌达成AI战略合作 - 苹果下一代“苹果基础模型”将直接基于谷歌的Gemini模型构建,放弃了全栈自研的执念 [2][17] - 苹果每年将向谷歌支付约10亿美元作为Gemini架构及谷歌云TPUs算力的授权费 [10][25] - 合作确保苹果在AI手机时代不掉队,并为自研团队争取2~3年的追赶时间 [15][29] 苹果在生成式AI领域的困境 - 在生成式AI竞争中落伍,Siri体验不佳,而竞争对手如OpenAI的GPT-4和谷歌的Gemini已取得显著进展 [3][19] - 苹果自研的Apple Intelligence功能迟迟达不到预期,Siri对话式版本已从2025年3月推迟发布 [3][19] - 公司面临技术、数据和人才多重挑战:数据隐私政策导致训练数据匮乏;过去一年至少有十余名资深AI工程师跳槽至Meta与OpenAI [6][21] 合作对谷歌的战略意义 - 对谷歌AI战略是关键胜利,通过将Gemini植入iOS底层,完成了“偷家”式的技术征伐 [8][23] - 当全球二十亿台活跃苹果设备由Gemini驱动时,谷歌将获得海量高质量交互样板,实质主导移动端AI [8][23] - Gemini正成为AI时代的“Intel Inside”,深度嵌入苹果生态 [8][23] 产品发布与功能规划 - 新款Siri将随iOS 26.4一同亮相,计划于2026年2月进入beta测试,3月或4月初正式发布 [13][28] - 苹果将在夏季WWDC发布代号Campos的全新Siri,基于Gemini的Apple Intelligence功能将随iOS 27、iPadOS 27等系统以测试版形式推出 [13][29] - 苹果计划将Siri打造成功能齐全的聊天机器人,支持持续双向对话,并直接内置于设备中 [15][29] 合作引发的行业反应与竞争格局 - 特斯拉CEO埃隆·马斯克批评合作导致谷歌权力过度集中 [13][28] - OpenAI地位可能因Gemini切入系统底层而降级为“备选”,其CEO萨姆·奥特曼据传已在内部发布“红色警报” [13][28] - 生态护城河不再仅由硬件决定,很大程度上取决于所调用AI大模型的可用性 [15][29] 中国市场的特殊情况 - 受法律合规等限制,Gemini无法在中国大陆使用,导致国行版iPhone将面对一个“平行”的AI生态 [13][28] - 为确保功能,国行版iPhone需在维持AI架构不变的前提下,换用可能由阿里、百度或月之暗面提供的国产大模型 [13][28] - 国行版iPhone在国产大模型驱动下的表现,是苹果留给中国市场的关键答卷 [15][29] 苹果的后续策略 - Apple Intelligence将继续运行在苹果设备和私有云计算上,公司仍将开发者和运行控制权紧握在手 [11][26] - 合作类似当年谷歌搜索成为Safari默认引擎,是应对现实的策略性选择 [15][29]
腾讯研究院AI速递 20260128
腾讯研究院· 2026-01-28 00:03
核心观点 文章汇总了近期人工智能领域在硬件、模型、应用及前沿研究方面的多项重要进展,核心观点是AI技术正沿着硬件性能突破、模型能力泛化与智能化、应用场景大规模落地以及向具身智能等前沿领域扩展的方向加速演进,行业竞争焦点从单一模型能力转向包括芯片、操作系统级平台、开源生态及垂直应用在内的全栈竞争 [1][2][3][4][5][6][7][8][9] 硬件与芯片 - 微软发布自研AI推理芯片Maia 200,采用台积电3nm工艺,单芯片晶体管数量超1400亿,FP4性能超过10 PetaFLOPS,是第三代Amazon Trainium芯片性能的三倍 [1] - Maia 200配备216GB HBM3e内存和7TB/s带宽,每美元性能比当前最新硬件提升30%,专为AI推理打造,将为OpenAI GPT-5.2等大模型提供支持,并已开始部署 [1] 大模型与平台能力 - Anthropic为Claude推出MCP服务,整合Figma、GitHub、Canva等生产力工具,使其从聊天机器人转变为可调度外部资源的智能体平台,用户可用自然语言指挥跨应用工作流 [2] - 月之暗面开源Kimi K2.5模型,该模型原生支持视觉与文本输入,并首次引入Agent集群能力,可自主创建最多100个分身并行处理1500个步骤的任务,实际运行时间最高缩短4.5倍 [4] - 阿里发布千问旗舰推理模型Qwen3-Max-Thinking,具备自适应工具调用能力,可自动调用搜索引擎和代码解释器,采用经验累积式测试时扩展策略以优化推理效果 [5] - DeepSeek开源OCR专用模型DeepSeek-OCR 2,采用新型解码器让模型按结构顺序阅读,在OmniDocBench v1.5测试中得分达91.09%,较前代提升3.73% [3] 应用落地与商业化 - 腾讯搜狗输入法全面AI化,接入混元大模型,AI用户规模破亿,日均语音使用近20亿次,AI语音大模型识别流畅性提升40%、准确率达98% [6] - Hyper3D发布Rodin Gen-2 Edit,推出基于自然语言的3D模型局部编辑功能,是业内首个将3D生成与编辑整合为完整工作流的商用产品,支持导入任意现有模型进行编辑 [7] 前沿技术与研究 - 蚂蚁灵波科技开源高精度空间感知模型LingBot-Depth,采用掩码深度建模方法,无需更换硬件即可提升对透明、反光等复杂材质的深度感知质量,实测中灵巧手可成功抓取透明玻璃杯 [8] - Anthropic CEO Dario Amodei发布长文预警,预测最早2027年可能出现诺奖级别的AI,并可能形成拥有5000万“国民”的“数据中心天才国家”,同时剖析了AI可能带来的五大危机 [9]
政策连发!“工业互联网+AI”这对CP,要炸出万亿新蓝海
搜狐财经· 2026-01-27 21:52
政策目标与产业规划 - 政策设定了明确的工业互联网发展路线图,目标是到2028年建成超过450个具有影响力的工业互联网平台,并推动不少于5万家工业企业完成“新型工业网络”改造 [1] - 政策旨在推动人工智能与工业互联网深度融合,为工业互联网装上“大脑”,并设定到2025年核心产业规模超过1.6万亿元人民币的目标 [1] 技术演进与应用现状 - 工业互联网正从“连得上、看得见”的数据连接阶段,向基于生成式AI和工业大模型的“认知理解”与“智能决策”阶段跨越 [3] - 工业互联网已覆盖41个工业大类,累计实施超过2.3万个“5G+工业互联网”项目,黑灯工厂、无人矿山等应用已成为现实 [3] - 网络技术需向具备“自感知、自决策”能力的智能化方向演进,以支持柔性制造等高级应用,具体技术包括5G、时间敏感网络等 [7] 产业链生态与企业参与 - 政策利好刺激产业链活跃,数据显示2025年新注册的工业互联网相关企业数量同比大幅增长27.8% [5] - 行业呈现分层服务模式:大型企业倾向于构建专用大模型,而针对中小企业则推广“模型即服务”模式以降低使用门槛 [5] 实施路径与行业重点 - 工业互联网的落地实施需遵循从“设备-产线-车间-工厂”的渐进式路径,不能一蹴而就 [7] - 建议优先在生产控制、设备协同等价值深厚的环节进行技术投入与改造 [7] - 汽车、钢铁等重点行业被列为优先发展对象,需重点培育其数据集和智能体应用 [7]
万兴科技发布天幕文生图功能写实版 推进AI视觉创作能力升级
证券日报网· 2026-01-27 21:44
本报讯 (记者舒娅疆)1月27日,记者从万兴科技(300624)集团股份有限公司(以下简称"万兴科 技")获悉,该公司旗下AIGC视频创作平台万兴天幕创作广场文生图功能于近日推出全新写实版模式, 为创作者提供更高质量、更高效率的图像生成能力,满足商业摄影替代、人物海报与宣传物料制作、插 画创作及概念设定图生成等多类场景需求。通过持续对AI视觉创作能力的升级,万兴科技积极为用户 提供高价值、低门槛的专业工具,重塑内容生产工作流。 围绕视频、绘图、文档等核心创作场景,万兴科技正在持续完善底层模型能力,并推动场景化应用与商 业化落地。 为巩固AI产品的长期竞争力,万兴科技在人才领域持续加码。据悉,其正在推进的2026届全球校园招 聘开放产品、研发等五大类岗位,为应届生和研发人才提供较为丰厚的薪酬待遇,优秀者不设上限。此 外,万兴科技正在推进的AIGC实习生招募"Wonder Nova新星计划",面向2026届及后续学年毕业的本/ 硕/博在校生,开放上千个实习岗位。 目前,生成式AI正加速走向实际生产与商业应用阶段。相关研究机构发布的数据显示,全球AI文生图 市场规模在接下来的十年内预计呈现较高速增长态势。 ...
港股异动 | MINIMAX-WP(00100)盘中涨超12% MiniMax近日发布专家Agent桌面端及AI工作台
智通财经· 2026-01-27 13:53
中信建投此前指出,在生成式AI浪潮席卷全球的当下,MINIMAX以"反共识"的战略定力,聚焦模型智 力突破,正从行业竞争中脱颖而出。作为上海首批获得大模型备案的企业,公司凭借技术深耕与商业化 远见,展现出强劲的发展潜力。该行预测,2025-2027年公司营收将保持90%以上的高速增长,Non- GAAP毛利率有望提升至55%,净亏损率持续收窄。随着推理成本优化与新一代多模态模型落地,公司 有望在AI原生应用领域开辟更大市场空间。 消息面上,1月20日,MiniMax的AI原生工作台Agent2.0上线,其以Desktop App和Expert Agents两个核 心组件为载体。Desktop App注重执行力,可完成读取本地文件、操控浏览器、处理文档等工作任务; Expert Agents侧重于对业务场景的理解,核心逻辑是用户注入私有知识库,将其打造成专业领域的专 家,使得Agent执行任务并给出特定标准的高质量产出。 智通财经APP获悉,MINIMAX-WP(00100)盘中涨超12%,截至发稿,涨9.53%,报422.8港元,成交额 6.49亿港元。 ...
MINIMAX-WP盘中涨超12% MiniMax近日发布专家Agent桌面端及AI工作台
智通财经· 2026-01-27 13:48
公司股价与市场表现 - 盘中股价一度上涨超过12%,截至发稿时上涨9.53%,报422.8港元 [1] - 当日成交额达到6.49亿港元 [1] 产品与技术进展 - 公司于1月20日上线了AI原生工作台Agent2.0 [1] - Agent2.0以Desktop App和Expert Agents两个核心组件为载体 [1] - Desktop App注重执行力,能够完成读取本地文件、操控浏览器、处理文档等工作任务 [1] - Expert Agents侧重于对业务场景的理解,核心逻辑是用户注入私有知识库,将其打造成专业领域的专家,以执行任务并产出特定标准的高质量成果 [1] 行业地位与战略 - 在生成式AI浪潮席卷全球的背景下,公司以“反共识”的战略定力,聚焦模型智力突破,正从行业竞争中脱颖而出 [1] - 公司是上海首批获得大模型备案的企业 [1] - 公司凭借技术深耕与商业化远见,展现出强劲的发展潜力 [1] 财务与增长预测 - 中信建投预测,公司在2025年至2027年期间,营收将保持90%以上的高速增长 [1] - 同期,公司的Non-GAAP毛利率有望提升至55% [1] - 公司的净亏损率预计将持续收窄 [1] 未来展望 - 随着推理成本优化与新一代多模态模型落地,公司有望在AI原生应用领域开辟更大的市场空间 [1]
3D版Nano Banana来了!AI修模成为现实,3D生成进入可编辑时代
量子位· 2026-01-27 11:53
行业趋势与市场动态 - 2026年初,AI领域焦点从大模型、生图、生视频转向更具挑战性的3D生成领域[1] - 2025年1月,Google收购3D生成公司Common Sense Machines并与Epic Games合作,引发市场对3D版“Nano Banana”的猜测[1] - 3D生成行业产品化起步较晚、生态分散、工具链长,多数团队仍停留在“随机抽卡”阶段[19] 公司产品发布与核心功能 - 全球领先的3D生成平台Hyper3D发布Rodin Gen-2 Edit,推出基于自然语言的3D模型局部编辑功能[3] - 该产品是业内首个将“3D生成”与“3D编辑”整合为完整工作流的商用产品,标志着3D生成进入可编辑时代[3] - 产品支持两种核心操作路径:在平台内文/图生3D后直接对结果进行局部修改;或导入任意现有第三方模型进行编辑[4][5] - 操作逻辑简单直接:框选需要修改的区域并输入文字指令即可完成局部调整,修改区域与原模型衔接自然[4][9] - 编辑功能已成为平台级基础设施,支持任何第三方3D资产导入编辑,而非单点功能[9][11] 技术路径与产品意义 - 产品意义在于首次将3D从“结果展示”推进到“可迭代工作流”,补上了AI工作流的关键一环[14] - 生成式AI的进化路径清晰:先生成 → 再可控 → 最终可编辑[14] - 该产品通过“选中局部+文本指令”的方式,将修改需求转化为明确路径,避免了反复推倒重来的“抽卡”模式[20] - 产品编辑功能与强大的“可控性”体系相辅相成,为专业用户提供了一套完整的工作流[21] 技术积累与核心能力 - 公司选择更艰难的原生3D路线,而非行业早期普遍的“2D升维3D”路径,以解决产业应用的致命问题[24] - 2024年,公司发布原生3D大模型框架CLAY,并基于此推出全球首个原生3D大模型产品Hyper3D.AI Rodin[24] - 公司从Rodin第一个版本就引入3D ControlNet,并在每个版本更新相关能力[24] - 随着Rodin Gen-2上线,公司推出了业内唯一的递归分件技术——BANG[24] - 公司核心技术体系包括:3D ControlNet控制、BANG分件、Smart Low-poly智能低模优化、Text-to-Edit基于自然语言的定向修改[25] - 公司获得SIGGRAPH 2025最佳论文的CAST技术,指向从单图生成包含物体、关系和物理约束的完整3D场景的未来方向[26] 商业化与生态建设 - 产品已打通Blender、Maya、Unity等主流工作流[23] - 与国内头部大型UGC游戏的合作验证了其在移动端大规模用户场景下的稳定性[23] - 与拓竹的合作使生成模型可直接进入3D打印流程[23] - 仅2025年,公司就连续完成由顶级美元VC和战略产业方投资的两轮融资[27] - 新功能已在Hyper3D平台上线,支持用户免费体验[28]
对话DEEPX创始人:当AI芯片从云端走向现实物理世界
观察者网· 2026-01-27 10:08
公司核心定位与愿景 - 公司DEEPX是一家韩国AI芯片公司,致力于让AI从云端走向边缘,嵌入物理世界的各个角落[1] - 公司创始人金錄元将公司定位为“帮助人类向真正智能文明演进的公司”,其创立源于AI可能是人类克服缺乏智慧的终极解决方案的信念[2] 核心技术突破与优势 - 公司通过“黄油测试”直观展示了其芯片在运行相同AI负载时,相比竞品在功耗和散热方面的巨大优势[1] - 公司核心产品DX-M2芯片能在5瓦功耗下运行200亿到1000亿参数的大语言模型,功耗仅为手机充电器级别,实现了物理安装可行性[5] - 公司能效提升源于其“极简主义”哲学,深入研究AI数学运算本质,对处理器架构进行针对性剪裁与优化,而非简单依靠工艺进步[5] - 公司已建立坚固的专利护城河,在美国注册的NPU专利数量已超过高通、ARM、英特尔和英伟达,全球专利申请超过400项,保护了NPU的核心工作原理[5] 市场验证与商业落地 - 公司第一代芯片DX-M1已在全球获得超过50个量产项目,覆盖机器人、国防、智能家电等领域,成功跨越了从技术演示到商业落地的鸿沟[8][9] - 现代汽车机器人实验室将在2026年开始量产搭载公司芯片的MobED和DAL-e平台,初期预计出货1万台[11] - 韩国钢铁巨头POSCO同时推进9个量产项目,涉及工厂自动化、物流系统、工业事故监控及自动叉车等领域[11] - 与百度的合作预计在2026年将为中国市场出货约4万台芯片,应用于OCR相机、数据解析系统和无人机等场景[11] 产品价值主张与市场需求 - 公司芯片解决了GPU在边缘部署中的核心痛点:功耗、散热和成本 主流GPU运行AI推理需消耗300瓦以上功率,而公司芯片仅需5瓦[5] - 在POSCO的案例中,使用公司芯片后,芯片价格已低于人工成本,使得工厂自动化的大规模部署成为可能,而此前使用GPU方案时人工成本竟比GPU卡便宜[11] - 在与百度的合作测试中,公司芯片性能比300瓦的GPU卡高出近5倍,而功耗仅为5瓦,证明了AI从数据中心转移到边缘设备的可行性[11] - 通过对全球700多家公司的调研,公司理解到客户的关键需求是:在功耗和成本最多比现有方案高20-30%的前提下,达到GPU级别的性能 这一“20-30%原则”是技术成功商业化的关键[11]
微软新一代自研AI芯片“Maia 200”出鞘!推理狂潮席卷全球,属于AI ASIC的黄金时代到来
智通财经· 2026-01-27 09:38
微软推出第二代自研AI芯片Maia 200 - 微软重磅推出由台积电3nm制程制造的第二代自研AI芯片Maia 200,旨在为云端AI训练/推理提供高能效比与性价比的算力基础设施,作为英伟达AI GPU的替代方案[1] - Maia 200在多项测试中性能超越亚马逊第三代Trainium和谷歌第七代TPU,被微软官方称为“所有超大规模云计算服务商中性能最强的自研内部专属AI芯片”[3] - 该芯片每美元性能比微软当前最新一代硬件提升30%,在FP4精度下的整体推理性能是亚马逊第三代Trainium的三倍,FP8性能超过谷歌第七代TPU[5] Maia 200的技术规格与性能 - Maia 200采用台积电3nm工艺,包含超过1400亿个晶体管,在750瓦功耗下,FP4精度算力超过10 petaFLOPS,FP8精度算力超过5 petaFLOPS[5][6] - 芯片配备216GB、带宽达7TB/s的HBM3e存储以及272MB的片上SRAM,每块芯片提供2.8TB/s的双向专用扩展带宽,支持在6144个加速器集群中实现高性能集合操作[6] - 微软已向开发者开放Maia 200软件开发工具包的预览版,并计划未来向更多客户开放云端服务器租用,该芯片将用于支持微软下一代AI大模型训练、企业版Copilot及托管型AI推理服务[3][5] 云计算巨头加速自研AI ASIC芯片 - 生成式AI热潮推动亚马逊、谷歌、微软等云计算巨头加速开发内部专属的AI ASIC芯片,以打造更具成本效益和能效的算力基础设施[2] - 经济性与电力约束是推动科技巨头自研AI ASIC的核心动力,旨在优化“单位Token成本、单位瓦特产出”,应对AI数据中心不断增长的能耗需求[7] - 自研AI ASIC能为云计算巨头提供“第二曲线产能”,在采购谈判、产品定价与云计算服务毛利层面获得更大主动权,并实现从芯片到软件的一体化设计,提高算力利用率并降低总拥有成本[8] AI ASIC在推理侧的优势与行业趋势 - 相比于英伟达AI GPU,AI ASIC在云端AI推理算力需求猛增的背景下,凭借更高的性价比和能效比优势,正迈入更强劲的需求扩张轨迹[9] - AI推理侧更看重单位token成本、延迟与能效,谷歌将其最新TPU Ironwood定位为“为AI推理时代而生”的专用芯片,并强调性能、能效与性价比[10] - 谷歌TPU v7 (Ironwood) 的BF16算力高达4614 TFLOPS,是上一代TPU v5p(459 TFLOPS)的十倍,针对特定应用,其架构可提供比英伟达Blackwell高出1.4倍的每美元性能[9] 行业竞争格局与市场影响 - 英伟达面临来自云计算巨头自研AI ASIC的竞争压力,正通过多架构AI算力、巩固CUDA生态及引进人才(如与Groq合作)来维持其在AI芯片领域约90%的市场份额[11] - 摩根士丹利研报显示,谷歌TPU芯片的实际产量预期被大幅上修,2027年和2028年将分别达到500万和700万块,较此前预期分别上修67%和120%[12] - 报告测算,谷歌每对外销售50万片TPU,便有望带来130亿美元的额外营收以及0.40美元的每股收益,这可能预示着谷歌将开启TPU AI芯片的直接对外销售[12]