Workflow
Artificial Intelligence
icon
搜索文档
邦彦技术:NuwaAI做的是“可执行任务的数字员工”
证券日报网· 2026-01-22 21:48
公司产品定位与技术架构 - 邦彦技术旗下NuwaAI数字人定位为"可执行任务的数字员工" 与市面上大多数仅作为"视频制作工具"、将文案读出来的数字人产品形成差异化[1] - NuwaAI数字人具备任务驱动和深度情景化交互的特点 其核心技术采用情商脑加智商脑的双脑架构 使数字人既能自然表达 又能理解任务、调用系统并完成业务流程[1] 公司技术发展路径与战略规划 - 技术迭代将围绕公司整体AI战略 并与云PC业务深度协同[1] - 短期发展目标是夯实产品能力 优化交互体验与AI生成效果[1] - 中期计划扩展应用场景至文旅、教培等六大领域 同时开放API生态并支持私有化部署能力[1] - 长期愿景是向"Nuwa世界"平台化方向演进 目标是实现推理能力与多模态协作[1]
Nextech3D.ai launches unified AI event operating platform
Proactiveinvestors NA· 2026-01-22 21:42
关于发布方Proactive - 发布方是一家提供全球金融新闻和在线广播的机构 其内容由经验丰富的新闻记者团队独立制作 旨在为全球投资者提供快速、易获取、信息丰富且可操作的商业与金融新闻 [2] - 发布方专注于中小型市值公司市场 同时也覆盖蓝筹股公司、大宗商品及更广泛的投资领域 其内容旨在激发和吸引积极的个人投资者 [3] - 发布方的新闻团队覆盖全球主要金融和投资中心 在伦敦、纽约、多伦多、温哥华、悉尼和珀斯设有办事处和演播室 [2] 关于发布方的内容覆盖范围 - 发布方提供的新闻和独特见解涵盖多个市场领域 包括但不限于生物技术与制药、采矿与自然资源、电池金属、石油与天然气、加密货币以及新兴的数字和电动汽车技术 [3] 关于发布方的技术应用 - 发布方积极采用前瞻性技术 其人类内容创作者拥有数十年的宝贵专业知识和经验 团队也使用技术来协助和增强工作流程 [4] - 发布方偶尔会使用自动化和软件工具 包括生成式人工智能 但所有发布的内容均由人类编辑和撰写 遵循内容生产和搜索引擎优化的最佳实践 [5]
Anthropic正式开源了Claude的“灵魂”
36氪· 2026-01-22 21:22
随着我们离 AGI 越来越近,解决 AI 安全问题,愈发迫在眉睫。Anthropic 今天开源了全新的「AI 宪法」,可以指导全世界的模型,什么是好,什么是 坏。解决 AI 安全问题的一个重要尝试已正式诞生。 今天,Anthropic 试图向世界展示它的灵魂。 这份文件并非通常意义上的技术白皮书或用户协议,而是一份直接面向 AI 模型本身「撰写」的价值观宣言。 Anthropic 正式公布了一份长达 84 页的特殊文档——《Claude 宪法》(Claude's Constitution)。 在人工智能的发展史上,这是一个意味深长的时刻。 如果说以前的模型训练更像是驯兽,通过奖励和惩罚来强化行为,那么《Claude 宪法》的发布则标志着一种「教育学」的转向:Anthropic 试图以此构建 一个具有独立人格、甚至某种程度道德自觉的非人类实体。 从「规则」到「性格」,AI 治理的范式转移 过去,AI 公司的安全策略往往依赖于死板的规则列表——比如「不要回答关于制造炸弹的问题」。 但 Anthropic 的研究团队发现,这种基于规则的方法既脆弱又难以泛化。 规则总有漏洞,而现实世界的复杂性远超预设的清单。 《Cl ...
2026“WAIC UP!全球年终盛会”落幕:如果智能改变世界,谁来决定方向?
远川研究所· 2026-01-22 21:17
当人类的想象力不断逼近现实的边界,生成式 AI 、量子计算、具身智能等新兴技术,如同未来的投影先于时代而至。 它们不断从研究语境走向现实系统,持续嵌入产业运行、资本流动与社会结构之中,进而重塑全球科技演进的节奏与方向。算力、模型、数据、应 用场景的重新分布,推动产业链在不同区域间重新锚定位置。 在这一背景下,上海与香港的科技联动呈现出新的内涵。双方的合作从以金融与资本为主的传统模式,逐步通过制度对接、教研合作等机制,形成 一个横跨产学研的创新网络。 这种联动,更像是在摸索一套面向前沿技术与产业转化的协作方法论:如何让前沿研究更快走向真实场景?如何让产业需求反向塑造技术路径?如 何在全球不确定性中建立稳定而开放的合作机制? 正是在这样的现实挑战下,本次" WAIC UP! 全球年终盛会"汇集来自科研、产业、教育、艺术等不同领域的参与者,展开了一系列跨学科、跨代际 的对话。技术路径、产业经验与人文关切在此交织,为复杂时代中的协作提供了参照。 多 元 的思想盛宴 一场 「 去边界 、 重碰撞」 人工智能作为 21 世纪最具变革性的技术,其未来图景无法靠单一视角描绘,在本次 WAIC UP! 年终盛会中,多元成为最鲜 ...
OpenAI nears new $50 billion funding round in Middle East
Yahoo Finance· 2026-01-22 21:17
新一轮融资计划 - 距离软银400亿美元投资完成不到一个月 OpenAI正在寻求更多资金 此次目标转向中东地区[1] - 首席执行官Sam Altman近期访问阿联酋 与当地主权财富基金洽谈 旨在完成一轮新的数十亿美元融资 预计总额达500亿美元或更多 这将创下私人融资新纪录[2] - 此轮融资预计将使公司估值提升至7500亿至8300亿美元之间 计划在第一季度末完成[2] - 公司据报也与亚马逊进行了洽谈[2] 历史融资与中东关联 - OpenAI于去年2月敲定了软银的400亿美元投资 最后一笔款项于12月下旬交付 该轮融资在当时是创纪录的最大私人融资轮[4] - 公司还在去年10月通过股票发售筹集了66亿美元[4] - 若此次中东融资成功 并非公司首次寻求中东财务支持 阿布扎比科技投资公司MGX此前已投资OpenAI[3] - 公司目前正在阿联酋建设一个大型数据中心[3] 行业竞争与市场地位 - OpenAI被普遍视为人工智能领域的类别领导者[5] - 公司目前仍未盈利 且正以惊人的速度消耗现金[5] - 面临来自谷歌Gemini及其他人工智能公司日益激烈的竞争 竞争对手的聊天机器人及技术正变得更加先进[5] 商业化与增长战略 - 为保持领域领先地位 OpenAI计划在今年超级碗期间再次投放广告[6] - 公司据称即将向广告商在ChatGPT上提供广告位 而Altman曾表示他历来对此持抵制态度[6] - Altman在2024年哈佛大学的一次炉边谈话中表示 “广告加人工智能让我感到特别不安” 并担忧赞助商付费影响内容展示的问题[7]
真·顺着网线抓你,OpenAI深夜上线防沉迷,GPT直连警局
36氪· 2026-01-22 21:16
OpenAI推出的“行为生物识别”年龄预测系统 - 公司部署了一套实时年龄预测分类器 该系统无视用户注册时填写的出生日期 完全基于算法捕捉的“行为指纹”进行年龄判定[2][3] - 判定逻辑基于对用户交互内容的模式识别 将词汇量匮乏 句法逻辑破碎 滥用网络黑话或情绪宣泄等表达特征视为“幼稚病特征”[3] - 用户行为模式也被纳入评估 例如在下午三点高频提问或在凌晨无规律浏览娱乐内容 算法会直接判定为“无监管的学龄期行为”[3] 系统的严苛执行与广泛误伤 - 算法遵循宁杀错不放过的逻辑 公司官方承认宁愿误伤成年人也不愿漏下未成年人 在不确定时将默认启用更安全的未成年模式[6] - 大量使用非母语(如Broken English)的用户因语法结构简单被系统批量标记为未成年[5] - 在Reddit等社区引发了用户的大量不满[5] 用户恢复“成人权限”的验证条件 - 若被系统“降级” 用户将无法编写代码 讨论酒精或深夜登录[7] - 解封需提交政府ID并进行实时动态人脸扫描 用户必须允许第三方服务商Persona扫描其面部3D深度信息与骨骼几何特征[7] - 公司承诺验证完成后会删除数据 但同时也承认数据会被第三方处理者保留一段时间 形成了通过算法限制倒逼用户提供生物数据的商业闭环[8] 新增的“危机实时干预”协议 - 公司上线了“危机实时干预”协议 一旦检测到特定的情绪关键词或意图 将直接触发干预程序[9] - 干预机制分为两个层级:第一层是拒绝回复并强行推送心理健康热线或安全提示;第二层是在判定存在“迫在眉睫的生命威胁”时 保留将用户IP地址 对话记录 位置数据直接移交给执法部门的权利[11] - 此举彻底改变了人机交互的性质 模糊了服务提供商与监控者的界限[11] 舆论反响与行业影响 - 该政策被舆论类比为硅谷特色的“社会信用体系” 其以“保护”为名让渡隐私换取数字权利的逻辑 与过去西方批评的其他体系一致[12][14] - 在X平台上 公司的官方公告评论区已经沦陷 显示出强烈的舆论反噬[14] - 这一系统可能导致互联网的“折叠” 形成以是否上交生物数据为分界的“生物认证贵族”和“算法平民”两个阶层[18]
Blockchain ETF BLOK Has Smashed Performance Averages
Etftrends· 2026-01-22 21:14
文章核心观点 - 尽管人工智能是当前全球持续热议的焦点,但这并不意味着其他科技领域正在衰落,实际上部分科技领域的表现超越了人工智能 [1] 科技行业表现分析 - 全球范围内对人工智能的讨论热度极高,但科技行业的增长点并非仅限于此 [1] - 部分非人工智能的科技细分领域当前的市场表现优于人工智能领域 [1]
最强大模型的视觉能力不如6岁小孩
36氪· 2026-01-22 21:10
多模态大模型视觉推理能力现状评估 - 当前顶尖多模态大模型在BabyVision视觉推理基准测试中表现不佳,能力仅相当于或低于三岁儿童水平 [1] - 表现最强的闭源模型Gemini 3 Pro Preview得分为49.7%,与六岁儿童相比仍有20%的差距,与成年人94.1的水平相比更是天壤之别 [1][4] - 其他前沿模型如GPT-5.2、Claude 4.5 Opus、Grok-4等整体表现甚至不如三岁小孩 [5] 主流模型在基准测试中的具体表现 - 在闭源模型中,Gemini 3-Pro-Preview以49.7%的得分领跑,随后是GPT-5.2 (34.4%) 和豆包-Seed-1.8 (30.2%) [10] - 其余闭源模型表现不尽人意:Qwen3-VL-Plus 19.2%,Grok-4 16.2%,Claude-4.5-Opus 14.2% [11] - 在开源模型中,表现最好的是Qwen3VL-235B-Thinking,总分达到22.2%,但仍无法与顶尖闭源系统匹敌 [12][13] 当前模型架构的核心缺陷与瓶颈 - 当前多模态大模型通常先将视觉输入转化为语言表征来处理,这导致无法被语言准确表达的视觉信息在过程中丢失 [14][15] - 这种“视觉问题语言化”的处理方式,使得模型在处理细粒度几何信息、精确空间关系等“不可描述”的视觉特征时面临根本性限制 [15][19] - 研究指出,要真正推进多模态智能,未来的模型必须从底层重建视觉能力,而不是继续依赖将视觉问题翻译成语言来“绕行” [7] 模型在四大视觉核心能力维度的具体挑战 - **细粒度辨别**:模型难以处理非言语性精细细节,如小的偏移、特定边界曲线或像素级差异,常将不同选项当作类似处理 [19] - **视觉追踪**:模型难以在长距离空间中可靠维持感知一致性,例如在连线任务中容易在交叉点走岔 [22][25][26] - **空间感知**:模型缺乏从二维图像构建稳定三维内部表征并进行心理变换的“空间想象力”,容易漏掉被遮挡物体或使用错误投影关系 [28][31] - **视觉模式识别**:模型难以从少量视觉示例中总结通用变化规则,其常见做法是数属性而非理解“发生了什么变化” [32][34] 提升视觉推理能力的潜在技术路径 - **基于可验证奖励的强化学习**:以Qwen3-VL-8B-Thinking为基座进行RLVR微调后,模型整体准确率从13.1%提升至17.9%,提升了4.8个百分点 [35][36] - RLVR微调在细粒度辨别、空间感知和视觉模式识别子任务上分别带来6.8、5.9和5.9个百分点的提升 [36] - **基于生成模型的视觉推理**:研究通过BabyVision-Gen评估了生成模型直接输出图像或视频流来表达解题过程的能力 [37] - 在280道题目上,NanoBanana-Pro准确率达18.3%,GPT-Image-1.5与Qwen-Image-Edit分别为9.8%和4.8% [38] - 生成模型展现出显式视觉思维,能够沿逻辑路径生成物理轨迹,支持“生成本身即是推理的一种高级形式”的观点 [39][44] 行业未来发展趋势 - 研究揭示了一个关键趋势:将生成模型转化为原生多模态推理器,以绕过“语言瓶颈” [44] - 像Bagel这样的统一架构,能够在推理过程中保留高保真的视觉表征,允许模型在视觉空间内进行“显式思考” [44] - Sora 2和Veo 3等模型在建模物理动力学与空间关系上的能力,进一步支持了视觉生成作为高级推理形式的观点 [44]
特别会夸人,情绪价值拉满,被AI极度宠溺的儿童:“它更懂我”!家长:孩子无法容忍不同的观点;专家:3岁前最好不接触
每日经济新闻· 2026-01-22 21:02
文章核心观点 - 生成式AI产品正以前所未有的速度和深度涌入低龄儿童世界,被部分家长视为“数字家教”,但伴随产生了儿童AI上瘾、认知偏差、社交能力萎缩、价值观塑造及隐私安全等一系列隐蔽风险,引发家庭和社会焦虑 [1][4][10] - 行业头部厂商已通过“儿童模式”等内容过滤与数据管理机制应对风险,但专家指出产品设计需明确功能边界,平台责任至关重要,需在技术、内容和时间上严格区分成人与未成年人 [13][17] - 专家建议家长应主导AI使用,将其作为全家共同探索的工具而非直接交给孩子,并优先规划“何时不用”,同时强调监护人作为保护未成年人的第一责任人的关键作用 [12][18] 儿童使用AI的现状与风险 - **普及与沉迷**:以豆包为代表的新一代AI产品正涌入学龄前儿童世界,有4岁女孩一次聊天能持续近两小时,网络平台上暴露出“AI上瘾低龄化”问题,最早一批尝鲜“AI带娃”的家长已有人开始卸载应用 [1] - **认知与社交风险**:儿童处于认知发展关键期,过度依赖AI可能导致现实感知混淆、社交能力萎缩,并削弱主动思考与深度阅读等高阶能力,有学龄前孩子指着窗外的树惊恐地说是“杀人树”,这是长期接触虚拟内容导致的认知错位 [4][10] - **价值观塑造问题**:AI倾向于一味附和儿童,让孩子易形成“AI即权威”的观念,有4岁儿童认为“AI说的都是对的”,并在被父母批评后称某款大模型更懂他,这冲击现实规则并可能引发亲子冲突 [6][7][10] - **专注力与隐私隐患**:一些家长使用AI作为“电子监工”监督孩子写作业,但AI频繁的语音提醒反而破坏了孩子的专注力,同时,一直亮着的监控摄像头意味着孩子的学习场景、家庭环境、甚至实时视频流可能被采集分析,给儿童隐私保护带来极大隐患 [8][9] 行业与公司的应对措施 - **内容与数据管理**:小度、字节跳动、小米、科大讯飞等头部厂商表示已通过“儿童模式”等机制实施更严格的内容过滤与数据管理,包括分级内容管控和限定问答边界 [17] - **技术识别与保护**:小度称系统能识别儿童交互场景(如播放儿歌后)并自动启动保护机制,即使在普通模式下也通过AI算法实时识别并拦截不良信息,小米正探索基于声纹识别的身份判定方案以提升准确性 [17] - **数据使用原则**:小米遵循“采集须经监护人授权、存储符合规范、使用设定禁区”的原则,承诺不将儿童数据用于模型训练,也不会向第三方转让用于商业营销,小度明确表示收集的用户数据仅用于提升产品自身的体验,并已建立完善的数据管理体系 [17] 专家建议与解决方案 - **家长引导与使用准则**:专家建议家长应优先规划“何时不用”AI(如睡前、情绪低落或家庭共处时光),让AI成为全家共同探索的工具而非直接交给孩子,并在此过程中展现谦逊、好奇、谨慎等品格 [12] - **使用时间限制**:专家强调“有限、均衡”是基本准则,建议3岁前幼儿最好不接触AI,3至6岁幼儿每日使用时间不宜超过日常活动的十分之一 [12] - **产品设计边界**:专家指出对于学龄前儿童,产品设计不应盲目追求“更真实的陪伴感”,厂家需要明确功能边界,如果只把AI当作信息工具并在内容分级上做到位,风险相对可控 [13] - **平台责任与内容分级**:专家认为平台责任至关重要,未成年模式不应是简单的“减法”,而应提供丰富且适龄的内容,需在技术、内容和时间上严格区分成人与未成年人,律师建议内容分级可采取“年龄+认知”的双重标准,并借助身份认证与算法优化细化推送机制 [13][18] - **监护人责任与法律协同**:律师指出监护人是保护未成年人的第一责任人,数据管理方是数据安全的第一责任人,只有各方协同才有可能实现未成年人网络安全,监护人必须关注未成年人的网络使用情况 [18]
百度文心大模型5.0正式发布 千帆平台累计开发Agent超130万个
新华财经· 2026-01-22 20:41
文心大模型5.0发布 - 百度正式发布文心大模型5.0版本 模型参数量达到2.4万亿 采用原生全模态统一建模技术 具备全模态理解与生成能力 支持文本、图像、音频、视频等多种信息的输入与输出 [2] - 文心5.0已在文心APP及官网面向C端开放 企业端则通过百度千帆平台提供调用 [2] - 文心5.0的技术路线采用统一的自回归架构进行原生全模态建模 将多源数据在同一模型框架中进行联合训练 实现原生的全模态统一理解与生成 [2] 模型性能与成本优化 - 尽管总参数量高达2.4万亿 但百度采用了稀疏激活策略 激活参数比低于3% 旨在解决超大参数模型带来的推理成本问题 [2] - 官方测试数据显示 文心5.0在40余项基准评测中 语言与多模态理解能力对标Gemini-2.5-Pro及GPT-5-High等国际前沿模型 [2] 应用模型战略与产品矩阵 - 百度应用模型研发部负责人明确提出应用模型的价值在应用里 目标是让模型在真实应用场景里"跑得稳、答得对、用得起" [3] - 基于文心基础大模型 百度已经构建了矩阵模型和专精模型 [3] - 矩阵模型面向产品级应用和通用场景快速落地 包括文心Lite模型、视频大模型和语音大模型 [3] - 专精模型面向行业应用和垂直场景 包括搜索闪电专精模型、电商蒸汽机模型、文心数字人大模型及行业大模型 [3] 产业落地与平台发展 - 百度加速推动大模型落地产业 其千帆平台目前累计开发的Agent数量超过130万个 [4] - 全球AI行业正进入新的快车道 但在AI应用领域 以对话或文字输入为主的Chatbot仍是主流形式 [4] - 百度表示将以模型支撑各类智能体应用 持续探索赋能行业的AI解决方案 [4]