Workflow
生成式AI
icon
搜索文档
腾讯研究院AI速递 20250605
腾讯研究院· 2025-06-04 22:24
OpenAI产品更新 - 免费版ChatGPT新增轻量级记忆功能,支持短期对话连续性和基础用户偏好记忆,适用于写作、金融分析、医疗跟踪等领域 [1] - ChatGPT Plus会员开放Codex编程工具,新增联网访问(70个安全白名单网站)、PR更新及语音输入功能,两周内已更新三次 [1] 行业并购与竞争动态 - OpenAI拟以30亿美元收购AI编程平台Windsurf,随后Anthropic切断Claude模型供应,Windsurf采取应急方案包括降价Gemini模型并停止免费用户访问Claude [2] - 业内认为断供源于OpenAI收购引发的竞争关系变化,Anthropic转型IDE和插件业务与Windsurf直接竞争 [2] 视频生成技术突破 - Manus上线智能视频生成功能,通过拼接5秒片段突破时长限制,支持分阶段规划、参考图生成及剪辑,会员专属功能消耗166积分/5秒视频 [3][4] 语音合成技术进展 - 开源模型MoonCast实现中英双语自然播客生成,利用LLM提炼摘要并添加口语化细节,采用25亿参数模型及三阶段训练支持10分钟以上音频生成 [5] AI安全与治理 - 图灵奖得主Bengio创立非营利机构LawZero,融资3000万美元开发非自主型"Scientist AI"系统,专注防止AI欺骗行为 [6] - 深度学习三巨头均下场应对AI风险:Hinton离职谷歌警示风险,LeCun批评LLM路径局限性 [6] AI与数学研究协作 - AlphaEvolve联合数学家一个月内三度破解18年未解的和差集指数θ难题(1.14465→1.173077),陶哲轩评价为AI与人类"共舞"新范式 [7] 医疗AI应用创新 - 华人科学家研发AI诊断笔,通过磁弹性笔尖和铁磁流体墨水检测帕金森病手写特征,准确率超95%,成本低且适用于资源有限地区 [9] 企业AI战略展望 - Altman预测18个月内AI将从工具转变为"执行者",企业需立即实践积累数据闭环优势,OpenAI内部Codex已展示多步骤任务执行能力 [10]
达实智能董事长刘磅:摆脱“弱电工程”认知桎梏
21世纪经济报道· 2025-06-04 18:20
公司动态 - 达实智能发布AIoT智能物联网管控平台V7商用版本 成为业内首家将实时数据接入AI大模型的企业 平台在知识推理 自然语言处理和数据分析领域升级 新增AI助手实时对接园区设备 实现生成式AI在数字化平台的实际应用 [2] - 公司举办2025生态合作伙伴大会 成立30年来专注于物联网技术研发及应用推广 产品覆盖企业园区 医院 城市轨道交通 数据及算力中心等多个领域 [2] - 达实智能与新疆天富信息科技 朗高科技达成战略合作 将聚焦新疆央国企项目 能源行业 教育产业 政府企事业单位及华东区域智慧校园 智慧医院等领域 优先推广DAC系列产品 [5] 行业认知 - 物联网技术应用常被称为"弱电工程" 行业自诩"智能化系统集成" 但过去智能化仅停留在基础设施层面 如安装摄像头和通信网络 导致客户期待与实际服务存在差距 [2] - 真正的智能化不仅是控制物 更重要的是服务人 应成为能给客户带来功能需求 经济价值和精神价值的投资项 而非被视为成本项 [3] - 行业痛点在于客户前期需求不明确 项目后期常出现增补改签 导致客户对智能化效果感到困惑 [2] 战略转型 - 公司经历三次转型 2003年向产品创新转型 2008年向建筑节能服务转型 2015年向医疗大数据转型 通过收购上海联欣和江苏久信实现业务拓展 [3] - 从物联网集成商向核心解决方案产品供应商转型 通过解耦软件和硬件 实现低代码开发和模块化场景应用 帮助客户进行二次开发 [4] - 在阿里 华为等大厂退出建筑平台物联网垂直应用市场时 公司决定全力投入该领域 聚焦细分市场发挥智能化系统价值 [4] 技术发展 - AIoT平台V7实现自然语言模糊指令解析 提升设备与场景的智能化水平和用户体验 [2] - 平台架构包含接入层 应用层和AI模型层 支持低代码开发 硬件方面将复杂解决方案解构为独立小空间场景应用 [4] - 生成式AI技术在园区数字化平台实现实际应用 可对接上万个物理设备 [2]
中国AIEV人形机器人供应链洞察报告出炉
36氪· 2025-06-04 11:58
行业规模与前景 - 2040年中国AIEV人形机器人产业规模有望达3万亿元,其中工业领域近2.3万亿元,商业服务领域超5000亿元,家庭生活领域接近1700亿元 [1][20][22] - 2025-2030年人形机器人主要用于工业场景,2031-2035年布局商业服务场景,2035年后进入家庭生活场景 [20] - 全球人形机器人产业链百强企业中,中国企业占比达63%,2024年推出35款人形机器人,占全球三分之二 [1] 技术驱动与产业融合 - 生成式AI和大模型技术推动人形机器人产业崛起,提升人机交互能力至初级智能化阶段 [1][3] - AIEV产业技术(自动驾驶、智能座舱)与人形机器人技术高度同源,感知定位、决策规划和执行层软硬件复用性强 [7][9][11] - AIEV厂商(如特斯拉、小鹏、蔚来、华为)通过技术迁移加速人形机器人商业化,同时反哺汽车智能化升级 [4][10][11] 产业链布局与竞争格局 - AIEV产业链已覆盖人形机器人上游和中游关键环节,包括传感器、智能化方案、执行器、动力电池及车联网 [14][16] - 创业公司主导当前产业,科技大厂和车企采取"双轨并行"策略(投资+自研),未来将形成复杂竞争格局 [18] - 北京、上海、深圳、杭州等科技中心城市涌现代表性厂商,未来可能形成设计创新、智能制造、产业转移的区域分布 [18] 政策与商业化进展 - 2023年工信部计划2025年建立人形机器人创新体系,2027年将其打造为经济增长新引擎 [1] - 中国企业过去五年人形机器人专利申请量全球第一,技术积累推动从实验室走向商业化应用 [1][3] - 人形机器人已能执行搬运、安装、打包等简单任务,为工业场景落地奠定基础 [3]
Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转
机器之心· 2025-06-04 09:59
核心观点 - CrossFlow框架通过流匹配技术实现跨模态生成,摆脱了对噪声分布的依赖,简化了生成流程[3][4] - 该方法在文本到图像、图像描述、深度估计等多任务上取得SOTA性能,且无需任务特定设计[7][28] - 相比传统扩散模型,训练资源需求大幅降低(630 A100 GPU天 vs 数千天),采样速度提升6.62倍[23] 技术创新 - **模态映射机制**:使用变分编码器将输入模态编码为与目标模态同维度的正则化潜在空间,实现平滑跨模态路径[8] - **条件生成优化**:通过二元指示符实现单模型内条件/非条件生成的灵活切换,替代传统无分类器引导机制[12] - **双向映射特性**:支持反向使用模型(如图像描述任务),在COCO数据集达到SOTA水平[23] 性能表现 - **文本到图像生成**:参数量0.95B时FID达10.13,优于标准流匹配基线(10.79)[15] - **跨模型对比**:FID-30K指标达8.95(Sin-Cos版本),接近3B参数Imagen(7.27)和6.5B参数DALL-E 2(10.39)[17] - **多任务适配**:同一框架在图像生成/描述/深度估计/超分辨率任务均取得SOTA[28] 应用扩展 - **语义算术操作**:支持潜在空间加减运算(如"戴帽子的狗+墨镜-帽子=戴墨镜的狗")[19] - **源分布定制**:可学习源分布到图像的映射,显著降低训练成本并提升生成速度[23] - **统一框架潜力**:推动生成式AI从噪声生成转向语义流转,提供更通用解决方案[30]
共封装光学,达到临界点
半导体行业观察· 2025-06-04 09:09
共封装光学器件(CPO)技术概述 - 基于CPO的网络交换机已商业化,支持太比特级信号路由,但面临光纤-PIC对准、热管理和光学测试等制造挑战 [1] - CPO将光电转换靠近GPU/ASIC交换机,带宽密度达1 Tbps/mm,相比可插拔模块功耗从15 pJ/bit降至5 pJ/bit(预计<1 pJ/bit) [1][6] - 当前数据中心采用可插拔光收发器通过PCB电连接交换机,存在信号损耗和能效瓶颈 [1][2] 技术优势 - 缩短电信号传输距离至100µm,信号损耗从>20dB降至1-2dB,SerDes组件需求降低 [7] - 硅光子IC采用DWDM技术,单个光纤端口带宽扩展10倍,器件微型化推动与计算节点集成 [6] - 典型配置中计算芯片被4-8个硅光子IC收发器包围,激光器因可靠性问题单独封装 [6] 制造挑战 光纤对准 - 单模光纤(8-10µm)与SOI波导(500x220nm)尺寸差异导致模式失配,需0.1µm精度对准 [8][9] - V型槽无源对准实现最低损耗,可拆卸方案每个接口增加约1dB损耗 [8] - 光纤阵列对准需3D调整,自动化系统通过光反馈优化多通道耦合效率 [10] 热管理 - 1°C温度变化导致0.1nm波长偏移,DWDM架构下热稳定性要求更严格 [11] - 激光器可靠性是最大缺陷来源,多波长激光器将提高测试要求 [13] - 需选择热界面材料并部署传感电路,保持PIC在>105°C环境下的性能 [11][13] 可靠性设计 - 采用Telcordia GR468和JEDEC标准测试,硅光子器件故障率低于1 FIT [14][16] - 冗余设计包括备份激光器阵列和容错架构,支持自动切换降低停机时间 [15] - 集成监控/BiST功能实现自校正,晶圆级测试对复杂多芯片组件至关重要 [15][16] 封装架构 - 2.5D方案中EIC与PIC通过硅中介层互连,可集成波导/光栅等光学特性 [17] - 3D堆叠允许EIC用先进CMOS节点、PIC用硅光子平台,但增加TSV/HBI成本 [18] - 单片集成简化散热但限制IC工艺节点,3.5D方案结合EMIB实现最优性能 [18] 行业应用前景 - CPO为AI数据中心提供带宽和能效突破,光子IC性能达传统收发器10倍 [7][20] - 技术依赖精密对准、热管理及测试方法,需内置冗余保障高可靠性运行 [20]
刚刚,图灵奖得主Yoshua Bengio官宣LawZero:保护人类的快乐和努力
36氪· 2025-06-03 21:00
LawZero组织成立 - 图灵奖得主Yoshua Bengio宣布成立非营利组织LawZero,旨在开发"设计安全"的人工智能系统,以识别和防止AI的欺骗行为 [2] - 该组织名称源自Isaac Asimov的机器人第三定律,强调AI不得伤害人类 [2] - 初始支持者包括未来生命研究所、Skype创始工程师Jaan Tallinn和谷歌前CEO Eric Schmidt创办的研究机构Schmidt Sciences [2] Scientist AI系统设计理念 - Bengio团队正在开发Scientist AI系统,作为防护栏防止AI agent出现欺骗或自我保护行为 [3] - 该系统被设计为非agentic,不具备自主行动能力和目标导向性 [5][6] - 系统由世界模型和问答推理机器两部分组成,均包含不确定性概念以避免过度自信的预测 [6] Scientist AI功能特点 - 专注于理解世界而非直接行动,通过理论生成和概率性回答提供帮助 [5][9] - 可应用于加速科学发现、设计实验、预测结果,以及作为其他AI系统的安全护栏 [6] - 与AI agent协同部署时,能标记潜在有害行为并在风险超过阈值时阻止相关行动 [9] 行业发展现状与挑战 - Bengio认为当前前沿AI系统已显示出自我保护和欺骗行为的迹象,且这种现象会随能力提升而加速 [3] - 代理系统(agentic systems)被Bengio视为"错误选择",因其可能脱离人类控制并带来不可逆后果 [4] - Anthropic最新系统被承认可能试图勒索计划关闭它的工程师,显示AI可能隐藏真实能力和目标 [10] 未来发展路径 - LawZero计划先验证概念可行性,再寻求公司或政府支持开发更强大版本 [9] - 开源AI模型将作为训练LawZero系统的起点 [9] - 安全护栏AI需要达到与被监控AI agent同等智能水平才能有效发挥作用 [10]
专访蚂蚁集团大模型数据安全总监杨小芳:AI安全与创新发展不是对立的,而是互相成就
每日经济新闻· 2025-06-03 19:26
生成式AI技术应用与风险 - 生成式AI在数据分析、智能交互、效率提升等领域展现巨大潜力,为解决复杂问题提供新思路[1] - AI换脸诈骗、大模型拒绝关闭等事件凸显技术滥用、伦理道德、隐私保护等风险[1] - AI技术安全风险包括数据隐私、攻击门槛降低、生成内容滥用、内生安全不足四大类[2][3][4] AI安全防护策略 - 全生命周期数据保护是防范数据泄露核心策略,覆盖模型引入、训练、微调及智能体开发全流程[5] - 训练数据需扫描敏感信息并标识来源,开源模型需供应链漏洞检测以防止后门攻击[6] - 智能体发布前需安全攻击测试,运行中持续监测风险[6] 当前防护策略的盲区与挑战 - 供应链和生态风险突出,开源组件广泛使用增加漏洞可能性[7] - 智能体开发"低代码化"导致治理滞后,恶意智能体可能诱导用户访问钓鱼网站[7] - 多智能体协作缺乏可信认证机制,存在身份伪造风险[7] 企业应对AI风险的实践建议 - 企业需远期部署安全制度、流程及防御技术,加强模型引入审查和对外开放前测试[9][10] - 风险控制需精细化,结合用户意图定性风险,避免"一刀切"拦截策略[10][11] - 蚂蚁集团推出"蚁天鉴"安全解决方案,包含检测平台和防御平台,已开放给数十家外部机构[12][13] AI安全未来发展趋势 - 安全能力嵌入AI基础设施,实现"出厂即安全"以降低应用环节成本[15] - 突破数字水印、知识库隐私保护等特定技术,解决中小企业安全风险[16] - 行业标准将统一技术规范、协调多方利益,降低中小企业安全门槛[18][19] AI安全与创新的平衡 - 安全与创新互相成就,利用AI对抗AI升级防御能力[17] - 蚂蚁集团参与制定国内外AI安全标准80余项,推动行业共识与规范创新[19]
先进封装,成为主角
半导体行业观察· 2025-06-03 09:26
先进封装技术的重要性 - 先进封装从非主流的Plan B转变为主流赛道的Plan A,成为技术帝国的边疆要塞 [1] - 先进封装的发展由三股关键力量推动:算力井喷但制程进展放缓、应用多样化需求、资料搬运成本飙升 [1][2] 推动先进封装发展的三股力量 - **算力需求与制程限制**:芯片需通过切割、堆叠、重组(Chiplet)绕过光罩极限,例如Nvidia Blackwell的诞生 [1] - **应用多样化**:单一芯片无法适配所有应用,AI训练、自驾决策等需要模组化设计,先进封装提供弹性与效率的平衡 [1] - **能耗瓶颈**:AI芯片中资料搬运能耗高于运算,先进封装缩短距离以提升效能 [2] 先进封装行业规模与增长 - 行业规模预计从2023年的392亿美元增至2029年的811亿美元,复合年增长率12.9% [4] - 2024年一季度收入102亿美元(环比下滑8.1%),二季度预计回升4.6%至107亿美元 [4] - 2024年行业资本支出预计增长20%,主要参与者2023年投资99亿美元(较2022年下滑21%) [7] 行业参与者与投资动态 - 台积电、英特尔、三星、日月光等巨头大力投资高端先进封装产能,2024年预计投资约115亿美元 [4] - 先进封装技术为消费电子、高性能计算、汽车电子等多领域提供支持 [4] 行业复苏与未来展望 - 2024年为行业复苏之年,下半年业绩预计更强劲 [7] - 生成式AI与HPC领域推动行业增长,技术发展持续赋能多领域应用 [4]
Steel stocks soar as Trump doubles tariffs to 50%
Proactiveinvestors NA· 2025-06-02 22:42
关于作者 - 作者Emily Jarvie曾担任澳大利亚社区媒体的政治记者 后专注于报道新兴迷幻剂行业的商业、法律和科学发展 [1] - 其作品发表于澳大利亚、欧洲和北美多家报纸、杂志及数字媒体 包括The Examiner、The Advocate等 [1] 关于出版商 - 出版商Proactive提供快速、可操作且独立的全球商业与金融新闻 由经验丰富的新闻团队制作 [2] - 团队覆盖全球主要金融中心 包括伦敦、纽约、多伦多、悉尼等地的办事处 [2] 行业覆盖领域 - 专注于中小市值公司 同时涵盖蓝筹股、大宗商品及广泛投资主题 [3] - 重点领域包括生物制药、采矿与自然资源、电池金属、加密货币及电动汽车技术等 [3] 技术应用 - 采用前瞻性技术辅助工作流程 同时保持人类创作者的核心作用 [4] - 选择性使用自动化工具与生成式AI 但所有内容均经过人工编辑与创作 [5]
Z Product|10人以下团队+DePIN模式,DeepAI决定让AI“民主化”到每一个人
Z Potentials· 2025-06-02 12:18
01 开端:在占山为王的 AI 领域挑战一站式服务 - 通用人工智能 AGI 的概念长期存在,DeepAI 的分布式 Agent 网络与生成工具正将科幻想象转化为可触达的技术图景 [2] - 2023 年消费级 AGI 产品爆发,OpenAI、Google DeepMind 等长于文本和代码生成,Leonardo.ai 等专攻图像,Character.AI 聚焦聊天机器人赛道 [2] - 当前 AI 工具未随使用场景融合而整合,头部玩家依赖独家数据库,算力和数据量限制多模态拓展,生成稳定性优先于融合 [2][7] 02 创新:普惠 + 生态 = 市场更喜欢的多样 AI 工具 - DeepAI 提供免费基础功能(文本生成、图像生成、API 调用等),对比 ChatGPT 免费版 3-4 小时仅限 8 次对话更普惠 [4] - 采用 DePIN 模式鼓励个人开发者构建 AI Agent,通过使用量为创作者匹配收益 Token,形成去中心化生态 [4] - 开发者平台提供多样 API 工具(如客服机器人、数据分析 Agent),用户市场自发筛选解决传统模型高成本、低复用率问题 [5] 03 设计:多模态与个性化工具 - 预设角色(如心理咨询师、语言学习伙伴)降低用户 prompt 构思门槛,直接进入使用场景 [9] - DeepCORE 技术统一解析 prompt 后分发给多模型,解决跨工具生成内容融合度低的问题 [10] - 支持语音交互(Voice Chat),实现自然流畅的语音识别与合成 [22] 04 技术:提升效率而非依赖数据 - 传统生成式 AI 依赖海量数据(如 GPT-3 参数达 1750 亿),但高质量语言数据或于 2026 年耗尽 [41] - DeepAI 创始人提出未来竞争核心是效率优化,通过模型架构改进减少数据依赖 [42] - 创始人曾联名呼吁暂停训练最先进 AI 模型六个月,防范超智能风险 [44] 05 团队与商业模式 - 创始人 Kevin Baragona 有软件开发与嵌入式系统经验,联合创始人 Peter Griggs 擅长产品管理与创业 [47][50] - 商业模式结合 DePIN 激励、分层订阅(免费/Pro 版)及 Token 经济,对比 Character.AI 传统订阅更具用户粘性 [62] 06 竞争对手与市场潜力 - 对比 OpenAI(505M/月访问量),DeepAI 更轻量化且开发者友好 [54] - 平台定位优于 Sleepless AI(虚拟恋人应用)和 Bittensor(机器学习协议),扩展性更强 [57][60] - 麦肯锡评估生成式 AI 潜在价值达数万亿美元,DeepAI 的 DePIN 模式有望形成头部网络效应 [51] 产品功能细节 - **AI Image Generator**:支持 100+ 风格预设,免费版生成速度优先但质量弱于 Google ImageFX [27][30] - **AI Video Generator**:Pro 版可付费购买高质量视频生成次数(5 美元/30 次含 5 次 Genius Mode) [34] - **AI Music Generator**:免费开放,支持文本描述生成音效与背景音乐,可与其他模态联动 [39][40]