视觉

搜索文档
富煌钢构: 华泰联合证券有限责任公司关于本次交易产业政策和交易类型的核查意见
证券之星· 2025-05-26 23:16
交易概述 - 公司拟通过发行股份及支付现金方式收购合肥中科君达视界技术股份有限公司100%股份,并向不超过35名特定投资者募集配套资金 [1] - 交易涉及17名交易对方,包括富煌建设、孟君、吕盼稂、富煌众发等 [1] 行业属性核查 - 标的公司属于"C40仪器仪表制造业"之"C401通用仪器仪表制造"子类,具体为"C4019其他通用仪器制造" [1] - 标的公司主营业务为高速视觉感知和测量技术,专注于高速图像采集、分析与处理仪器及系统的研发、生产和销售 [1][2] - 经核查确认标的公司不属于《监管规则适用指引——上市类第1号》规定的快速审核通道行业(如新能源、生物产业等19类产业) [1][2] 交易类型分析 - 上市公司主营业务为钢结构加工制造(重型/轻型钢结构、实木复合门等),与标的公司的科学仪器业务无直接关联 [2] - 本次交易不属于同行业或上下游并购 [2] - 交易不构成重组上市,因控股股东(富煌建设)及实控人(杨俊斌)在交易前后均未变更 [2] 交易方案细节 - 交易包含发行股份及现金支付两种方式 [3] - 配套融资计划向不超过35名特定投资者发行股份 [3] 合规性核查 - 上市公司未被中国证监会立案稽查且无未结案情形 [4]
《科学智能白皮书2025》发布,中国引领AI应用型创新领域
第一财经· 2025-05-26 21:27
全球AI科研发展趋势 - 中国AI论文引用量占全球40.2%,快速追赶美国(42.9%)[1][8] - 全球AI期刊论文数量十年激增近三倍,从30.89万篇增至95.45万篇,年均增长率14%[7] - 科学智能(AI4S)占比提升6个百分点,2020年后年均增长率从10%跃升至19%[7] 科学智能(AI4S)领域进展 - 报告覆盖7大科研领域、28个方向、近90个科学智能前沿问题及突破路径[1] - 大语言模型(LLMs)成为物质科学、生命科学等领域的通用科研工具[4] - 强化学习在工程控制、数学证明及物理模拟等复杂场景占主导地位[4] - 计算机视觉技术在生命科学和地球环境领域渗透显著[4] 国别科研表现对比 - 中国AI出版物总量从2015年6.01万篇增至2024年30.04万篇,占全球29%[7] - 印度AI出版物从2015年1.82万篇增至2024年8.51万篇,几乎与美国(8.57万篇)齐平[7] - 中国在专利、政策及临床试验中AI引用量占比达41.6%,全球领先[8] 细分领域竞争格局 - 中国在地球环境科学和工程交叉领域具有先发优势[9] - 欧盟与美国在AI与生命科学交叉领域保持优势,中国位居第三[9] - 印度在地球环境、工程和人文社科领域居全球第三[9] - 中美合作AI出版物2024年达1.22万篇,为2015年两倍[9] 科研影响力动态 - 美国高质量AI论文引用量2020年达30.22万次,保持领先[8] - 中国高质量AI论文引用量从2015年1.03万次跃升至2020年14.48万次[8] - 中国在AI应用型创新领域从"跟随者"转变为"引领者"[8]
豆包可以跟你打视频了,陪我看《甄嬛传》还挺懂!难倒一众AI的“看时钟”也没难倒它
量子位· 2025-05-26 16:18
国产AI突破视觉理解能力 - 国产AI豆包成功解决大模型识别时钟难题,能通过视频实时准确报时,从4点14分到4点15分[1][2][3] - 豆包新增视频通话功能,实现边看边聊的交互方式,并接入联网搜索提升回答准确性和时效性[4][5][6] - 视频通话功能可实时总结微博热搜等网络热点新闻,增强互动趣味性和可靠性[7][8] 视频通话功能实测表现 - 豆包能作为看剧搭子,实时识别《甄嬛传》剧情并分析角色动机,如判断祺贵人企图借皇后之手扳倒甄嬛[15][16][17] - 在生活场景中,豆包可识别食材并详细讲解烹饪步骤,解决做菜难题[20][21][22] - 教育场景表现突出,能准确识别物理题、论文和代码,提供详细解题过程和答案[23] 核心技术能力解析 - 豆包·视觉理解模型具备强大内容识别能力,可精准识别物体类别、空间关系及文化知识,如识别猫的影子或丁达尔效应[24][25][26][27][30] - 模型拥有复杂逻辑计算能力,在教育场景中能理解微积分题目并进行推理计算[33][34] - 视觉描述和创作能力支撑视频通话功能实现又快又准的交互体验[35][36] 行业影响与趋势 - AI与人类交互方式正向更趣味化、实用化方向发展,视频通话功能体现技术落地价值[37] - 视觉理解技术的突破为AI在娱乐、教育、生活服务等场景的应用开辟新路径[15][20][23]
3D视觉核心优势,物理AI第一步
2025-05-25 23:31
纪要涉及的公司和行业 - 公司:思看科技、行创公司、先临 3D 公司、海克斯康、卡尔蔡司、联赢光、奥普特、铂力特 [1][17][21] - 行业:3D 扫描技术行业、汽车制造、航空航天、工程机械、文物保护、医疗、游戏 [1][10][18] 纪要提到的核心观点和论据 思看科技市场地位和产品特征 - 市场地位:国内市占率第一,全球市占率第二 [2] - 产品特征:产品包括手持式扫描枪、跟踪式扫描设备及一体化质量检测设备,精度可达 0.03 毫米以下,具有高毛利率和高净利率特点,广泛应用于逆向工程、质量检测等高端制造领域 [1][2] 思看科技发展方向 - 深耕工业专业领域和拓展机器人应用,探索新应用场景如 3D 打印,通过与 FDM 3D 打印机结合实现更高效精确建模和打印 [1][3][4] 思看科技重要客户及应用场景 - 重要客户:商飞集团、比亚迪等 [1][5] - 应用场景:客户用跟踪式扫描设备进行大物体、大面积工件扫描,一体化质量检测设备用于高端制造业质量检测,如汽车制造中对车门建模并与理想图纸对比 [5] 思看科技软件算法优势 - 软件算法全部自主研发,能无缝兼容主流 CAD 格式,提供硬件和软件解决方案,在质量检测系统中可快速识别工件误差并实时反馈 [1][6] 思看科技财务状况和收入结构 - 财务状况:过去几年收入稳健增长,毛利率稳定在 76%左右,净利率接近 40%,经营性现金流每年保持 1 亿元以上净流入 [1][7] - 收入结构:海外收入增速显著,目前海外市场贡献约占总收入的 40%,得益于替代海外同类产品和经销模式 [1][7][8] 思看科技国内外市场增速预期 - 海外市场:增速预计保持乐观,得益于直销点落地带来客单价和利润率提升 [1][9] - 国内市场:增速可能放缓,因 2022 年汽车行业资本开支高峰已过,采购周期进入相对平缓期 [1][9] 思看科技产品结构 - 产品包括手持式 3D 扫描仪(价格 10 万元以上)、大型跟踪式 3D 扫描产品、工业级自动化检测系统,新发布消费级产品价格约 2000 美元,正在拓展专业级及消费级市场,增长潜力大 [1][11] 思看科技技术优势 - 体现在识别重建、立体延伸和立体标定三个方面,通过 FPGA 和 SoC 模块进行端侧计算,实现无线状态和多波段复合扫描,在 3D 重建领域有显著竞争优势 [3][13] 扫描技术发展趋势 - 非接触式扫描精度提升,有望替代接触式扫描,未来占据 80%市场份额,思看科技非接触式产品具显著竞争力 [3][14] 思看科技未来驱动力 - 全球高端制造业出海,产品渗透率和市占率稳步提升;物理计算 AI 的应用,在机器人及工业侧有更多应用场景 [15][16] 全球 3D 扫描仪市场参与者 - 主要参与者有行创公司、先临 3D 公司、海克斯康、卡尔蔡司,市场规模目前不大但未来发展潜力大 [17] 3D 扫描技术应用 - 工业领域用于高精度设备如焊缝质量检测;专业级领域用于文物保护、医疗、游戏场景等 [18] 物理 AI 与 3D 扫描技术结合 - 构建完整物理场和生成更多场景,避免传统测试问题,确保数据质量,适用于家居和工业级机器人视觉系统 [19] 思看科技消费级产品及机器人视觉优势 - 消费级产品不断拓展,结合算法有望相同精度下实现更低成本,进入更多机器人场景,在工业级机器人视觉模块输出上表现突出 [20] 思看科技未来盈利预测 - 专业级领域预计翻倍以上增速,工业级预计维持 25% - 30%增速,增速快且盈利水平高,市盈率有提升空间 [21] 其他重要但是可能被忽略的内容 - 思看科技股东结构稳定,由三位浙大系创始人组成一致行动人,还有员工持股平台 [12] - 余杭区政府曾推送思看科技与斯泰科技合作,通过脑机接口捕捉电信号实现截面 1:1 复刻 [18]
只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max
机器之心· 2025-05-25 11:51
例如,模型虽然能够识别图像中的物体并描述它们之间一些相对简单的空间关系,但在追求极致的定位精度,或需要深入理解和预测物体间高度复杂、动态或隐 含的交互逻辑(而非仅仅识别表面现象)时,其表现仍可能因视觉信息在文本化过程中的细节损失而受到限制。 机器之心报道 编辑:Panda、+0 近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理 视觉信息时也是如此 。 常见的 MLLM 结构。 这种模式要求模型首先将视觉信息「翻译」或「映射」为文本描述或内部的文本化 token,然后再利用大型语言模型的文本推理能力进行处理。 这个转换过程不可避免地可能导致视觉信息中固有的丰富细节、空间关系和动态特征的丢失或削弱,形成了所谓的「模态鸿沟 (modality gap) 」。这种鸿沟不仅限 制了模型对视觉世界的精细感知,也影响了其在复杂视觉场景中进行有效规划的能力。 来自剑桥、伦敦大学学院、谷歌的研究团队认为: 语言不一定始终是进行推理最自然或最有效的模态,尤其是在涉及空间与几何信息的任务场景中 。 基于此动因,研究团队提出了一种 ...
南财早新闻|国家网信办整治网上金融信息乱象;端午档新片预售总票房已破1000万元
21世纪经济报道· 2025-05-25 07:29
宏观经济 - 市场监管总局等四部门联合印发指导意见,推动企业迁移登记实现"一次办、便捷办、高效办",降低企业办事成本 [2] - 香港特区行政长官李家超表示将利用香港优越地理位置和物流设施,打造跨境电商物流配送中心 [2] - 端午档新片预售总票房破1000万元,《时间之子》《碟中谍8:最终清算》《私家侦探》位列前三 [2] - 端午假期旅游消费呈现"周边深度游+文旅新体验"特征,国内周边游预订量同比增长,亲子景区热度攀升 [2] - 2025年中国婴幼儿托育市场规模预计达1621.3亿元,2030年有望增至2323.1亿元,年均增长率约7.5%,现有机构仅满足不到10%需求,保育人员缺口近100万人 [2] 投资要闻 - 中金所刘绍统表示将优化国债期货品种规则制度,丰富利率风险管理工具,深化中长期资金参与力度 [3] - A股市场掀起赴港上市热潮,宁德时代、比亚迪、招商银行等公司H股价格超越A股,AH股价格倒挂现象受关注 [3] - 国内金饰价格随国际金价上涨,过去一周大部分品牌足金饰品价格涨超40元/克,30克足金镯子较上周贵1200元 [3] - 全市场46只煤炭行业主题基金5月以来净值悉数上涨,平均净值增长率达4.11%,10只基金净值增长率超5% [3] - 多只红利主题基金提前结束募集,份额创新高,基金管理人修改收益分配规则加大分红力度 [4] 公司动向 - 小米汽车表示YU7展车将陆续抵达全国门店 [5] - 京东、上海具身智能基金参与智元机器人新一轮融资,京东科技出资61.8909万元 [5] - 比亚迪推出限时促销活动,涉及22款智驾版车型,最高补贴5.3万元 [6] - 云鼎科技发布云鼎工业视觉智能一体机,实现工业大模型与边缘计算协同创新 [6] - 新易盛在AEC技术领域深入布局,与AEBS系统无直接关联 [6] - 合金投资运输业务稳定,暂无氢能汽车运输计划 [6] 国际动态 - 美国总统特朗普建议对欧盟商品征收50%关税,欧洲多国政要表示反对 [7] - 欧盟讨论对俄罗斯实施新一轮制裁,重点针对能源领域 [7] - 朝鲜驱逐舰下水时发生事故,修复工作按计划进行,相关责任人被拘留 [7]
新 Apple Watch 突然曝光,新外观没了
新浪财经· 2025-05-24 19:36
苹果智能穿戴设备研发动态 - 初代Apple Vision Pro头显设备市场表现不佳 但公司在智能穿戴领域的研发工作更加密集 [1] - "摄像头版Apple Watch"项目已被搁置 相关研发工作已于本周停止 [2][4] - 原计划中Series机型采用屏下摄像头设计 Ultra版本将摄像头集成于表冠侧边 [2] - 摄像头功能主要为实现AI环境分析、物体识别、导航和翻译 不具备拍摄和视频通话功能 [4] 苹果其他智能穿戴设备进展 - "配备摄像头AirPods"项目仍在推进 将搭载微型红外摄像头系统 [7] - 该AirPods集成苹果"视觉智能" 支持环境扫描和物体识别功能 [7] - 产品有望支持手势控制 可与Vision Pro搭配增强音频定位功能 [9] - 分析师预计配备摄像头的AirPods将于2026年开始量产 最快同年发布 [9] - 公司首款AR智能眼镜加速推进 预计最快2026年底推出 [11]
中金《秒懂研报》 | 智能驾驶:引领出行变革的新时代
中金点睛· 2025-05-24 16:32
智能驾驶背后的技术引擎 - 端到端架构降低数据标注难度并优化数据处理流程,减少人工工作量,提升信息传递效率[2] - 视觉语言模型和云端模型的引入增强系统处理复杂场景的能力[3] - 城市导航辅助驾驶(NOA)或成为车企竞争新热点,未来可能向L3/L4高阶自动驾驶发展[3] 智能驾驶的普及步伐 - 高速NOA功能2024年已规模化上车,有望成为20万元以上智能驾驶汽车的标配[5] - 城市NOA渗透率2024年有望达6.5%,成本降低推动搭载车型价格下探至20万元级市场[7] 智能驾驶的商业模式 - L2++智能驾驶软件收费面临挑战,车企多选择标配系统积累用户数据,探索减配方案增厚硬件利润[11] - 头部车企尝试买断或订阅付费模式,如华为ADS 3.0订阅价720元/月或7200元/年,买断价36000元[12] - L3自动驾驶功能落地可能推动后向功能订阅收费,2025年或迎来收获期[12] 城市NOA的益处 - 带动高配置、高毛利车型销售,硬件成本增加但单车毛利增量可观[13][14] - 理想L7 Pro/Max车型差价28000元,单车毛利润增量13700元;小鹏G6 Pro/Max差价20000元,毛利润增量10000元[15] - Robotaxi与城市NOA技术栈需求重叠,2025年头部智驾企业或公布相关路标推动行业转型[15] - 国内Tier1企业凭借技术和量产经验具国际市场代际优势,合资车企合作推动全球化发展[16][17]
「智驾」人才争夺战:帮新员工支付前司百万竞业赔偿
36氪· 2025-05-23 21:58
车企AI辅助驾驶人才争夺战 - 行业核心人才遭哄抢,理想、华为、Momenta成为被挖角最严重的公司,理想核心人员每人接到20+猎头电话[3][4][6] - 竞业协议诉讼频发,理想起诉跳槽员工案例涉及千万元赔偿,南方车企员工赔付超百万元[4][5] - 技术保密手段升级,理想要求VLA项目员工签署保密协议,离职需脱敏6个月;华为采取类似措施[12][14] 技术路线演进与竞争格局 - 技术路径从规则方案转向端到端模型,VLM/VLA多模态大模型成为新方向[6][9][24] - 头部企业技术布局: - 理想尝试4种技术路线(城市NOA/轻地图/端到端+VLM/VLA),与清华合作开发双系统方案[9][25] - 小鹏采用"世界基座模型"训练方式[10] - 华为乾崑智驾装机量突破50万,Momenta方案搭载量近30万辆[10] - 特斯拉停止公开FSD技术细节后,国内企业进入自主探索阶段[8][23] 车企人才战略与市场动态 - 传统车企加速布局: - 比亚迪推出5.58万元级辅助驾驶车型,下半年计划推出自研城市NOA[11] - 比亚迪技术院高层亲自招揽新势力背景人才,团队已吸纳多名竞品员工[11] - 小米引进Wayve科学家陈龙,强化辅助驾驶团队[11] - 人才流动双向性: - 理想曾为关键人才支付数百万竞业赔偿[12] - 端到端技术导致理想精简团队,部分人才外溢[12] 行业技术挑战与发展趋势 - 当前技术局限性: - 端到端方案存在场景泛化难题[23] - VLA模型面临人才稀缺、数据获取、问题定义等量产挑战[25] - 未来技术重点: - 生成式AI世界模型仿真器[25] - 强化学习在规控/仿真领域应用[25] - Momenta已率先在预测/规控环节应用AI模型和强化学习[26] 行业生态与潜在问题 - 技术泄露现象严重,存在代码被员工携带跳槽或出售的情况[18] - 部分企业通过"白盒"获取供应商代码进行拼凑开发,与头部"好用"方案存在差距[19][20] - 行业面临工程化能力与AI不确定性的双重挑战,需原创性思考突破技术迷雾[23][26]
有稀土颗粒的隐形眼镜?《细胞》新成果有望解锁红外视觉“超能力”
第一财经· 2025-05-23 19:33
他介绍,之所以当初想到把含有多个荧光发射的稀土颗粒与隐形眼镜相结合,是因为近红外波段相较于我们目前肉眼可感知的可见光波段更加广阔,并且由 于稀土具有独特的上转换发光现象,这对于近红外视觉研究非常有启发。 目前该成果初步完成了概念验证 人类可看见的光波长范围仅限于400-700纳米,如果戴上一副由特殊材料制成的隐形眼镜,未来或许能让近红外波段"肉眼可见"。 北京时间5月22日晚间,复旦大学与中国科学技术大学等国内外科研机构的合作研究成果以《上转换隐形眼镜赋能人类近红外光视觉》为题发表在《细胞》 (Cell)杂志上。该研究创新性地将一种含有多个荧光发射的稀土颗粒与隐形眼镜相结合,通过可穿戴的形式使人类感知近红外光的时间、空间和色彩等多 维度信息,更为色盲等视觉疾病的治疗提供新的解决方案。 该研究的通讯作者之一,复旦大学化学系、智能材料与未来能源创新学院张凡教授告诉第一财经,自然界中的光,包含各种不同频率的电磁波。当人眼捕获 到外界自然光后,可以激活视网膜上识别红、绿、蓝三原色的三种视锥细胞,并根据三种视锥细胞被激活的比例,向大脑发送外界的颜色信息。然而,相对 于自然界广阔的光学波段,人眼可感知的波长范围仅有400 ...