云知声(09678)
搜索文档
港股异动 | 云知声(09678)涨超13% 推出 Unisound U1-OCR文档智能基础大模型
智通财经网· 2026-02-27 10:01
公司股价与市场反应 - 公司股价大幅上涨,截至发稿涨13.46%,报359港元,成交额1.79亿港元 [1] 产品发布与核心突破 - 公司正式推出文档智能基础大模型“Unisound U1-OCR”,标志着AI从“识字”跃迁至“理解业务逻辑” [1] - 该模型是首个工业级文档智能基座,开启OCR 3.0时代,实现了从“字符感知”到“文档认知”的质的飞跃 [1] - 模型核心优势在于突破了传统模型“只读文字、不懂排版”的瓶颈,能够“看懂”复杂文档 [1] - Unisound U1-OCR是一款达到国际顶尖水平(SOTA)的文档智能理解模型,在多项权威测试中均获业界SOTA表现 [1] 战略意义与行业影响 - Unisound U1-OCR的推出不仅是文档智能的革新,更是公司迈向AGI(通用人工智能)的关键一步 [1]
云知声发布首个工业级文档智能基础大模型
证券日报网· 2026-02-26 17:11
公司产品发布与核心优势 - 云知声正式推出Unisound U1-OCR文档智能基础大模型,该模型被定位为首个工业级文档智能基座 [1] - 模型具备五大核心优势:性能领先、可信可验、开箱即用、高效部署、强适配,旨在打破传统文档处理边界并树立行业新标杆 [1] - 模型采用ViT+LLM架构,其中视觉编码器部分采用NaViT架构以实现文档分辨率动态处理,模型参数规模为3B(三十亿)量级 [2] 技术演进与产品定位 - 文档智能是指利用人工智能技术自动阅读和理解文档影像,并进行内容的读取、理解、分类及关键信息提取 [1] - 传统视觉方案(OCR1.0)仅能识别文字,新一代多模态方案(OCR2.0)具备端到端版面理解和文字识别能力 [1] - Unisound U1-OCR开启了OCR3.0时代,在理解版面的基础上,进一步洞察文档深层语义,实现自动分类与业务级信息抽取,完成了从“字符感知”到“文档认知”的飞跃 [1] - 该模型突破了传统模型“只读文字、不懂排版”的瓶颈,能够像人类专家一样“看懂”复杂文档 [2] 战略愿景与行业影响 - Unisound U1-OCR的发布标志着人工智能从单纯“识字”跃迁至“理解业务逻辑” [2] - 公司将以多模态文档为知识入口,赋予机器自主推理与证据溯源能力,旨在推动人工智能从感知走向认知 [2] - 公司的长期愿景是构建能像人类一样阅读、思考并解决复杂问题的通用智能体,让每一份文档都成为通往AGI(通用人工智能)的智慧阶梯 [2]
云知声Unisound U1-OCR大模型发布,评测得分超Deepseek-OCR2
新浪财经· 2026-02-26 16:39
公司产品发布 - 云知声发布名为Unisound U1-OCR的文档智能基础大模型 [2][5] - 该模型具备“性能SOTA、可信可验、开箱即用、高效部署、强适配”等优势 [2][5] 产品技术能力 - 模型在理解文档版面的基础上,能洞察文档深层语义,实现自动分类与业务级信息抽取 [2][5] - 模型突破了传统模型“只读文字、不懂排版”的瓶颈,能够像人类专家一样“看懂”复杂文档 [2][5] 性能评测表现 - 在OmniDocBench V1.5评测中,该模型以95.1分取得SOTA(当前最佳)表现 [2][5] - 该评测表现领先于GLM-OCR、Deepseek-OCR2、Gemini-3-Pro、GPT-5.2等主流模型,实现了精度与泛化能力的双重突破 [2][5] 内部业务测试 - 在内部业务测试中,该模型的信息抽取与文书分类能力超越了Gemini-3-Flash、Qwen-235B-VL等主流通用商业和开源模型 [2][5] - 在医疗入院记录、出院小结等强业务场景中,其领先优势尤为明显 [2][5] - Unisound U1-OCR以3B(30亿)规模的参数,获得了比更大规模通用VLM(视觉语言模型)更好的评测性能 [2][5]
云知声黄伟:AI向善才关键!外科医生不会被全替代
凤凰网财经· 2026-02-26 16:01
AI在医疗领域的应用前景与挑战 - 公司创始人认为,中美医疗现状存在差异,中国当前的核心需求是丰富和平衡医疗资源,而非简单地用AI替代医生[1] - 公司认为AI未来可能替代医生部分或绝大部分工作,但受医学伦理、法律等因素制约,完全替代绝无可能[1] - 即便AI能完成高难度手术,仍需确保其以治病为目的且符合伦理,不能将所有医疗工作交给无需负责的AI[1] 对AI替代外科医生观点的具体回应 - 公司创始人承认马斯克观点有其合理性,许多知识性、经验性工作可能被AI替代,外科医生工作被替代也不奇怪[1] - 关键在于替代是部分还是全部,公司创始人倾向于认为应是部分或绝大部分替代[1] - 公司强调,在医学伦理和法律问题未考虑清楚前,全面替代不是理想结果[1]
云知声黄伟:AI 医疗不赚快钱,先做严肃医疗
凤凰网财经· 2026-02-26 16:01
公司战略与业务布局 - 公司明确未来将布局AI医疗健康服务业务,以满足用户的健康搜索需求 [1] - 公司坚持“严肃医疗”的发展路线,尽管该领域门槛高且短期商业回报较低 [1] - 公司计划分阶段推进业务,首先与顶尖公立三甲医院合作打磨模型,待模型能力达到高水准后再向C端用户提供服务 [1] 市场与行业分析 - 用户的健康搜索需求是明确且重要的商业需求,印证了健康是人的核心需求之一 [1] - 中美医疗资源分布存在差异,中国最优质的医疗资源和医学知识财富集中在公立三甲医院,且各医院具有专科特色 [1] 合作与能力建设 - 公司选择与顶尖公立三甲医院合作,旨在深入了解医生需求并提升AI模型能力 [1] - 公司强调,只有在模型能力达到非常高的水平后,才会负责任地向C端用户提供健康服务 [1]
云知声黄伟:AI 医疗要打破资源不均
凤凰网财经· 2026-02-26 16:01
公司战略与核心出发点 - 公司布局AI医疗向C端发展的核心出发点是希望借助AI医疗能力推动医疗水平平权,解决看病难、看病贵及医疗资源分布不均的问题 [1] - 公司旨在通过与国内顶尖三甲医院合作形成的AI医疗能力,服务中西部医疗资源薄弱地区,并为居家老人等群体提供便利,使其无需奔波排队即可在家获得必要的医疗咨询和服务 [1] - 公司的核心理念是打造服务人类、有温度的AI,创造价值,而非打造超越或替代人类的AI [1] 市场问题与行业背景 - 行业中存在看病难、看病贵以及医疗资源分布不均衡的普遍问题,患者常需从当地前往北京、上海等地的优质医院才能解决疾病问题 [1] - 医疗水平对患者的影响极大,医疗资源的地域性差异是行业面临的显著挑战 [1]
云知声黄伟:AI医疗不意味着要超过协和医院
凤凰网财经· 2026-02-26 16:01
公司战略与产品定位 - 云知声的医疗AI产品侧重解决看病难、看病贵相关问题,核心目标是提高医生效率与优化医患资源分配 [1] - 公司面向公立三甲医院的产品核心解决两类问题:一是提高医生效率,让优秀医生能承接更多门诊量;二是辅助提升医生工作能力,替代部分工作内容,帮医生解放精力以专注关键诊疗环节 [1] 行业观察与公司观点 - 公司创始人认为当前部分AI存在炫技倾向,但指出这种炫技是阶段性的,某种程度上也是为了抬高能力天花板,并非全是坏事 [1] - 公司认为其医疗AI产品的本质是为了改善中国医患资源分配不平衡、医生精力有限的现状,进而缓解看病难、看病贵的问题 [1]
发现新势力|云知声黄伟:AI向善才关键!外科医生不会被全替代
凤凰网财经· 2026-02-26 15:48
文章核心观点 - 云知声创始人黄伟认为,中美医疗现状存在差异,中国当前核心需求是丰富和平衡医疗资源,而非替代医生 [1] - 黄伟认为,AI未来可能替代医生部分或绝大部分工作,但受医学伦理、法律等因素制约,完全替代绝无可能 [1] 行业观点与趋势 - 中美医疗情况有所不同,中国当下的核心问题不是替代医生,而是让医疗资源更丰富、更均衡 [1] - 很多知识性、经验性工作确实可能被AI替代,外科医生的工作被替代也不奇怪 [1] - 即便AI进化到能完成高难度专科手术,还需考虑其是否向善、是否以治病为目的等核心问题 [1] 公司战略与方向 - 让医疗资源更丰富、更均衡是云知声在AI医疗领域的努力方向 [1]
发现新势力|云知声黄伟:AI医疗不意味着要超过协和医院
凤凰网财经· 2026-02-26 15:48
公司核心战略与产品定位 - 公司医疗AI产品的核心是解决看病难、看病贵相关问题,而非炫技[1] - 产品侧重提高医生效率与优化医患资源分配[1] 产品具体目标与价值主张 - 面向公立三甲医院的产品旨在解决两类问题:一是提高医生效率,让优秀医生服务更多患者;二是辅助提升医生工作能力,替代部分工作以解放医生精力[1] - 产品目标并非超越顶尖医生,而是帮助医生专注处理更关键的诊疗环节[1] - 产品本质是为了改善中国医患资源分配不平衡和医生精力有限的现状[1] 行业观察与公司观点 - 当前部分AI存在炫技倾向,但公司认为这是阶段性的,某种程度上也是为了抬高能力天花板[1]
云知声(09678)推出文档智能基础大模型“Unisound U1-OCR” 正式开启OCR 3.0时代
智通财经网· 2026-02-26 15:46
公司产品发布 - 云知声于2月26日宣布正式推出文档智能基础大模型“Unisound U1-OCR” [1] - “Unisound U1-OCR”被定位为首个工业级文档智能基座,标志着OCR技术从“字符感知”进入“文档认知”的3.0时代 [1] - 该模型实现了从单纯“识字”到“理解业务逻辑”的跃迁,能够洞察文档深层语义,实现自动分类与业务级信息抽取 [1] 模型性能与架构 - “Unisound U1-OCR”是一款达到国际顶尖水平(SOTA)的文档智能理解模型,在多项权威测试中均获业界SOTA表现 [1] - 模型核心优势在于突破了传统模型“只读文字、不懂排版”的瓶颈,能够像人类专家一样“看懂”复杂文档 [1] - 模型采用ViT + LLM架构,其中视觉编码器部分采用NaViT架构,以实现文档分辨率动态处理 [1] - 模型参数规模为3B量级,旨在兼顾计算效率与深层语义信息理解的能力要求 [1] 技术创新 - 模型首创“语义驱动+动态聚焦”策略,自动构建文档的“语义地图”,精准识别标题、图表与正文的从属关系 [2] - 模型具备敏锐的“空间感知力”,能主动理解元素间的空间布局,结合动态分辨率技术精准还原文档结构 [2] - 模型采用Multi-Token Prediction(MTP)技术,在预测当前Token时同步考虑未来多个Token的概率分布,大幅提升长文档逻辑连贯性 [2] - 配合全任务强化学习策略,增强了模型对版式结构的全局预见性,并在推理阶段将模型生成效率提升了80%以上 [2] 业务应用与能力 - 模型立足于工业级场景需求,打造了精准溯源、业务融合、安全高效部署、超强适配四大核心能力 [2] - 模型旨在真正适配企业真实业务的全场景需求,实现从“读懂”到“执行”的业务落地 [2] 行业与战略意义 - “Unisound U1-OCR”的发布开启了OCR 3.0时代,不仅是文档智能的革新,更是云知声迈向AGI(通用人工智能)的关键一步 [2] - 公司将以多模态文档为知识入口,赋予机器自主推理与证据溯源能力,推动AI从感知走向认知 [2] - 公司未来目标是构建能像人类一样阅读、思考并解决复杂问题的通用智能体,让每一份文档都成为通往AGI的智慧阶梯 [2]