OpenEvidence
搜索文档
腾讯研究院AI速递 20251216
腾讯研究院· 2025-12-16 00:22
生成式AI 一、 深夜炸场!Manus 1.6 突然发布,史诗级进化暴力实测 1. Manus 1.6 Max发布,实现从"辅助工具"到"独立承包商"的质变,用户满意度提升19.2%,采用子Agent并行处理架 构,能独立完成复杂Excel财务建模和数据分析; 2. 新增移动开发功能,支持端到端App开发流程,用户只需描述需求即可生成可运行的iOS和Android应用; 3. 推出Design View设计视图,实现局部修图、精准文字渲染和多图层合成,解决AI生图不可控的痛点。 https://mp.weixin.qq.com/s/8gsfjMHOiadZMrRUUo4ZRw 二 、 OpenAI开源模型Circuit-Sparsity,0.4B,99.9%权重为零 4. OpenAI开源Circuit-Sparsity模型参数量仅0.4B,强制99.9%权重为零仅保留0.1%非零权重,解决模型可解释性 问题; 1. 前OpenAI CTO Mira Murati创办的Thinking Machines取消候选名单全面开放Tinker产品,这是用于帮开发者微 调语言模型的API; 2. 新增支持Kimi K2 ...
思考的终结:人类脑力降级是比AI崛起更大的危机
36氪· 2025-11-03 08:05
人工智能对经济与就业的潜在影响 - 人工智能高管预测人工智能能力将在18个月内呈爆炸式增长,到2027年夏天可能主导经济[1] - 预计高达半数的入门级白领工作将被人工智能淘汰[1] 教育领域技能衰退的现状 - 大语言模型导致学生普遍使用人工智能完成作业,大学教授担忧大量毕业生本质上是文盲[3] - 美国教育进展评估(NAEP)数据显示,平均阅读分数达到32年来最低点[7] - 自21世纪初以来,声称为了休闲而读书的美国人比例下降了近50%[8] - 美国最顶尖大学的学生甚至难以对一首十四行诗保持专注,高中教育为应对标准化考试将书籍碎片化[11] 深度思考能力的重要性与衰退 - 写作行为本身就是思考,将写作过程外包给大语言模型剥夺了理解与发现的重要性[3] - 阅读和写作是深度思考的两大支柱,为现代经济提供符号逻辑和系统思维能力[12] - 读写能力是重构人类思想和知识、为复杂思想创造空间的关键手段,书面英语拥有至少150万个词汇[12] - 科技(电视、互联网、社交媒体、智能手机)持续窃取注意力,研究发现使用手机的学生做笔记更少,课堂信息记忆也更少[12] 人工智能在专业领域的应用与挑战 - 医学研究发现ChatGPT等大语言模型在诊断罕见疾病方面比大多数医生更出色[13] - 医学院鼓励使用AI工具,但有医学生担忧这会侵蚀其独立诊断能力,并感到在陈述诊断时“不诚实”[14] 对未来的展望与应对建议 - 有观点预测,读写能力衰退可能导致批判性思维技能丧失,使公民易受非理性呼吁影响,进而威胁民主[15] - 深度思考技能被强调为在人工智能时代应被珍视的关键能力,其培养类似于健身中的“肌肉紧张状态时间”原则,需要耐心面对不相关的想法以进行组合创新[16][17]
百川智能发布最强循证增强大模型M2 Plus,打造“医生版ChatGPT”
IPO早知道· 2025-10-22 22:38
产品发布与定位 - 百川智能于10月22日发布循证增强医疗大模型Baichuan-M2 Plus,并同步升级应用百小应及开放API [2] - 该产品定位为“医生版ChatGPT”,旨在让大模型技术在辅助临床诊疗场景中迈过“敢用、可用”的关键门槛 [3] - 产品通过百小应应用和网页版向医生及患者提供服务,并开放标准化API接口供医院信息化部门、互联网医疗等机构集成使用 [7][8] 技术优势与性能表现 - Baichuan-M2 Plus首创六源循证推理(EAR)范式,其医疗幻觉率较通用大模型显著降低,相比DeepSeek低约3倍 [2] - 在美国执业医师资格考试(USMLE)中取得97分,与GPT-5成绩持平,远超人类考生平均水平 [4] - 在中国执业医师资格考试(NMLE)中取得568分,超过500分的“学神”级别,在所有公开测试的主流大模型中位列第一 [5] - 在中国硕士研究生招生考试临床医学综合能力(西医)考试中取得282分,该考试280分以上为顶尖学府头部学霸水平 [6] - 在日本、英国、澳大利亚等国高级医师职称晋升考试中,准确率达85%以上,远超各国及格线 [6] - 在全球多等级医疗资格考试中取得85分,优于GPT-5的83.8分和OpenEvidence的81分 [5] 市场竞争与行业影响 - Baichuan-M2 Plus在性能上超越美国最火医疗产品OpenEvidence,后者已有40%美国医生注册使用,月咨询量达1650万次 [2] - OpenEvidence所在公司于近期完成2亿美元C轮融资,估值达60亿美元 [2] - 该产品的推出被视为中国在世界大模型擂台上的又一成果,代表中国在医疗AI领域的竞争力 [3] - 产品为医生提供了应对患者使用DeepSeek等通用模型自诊挑战的“专属武器”,有助于提升临床决策的专业性和效率 [7]
“医生版ChatGPT”来了!百川发布最强循证增强大模型M2 Plus,幻觉率远低于DeepSeek
生物世界· 2025-10-22 16:38
产品发布与市场定位 - 百川智能于2025年10月22日发布循证增强医疗大模型Baichuan-M2 Plus,并同步升级应用百小应及开放API [3] - 该模型旨在解决通用大模型在严肃医疗场景中的幻觉问题,推动技术迈过“敢用、可用”的关键门槛 [4] - 产品定位为“医生版ChatGPT”,不仅在美、日、英的医疗评测中超过美国领先产品OpenEvidence,也适合中国医疗环境 [4] 核心技术:六源循证推理范式 - 首创六源循证推理范式,构建从原始研究到真实世界的完整知识体系,包含六个层级 [5][6][8] - 原始研究层索引超过4000万篇医学期刊论文,数量超过PubMed [8] - 证据综述层整合系统评价和Meta分析等高等级证据 [8] - 指南规范层引入国际和国内权威机构发布的临床指南和专家共识 [8] - 实践知识层包含临床病例报道和一线专家经验 [8] - 公共健康教育层汇集权威科普和公共卫生知识 [8] - 监管与真实世界层涵盖药监部门公告和真实世界研究数据 [8] 技术优势与性能表现 - 模型幻觉率显著降低,仅为DeepSeek最新版的三分之一,并优于OpenEvidence [3][15] - 在美国执业医师资格考试中取得97分,与GPT-5成绩持平 [19][21] - 在中国执业医师资格考试中取得568分,远超人类高水平考生及同类模型 [19][21] - 在中国硕士研究生招生考试临床医学综合能力考试中取得282分 [20][21] - 在日本、英国、澳大利亚等国高级医师职称晋升考试中准确率达85%以上 [20] 检索与推理技术突破 - 采用PICO框架将查询转化为结构化医学问题,在六源数据库中进行分层匹配 [11] - 通过三步精准锁定证据:智能提问、精准锁定、证据排序 [11][12] - 引入循证增强训练机制,奖励模型准确引用权威来源,惩罚脱离证据的臆测 [13] - 模型输出关键结论时会自动附上参考文献和指南出处,实现可回溯和可验证 [13] 应用场景与生态建设 - 接入M2 Plus的百小应应用已在各大手机应用商店更新,并同步上线网页版 [23] - 为医生提供应对患者使用通用大模型自诊的“专属武器”,帮助甄别信息真伪 [23] - 为患者及家属提供理解诊疗方案背后科学逻辑的渠道,获得权威知识解答 [23] - 开放标准化API接口,供医院信息化部门、互联网医疗及开发者接入服务场景 [23] 行业对标与竞争格局 - 美国产品OpenEvidence已有40%美国医生在临床场景中注册使用,月咨询量达1650万次 [3] - OpenEvidence所在公司近期完成2亿美元C轮融资,估值达60亿美元 [3] - 百川M2 Plus在多项关键评测中超越OpenEvidence,代表中国在医疗大模型领域取得进展 [4][21]
Z Event|硅谷最高规格 AI 投资峰会来了,AI Investment Summit UC Berkeley 2025
Z Potentials· 2025-10-16 11:03
活动核心信息 - 活动名称为AI Investment Summit 2025,将于11月2日在加州大学伯克利分校举行 [2][3] - 活动旨在汇聚全球学界、产业界与资本界领袖,探讨AI驱动未来十年的技术革新、产业变迁与资本布局 [3] 行业趋势与宏观背景 - 人工智能正以前所未有的速度重塑世界,英伟达押注OpenAI 1000亿美元,显示资本与算力共同增长 [3] - 法律AI「Harvey」三年营收突破1亿美元,医疗AI「OpenEvidence」已覆盖全美超过10,000家机构 [3] - 「ChatGPT Pulse」的出现标志着AI从工具向“思维后台”演进 [3] - AI不仅催生新产业和商业模式,更在深刻改变工作方式与社会结构 [3] 观众与参与者构成 - 参会者总数超过1000人,构成包括150+位研究人员、150+位创始人、400+位学生以及100+位投资人 [3][8] - 参会者背景为学术、产业与资本的罕见汇聚,来自UC Berkeley、Stanford、MIT、Yale、Harvard等顶尖机构 [6][8] 演讲嘉宾阵容 - 学界领军人物包括OpenAI核心研究员Tianfu Fu、UC Berkeley助理教授兼NVIDIA研究总监Jiantao Jiao、Stanford大学教授Le Cong等 [11][12][15][17][20] - 产业与技术先驱包括Meta Superintelligence Labs研究总监Rohit Patel、Google DeepMind研究总监Madhavi Sewak、Adobe应用研究总监HyunJoon Jung等 [11][14][17][21] - 投资与资本力量包括红杉资本合伙人Konstantine Buhler、光速创投合伙人James Alcorn、Khosla Ventures合伙人Kanu Gulati、贝莱德董事David Hefter等 [10][12][13][17][21] - 企业与机构代表包括加州大学伯克利捐赠基金公司首席投资官Melody Ing [15][21] 峰会议程主题 - 议程贯穿全天,上午聚焦经济与产业格局,下午讨论激励机制、多模态突破与智能医疗等前沿话题 [21][22] - 具体讨论主题包括AGI智能基础设施、AI原生产品与数据前沿、构建者飞轮、重建AI经济、多模态与下一代界面、AI用于发现、为AI时代重构资本等 [23][24] 合作伙伴与赞助商 - 活动合作伙伴包括Perplexity、亚马逊云科技等机构 [30]
哈佛学生靠医疗“ChatGPT”,成了亿万富翁
虎嗅APP· 2025-08-29 18:10
文章核心观点 - 生成式AI在医疗垂直领域创造快速增长奇迹 OpenEvidence通过专业化AI搜索和PLG模式实现病毒式传播 三年估值达35亿美元[5][8][30] - 医疗AI成功关键在于解决行业核心痛点 包括知识更新快 信息过载和准确性要求高 而非单纯追求大模型参数[5][18][32] - 独特免费增值+广告商业模式打破传统医疗软件销售桎梏 直接触达医生群体 年化广告收入达5000万美元[8][23][24] 公司业务与产品 - 核心产品为AI驱动的临床决策支持平台 提供智能搜索和即时问答功能 平均响应时间5-10秒[11][13] - 2025年推出DeepConsult Agent功能 能自主分析上百篇研究 数小时内生成综合报告 计算成本为普通搜索100倍以上[13] - 平台集成多媒体医学内容 包括临床图片和图表可视化 与《新英格兰医学杂志》等顶级期刊合作[14][19][20] - 专注小模型策略 采用3亿参数临床模型 性能超越1750亿参数大模型 通过不联网和专业数据减少幻觉[18] - 成为首个在美国医师执照考试(USMLE)取得满分100%成绩的AI系统[19] 用户增长与市场表现 - 用户数从一年前几千激增至10万执业医生 覆盖全美40%以上执业医师[5][10] - 总注册医生数超43万名 每月新增6.5万用户[10] - 咨询量从2024年7月月处理36万次激增至2025年7月每日35万次 相当于月处理超850万次临床咨询[10] - 被GV合伙人称为"增长最快的科技应用之一" 被誉为"继iPhone后在医生群体中传播最快的技术工具"[5][10] 商业模式与变现 - 采用免费增值+广告模式 对验证医生完全免费开放 绕过传统医院采购流程[8][23][24] - 广告客户包括制药公司 医疗器械厂商和医学会议主办方 年化广告收入约5000万美元[24][25] - 借鉴谷歌"区分广告与有机结果"做法 保证医生对查询结果的信任[25] 创始人背景与融资历程 - 创始人Daniel Nadler为连续创业者 曾以5.5亿美元将金融AI公司Kensho出售给标普全球[8][27] - 初始自掏1000万美元启动 2022年底获2700万美元融资[30] - 2025年初A轮融资7500万美元(红杉领投) 估值达10亿美元 数月后B轮融资2.1亿美元 估值推高至35亿美元[30] - 团队包括哈佛 MIT博士和工程师 已故诺奖得主Daniel Kahneman曾任顾问[20][21] 行业竞争与差异化 - 与IBM Watson失败案例形成对比 后者因技术局限和过度营销最终拆分出售[32] - 竞争对手包括DynaMed(Best in KLAS工具)和Hippocratic AI(专注安全医疗大模型)[33] - 差异化在于垂直领域深度 PLG增长策略和场景化变现能力[8]
哈佛学生靠医疗“ChatGPT”,成了亿万富翁
虎嗅· 2025-08-29 10:00
公司概况与市场地位 - OpenEvidence是一款AI驱动的临床决策支持平台,核心功能是医学搜索引擎,为医生提供快速、准确的循证医学信息查询服务[6] - 公司在美国医疗市场取得显著渗透,已有超过43万名医生注册,覆盖全美40%以上的执业医师,每月新增65万名用户[4] - 平台使用频率快速增长,从2024年7月月处理约36万次咨询激增至2025年7月的每日35万次,相当于月处理超过850万次临床咨询[5] - 公司估值在短短三年内达到35亿美元,创始人Daniel Nadler因OpenEvidence的影响力入选TIME100 Health全球健康领域百大人物[3][15] 产品功能与技术特点 - 平台提供智能搜索与即时问答功能,医生用日常语言提问临床问题,平均5-10秒内得到附有权威出处的简明答案[9] - 2025年推出DeepConsult Agent功能,能自主检索分析上百篇研究,将需要数月人工综述的主题在数小时内生成综合研究报告[10] - 采用专注小模型策略减少幻觉,使用仅3亿参数的临床模型,大规模采用FDA、CDC权威信息和同行评审医学文献,不依赖联网数据[12][13] - AI系统在2025年创造历史,成为首个在美国医师执照考试(USMLE)上取得满分100%成绩的AI系统[14] - 是目前唯一完整训练《新英格兰医学杂志》全文的AI产品,该杂志编辑委员会多位重量级人物是平台深度用户[15] 商业模式与增长策略 - 采用"免费增值+广告"的独特商业模式,对经过验证的医生完全免费开放使用,大幅降低使用门槛[19][20] - 绕过传统医疗软件B2B销售路径,直接面向医生个人免费服务,实现类似消费互联网的病毒式传播[3][20] - 广告客户包括制药公司、医学会议主办方、医疗器械厂商等,截至2025年中广告收入年化约为5000万美元[20] - 采用PLG(产品驱动增长)策略,通过高质量产品直接吸引医生用户,而非依赖传统医院采购流程[3] 创始人背景与团队构成 - 创始人Daniel Nadler是连续创业者,曾将金融AI公司Kensho以约55亿美元卖给标普全球[2][22] - 联合创始人Zachary Ziegler是哈佛博士候选人,师从知名AI学者Alexander Rush,在自然语言处理方面功底深厚[22] - 团队拥有豪华人才储备,包括哈佛计算机科学家、MIT博士等顶级人才,已故诺奖得主Daniel Kahneman生前也曾担任顾问[15][17] 行业背景与竞争格局 - 医学知识更新迅速,Nature研究表明医学知识每73天就能翻一倍,医生需要快速获取最新医学证据[2] - 与传统医疗AI形成对比,IBM Watson Health因技术局限和过度营销最终失败,为行业敲响警钟[28] - 潜在竞争者包括DynaMed和Hippocratic AI等专注于临床决策支持的AI工具[29] - 公司通过梅奥诊所孵化项目获得匿名化临床数据和专家指导,梅奥诊所因此获得公司小部分股权[15]