水红花子

首页 » 常识 » 问答 » 授人以渔,教临床医生进行真实世界研究
TUhjnbcbe - 2024/12/14 18:35:00
<

5月14日,“中国卒中中心联盟——真实世界研究学习班”在线上召开,中国卒中中心联盟邀请多位专家就真实世界研究相关话题进行了方法指导和经验分享。会议邀请了中国卒中学会会长王文志教授和中国卒中学会副秘书长何士大教授作为主持,对各位专家的报告进行了点评,并给与了积极地肯定。

临床医生如何做科研?

年轻医生没有经费,如何做临床科研?中医院李淑娟教授表示,好的临床科研往往来自临床观察,可以从临床病例中总结思路,发表SCI文章。多问几个问题,就是很好的科研课题,如脑梗死患者气管插管机械通气比例是多少?成功撤机拔管的比例呢?影响撤机的因素是什么?成功的,失败的?……收集了这些临床数据,就能撰写一篇文章。

研究焦虑抑郁的中科院心理研究所张向阳教授总结了课题研究的6大维度,即临床症状、呼吸机应用、血样的水平和活性、蛋白表达、对应的基因型、核磁和电生理。例如,研究躯体疾病伴发抑郁,相关的课题可以包括躯体疾病伴发抑郁的发病率、危险因素,男女差异、危险因素差异,生物标志物,遗传学基础,生物标志物与相关基因型,是否存在脑功能损伤,生物标志物、相关基因型与核磁/电生理,症状+认知损伤等。其他类疾病的研究课题也可以套用这些维度,加上良好的设计和执行就可以做出好的研究和文章。

李淑娟教授表示,临床医生做科研还要学会依靠优势学科,寻找科研合作平台。李淑娟教授在首都医科医院工作时,医院的优势学科是呼吸科,重症患者也很多,因而她将选题方向定为与呼吸科相关的神经重症研究;医院心内科与上海复旦大学有基因多态性的研究合作,因此李教授团队也收集了一些脑梗与正常人的基因多态性标本,与上海合作,很快就在9p21区发现了基因多态性。李淑娟教授目前在中医院工作,该院患者中单纯性卒中很少见,很多患者都有严重的心脏病或心衰,或是房颤脑梗死后发生出血,这些患者的治疗都充满挑战,在心源性卒中等方面需要积累更多经验,可以进行更多的研究。

从临床数据到科研数据

国家神经系统疾病临床研究中心、首都医科医院姜勇教授指出,医院信息化的快速发展促进了临床大数据的快速积累,数据维度也越来越多,这些临床诊疗过程中的数据是很好的潜在临床研究来源。

但是,临床数据与科学数据有很多差异,主要包括①数据收集的目的:是临床诊疗(记录)还是科学研究(统计分析);②是否有研究设计:无设计还是科学设计;③采访方法:电子病历还是病例报告表(CRF)、电子数据采集(EDC);④数据特点:数量大、维度复杂、更新快还是数量少、简单、更新慢;⑤随访信息:无或简单还是复杂;⑥质量控制,临床数据在结构化程度、完整性、异常值、逻辑错误等方面无太多要求;⑦偏倚:临床数据存在选择偏倚、测量偏倚、混杂偏倚等。姜勇教授指出,利用临床诊疗数据开展研究的最好方向之一是医疗质量监测与评价。此外,还可以做一些罕见病的登记。

利用常规收集的临床诊疗数据开展研究首先要以临床需求为导向,提出清晰明确的临床问题;其次,要有科学合理的研究设计,这方面可以寻求专业的方法学团队的支持;第三,要审慎地收集数据并开展质量控制,不贪多、不遗漏;第四,要运用合理的方法去分析数据,包括传统方法以及大数据人工智能方法;第五,要开展前瞻性验证研究,进行外部验证,如果建立的模型没有外部验证,基本上很难发很好的文章;第六,要客观、全面地报告研究结果及临床意义,特别是偏倚和适用性,这非常关键。

研究问题的构建可以采用PICO(注:循证医学文献检索格式)模型,临床研究问题要想得到杂志和同行的认可,必须符合FINER标准,即可行(Feasible)、有趣(Interesting)、创新(Novel)、符合伦理(Ethical)、有意义(Relevant)。

抽丝剥茧,披沙沥金--病案科助力临床病案信息检索

首都医科医院病案科关欣老师指出,病案在临床教学和科研都发挥着非常重要的作用,发生医疗纠纷时,病例还可以作为法律证据,也是绩效评价和疾病诊断相关分组(DRG)付费的重要依据。根据《住院病案首页数据填写质量规范(暂行)》,住院病案首页是医务人员使用文字符号、代码、数字等方式,将患者住院期间相关信息精炼汇总在特定的表格中,形成的病例数据摘要。因此,病案首页是整本病案信息的凝聚,包含了非常丰富的内容,主要包括患者信息、住院信息、诊疗信息和费用信息。

进行病案信息的检索与统计首先要明确检索需求,除需要检索的内容外,还要了解检索者的身份,医生和护士的检索需求可能不同,外科医生和内科医生的检索侧重点可能也不一样。此外,还要了解检索的目的,如果是为了进一步随访,检索的侧重点就需要提供患者的住址、联系电话等;如果是科研,需要挖掘的数据就更多。给病案科的条件越详细,检索出的信息就越精准。

病案数据质量是后续检索统计的基石,临床医生要重视病案首页的填写,住院病案首页填写应当客观、真实、及时、规范,项目填写完整,准确反映住院期间的诊疗信息。此外,临床医生需要了解ICD编码。病案编码是疾病分类学的应用,临床术语五花八门,统一标准的医疗数据才有统计学意义。以脑梗死为例,脑梗死有两个分类中心,一是责任血管,一是病因。责任血管分为入脑前动脉、脑动脉和脑静脉,病因分为血栓形成栓塞、血管闭塞和狭窄。根据不同的具体情况,脑梗死病例会有不同的编码。临床医生了解了编码规则,在病案检索时会有更大的帮助。

信息人教你如何高效做科研

首都医科医院信息中心林琳老师指出,在临床研究过程中,从试验设计到最终形成论文,包括科研选题、数据收集、数据清洗、数据统计等工作,在各个环节中,都存在着一定的壁垒。

在临床研究过程中,数据的获取是一大难题,数据的治理更是专业强、难度大的工作,包括数据转化、数据量化、行列转换、二次计算、缺失值处理、数据纠正等。对临床数据的质控通常是发生在写病历阶段以及数据生成的阶段,包括准确性、完整性、及时性以及一致性。经过数据治理阶段的清洗量化后,就进入到统计分析和阶段性验证阶段,这涉及一些专业的统计分析工具。

因此,基于专病数据的科研是一项系统复杂的工程,要解决以上诸多的壁垒和难点,需要多工种的协作,专病分析师解决数据集的收集,数据工程师明确数据的来源及数据的规则,统计师和流行病学专业人员要对清洗后的数据进行统计分析,专业做专业的事儿,才能更好地提高科研质量和效率。

林琳老师表示,医院资源建立自己的科研专病库很重要。专病队列资源库提供的是以疾病为中心的详细临床科研数据,医院各个系统间的数据进行标准化整合,实现医疗系统间各类数据的共享。患者入院期间,可以在电子病历系统或医嘱系统中设置好入组条件,一旦患者满足入组条件,系统就会将其纳入到专病库的数据收集需求中,专病数据库会针对这例患者在院期间的所有数据进行清洗、整理、收集、量化,直接采集到数据专病库中,建设专病数据集。专病库是优化临床科研的研究模式,能够提出创新的科学问题和假设,降低了临床数据获取的时间成本,同时为医生提供了大量的样本。如果想发起多中心的研究,可以通过在区域内乃至全国范围内推广专病库的标准,建立多中心专病库。

临床数据统计分析策略

首都医科医院谷鸿秋教授指出,通过一些已成型的研究,分析其讲故事的方法以及呈现统计图表的形式,再去反推怎样运用好这些统计分析方法,可以使教材中学到的内容很容易理解和运用。

以SPRINT研究为例,这是一项心血管内科医生非常熟悉的强化降压研究。以PICO准则来解析SPRINT研究:纳入人群(P)——收缩压≥mmHg、年龄>50岁伴有心血管疾病风险的患者;要做什么(I)——比较收缩压降至<mmHg和强化降压至收缩压<mmHg的效果;转归是什么(O)——比较心梗、急性冠脉综合征、卒中、心衰、心源性死亡有无差异;时间(T)——中位随访3.46年;研究设计(S)——随机对照研究(RCT)。

统计分析策略有4个步骤。

第一步,确定分析人群。从研究开始到结束的各个环节,每一步有多少人,排除多少人?都需要有具体的数据支撑。

第二步,基线描述与比较。在描述与分析时,有的数据是连续变量,服从正态分布,采用均数±标准差的形式;有的数据可能不是连续变量,会使用中位数的形式;对于分类变量,采用频数(百分比%)进行描述;对于组间的均衡性,样本量较大时,P值基本都会<0.05,此时只是统计学有差异,可能临床没有意义,另一种比较方法为标化差,一般认为标化差>10%,组间就存在均衡性问题,需要做混杂因素的控制。

第三步,效应估计。此时要回答核心问题,即强化降压对比标准降压效果如何?生存分析一般使用风险比(HR),该研究为0.75,即强化降压相对标准降压能够降低25%的风险。此外,还有相关次要指标、安全性指标的分析和展示。

第四步,敏感性分析。分析不同人群或亚组、不同统计模型、不同定义、不同缺失值插补的效果。

统计分析方法主要是使用生存分析、列联表分析和流病统计指标进行分析,这3种方法就是临床研究的“三板斧”。在这“三板斧”中,依据结局指标类型的不同,选择不同的方法。

真实世界研究中缺失值和离群值的处理

国家神经系统疾病临床医学研究中心、国家神经系统疾病医疗质量控制中心、首都医科医院王孟教授指出,缺失值分为可恢复的缺失值和不可恢复的缺失值。可恢复的缺失值指缺失的数值实际存在,但是没有观测到。不可恢复的缺失值指缺失处的数值并不存在。

可恢复缺失值的产生机制包括完全随机缺失、随机缺失和非随机缺失。完全随机缺失指缺失的发生与已观察到的数据和未观察的数据都无关,这种缺失机制可以忽略。随机缺失指随缺失的发生仅与已观察到的数据有关,而与其本身的值无关,此时可利用已有的信息尝试对缺失值进行插补。非随机缺失是指缺失的发生与缺失值本身有关。

缺失值的处理方法主要有两种。

第一种是删除法,即直接删除含有缺失值的观测,或删除频繁出现的缺失变量。通常,直接删除法只有在完全随机的情况下才能得到有效的结论。删除法包括①变量删除法:实际上是变量选择的一个步骤,在进行数据挖掘时,需要从数据集的变量选集中挑选出能对研究的问题进行分析的变量,一个变量如果有多余50%的缺失观测,建议将此变量删除;②完整案例分析法:在完整案例分析中,含有一个及以上缺失值的观测均被删除;③可及案例分析法:原理上与完整案例分析法相同,但其更侧重于使用同一个数据进行多项分析时如何处理缺失。

第二种是插补法,即用多种类型的预测值来插补缺失值。但需要注意的是,用插补法填补某自变量的缺失值时,通常不能用因变量的信息,使用因变量的信息进行插补,可能会强化自变量和因变因变量的关系,从而产生偏倚。插补法共有7种:均值/中位数插补法、末次观测结转法、线性回归法、线性插值法、K-最近邻法、热层插补法与冷层插补法、多重插补法。

离群值是一个与其余数据不同的数据点,也被称为异常值、不和谐值或噪音值,根据产生的原因分为人为离群值和自然离群值。在医学领域中,离群值的主要来源是设备故障、人为失误、病人特殊行为以及患者的自然变异。检测离群值的方法主要有两种:四分位间距法和Z分数法。对于信息时代的大数据离群值处理,通常基于不同算法对数据进行可视化、分类、聚类等处理,以便更加准确、快速地找出庞大数据量中的离群值。离群值的处理包括直接删除法、均值替换法、回归替换法、多重替换法。

中国卒中中心联盟(CSCA)平台数据使用方法

国家神经系统疾病临床医学研究中心、国家神经系统疾病医疗质量控制中心、首都医科医院杨昕教授指出,医生开展临床研究工作,如果没有专病数据库等结构化数据,还可以依靠中国卒中学会搭建的CSCA数据平台。

CSCA是依据《中国卒中中心建设指南》,由中国卒中学会发起、国家神经系统疾病医疗质量控制中心指导的中国卒中医疗质量规范和改进项目。目前CSCA在全国31个省市自治区有家卒中中心,家综合卒中中心。卒中中心有一系列认证流程,中国卒中学会全程进行数据的采集、管理与监控。这一过程需要数据平台的支撑——CSCA数据管理云平台。

卒中数据平台包括数据上报、关键指标反馈、基本信息管理、随访等数据。数据的上报以网络平台为主,手机APP也可以上报,二者采用了一体化设计,方便录入。数据的上报对象为发病年龄≥18岁的成年患者,临床拟诊为缺血性卒中、短暂性脑缺血发作(TIA)、原发性脑出血(不包括外伤性脑出血)、蛛网膜下腔出血之一,卒中事件发生时间距就诊日期7天以内的急性期患者。数据上报的核心包括卒中或TIA医疗服务质量指标及患者的基线特征。病例数据需要有连续性和准确性。

输入数据后,平台可对数据进行处理和简单分析,自动生成图表式报告,除本院概况外,报告还包括本院数据与本省或全国数据的对比、本院不同时间段的对比等。医院都可以在自己的联盟平台上生成报告。临床医生可以使用平台的数据库进行自己的数据分析,申请联合开展的研究。

杨昕教授指出,CSCA旨在推进我国卒中中心的建设,建立基于区域急救系统的转诊模式,制定卒中规范化诊疗的标准操作流程,构建中国卒中医疗质量持续改进模式,开展临床规范和健康教育培训。自年起,国家每年都会出版年度国家医疗服务与质量安全报告,其中脑血管病质控报告的数据一部分就来源于中国卒中中心联盟平台的数据,年度神经系统疾病质控报告的数据也来源于联盟的数据。

同时,基于联盟的数据平台还可以合作开展高质量的研究项目,如急性缺血性卒中再灌注医疗质量改进项目(IMPROVE)。该项目是中国卒中学会于美国卒中学会合作开展的,医院参与了该项目。

目前,中国卒中学会建设的国家脑血管病医疗质量大数据平台已有接近万数据,可用于开展医疗质量数据分析,并与31个省级质控中心进行脑血管病大数据共享。

原标题:《授人以渔,教临床医生进行真实世界研究——中国卒中中心联盟真实世界研究学习班报道》

1
查看完整版本: 授人以渔,教临床医生进行真实世界研究