中国整形美容协会

信息发布

当前位置：首页 > 新闻中心 > 信息发布

【科研管理】医疗美容不良事件的临床研究常见问题与对策

医疗安全不良事件是指在临床诊疗活动中以及医院运行过程中，任何可能影响患者的诊疗结果、增加其痛苦和负担并可能引发医疗纠纷或医疗事故，以及影响医疗工作正常运行和医务人员人身安全的因素和事件[1]。医疗美容在践行“回归医疗本质”的过程中，不良事件是不可回避的问题。根据不良事件的发生时间、好发因素等制定防治临床路径，是保证患者安全的有效办法。医疗美容不良事件的研究，是医疗美容产品和技术推广的基础。笔者根据近十年医疗美容研究热点，分样本量、研究设计、案例分析、时间因素及讨论四个方面探讨本领域不良事件研究方法，全文如下。

1 样本量

1.1 错误一，有研究共纳入100例患者，共进行240次填充注射。其中发生不良事件5例。不良事件的概率是5%。

药物不良反应以案例数为总样本量是比较合理的。假定一个人各生理指标稳定，在首次与再次使用某药物的反应是比较稳定的。但是在填充注射这种操作性治疗中，药物临床报告显然不太恰当。

比较能让学者接受的是，以次数作为总样本量。填充注射治疗应当认为每次治疗都是独立的，故而发生不良事件应该是5次，而不是5例，不良事件的概率应当是1/48。

让我们在深入思考一下，分析到这里，就结束了吗？显然数据仍有被挖掘的空间。

在透明质酸的填充中，当发生不良反应时即终止治疗，就诊者不再会接受下一次治疗，类似生存结局研究[2]。假定完成1次注射100例中发生2例不良事件，参与第二次注射80例，不良事件2例，第三次注射60例，不良事件1例。从直观数据中，我们得到的应当是首次注射不良事件率2/100，二次注射不良事件率2/80，三次注射不良事件率1/60。当然，上文中提到，基于“每次治疗是独立的”的不良事件率1/48，仍然具有重要的临床意义。

1.2 错误二，某“白皮书”“行业报告”“产品介绍”中写道，产品共卖出60万支，其中不良事件共报告300例，不良事件的概率是300/60万。”

作者“心思巧妙地”借鉴了生态学研究。如当地食盐销售量与食管癌发病率的关系、烟草出售量与肺癌发病率的关系。可惜生态学研究的目的是“析因”，不适用于当前情况。

只要是临床医生，就不太可能用“60万支”作为分母，产品数量是不可能代表治疗次数，更不可能代替治疗的人数。填充类产品常反复注射，且每次不可能恰好是“1支”。

不少临床医生根据自己的经验，判定每次治疗平均5支，治疗次数则为12万次，不良事件的概率为300/12万，四千分之一。拿出自己的临床数据比比，指数级别的差距，可见“不良事件数/售卖量”得出的不良事件率不足取信。

而在临床上，你收集近3个月以上自己的案例（保证规范操作、随访超过90%），无论不良事件是1%，还是10%，都是最真实可靠的。

1.3 错误三，研究纳入了100例患者，随访了50例，其中不良事件5例，不良事件概率是5%。

众所周知，临床研究质量管理中要求，随访率不少于70%。在本例中随访只有50%，不能得出5%这个值。这项研究显然是失败了。

用心钻研统计学者，通过摸索规律，重新设定纳入排除标准，降低总样本量、保留随访数量，从而满足70%随访率的要求，这种“丢车保帅”的方式，或有可能完成论文的发表。

比如，调整案例纳入临床特征、缩短案例纳入时间、改变案例的年龄区间。将失败的研究转化为统计学方法问题，条件重置目标为实现随访/总样本量不低于70%，总样本量、随访数及不良事件数都会变化，加入条件重置后最终总样本量为60，随访数为45，不良事件为3，随访率超过了70%，不良事件概率就是3/60，即5%，这个错误，转身就正确了。

必须承认的是，这个数据只能解释特定条件的案例，研究依然具有真实性。

我常常思考，假如任何条件都不能实现数据上的达标。随访50例与非随访的50例基本数据存在高度相似性，理论上真实概率不低于5%（5/100），不高于10%（5/50）？不良事件在医疗机构的检出率很高，所以真实数据接近5%，而远10%。这两个概率的可信度又应该怎么区分才好呢？

当然，在医疗美容领域，基本可以完成100%的随访，随访率低的情况较少。基于这个认知，假如某个医疗项目的随访不达标（复诊率低），是否应该分析一下影响随访的因素[3]呢？

2 研究设计

2.1 发生率

不良事件的发生率是基本的数据描述。回顾性分析是研究设计的预判。当不良事件的发生率在1%以下时，则提示不良事件原因具有特殊性，建议采用案例分析甚至个案分析进行处理。当不良事件发生率在10%以上时，则可进行因素分析或干预措施效果评价。不良事件发生率1%～10%时，则先进行案例临床证据收集，后视情况建立因素分析或干预措施模型。

需要注意的是，研究者往往忽略回顾性研究的质量，即一些无法排除的干扰因素。部分回顾性研究可以通过设置权重或剔除标准提高研究的可靠性，但规范性操作、护理、随访等因素的差异是统计学无法消除的，故而回顾性研究获得的不良事件发生率是一个模糊的结果。对于回顾性研究中获得的不良事件发生率产生高度质疑时，应以前瞻性研究进行观察，统一纳入排除标准、统一规范操作、规范随访等，从而得出可信度更高的数据[4]。

在两种产品或方法的比较中，我们偶尔能看到一些荒唐的例子观察组术后感染1例（1%），对照组术后感染10例（10%），观察组并发症显著少于对照组，差异有统计学意义。术后感染为严重的医疗质量问题，怀疑术中无菌操作不规范、护理质量不到位等。读者会认为，对照组接受了不公平的、违背医学伦理的治疗体验，研究有严重的偏倚。如果只是捏造数据，拒稿就算结束了。如果研究是真实的，则研究者恐怕要接受调查，甚至追究责任。

2.2 案例分析

透明质酸填充注射导致的眼动脉栓塞，适合案例报道[5]。从诊治到随访，案例临床资料越丰富，对临床的指导意义越大。发生时间、可能原因、临床表现、进展情况、治疗方案等，应尽量详细。专家讨论会要有详细笔录，如有可能邀请知名专家视频会议进行讨论。会议资料就是直接的讨论内容了。

2.3 因素分析

肋软骨隆鼻术术后5年变形率的因素分析。Logistics回归分析是最为常用的统计学方法[6]。以往认为多因素分析模型中的观察指标与样本量的比例为1:20，如样本量为200时，观察指标最多可纳入10个。但随着统计学上的完善，多因素分析模型中观察指标与不良事件比例为1:10，假定样本量为200时，不良事件的发生率为10%，多因素分析模型中只能有两个观察指标，此时就需要考虑更换其他统计学方法了。

统计学只是工具，我们常常需要脱离一些框架，甚至完全弃用。选择什么样的因素纳入观察指标，哪个因素纳入统计模型，都要依从专业基础认知。当某一个指标在单因素分析中没有意义，但有足够理论支持，也是可以纳入多因素分析模型中的。比如，隆鼻术二次手术的因素分析应当用归类法简单描述，每个结果-因素环节进行直接的手术操作、解剖学支持，比所谓的统计学模型，更接近真实。

2.4 干预措施

透明质酸注射中的回抽操作，就是典型的干预措施。首先，回抽操作来自于个人经验分享，可能有时回抽，有时不回抽。我们可以在回顾性研究的多因素分析模型中，纳入“回抽”“不回抽”进行统计学论证。但在临床实践中，没有文案辅助我们记录回抽了还是没有。模型虽好，不切实际。假定“不回抽”可能会带来损害风险，开展“回抽”“不回抽”的前瞻性研究，可能损害“不回抽”组的生命健康，是违背医学伦理学原则的。故而这种高质量的研究办法显然也是行不通的。

进行非同时空对照，是一个切实可行的办法，比如2020年全年回抽注射者100例纳入回抽组，再从2016-2019年300例非回抽注射者中抽取100例纳入非回抽组，非回抽组的纳入可使用“倾向性评分匹配法”[7]以保证两组研究对象均衡。非时空对照的时间跨度不能过大，以避免因医疗质量的提升或降低而影响结果。

3 时间因素

3.1统计值为HR的COX回归模型[8]

鼻整形术后鼻部变形往往发生在术后3-5年。采用单一的3年变形率或5年变形率是扁平化数据的表现。鼻整形术后鼻部变形者的临床资料往往是这样的“案例1 随访5年，未见变形”“案例2 随访6个月，未见变形”“案例3 随访9个月，变形”“案例4 随访4年，变形”......

时间—结局，用Logistics回归就错了。最恰当的应该是Cox回归模型。

3.2 不良反应持续时间[9]

以程度来定义短暂性的不良事件发生率并进行两组比较时，其结果往往是没有差异的。而在此基础上进一步设计或有可能产生差异。这个最好的度量衡就是时间，最简单有效的统计方法就是t检验。比如疼痛VAS≥5分，定义为疼痛，再比较两组的疼痛时间。在外科领域，微创术式组的患者恢复期更短。同理，假定某个填充注射产品引发的炎症反应更低，就有理由相信该组患者不良事件存在时间更短。肿胀、神经感觉异常等也是如此。

4 讨论

4.1 并发症的讨论是数据解读与专业解释的结合

案例报道类文章重在临床管理体系的建立，包括并发症的预判、临床表现，治疗方案的制定及治疗效果的反馈。干预性研究，如回抽、不回抽，是否添加利多卡因等，一般指向一个因素，需要有扎实的专业分析。如回抽的学说假设，已有的基础研究、临床研究证据支持等等。必要时还要分析填充部位的解剖学特征、血管走形等。在添加利多卡因的透明质酸填充剂的临床评价论文的讨论中，利多卡因的生物化学特性以及对局部注射部位的影响应详细说明，以体现科学的理论基础。以结果数据为导向的文章，首先要解读数据，包括差异性、差异性。讨论的重点是差异性，最容易被忽略的是可靠性。

4.2 差异性的比较以及归因

比如本研究并发症5%，同类研究并发症为2%～8%，基本相符。

本研究结果显示并发症10%，高于同类报道的2%。分析原因为......

有文献报道透明质酸填充并发症发生率为2%，本研究结果显示，透明质酸在泪沟畸形填充中并发症为10%，则提示泪沟畸形的填充高于一般的透明质酸面部填充效果。

数据解读离不来归因。归因可以是统计学上分析，也可以说直接的专业分析。

对于有Logistics回归分析的研究来说，统计学上有差异的因素，要进行专业的理论论证，如填充剂量大的患者容易发生并发症，分析如下......

不需要数据上的差异性或相关性分析的论文也比比皆是。比如鼻部术后再次修复的原因分析、重睑术后并发症分析等，可直接从手术操作中寻找答案。只做归类数据统计，不做差异分析。这种饱含作者经验的论文，完全不需要统计学方法的加持。

5 专业上归因的甄别

5.1 术中操作不当

术中操作不当是手术项目并发症的常见原因，但不适合解释操作性不强。某项填充注射类产品面部填充前瞻性研究中说“不良事件过多是术中操作不当引起的”，潜台词为“不是产品的问题，是医生的问题”。

前瞻性研究旨在客观评价，临床操作、数据整理、科研管理等均应有相应专业人员通过培训并考核合格后上岗。“研究者操作不当”，则提示“研究者不具备基本资格”或“产品本身操作有难度”，最终结论就是，这是一项仓促的、低级的、毫无质量管理的研究，结果不可信。读者对研究的评价尚且如此，对产品的评价又会好到哪里去呢？

5.2 术后护理不佳

因一般性的医疗美容项目并不需要住院观察，即便前瞻性研究，也无法完全避免术后自我护理不到位。激光术后的护理不佳，特别是防晒不到位，往往会将病例剔除研究。非前瞻性的研究，则更注重实践，文内是可以吸纳部分特殊案例的。

值得注意的是，术后护理不佳，只可以解释部分、少发并发症，如术后感染、色素沉着等。如果文内报道，护理不佳导致重睑术后患者眼睑闭合不全1%（1/100），这是典型的错误之一，因为眼睑闭合不全与术中切除皮肤过多有关，与护理关系不大。再如，术后护理不佳，导致术后感染10%（10/100）；超过5%即认定非偶发事件，为严重的医疗质量问题，怀疑术中无菌操作不规范、护理质量不到位等。

6 小结

当前，医疗美容不良事件的研究越来越多。笔者文中列举是比较常见的类型，难以面面俱到。建议开展相关研究者

第一，以临床问题为导向，从临床问题的解答思路上，设计临床研究方案。

第二，广泛吸收各个渠道的文献资料，包括但不限于书籍、期刊、会议、专家意见、科室意见、其他学科的成果等。

第三，保证数据的真实性、可靠性，再此基础上强化科研质量管理，保证研究质量。

第四，加强统计学基础知识的学习，避免错误数据的使用，进而用科学的统计学方法（如权重），控制混杂因素，进一步提高数据的可信度。

参考文献：略

张少伟，张云川

《中国医疗美容》杂志社

搜索