功能性动作筛查(FMS)争议探究

进人21世纪以来,功能性动作测试(FMS)作为可以综合检查人体灵活性和稳定性,发现人体动作代偿和不对称的一种测试方法,逐渐在体育、消防、军队和大众健身领域得到广泛运用,其中涉及的体育项目涵盖足球、篮球、橄榄球、田径、高尔夫和皮划艇激流回旋等。尽管如此,FMS在实际应用中的信度和效度仍有很大的争议。
    FMS的背景和起源
    物理治疗诞生于第二次世界大战后,历经近60年的演变,其关注点先后经历了骨骼肌肉(1950s-1960s)、中枢神经系统(1960s-1980s)、关节(1980s)和动作(1990s至今)4个时期。
    二战后,伤员的增加和脊髓灰质炎的流行促使物理治疗着重于通过牵拉和支架保持关节的活动度;
    进入20世纪60年代,随着中风、头部或脊髓损伤以及脑部瘫痪病例的增加,中枢神经系统成为物理治疗的重点;
    在20世纪80年代,随着诊断和治疗关节功能的相关技术的诞生,物理治疗转而关注关节软组织和关节障碍;
    进人90年代后,骨骼肌肉疼痛者成为物理治疗的主要对象,单独进行骨骼肌肉或神经系统的治疗都有失完整,物理治疗开始综合考虑骨骼肌肉和神经系统在动作障碍中的作用,动作从此成为物理治疗的关注点。
在20世纪90年代,运动前的身体诊断一般分为医务和运动测试两个层面,但医务诊断的微观化(如髓关节功能诊断)和运动测试的宏观化(如100 m跑)造成的是对运动过程中动作质量(如跨步动作的正确性)的忽视,而未能有效达到运动前身体诊断的应有目的,即预防损伤、提高运动能力,并最终提高生活质量。因此,相关人士呼吁在运动前的身体诊断中增加对身体基本动作的分析,以对从事运动者进行个体化的动作诊断,确认其是否具备进行这种运动方式的基本动作能力。FMS正是在物理治疗关注动作以及常规医务诊断和运动能力测试间存在脱节的背景下,由美国理疗师Gray Cook于2001年首次提出的。
FMS测试内容简要回顾
功能性动作筛查是评价个体基本动作模式的一种测试方法,它由反映人体灵活性和稳定性的7个基本测试动作组成,包括深蹲、跨栏步、直线弓步蹲、肩部灵活性、直腿高抬、控体卧撑和转体稳定性。其中,肩部灵活性、控体俯卧撑和转体稳定性动作还各附带有一个疼痛排查动作。测试者根据受测者完成这7个基本测试动作的质量进行量化评分。评分标准分为0-3分4个等级:3分对应为能够按照要求完成动作;2分对应为受试者可以完成动作,但是出现了动作代偿;1分对应为不能完成动作;当测试过程中出现任何疼痛,此测试对应的评分则为0分(疼痛排查动作时出现疼痛同样为0分)。基于左右侧的不对称将增加身体受伤机率这一现象的发现,7个测试动作中有5个动作(跨栏步、直线弓步蹲、肩部灵活性、直腿高抬和转体稳定性)需要进行身体左右两侧的测试,并且每个动作左右侧各对应一个得分,总分取两侧中较低的评分。7个测试动作的总满分为21分。得分在14分以下说明受试受伤的风险将会很大。本平台前期已经对7项测试的内容进行了介绍,此处不再累述。
FMS的信度与效度争议
FMS自提出后,其信度和效度便一直受到争议,其中,对信度的争议主要集中于不同评分者之间的信度(Inter-rater Reliability)和同一评分者对同一受试者多次评分的信度(Infra-rater Reliability)方面,对效度的争议主要在于FMS能否有效预测和预防损伤。
有关信都的研究:FMS的评分结果是来自测试者对受试者完成动作质量的主观评价,这种主观评价的信度可能受测试者测试水平(有无专业资质)、测试经验以及测试时所选择的观察角度影响,并且,FMS的有些评分标准本身就比较模糊(如旋转稳定性动作中“脊柱保持水平”)。
研究1:Frohm等对8名FMS测试经验为2-7年(FMS测试例数为50-800名)的测试者进行了信度研究,结果表明,尽管个别测试者评出的总分间存在显著性差异,并且同一测试者对同一测试动作两次测试的评分间也存在差异。其中,转体稳定性动作的差异性最大,但是两次测试的平均总分间并无显著性差异。
研究2:Minick等比较了两名经验丰富的测试者和两名新手对40段FMS测试视频同时进行评分的结果,发现在17项评分中((7个测试动作和5个非对称性动作左右两侧得分,即7+5x2=17),新手与经验丰富者之间有14项高度一致,此外与Frohm等人的研究一致,测试者在对转体稳定性动作的评分上差异最大。
研究3:Onate等人对两名测试者两次现场评分结果的研究同样表明,FMS具有较高的信度(不同测试者之间和两次测试间),7个测试动作的得分中除跨栏外,其余6个动作的信度都为中等到高等。
研究4:Schneiders等、Smith等和Teyhen等同样发现测试者间和测试次数间的评分结果间具有高的信度。但是,并不是所有研究都证明FMS拥有高的信度。
研究5:Shultz等研究发现,尽管两次测试间的信度较高,但是测试者间的信度却很低。