Letter to the Editor
DOI:
https://doi.org/10.17784/mtprehabjournal.2017.15.497Keywords:
post-traumatic, cervicalgiaAbstract
Caros editores,
O artigo recente “Avaliação da eficácia clínica da microcinesioterapia na cervicalgia pós-traumática: um ensaio clínico randomizado, duplo-cego” é provavelmente um dos estudos mais ambiciosos, do ponto de vista metodológico, publicado sobre este tópico. Tais estudos são um primeiro passo necessário para avançar nas terapias manuais.
No entanto, temos várias preocupações com a análise estatística proposta e gostaríamos de fornecer uma análise alternativa dos dados brutos fornecidos pelos autores.
Primeiro, a análise proposta se concentra nas diferenças dentro do grupo (intervenção pré-pós). Os autores mostram melhora estatisticamente significante do resultado primário da dor avaliado pela escala visual analógica (EVA), e o resultado secundário da amplitude de flexão-extensão no grupo de microcinesioterapia (MK) quando os resultados para pacientes no grupo controle não mostram diferença significativa. Nesta base, os autores concluem sobre a eficácia do MK. No entanto, como apontado por Senn 1, esse modo de agir é inconsistente com o objetivo de ensaios clínicos controlados e randomizados (ECR). Os ECRs exigem comparações diretas entre os resultados dos diferentes grupos. Gelman 2 e Nieuwenhuis 3 também apontaram que a diferença entre “significativo” e “não significativo” não é, por si só, estatisticamente significante. Consequentemente, mais uma vez,
Quando os autores propuseram análises entre grupos, apenas os resultados pós-intervenção foram comparados e as diferenças basais entre os grupos não foram levadas em consideração. No entanto, no presente estudo, um boxplot sugere que a pré-intervenção da EVA foi menor no grupo controle do que no grupo MK (veja a figura 1). Além disso, a escolha de um teste t independente para comparar os resultados pós-intervenção nos parece uma abordagem inválida, considerando o tamanho pequeno da amostra (levando a uma distribuição não normal da média das amostras).
Por último, a diferença clínica mínima interessante (MCID) não é mencionada em nenhum lugar, nem a variabilidade esperada do efeito correspondente. Portanto, o tamanho da amostra necessário para detectar o efeito com 80% de poder não foi calculado com base em bases clínicas, mas com considerações estatísticas: “Sessenta pacientes foram planejados para serem incluídos no protocolo. Esse número permite satisfazer as condições de validade para o uso razoável da ferramenta estatística escolhida. ” Como resultado, o poder estatístico é desconhecido e provavelmente muito inferior a 80%. Os autores afirmaram que “o número reduzido de participantes poderia ter resultado na limitação da força estatística dos testes. No entanto, os resultados mostram um nível de significância muito superior ao limite de 5% retido.
Considerando (a) o desenho do estudo (ECR), (b) as propriedades primárias do resultado (o EVA sendo apenas ordinal, considerando que uma determinada alteração em um paciente pode ter magnitude diferente da mesma alteração aparente em outro Kersten 6), evitando estatísticas paramétricas para análise.), (c) a diferença entre os grupos na EVA basal (fig. 1) e (d) a diferença nas formas da pontuação da alteração da EVA em cada grupo (fig 2), invalidando o uso do teste independente da soma de Wilcoxon para comparação mediana, nenhuma das análises propostas pelos autores é adequada para a estimativa do efeito do tratamento. Uma análise estatística adequada seria estimar a diferença nos escores médios de alteração da EVA (intervenção pré-pós) entre os grupos usando a abordagem de bootstraping. A diferença estimada correspondente em medianas (ver informações adicionais para o código R) foi -1. 2 mm a favor do grupo MK, e o intervalo de percentil de autoinicialização associado no nível de 5% foi de [-4,0; 0,1] (fig. 3) Assim, a diferença de medianas não foi estatisticamente significante.
Para o desfecho secundário (amplitude de flexão-extensão), a diferença estimada em medianas foi de 10,5 graus a favor do grupo MK, e o intervalo percentil de autoinicialização associado no nível de 5% foi de [-0,5; 20,5] (fig. 4). Assim, a diferença de medianas também não foi estatisticamente significante.
No contexto de risco beta desconhecido, é impossível concluir qualquer coisa com esses resultados não significativos.