Introducción
El interés en la medición de resultados en medicina ha sido creciendo durante décadas. Para medir los estados de salud y enfermedad percibidos por el paciente se han desarrollado multitud de cuestionarios y escalas. Las patient-reported outcomes measures (PROM) o la evaluación de los resultados comunicados por el paciente (ERCP) son una herramienta para valorar la calidad de la asistencia sanitaria percibida por los pacientes y las perspectivas de estos sobre los resultados de la salud(1). Por tanto, las PROM son sistemas diseñados para recoger la opinión de los pacientes sobre la efectividad de los cuidados de salud que se les proporcionan; dan información sobre la salud del paciente y el impacto que tienen los tratamientos o los cambios en su estilo de vida sobre su calidad de vida. La opinión del paciente de cara a su asistencia sanitaria es un indicador mayor de calidad asistencial.
Actualmente, existe un interés generalizado en potenciar el uso de las PROM para conocer la eficiencia de los procedimientos por parte de los gestores de la salud, así como de los profesionales sanitarios para mejorar la calidad de su asistencia médica y en la investigación médica(2).
Existen muchas PROM disponibles para los cirujanos de pie y tobillo, pero hay poco consenso sobre qué evaluación es la más apropiada para un determinado procedimiento o diagnóstico(3). Pueden evaluar desde simples resultados cualitativos sobre dolor o satisfacción, hasta complejos test adaptados en computadoras, que utilizan preguntas tomadas de una gran base de datos de preguntas basadas en respuestas previas (computer adaptive test –CAT–)(4).
En líneas generales, cuando queramos integrar las PROM en la práctica clínica, se recomienda utilizar un cuestionario de salud general, junto con un cuestionario funcional específico validado de la región anatómica intervenida, para así obtener una mejor valoración del resultado obtenido con un determinado procedimiento. Deben emplearse cuestionarios concisos para minimizar la carga al paciente, maximizar la participación del mismo y asegurarse de que se recopilen datos significativos(5,6).
Existe una necesidad fundamental de medidas PRO coherentes y validadas, para poder realizar estudios prospectivos de alta calidad con PROM validadas, así como métodos eficientes de recopilación de datos, análisis y difusión. Con este fin, muchas sociedades científicas y organizaciones han establecido y respaldado pautas para la obtención y el análisis de PROM(3), como por ejemplo, la International Society for Quality of Life Research, el National Quality Forum, el Patient-Reported Outcomes Measurement Information System (PROMIS) en los Institutos Nacionales de Salud (National Institutes of Health –NIH–) y la American Orthopaedic Foot and Ankle Society (AOFAS) con la iniciativa Orthopaedic Foot and Ankle Outcomes Research (OFAR) Network(7).
Características ideales de las patient-reported outcomes measures
Las PROM ideales deben estar disponibles de manera gratuita e incluir las siguientes características para su validación: precisión, validez, sensibilidad y cobertura(8,9).
- La precisión es la ausencia de error estándar en la medición. Es el grado de reproducibilidad, es decir, el grado de similitud que presentarían los resultados si se repitiera la aplicación del mismo cuestionario en condiciones clínicas similares.
- La validez es la ausencia de error sistemático en la medición. El cuestionario mide lo que realmente se propone medir.
- La sensibilidad es la capacidad de un test para detectar cambios o modificaciones clínicamente relevantes en el estado de salud. Cuando se quiere seguir la evolución de un procedimiento quirúrgico, es importante que el cuestionario detecte la diferencia mínima clínicamente importante (minimal clinically important difference –MCID–) para poder detectar los cambios en el tiempo.
- La cobertura es el rango de puntuaciones sobre las que una medida determinada es sensible. El cuestionario no puede demostrar una puntuación peor en los pacientes clínicamente deteriorados y una puntuación mejor en pacientes con mejor situación clínica; por tanto, se debe evitar el efecto suelo y techo.
Tipos de patient-reported outcomes measures en pie y tobillo
La exploración física y las escalas de puntuación clásicas proporcionan una información muy valiosa al cirujano de pie y tobillo. Sin embargo, la valoración de resultados se considera actualmente incompleta si no se evalúan otros aspectos, sumados a la exploración clínica (habitualmente anotados en la historia del paciente), tales como la satisfacción y la intensidad del dolor, junto con otros como la calidad de vida percibida por el paciente ante un eventual tratamiento que se le ha realizado (Figura 1).
Figura 1. La valoración de resultados debe contemplar: la exploración clínica, la intensidad del dolor, la satisfacción del paciente junto con la calidad de vida, usando instrumentos genéricos y específicos.

Exploración física
Es y ha sido la herramienta más utilizada para valorar los resultados, porque aporta datos relevantes como el balance articular, las inestabilidades, la fuerza, etc. Sin embargo, los parámetros clínicos no siempre se correlacionan con el estado de salud y satisfacción del paciente.
Calidad de vida percibida por el paciente
Se han convertido en herramientas esenciales para determinar de forma precisa el resultado de los tratamientos según la visión del paciente.
Hay numerosas PROM disponibles para los cirujanos de pie y tobillo con poco consenso sobre cuáles son las más adecuadas para una patología o área determinada. Estas medidas varían ampliamente en extensión, validez y contenido.
Al integrar las PROM en la práctica clínica, se recomienda que estas sean preferentemente PROM validadas, para que, de la mejor forma posible, evalúen el dolor, la función y la salud general. Además, se deben utilizar las PROM más concisas, para minimizar la carga del paciente, maximizar su participación y garantizar que se recopilen datos significativos.
Con esta recopilación de datos, obtendremos el resultado evaluado directamente por el propio paciente y basado en su percepción de la enfermedad y su(s) tratamiento(s).
Las PROM se pueden categorizar en instrumentos de valoración del estado de salud genéricos y específicos. En cualquier planteamiento de estudio de una patología y los resultados de un tratamiento (quirúrgico o conservador), se debe emplear un cuestionario genérico asociado a otro específico.
Los instrumentos genéricos están diseñados para evaluar el estado de salud en cualquier paciente, independientemente del tipo de enfermedad que presente. Pretenden medir los aspectos físicos, mentales y sociales, todos relacionados con la calidad de vida (calidad de vida relacionada con la salud –CVRS– o health related quality of life –HRQL–). La principal ventaja es la posibilidad de comparar el impacto relativo de diferentes programas de salud. Sin embargo, pueden no proveer de información suficientemente detallada o no medir el cambio de satisfacción del paciente con el tiempo. Los más frecuentemente usados son (Tabla 1):
Tabla 1. Patient-reported outcome measures (PROM) generales y específicas más usadas en pie y tobillo (MCID: diferencia mínima clínicamente importante)

Short Form-36 (SF-36)
Es un autocuestionario genérico (36 preguntas de respuesta múltiple) que permite calcular el perfil de CVRS. Se valoran 8 aspectos de salud diferentes (dolor corporal, función física, rol físico, salud general, vitalidad, función social, comportamiento emocional y salud mental), de manera que se puede realizar una valoración conjunta o para cada dominio de forma independiente. La duración de respuesta es de 5 a 10 minutos. Existe la versión traducida y validada al castellano, lo que aumenta su facilidad de administración en nuestro entorno. Uno de los principales inconvenientes que tiene es la complejidad en el cálculo del resultado estadístico, aunque permite detectar modificaciones mínimas de la calidad de vida.
Short Form-12 (SF-12)
Es la forma reducida del SF-36 a 12 preguntas, que permite un cálculo global pero no la medición de los diferentes aspectos de salud. Su principal ventaja es la mayor facilidad de aplicación al ser más reducido; sin embargo, su potencia es menor a la de la versión extendida.
Nottingham Health Profile
Consta de una primera parte con 38 preguntas donde se valoran 6 aspectos de salud (dolor, movilidad, reacción emocional, energía, aislamiento social y sueño) y una segunda parte con 7 cuestiones con relación a la vida cotidiana. Son preguntas de respuesta sí/no, siendo su principal ventaja la sencillez de manejo, ya que el resultado se obtiene en forma de una única puntuación global, lo que facilita el uso estadístico de este cuestionario. El inconveniente es que no permite el estudio diferenciado de aspectos concretos de la salud (calidad de vida, dolor, satisfacción del paciente, etc.) y ofrece solo una valoración de salud/enfermedad, a diferencia de otros cuestionarios que permiten detectar estados positivos o negativos de salud.
EuroQol
Se trata de un autocuestionario creado por un grupo europeo con la pretensión de armonizar la evaluación de la calidad de vida europea y, actualmente, también mundial. Está formado por una parte inicial de 15 preguntas con 3 opciones de respuesta que exploran la movilidad, los cuidados personales, las actividades cotidianas, el dolor y la depresión, y una segunda parte formada por una escala visual analógica sobre la percepción de salud global del paciente.
Los instrumentos específicos están concebidos para valorar el estado de salud en un tipo concreto de enfermedad, función o tratamiento. Su principal ventaja es ser más discriminatorios, presentar mayor fiabilidad y respuesta al cambio. Detectan mejor los cambios percibidos por cada paciente y están mejor diseñados para medir los resultados a nivel individual. Su inconveniente es que no permiten la comparación entre diferentes poblaciones o procesos. Un estudio reciente demostró que utilizar más de un cuestionario en la investigación clínica puede ser innecesario. Los más frecuentemente utilizados son (Tabla 1):
American Orthopaedic Foot and Ankle Society Score (AOFAS)
Se divide en 4 escalas anatómicas de 100 puntos: tobillo-retropié, mediopié, hallux y dedos menores. Cada subescala asigna puntos, con peso variable, basado en datos subjetivos y objetivos, en 3 categorías: dolor, función y alineación. Las variables incluyen calificaciones categóricas para el rango de movimiento de las articulaciones, anomalías en la marcha, estabilidad, alineación y calzado. Es la escala más utilizada en nuestro medio, aunque es probable que no sea suficiente para cuantificar o comparar con precisión los resultados y la satisfacción del paciente(3,7). No está validada en ningún idioma.
Foot and Ankle Outcome Score (FAOS)
Es una PROM de 42 elementos para el pie y la función del tobillo con buena fiabilidad y validez. Ha sido validada para una amplia variedad de patologías de pie y tobillo, incluido el pie plano adquirido del adulto, hallux valgus, hallux rigidus y reconstrucción de ligamentos. Se ha encontrado un instrumento débil para la artrosis del tobillo. La longitud de esta encuesta, sin embargo, puede crear una carga significativa para el paciente.
Foot and Ankle Ability Measure (FAAM)
Su finalidad es la de evaluar subjetivamente el efecto de una patología del pie/tobillo y su posible deterioro de la función física, relacionándolo con la calidad de vida, en el momento de la realización.
Se desarrolló en 2003 como una escala de 31 preguntas que informa de una puntuación tanto en la función diaria como en los deportes(10).
Ha sido validado en español en 2017 y ha demostrado su fiabilidad en una amplia población con dolor, inestabilidad de tobillo aguda y crónica, fracturas, fascitis plantar y rotura del tendón de Aquiles y diabetes mellitus.
Índice de discapacidad del pie y el tobillo (Foot and Ankle Disability Index –FADI– y FADI Sport)
El FADI (1999) es una versión anterior del FAAM todavía muy usado. Los 2 instrumentos son idénticos excepto por 5 elementos adicionales que se encuentran en el FADI. Cuatro de estos elementos evalúan el dolor y el quinto elemento evalúa la capacidad de un individuo para dormir. Estos 5 ítems fueron posteriormente eliminados de la subescala de actividades de la vida diaria (AVD) para mejorar las propiedades psicométricas del instrumento. La subescala deportiva se mantuvo sin cambios, lo que resultó en un nuevo instrumento, el FAAM.
Es un cuestionario de 34 ítems dividido en 2 subescalas: el índice de discapacidad del pie/tobillo y el índice de discapacidad del pie/tobillo en el deporte. El FADI tiene 26 ítems con 104 puntos máximo y el FADI Sport tiene 8 ítems con 32 puntos que representan el mejor estado. El FADI contiene 4 ítems relacionados con el dolor y 22 ítems relacionados con la actividad. El FADI Sport contiene 8 preguntas relacionados con la actividad. Evalúa las tareas más difíciles que son fundamentales para el deporte. El FADI Sport es el único específico diseñado para atletas.
Índice de Función del Pie (Foot Function Index –FFI–)
Se creó en 1991 como un PROM de 23 elementos que evalúa la función del pie en 3 dominios: dolor, discapacidad y limitación de la actividad.
Consta de 23 preguntas que se agrupan en 3 subcategorías: el impacto del trastorno de pie sobre el dolor, la dificultad y la limitación de la actividad. Las puntuaciones más altas significan un peor estado de salud del pie. Se puede usar en la práctica clínica, estudios y ensayos para evaluar la relación de patologías en el pie con el dolor, la función y la limitación funcional del paciente.
Ankle Osteoarthritis Scale (AOS)
Es una medida sólida del efecto del dolor y la disfunción en pacientes con artrosis de tobillo en etapa terminal. Consta de 2 dominios: dolor y discapacidad. Cada uno tiene a su vez 9 ítems. En 2019, Liu et al. validaron la AOS en un estudio comparativo prospectivo que confirma que es una medida sólida para evaluar el dolor y la disfunción en los pacientes con artritis de tobillo en etapa terminal, lo que respalda su uso previo en numerosos estudios clínicos(11,12).
Manchester-Oxford Foot Questionnaire (MOXFQ)
Consta de 3 dominios (dolor, caminar/estar de pie e interacción social) con 16 ítems en total. Cada elemento se responde en una escala de 5 puntos (0 a 4, donde “4” está asignado a “más grave”; las mayores puntuaciones denotan mayor gravedad). La puntuación para cada dominio se calcula como la suma de la puntuación de cada elemento individual. Se expresa en una métrica de 0 a 100 (100 = mayor deterioro). El MOXFQ ya se ha configurado con una puntuación resumida (MOXFQ-Index). Actualmente, se trata de un cuestionario validado en español específicamente para la cirugía correctora del hallux valgus (Schrier, 2015), donde se demuestra sus propiedades psicométricas, validez, fiabilidad y capacidad de respuesta(13).
Self-Reported Foot and Ankle Score (SEFAS)
Originalmente fue desarrollado para evaluar el resultado después de la cirugía de reemplazo de tobillo, basado en el cuestionario de tobillo total de Nueva Zelanda. Consta de 12 ítems, con 3 subescalas (dolor, función y síntomas adicionales). Entre otras, hay 4 preguntas que se centran en la patología de pie/tobillo. Recientemente, ha demostrado ser una buena alternativa al MOXFQ(13).
Short Musculoskeletal Function Assessment (SMFA)
El SMFA se adaptó en 1999 como una versión del Musculoskeletal Function Assessment (MFA). Con 46 elementos, el SMFA presenta un índice de disfunción, así como un índice de molestias, donde a los pacientes se les pregunta cómo interfiere su función con las actividades diarias, como dormir, realizar deportes y actividades familiares. Aunque no es específico para la ortopedia de pie y tobillo, se ha encontrado que tiene una validez similar a la SF-36. Una revisión reciente encontró que el SMFA tiene alta validez y fiabilidad, así como moderada capacidad de respuesta.
Kofoed Ankle Score
Se trata de una escala similar a la de la AOFAS de retropié y, junto a ella, son las más utilizadas en artroplastia de tobillo. Se basa en la exploración física realizada por el médico y es específica de la región. Los 100 puntos reflejan el mejor estado clínico. Su estructura difiere ligeramente de la de la escala AOFAS de retropié (40 puntos-dolor, 50 puntos-función y 10 puntos-retropié), pues el Kofoed, por el contrario, atribuye 50 puntos al componente de dolor, solo 30 puntos al componente de función y 20 puntos al rango de movimiento (range of motion –ROM–). Estas diferencias ilustran que, a pesar de ser puntuaciones de 100 puntos, los valores absolutos no se pueden comparar fácilmente entre estudios. Al igual que con la escala AOFAS de retropié, la validez, la fiabilidad, la capacidad de respuesta y su interpretación son limitadas(14).
Victorian Institute of Sport Assessment-Achilles (VISA-A)
La escala VISA es específica y única, desarrollada para la evaluación de la tendinopatía Aquilea y publicada por Robinson et al. en 2001. La VISA-A contiene 8 ítems que evalúan la rigidez, el dolor y la función. Ha presentado niveles aceptables de fiabilidad y validez, aunque no está validada(15).
Activities for daily living (ADL)
Son una serie de actividades básicas necesarias para la vida independiente tanto en el hogar como en la comunidad. Existen muchas variaciones, pero en general existen categorías básicas tales como la higiene personal, vestirse, comer, mantener la continencia y la transferencia o movilidad. Esta última es la más interesante para la patología de pie y tobillo, ya que son actividades para poder ponerse de pie desde una posición sentada, así como entrar y salir de la cama, y la capacidad de caminar de forma independiente de un lugar a otro. El nivel de independencia se basa en si alguien puede realizar estas actividades por su cuenta o si necesita la ayuda de un cuidador familiar.
European Foot and Ankle Society Score (EFAS Score)
El desarrollo y la validación de la puntuación de la EFAS comenzó en 2013 por el Dr. Ritcher(16), debido a que no había una puntuación adecuadamente validada para la articulación del pie y el tobillo en varios idiomas europeos. La EFAS creó un comité de puntuación para desarrollar y validar una nueva puntuación en las lenguas maternas europeas comunes (en 2018 se validó simultáneamente en 7 idiomas europeos) y en la actualidad se siguen validando nuevos idiomas. Todavía está en proceso su validación al español. Consta de 6 grupos de preguntas cuya puntuación máxima es de 24 puntos (la mejor posible) y la puntuación mínima es de 0 puntos (la peor posible). Con esta PROM conseguimos conocer el dolor, la función física y, además, se encontró que es internamente consistente, unidimensional y sensible a los cambios.
Dolor y satisfacción
Junto a los cuestionarios genéricos y los específicos, se debe evaluar el dolor del paciente, puesto que, si un paciente presenta dolor residual tras una intervención quirúrgica una vez finalizado el proceso, puede influir en su grado de satisfacción.
Los métodos ideales para la valoración del dolor son: la escala visual analógica (EVA) o visual analogue scale (VAS) y el NRS (numeric rating system). La primera consta de una línea horizontal de 10 cm junto a unas “caritas” que expresan la intensidad. El lado izquierdo es designado “sin dolor” y a la derecha se designa como “el peor dolor imaginable”. Se pide al paciente que marque en la línea el punto que indique la intensidad de su dolor y se mide con una regla milimetrada. La intensidad se expresa en centímetros o milímetros; se agrupará en dolor leve si el paciente puntúa el dolor como menor de 3, dolor moderado si la valoración se sitúa entre 4 y 7, y dolor severo si la valoración es igual o superior a 8. Actualmente, está validado para los resultados tras diversos tratamientos y ha demostrado ser reproducible. Similar en reproducibilidad es el NRS, en el que se califica de forma exclusivamente numérica con 11 puntos (0 = sin dolor y 10 = mayor intensidad), donde el paciente seleccionará el número que más se acerca a la intensidad de su dolor. Su aplicación para propósitos de la investigación clínica ha demostrado una eficacia más variable que la EVA(17,18).
Evolución de las patient-reported outcomes measures en cirugía de pie y tobillo
La incorporación de las PROM en los estudios y la práctica clínica de forma generalizada en todas las áreas de la medicina comenzó a finales del siglo XX, aumentando su uso y su número durante los últimos 25 años. En lo referente a la cirugía de pie y tobillo, existe publicada una revisión de la literatura(3,8,19) sobre el uso de PROM en pie y tobillo en el periodo que comprende los años 2012 a 2016(9). Dicha revisión identificó 89 mediciones, siendo las más frecuentemente utilizadas aquellas que abarcaban la evaluación de la función, la salud y cuestionarios diseñados para diagnósticos y procedimientos específicos. Las escalas más usadas fueron: AOFAS, VAS, SF-36, FAOS y SF-12, en orden decreciente. Aunque la escala de la AOFAS ha sido la más frecuentemente utilizada en los últimos 15 años, actualmente se está viendo mermado su uso tras una publicación de la AOFAS en 2011 que desaconsejaba su utilización como PROM única(9,20) debido a la detección de fallos en su validez y precisión. Por el contrario, la VAS ha incrementado su tasa de uso, pudiendo en el futuro, si la tendencia actual continúa, superar a la escala de la AOFAS(11,13).
El desarrollo más reciente de las PROM(21), en el año 2004, incluye el uso de las pruebas adaptativas computarizadas o CAT. Este tipo de formato minimiza la carga del test, reduciendo el número de preguntas que precisan ser completadas para obtener la máxima información sobre los resultados del tratamiento. El desarrollo sistemático y la facilidad de administración con CAT hacen que los instrumentos PROMIS constituyan una importante contribución a la práctica clínica e investigadora(22,23).
El presente y el futuro de las patient-reported outcomes measures
Cualquier esfuerzo para integrar las PROM en la práctica clínica debe tener como objeto la recopilación de datos significativos de forma eficiente, minimizando la carga del paciente, junto con herramientas útiles de uso y almacenamiento de estos datos. Desde el punto de vista práctico, existen múltiples barreras para que el cirujano de pie y tobillo pueda incluir todos los datos en el historial médico. El primer escollo es acerca del tipo de cuestionario que se debe utilizar, con preguntas con las que discernir cuál es el más fiable, qué escalas de medida están validadas o cómo se puede registrar, analizar o comparar los datos con los normales en la población de referencia o en la población general.
La selección del cuestionario resulta fundamental, puesto que una mala selección del mismo puede generar confusión en los resultados y no tener ninguna utilidad. Para llevar a cabo este esfuerzo tan importante por parte del cirujano, el paciente y el sistema, deben usarse PROM de pie y tobillo validadas y de consenso. Se debe evitar abrumar a los pacientes con cuestionarios engorrosos o recopilación de datos que son redundantes o de poco valor que interrumpen el flujo de trabajo durante la consulta médica. Idealmente, los datos de las PROM deben recopilarse durante el día de la visita (preferiblemente en otra sala), explicando las dudas al paciente. Los autores recomiendan el uso de, al menos, una medida de la función física, una de los niveles medios de dolor y una de la salud global. Además, una evaluación de la satisfacción con el tratamiento puede ser una herramienta útil para garantizar la calidad.
El objetivo final es maximizar los porcentajes de respuesta y minimizar las interrupciones durante su realización. Existen diferentes formas para recopilar PROM que no sobrecargan al personal ni interrumpen la práctica clínica, a diferencia de las rellenadas en papel en la consulta, tales como correos electrónicos, llamadas por teléfono y, últimamente, el uso de tabletas electrónicas(24). Los estudios han certificado que el método de cumplimentación no obstaculiza la puntuación, la validez o la confiabilidad.
En el año 2004, el NIH de los EE. UU. inició un proceso para superar todos estos desafíos principales de la investigación clínica del estado de salud y el PROMIS(12,13,14) fue una de sus primeras iniciativas. El PROMIS está basado en la colaboración de grupos de investigación y centros de excelencia estadounidenses con el objetivo de generar PROM estandarizadas que, adaptadas idiomáticamente, puedan usarse internacionalmente en la investigación y la práctica clínica. Globalmente extendido, tiene el potencial de transformarse en una plataforma universal para la evaluación del estado de salud, con terminología y métrica común de los síntomas y el funcionamiento humano. El PROMIS ha demostrado su valor y poder en la evaluación de los PRO en pacientes con patología de pie y tobillo; se obtienen utilizando 2 de estos dominios: función física (FP) e interferencia del dolor (PI).
En 2012, la AOFAS creó la OFAR Network como una red nacional para la agregación de datos de PROM (rellenando los cuestionarios FAAM y FFI) de pie y tobillo(7). Se realizó un estudio piloto inscribiendo a más de 300 pacientes de 10 instituciones diferentes. Informaron de un 76% de finalización de PROM preoperatorias y un 56% de finalización de PROM postoperatorias y a los 6 meses en los 10 sitios. Se demostró que una red nacional para la recopilación de datos de PROM es factible. En la actualidad, la red OFAR está utilizando una plataforma basada en la nube, comunicación directa con EMR, un portal para pacientes, y alertas automáticas de pacientes.
A medida que las PROM se integran cada vez más en la práctica clínica, los registros deben estar preparados para desempeñar un papel fundamental en la recopilación, la agregación, el almacenamiento, el procesamiento y el análisis de estos datos desde una amplia red de sitios periféricos. Por lo tanto, si se realiza una amplia recopilación de los datos de los cuestionarios en un sistema de registro intra- e interhospitalario con un tratamiento específico, se podría colaborar en la investigación médica, la vigilancia poscomercialización de dispositivos médicos y en estudios epidemiológicos a gran escala.