Desarrollo de un panel de biomarcadores para la detección de pacientes con sospecha clínica de cáncer de pulmón

  1. Blanco Prieto, Sonia
Dirixida por:
  1. Francisco Javier Rodríguez Berrocal Director
  2. María Páez de la Cadena Tortosa Director

Universidade de defensa: Universidade de Vigo

Fecha de defensa: 17 de xullo de 2015

Tribunal:
  1. Jacobo de Uña Álvarez Presidente/a
  2. Óscar Javier Cordero Santamaría Secretario
  3. Virginia Leiro Fernández Vogal

Tipo: Tese

Teseo: 387321 DIALNET

Resumo

A día de hoy el cáncer de pulmón es la neoplasia más mortal, siendo la responsable de un 20% de las muertes debidas a cáncer, tanto a nivel mundial como europeo, reflejado en una baja tasa de supervivencia a los 5 años, que en España se sitúa en el 10,7%. Dos son los grupos principales en los que se divide esta entidad, el cáncer de pulmón microcítico o de célula pequeña (CPM), y el cáncer de pulmón no microcítico (CPNM), que constituye el 75-80% del total. Sólo un 15-20% de los cánceres de tipo no microcítico se diagnostican en estadios tempranos. De la necesidad de acelerar el momento del diagnóstico surgieron los programas de cribado mediante tomografía computarizada de baja dosis de radiación (TCBD). Mientras en EEUU esta estrategia ha sido recomendada tras demostrar una reducción de la mortalidad por cáncer de pulmón en un 20%, en Europa está por demostrar su eficacia. En España se han creado en los últimos años en los servicios de Neumología Unidades de Diagnóstico Rápido de cáncer de pulmón, que persiguen un acceso más rápido a las consultas especializadas de enfermos con sospecha de cáncer de pulmón, reduciendo los tiempos diagnósticos y hasta el tratamiento. En estas unidades sería de gran ayuda poder definir a aquellos pacientes con mayor probabilidad de presentar cáncer, para iniciar procedimientos diagnósticos específicos sin demora. De acuerdo con lo expuesto, el objetivo primordial de este trabajo de investigación fue el establecimiento de un panel de marcadores séricos y, por tanto, de carácter no invasivo, para discriminar a aquellos sujetos con más probabilidad de tener cáncer y dirigirlos a pruebas clínicas más inmediatas. En este trabajo se han desarrollado dos paneles de marcadores. Para el primero de ellos, las proteínas examinadas fueron el sEGFR (EGFR soluble), EGF, HB-EGF, sCD26, VEGF y Calprotectina. En el segundo, se ampliaron los marcadores de interés con el CEA, CYFRA 21.1 y tres miembros de la familia de las Metaloproteinasas de Matriz (MMP): la MMP-1, -7 y -9. El criterio para seleccionar los marcadores candidatos a formar parte de los paneles fue su participación en algún paso del proceso tumoral. El Receptor del Factor de Crecimiento Epidérmico soluble (sEGFR) y el Factor de Crecimiento Epìdérmico (EGF) son claves en la promoción de la proliferación, invasión y metástasis en cáncer. El Factor de Crecimiento similar al EGF de Unión a Heparina, HB-EGF, es un ligando menos estudiado del EGFR y por eso nos pareció interesante incluirlo. La glicoproteína CD26 es una exoproteasa multifuncional, partícipe del sistema inmunitario y cuyo papel en cáncer de pulmón pasa tanto por mediador de la metástasis a pulmón, como por supresor tumoral. El Factor de Crecimiento del Endotelio Vascular (VEGF) es uno de los principales efectores de la angiogénesis, requerida para el crecimiento del tumor y diseminación del mismo. La Calprotectina interviene en la inmunidad innata y está involucrada en desórdenes inflamatorios y cáncer. Entre las proteínas incluidas posteriormente en el segundo panel, se encuentran los miembros de la familia MMP, conocida fundamentalmente por su capacidad de degradar la matriz extracelular, MMP-1, MMP-7 y MMP-9. Éstas se han descrito como sobre-expresadas en tejido tumoral de pulmón pero, a excepción de la MMP-9, han sido muy poco estudiadas por su valor diagnóstico en esta neoplasia. Finalmente, se incluyeron como candidatos dos marcadores que se usan habitualmente en la rutina clínica: el CEA y el CYFRA 21.1. La concentración sérica de estos marcadores se determinó de modo prospectivo en pacientes diagnosticados de cáncer de pulmón y sujetos control, tanto individuos con patologías benignas del pulmón como individuos sanos, que fueron atendidos en la consulta de Neumología del Complejo Hospitalario Universitario de Vigo. Inicialmente se consideró una población de 128 sujetos con la que se estableció el primer panel, y el tamaño poblacional se incrementó a 193 sujetos para valorar de nuevo los marcadores de ese primer panel más el segundo conjunto de marcadores candidatos. Para cada uno de los 11 marcadores estudiados se determinaron sus parámetros diagnósticos. El sEGFR exhibió una capacidad discriminativa limitada, debido a los niveles tan similares en cáncer de pulmón y patologías benignas, por lo que se concluyó que no es de utilidad diagnóstica. Este resultado corrobora la mayoría de bibliografía disponible, que coincide en una pobre diferenciación respecto a enfermedades pulmonares no malignas. Del ligando HB-EGF no se hallaron diferencias en sus niveles respecto al grupo control, lo que descarta su potencial discriminativo en esta neoplasia. Por el contrario, el EGF manifestó una buena distinción, con niveles significativamente incrementados en cáncer y una AUC global de 0,71, diferenciando también los enfermos con estadio I de CPNM del grupo control. El sCD26 también evidenció un valor prometedor en el diagnóstico de cáncer de pulmón, con niveles reducidos en suero de enfermos con cáncer y una AUC de 0,723. Los pocos datos disponibles en cáncer de pulmón corroboran esta disminución de su concentración en enfermos. Sus niveles inferiores en patologías benignas en relación con controles sanos apuntan a cierta implicación en procesos inflamatorios/infecciosos del pulmón. El VEGF no permitió una discriminación adecuada de sujetos de cáncer y controles, a pesar de detectarse un incremento respecto al grupo control, resultados que coinciden con otras evaluaciones, en las que se detectan en suero de pacientes con cáncer niveles mayores que en grupos de controles sanos y con enfermedad benigna, pero sin concluir una discriminación efectiva de cáncer pulmonar. La Calprotectina demostró en suero de cáncer de pulmón la mejor diferenciación de cáncer versus controles, con un valor de AUC de casi 0,8, con la elevación en estadio I de CPNM también significativa. A diferencia de su comportamiento en líquido pleural, con niveles disminuidos en derrames malignos respecto a derrames benignos, en suero de cáncer de pulmón sus niveles se hallan incrementados. La explicación residiría en la implicación de la Calprotectina en procesos inflamatorios en pulmón, siendo su nivel de alteración dependiente de la severidad de los mismos. De las MMPs evaluadas, la MMP-1 y MMP-7 no presentaron una adecuada discriminación entre pacientes con cáncer y controles en nuestro trabajo. La explicación probable es su implicación en condiciones inflamatorias en el pulmón, habiendo sido ambas propuestas en el diagnóstico diferencial de fibrosis frente a otras enfermedades. A diferencia de las anteriores, la MMP-9 demostró una buena capacidad discriminatoria, con niveles incrementados en cáncer y un valor AUC de 0,76, el segundo mayor del estudio. Estos datos están en la línea de los estudios del valor diagnóstico de la MMP-9, con niveles elevados en cáncer respecto a controles o pacientes con enfermedad pulmonar no maligna. En estadio I de CPNM también observamos una elevación significativa, mientras que el tipo microcítico no mantuvo la diferenciación frente al grupo control. En cuanto al CEA y CYFRA 21.1, los datos en general confirman los estudios presentados, aunque han sido un poco más pobres en el caso del CYFRA 21.1 en relación con la bibliografía. En nuestro caso, el CEA resultó un poco más eficiente en la discriminación de cáncer de pulmón, con un valor AUC de 0,746, valor que resultó de 0,711 para el CYFRA 21.1. Para seleccionar los marcadores con mayor poder discriminatorio para ser incluidos en un panel de predicción de cáncer de pulmón se realizó un análisis multivariante que constó de dos pasos. En primer término se aplicaron dos técnicas de reducción de variables, la regresión Boosted y los árboles Random Forest; ambas proporcionan índices de importancia que permiten establecer un ranking de los marcadores, para seleccionar aquellos más relevantes a incluir en el siguiente paso. En éste, los marcadores candidatos se emplearon para ajustar modelos de regresión y derivar una regla de clasificación para predecir el diagnóstico de un paciente, con la ayuda de índices de buena realización del modelo para escoger el conjunto de marcadores óptimo. El procedimiento de regresión genera un algoritmo final de clasificación que permite obtener, a partir de la sustitución de las concentraciones de los marcadores del individuo en el mismo, un valor de puntuación p. Tras fijar un punto de corte del parámetro p, un nuevo sujeto se clasificará como paciente con cáncer de pulmón si el valor de p es superior al punto de corte que se haya establecido. En la primera población de estudio, de 128 sujetos, cuatro fueron los marcadores que exhibieron una concentración diferencial entre el grupo de cáncer y el control: el sEGFR, EGF, sCD26 y Calprotectina. Las mayores capacidades de discriminación de cáncer, en base al valor AUC de la curva ROC, las presentaron el EGF y sCD26 con AUC ligeramente por encima de 0,7, y la Calprotectina con el valor más prometedor de AUC de 0,781, como ya se ha mencionado. El análisis de la asociación de estos marcadores con las variables demográficas y patológicas puso de manifiesto una dependencia de los niveles de sCD26 y EGF con el género, y del sCD26 con la edad del individuo. El hábito tabáquico también influenció la concentración de EGF. En relación con el estadio del tumor en CPNM, los niveles de EGF y Calprotectina en pacientes con estadio I fueron ya significativamente diferentes a los del grupo control, no así en el caso del sCD26. El análisis de clasificación multivariante identificó en primer lugar, mediante los métodos de Boosting y Random Forest, a la Calprotectina, sCD26 y EGF como marcadores de mayor contribución en la detección de cáncer de pulmón. El modelo de regresión logística seleccionó como panel óptimo al integrado por estos tres marcadores, con la inclusión de las variables de género y edad para corregir posibles efectos de confusión. A partir del algoritmo de clasificación asociado se seleccionó el punto de corte del parámetro de puntuación p=0,410, que para una sensibilidad del 90% resulta en una especificidad del 62%. Con este panel de Calprotectina, sCD26 y EGF, el 21,9% de los individuos no fueron asignados por el algoritmo a su grupo de pertenencia. Estos errores de clasificación no se produjeron en el estadio temprano de la enfermedad, sino en estadio III, y fueron en su mayoría producidos por casos de cáncer microcítico, con sólo un 4,7% de pacientes mal clasificados en el subgrupo de cáncer no microcítico. Este primer panel se consideró susceptible de mejora, por lo que, en una segunda parte del trabajo, se evaluaron los tres marcadores de este panel: Calprotectina, sCD26 y EGF, junto con las proteínas MMP-1, MMP-7 y MMP-9, y los marcadores CEA y CYFRA 21.1. Según el valor AUC, las MMP-1 y MMP-7 exhibieron la peor discriminación, con valores de aproximadamente 0,6, mientras que la Calprotectina y la MMP-9, con AUCs de 0,76 y 0,797, fueron las más discriminativas. De nuevo, se vio una influencia de las variables de género (en sCD26, MMP-9 y, en menor medida, EGF), edad (sCD26, MMP-7 y CYFRA 21.1) y hábito tabáquico (EGF) sobre las concentraciones de algunos de los marcadores. El análisis de los marcadores según el tipo histológico reveló que en el estadio I de CPNM los niveles de EGF, sCD26, Calprotectina, MMP-9 y CEA ya difieren de modo significativo respecto al grupo control; y 4 de los marcadores permiten la diferenciación de carcinoma microcítico en relación con los controles: sCD26, Calprotectina, CEA y CYFRA 21.1. El ranking de marcadores de acuerdo con su importancia según los análisis Boosting y Random Forest indicó que los marcadores con mayor contribución a la clasificación de cáncer fueron el CEA, Calprotectina, sCD26, MMP-9, EGF y CYFRA 21.1, en este orden. El modelo de regresión logística final presentó un valor AUC de 0,899 y se compuso de EGF, sCD26, Calprotectina y CEA, incluyendo las variables de género y edad. Se seleccionó como punto de corte de interés p=0,249, que, sin disminuir la especificidad del primer panel (65%) permite aumentar la sensibilidad hasta el 95%. Con este panel de 4 marcadores el número de individuos bien clasificados aumenta hasta el 79,3%. La incorrecta clasificación según la histología fue superior en el tipo microcítico (16,7%), en el cual todos los casos presentaron enfermedad limitada, que en el no microcítico (3,7%), en el cual sólo un 5,3% de los enfermos con estadio I se clasificaron erróneamente. Este algoritmo de clasificación podría aplicarse en una Unidad de Diagnóstico Rápido como sigue: tras obtener la puntuación de un individuo, si éste tiene una puntuación superior al punto de corte será un posible caso de cáncer, y se le someterá de forma inmediata a los procedimientos diagnósticos necesarios para confirmar esta malignidad. Cuando la puntuación de un sujeto sea inferior al punto de corte se considerará que el individuo no tiene cáncer sino una condición benigna, o que está sano, y recibirá seguimiento para confirmar la ausencia de cáncer. Los parámetros diagnósticos de sensibilidad y especificidad del segundo panel propuesto están en la línea de otros paneles multi-proteicos publicados por otros investigadores, en los cuales los mejores términos se han alcanzado cuando el grupo control se constituyó únicamente de controles sanos. Nuestro panel, además de considerar las patologías benignas, ha incluido el tipo de cáncer microcítico, a diferencia de alguno de estos trabajos. Es decir, podría aplicarse a una población no seleccionada. Por otro lado, consta de un menor número de marcadores por lo que su aplicación resultaría más sencilla y de menor coste.