Test de coronavirus y distribución de casos por edad

La presentación de los datos referidos a los test de coronavirus por países genera perplejidad en no pocas personas. Los datos que arroja no suelen ser los esperados, especialmente cuando se busca hacer un análisis intuitivo de comparación por países.

De la misma manera que hemos abordado otros aspectos de los problemas y oportunidades que tiene el análisis y la presentación de los datos en la comunicación de la crisis del coronavirus, vamos a aplicarlo al caso de la información que aportan los test, porque me parece que hay elementos que merecen ser reseñados y que creo que no llegan a la ciudadanía suficientemente.

1. Presentación de datos de los test: test totales y test por habitantes

Los países informan regularmente sobre el número total de test practicados a lo largo de la evolución de la epidemia. Los informes oficiales muestran la cifra total de test realizados y normalmente también la tasa de test que dan positivo.

España desgraciadamente no está entre los países que publican regularmente el número de test realizados, a pesar de ser uno de los países del mundo con mayor número de fallecidos con coronavirus.

Solo en una de sus últimas comparecencias, el 19 de abril, el Comité Técnico del Ministerio de Sanidad ha mostrado por fin los test practicados en España. España, en la fase más aguda de la crisis sólo fue capaz de realizar 200.000 test semanales, algo menos de 30.000 al día. En ese período se detectaban entre 4.500 y 8.500 casos diarios. Por eso sale una tasa tan alta de casos positivos, de más del 25%. En la semana del 13 al 19 de abril España ya ha expandido notablemente su capacidad de monitorización, a 100.000 test por día. Dado que la epidemia ya está remitiendo en esas fechas, los test se están haciendo a un espectro de población mucho más amplio, por lo que la tasa resultante de test positivos cae drásticamente, al 3%.

test100esptest

El número de test practicados da información valiosa sobre la gestión de la crisis epidémica. Eso lleva a mirar las prácticas seguidas por otros países, para intentar detectar pautas. Los repositorios de datos que hacen la ingente labor de agregar datos que no están centralizados suelen mostrar los datos disponibles en dos variantes: la evolución de test diarios y acumulados y la misma medida, pero ajustada por la población del país.

Como comentábamos, es en ese momento en el que aparece cierta perplejidad, al ver juntos los resultados de distintos países.

La lista de países con la mayor cifra de test realizados arroja una combinación de países con mucha población y muchos casos de coronavirus (EE.UU, Alemania), mucha población y pocos casos (Rusia, Corea del Sur) y población media y muchos casos (Italia, España).

test101totales

Tal como muestra el gráfico siguiente, hay una cierta relación entre test totales y población, pero bastante limitada.

test102reltotpob

 

El paso siguiente que se da es dimensionar esos resultados, para mostrar el número de test totales llevados  a cabo por cada 1.000 habitantes.

Aplicar esa corrección lleva a un resultado sorprendente: los resultados que aparecen son contraintuitivos con respecto a la información que se ha dado en medios especializados y en prensa sobre las distintas estrategias seguidas para controlar la epidemia. Por un lado, se aplaude y se pone como referencia a los países que han adoptado una política de control amplio de la población vía test masivos (Islandia, Australia, Nueva Zelanda) o vía rastreo sistemático de todas las personas en contacto con algún positivo, independientemente de que sean sintomáticas o no (Corea del Sur, Taiwán, Hong Kong). Por otro lado, se lamenta la gestión de la crisis sanitaria de los países que no han practicado rastreo masivo y se han conformado (o se han visto obligados por la situación) a aplicar los test únicamente a los sospechosos claros de contagio y incluso en algunos casos con doble requisito, de pertenecer a grupos de riesgo o personal en servicios esenciales (Italia, España, Francia, Reino Unido).

Pues bien, los resultados de test practicados por cada mil habitantes no permiten discernir ninguna pauta significativa que distinga a estos dos grupos. Eliminamos del gráfico el caso especial de Islandia, que tiene una tasa de test por 1000 habitantes excepcionalmente alta, de más de 120. Su inclusión impide ver bien los detalles de las diferencias entre los otros países. Para esta parte nos servimos de la excelente visualización de datos de la Our World in Data, de Oxford University (acceso aquí).

En el primer gráfico van todos los países juntos. El punto señalado corresponde a la única información oficial puntual que España había ofrecido en ese momento.

test103ourwtodos

Si procedemos a separar a los países en dos grupos, la conclusión es… que no hay conclusión, que no hay comportamiento agregado diferencial significativo.

Por lo tanto, las dos formas de salida usadas por los repositorios de datos (test totales y test por habitante) no aportan herramientas de análisis especialmente útiles para la población en general para entender la pandemia y su gestión sanitaria.

Es un resultado que de alguna manera está en sintonía con la ausencia de relación clara entre los fallecidos totales con coronavirus y la población del país. Eso lleva por ejemplo a John Burn-Murdoch, gran experto en visualización de datos, que trabaja en el Financial Times, a no mostrar datos relativos a la población del país. Mostramos uno de sus gráficos sobre esta cuestión (acceso aquí).

test106ft

2. La pista de avance: las tasas de test positivos

Ya que las dos modalidades principales en las que se muestran los datos del papel de los test no arrojan mucha luz para entender la gestión de la pandemia, el paso a dar es cruzar eso datos con otras variables distintas.

En análisis de detalle se suele aportar un nuevo indicador: la tasa de test positivos, es decir, el porcentaje del total de test hecho que han arrojado casos de persona contagiada por el coronavirus.

Y ahí sí que los resultados se empiezan a alinear con las diferentes pautas que estamos buscando entender mejor de estrategias distintas de aplicación de test a la población.

Entre los países con tasas de positivos más altos encontramos a todos los que han seguido básicamente una estrategia de confirmación de casos sospechosos, con tasas de positivos por encima del 20%. El dato de España, de 12,4% era prácticamente el doble hace una semana, ya que no contabilizaba el incremento de test que hemos visto anteriormente. En el extremo opuesto encontramos a países con tasas de positivos  inferior al 2%. Ahí sí que están también los que han seguido una estrategia distinta de test, basada en el rastreo y aplicada por lo tanto también a no sintomáticos.

test107positivos

Sin embargo, aunque esta variable ayuda a discriminar a los países por su criterio de aplicación del test, sufre de una limitación: que se dé positivo en el test no diferencia entre los casos con síntomas leves de los casos con síntomas serios o graves. Y conviene hacer esa separación porque entre los países que aplican los test únicamente a los ciudadanos que presentan síntomas (frente a los países que aplican el sistema de rastreo, también a no sintomáticos), hay algunos que han seguido políticas muy restrictivas para tener acceso al test. Países que se han visto desbordados por la escalada explosiva del número de casos sospechosos y una capacidad limitada de test por día, que les ha forzado a reservar el acceso al test a casos serios. En esas circunstancias los test han jugado un papel de confirmación, no de detección. En esos países, los casos sospechosos sintomáticos leves e incluso serios pero no graves o no provenientes de personas en grupo de riesgo se les ha pedido que se aplique autodiagnóstico sin test. Ha sido el caso de España, Italia, Reino Unido en muchas de las etapas de la crisis. Pero no parece que haya sido la pauta seguida en otros países que no han llegado a saturación, como Alemania, Austria o países nórdicos.

Por todas estas razones he puesto en relación la variables de los casos totales con otra relacionada de alguna manera con los casos positivos, pero que elimina el problema de la distinta intensidad de control de los casos: el número de fallecidos totales con coronavirus. Y me ha permitido descubrir bastantes cosas.

3. Poner en relación test totales con fallecidos totales con coronavirus

El indicador que se propone para fundar todo el análisis posterior de este artículo es el de número de test hecho por cada persona fallecida con coronavirus.

¿Qué aporta conceptualmente esta medida? Que uno de los dos elementos de la relación es una variable con una baja elasticidad en el criterio de gestión y de medición. Sí que admite grado de interpretación, y es un elemento a tener en cuenta en los resultados que se mostrarán, pero globalmente es la medición más homogénea y exógena con la que contamos. Hay efectivamente un margen de flexibilidad en el cómputo de los fallecidos asignados al coronavirus (si se contabilizan o no los fallecidos fuera del ámbito hospitaliario, si se contabilizan o no los casos con síntomas claros compatibles con el covid-19 pero al que no se pudo o no se quiso practicar el test).

Teniendo en cuenta esas salvedades, la cifra de fallecimientos es el elemento más comparable de medida de impacto directo de la crisis. Y no quita que a las cifras oficiales se pueda aplicar las correcciones y ajustes que los expertos estimen, para utilizarla como variable de referencia todavía más sólida.

Sin embargo, y como veremos a continuación, son también los resultados del análisis los que nos mostrarán en cierto grado en qué medida la cifra de fallecimientos es sustancialmente homogénea en su contabilización entre países. Volveremos a ello.

Mostremos ya el resultado del indicador general de test por persona fallecida, para la listas de países que estamos analizando.

Los resultados del gráfico muestran diferencias abismales entre países en el indicador. Hong Kong es de lejos el país con un multiplicador mayor: se han practicado 33.000 test por cada persona fallecida en el territorio. En este caso se trata de un valor muy inestable, por ser muy bajo el numerador (6 fallecidos), por lo que un incremento de unos pocos fallecidos reducirá notablemente el valor. El resto de países que han aplicado una política más amplia de test tienen un multiplicador de entre 5.000 y 10.000 test por cada persona fallecida. La cifra decae en el resto de países hasta valores que son tan pequeños por comparación que no son observables en el gráfico.

Por esta razón, y para analizar mejor el perfil de cada caso, hemos dividido los resultados en tres grupos, según su múltiplo de test por fallecidos.

test108testkillall

En el primer grupo incluimos a los países con más de 800 test practicados por persona fallecida. Hemos recortado los datos de Hong Kong para evitar la distorsión visual. Los referentes mundiales son Hong Kong, Taiwán, Nueva Zelanda, Australia, Rusia e Islandia. Corea del sur está en un segundo escalón, con 2.370 test por persona fallecida. En la zona intermedia aparecen países europeos, Sudáfrica y Chile.

test109killkor

Los países en el segundo nivel de intensidad de test aplicados con respecto al número de fallecidos sufridos en el páís, su horquilla se mueve entre los 150 y 800 test por fallecido. Son principalmente países europeos y de América Latina. En este grupo está Alemania, que se ha visto como un caso especial por su número alto de casos positivos y su baja tasa de letalidad del coronavirus.

test110killmixt

Finalmente, la lista de los países con un múltiplo más bajo. Ahí están todos los países que han sufrido un desarrollo masivo de la epidemia en fallecidos totales, más los casos de México y Ecuador.

test111killita

En la siguiente infografía se ve la variación del indicador en los países de Europa.

test119europa

4. Pautas de comportamiento del indicador de test por persona fallecida

Veamos cómo se comporta el indicador. Para ello no voy a proceder a proponer ni mostrar ningún modelo explicativo de integración de distintas variables y con diseño que permita identificar relaciones causales y factores de control. Para intentarlo tendría que saber de epidemiología. No soy ni experto ni siquiera conocedor con mínima solvencia de cuestiones de epidemiología y de sus distintos modelos explicativos. Lo he recordado en todos los análisis que he compartido. Sigo estando en el mismo punto que antes.

Muestro únicamente relaciones directas entre variables y en la mayoría de los resultados que voy a mostrar, en un formato simplificado que permita a todos los lectores ver con más claridad la existencia o no de relación fuerte entre ambas (sin que por ello se pueda hablar directamente de relación causa-efecto). Para ello lo que he hecho es agrupar los datos en los tres niveles de países que acabamos de mostrar. De los tres niveles mostramos los resultados de los dos grupos extremos. Al grupo con un múltiplo muy alto de test por fallecido le llamamos el Grupo Corea del Sur (el país dentro de ese grupo que más casos de contagio y de fallecimientos tuvo) y a los que presentan el múltiplo más bajo le llamamos el Grupo Italia. Lo que hacemos es mostrar los valores de las medias ponderadas para cada grupo con respecto a las variables que vamos a evaluar. Lógicamente, hemos calculado también los valores de medias no ponderadas, que arroja resultados muy similares.

Miramos en primer lugar aquellos factores en los que no emerge diferencia clara entre los dos grupos. Y el más destacado es la relación entre el múltiplo de test por fallecido y el promedio de test totales aplicados por país. La cifra es algo superior en el el Grupo Italia, pero sin diferencias destacadas (460.000 por 350.000 test de media por país).

test112testpais

Esta es la distribución del total de test llevados a cabo en el mundo, para los tres grupos que hemos identificado. Los países del Grupo Italia concentran casi el 50% de los test hechos en el mundo.

test114grupohabtot

Tampoco hay diferencias significativas entre grupos con respecto al indicador de test practicados por cada mil habitantes. En este caso, ligera ventaja para el Grupo Corea del Sur.

Como se puede recordar, estas son justamente las dos modalidades de presentación más generalizada para dar información comparativa sobre la política de test aplicada por los países afectados por la pandemia. Y la conclusión es que justamente estos dos criterios no sirven para discriminar el perfil de acción y resultados de los países que han aplicado políticas distintas de gestión de test.test113grupohab

Ahora, los factores en los que hay una clara diferencia de comportamiento.

Los países del Grupo Italia han identificado 10 veces más casos positivos que el Grupo Corea del Sur: 82.700 por 8.250. La dimensión de la epidemia en número de casos ha sido mucho mayor en los países con múltiplo bajo de test por persona fallecida.

test115grupopostot

Además, la tasa de positivos es más de 10 veces mayor en el Grupo Italia. Uno de cada 4 test da positivo en el Grupo Italia, por uno de cada 40 en el Grupo Corea del Sur. No se trata de un efecto equivalente al anterior, sino que es un efecto añadido, que incrementa las diferencias de comportamiento en la crisis de los dos grupos de países.

La crisis ha sido distinta en los dos países. Los test han jugado un papel distinto durante la gestión de la epidemia. Es un resultado incuestionable, salvo que se quiera explicar que la diferencia de comportamiento se deba a que el virus ha actuado de manera distinta en los dos grupos de países, es decir, que fuera mucho más contagioso o que se reflejara en sintomatología totalmente distinta, que llevaría a que en unos países se acierte mucho más que en otro a aplicar los test justo a las personas que están contagiadas por el virus; que en el Grupo Italia se «cazan» más y mejor los casos que en el Grupo Corea del Sur. Veremos que los datos complementarios que aportaremos explican lo contrario, y que la distinta tasa de positivos entre los grupos corresponde a distinta capacidad de identificar los casos reales infectados, a  favor del Grupo Corea del Sur.

test116grupotasapos

El efecto combinado de los dos factores que acabamos de mostrar es el que justifica la división de los grupos. Hay una distancia de 100 a 1 entre los dos países por número promedio de fallecidos en los países de cada grupo: 10.100 fallecidos en el Grupo Italia por 96 en el Grupo Corea del Sur.

test117gruposkill

El otro factor complementario de esta pauta de comportamiento diferencial entre los dos grupos, también ligado a todo lo anterior es la tasa de letalidad de las personas infectadas por el virus.

La tasa de letalidad promedio de los países del Grupo Italia es de 11,1%, por 1,3% de los del Grupo Corea del Sur; de nuevo una diferencia de diez a uno.

Para explicar estas diferencias caben dos escenarios extremos:

-la tasa de letalidad real del coronavirus es como máximo la de los países del Grupo Corea del Sur, porque son los que gracias a su sistema de test han conseguido identificar a la mayoría de los casos reales, o al menos la mayoría de los casos sintomáticos. La tasa real se reduciría tanto como peso tengan los casos asintomáticos no contabilizados. Y en ese escenario, los países del Grupo Italia habrían conseguido identificar sólo una fracción de los casos reales que sí han identificado en el Grupo Corea del Sur.

– Que las dos tasas son igual de representativas con respecto a la letalidad del virus en cada país, porque los países del Grupo Corea del Sur tendrían un variante menos agresiva y mortal que el otro grupo, o que por factores demográficos, de gestión geriátrica o de salud pública de los países del Grupo Italia, la epidemia se ha expandido de manera mucho mas letal en este grupo de países. En ese caso extremo, en los dos grupos de países los test consiguen identificar un porcentaje similar de los casos totales de personas infectadas en cada país.

Y en medio, combinación de ambas explicaciones. Son precisamente los matices que no indago ni introduzco, porque en este análisis no aporto un modelo explicativo epidemiológico de los factores que influyen en la relación entre test y personas fallecidas.

test118gruposletal

5. El indicador de los test por persona fallecida y la distribución por edad de los casos

Dedico un apartado especial a la pauta de comportamiento más sorprendente, no por el resultado, sino por la fuerza con la que emerge el resultado: la relación entre el múltiplo de los test por cada persona fallecida y la distribución por edad de los casos positivos en ese país.

Comparamos la distribución de casos de Corea del Sur con la de Italia, nuestros dos países de referencia.

Corea del Sur presenta una distribución con mínimos en las edades extremas: porcentaje bajo de casos en menores de 20 años y mayores de 70 años, con un pico en la franja 20-29 y con tendencia creciente al acercarse a las edades medianas.

Figura completamente distinta para el caso italiano ya que la distribución de los casos positivos presenta una tendencia creciente en función de la edad: porcentaje mínimo de presencia para los menores de 30 años, con peso concentrado en las personas de más de 50 años. La distribución de casos es más parecida a la de la estructura poblacional que la que muestra Italia.

La distribución de casos en Italia es parecida a la distribución de fallecidos (que refuerza todavía más la relación positiva entre edad y número de fallecimientos). En Italia el 85% de los fallecidos tienen más de 70 años… pero en Corea del Sur la cifra es similar, con 78% del total de fallecidos con edad superior a 70 años.

La distribución por edad de los casos positivos es muy diferente en en Corea del Sur e Italia, pero la distribución de fallecidos es muy parecida.

De nuevo, volvemos a estar en la tesitura de confirmar que, o hay una política distinta de test que lleva a que en Corea del Sur se identifiquen los casos en una proporción más cercana a la realidad que en Italia o que, si no, hay factores específicos de la difusión del virus en Italia que no se producen en Corea del Sur.

Y hay que descartar esta segunda vía de explicación (como vía principal explicativa) cuando expandimos el análisis de la distribución por edad a más países de cada uno de los dos grupos. Con resultado sorprendente para mí.

La constatación es que todos los países del Grupo Corea del Sur, que son los que tienen un múltiplo alto de test por persona fallecida presentan una distribución por edad prácticamente idéntica.

itest123grupokor

Y que si hacemos la visualización para los países del Grupo Italia, la similitud en la distribución por edad entre ellos roza la identificación.

test122grupo italia

Tenemos una homogeneidad máxima intragrupo con gran hererogeneidad intergrupos. Fenómeno que podemos medir con el coeficiente de correlación de las series con respecto al caso de Corea del Sur y el de Italia.

El coeficiente de correlación mide cómo se relacionan los valores de dos series que se comparan, y que tiene un máximo de +1 si todos los valores «bailan al unísono», y cuando uno sube, el otro también y cuando el uno baja el otro también, y un mínimo de -1 si los valores de dos series van sistemáticamente en sentido opuesto. El coeficiente es prácticamente 1 para todas las distribuciones de edad de los países del grupo Italia y es negativa para en su relación con los países del grupo Corea del Sur. Y la correlación de Corea del Sur con los países de su grupo es superior a 0,8, y menor que 0,2 para su relación con los países del grupo Italia.

Se puede ver que los representantes que hemos escogido del Grupo Mixto, Finlandia y Austria, se sitúan precisamente en zona intermedia de correlación entre los dos grupos.

test124correl

Esta es la distribución de edad de los casos de los dos representantes del Grupo Mixto.

test125mixto

Como se ha indicado varias veces, aquí no hay modelo epidemiológico ni test matemático para verificar las hipótesis, por lo que no lo presento como afirmación, sino como opinión: los datos son tan rotundos que mi opinión es que la distribución por edad de los países del Grupo Corea del Sur corresponden mucho más que la de los del Grupo Italia a la distribución real de los contagios del coronavirus por edad. Y que la acumulación de casos en personas de más de 70 años para el grupo Italia lo único que refleja es que en esos países los test se han aplicado fundamentalmente para confirmar que los casos graves que llegaban a los hospitales eran de coronavirus y que no se han podido aplicar al resto de la población, que también se ha contagiado, pero por ser de edades con riesgo mucho más bajo, sus síntomas han sido leves o si han sido serios se han podido controlar sin atención hospitalaria.

6. Extrapolación de las distribuciones de casos por edad de otros países a España

Porque los resultados del apartado anterior son tan claros, procedemos a un ejercicio apoyados en esos resultados.

Por el análisis de los apartados anteriores estamos convencidos de que la distribución de edad del Grupo Corea del Sur se acerca mucho más a la realidad que la del Grupo Italia.  Por eso haremos la extrapolación directa de las cifras de base del caso español a la estructura de distribución de edad de los países del Grupo Corea del Sur.

Lo formularemos en la versión más neutra y atada a los datos, sin convertirla en explicación de realidad y es: ¿cuántos positivos tendría España si tuviera la distribución de edad de casos de Corea del Sur o Islandia o Australia?

Hacemos el cálculo obligando a que sea compatible con el caso real actual español, es decir, en todas las extrapolaciones no habrá menos casos en ninguna franja de edad que los que actualmente tiene España. Dada la diferencia de distribuciones, eso hace que el punto de pivote es la cifra de casos positivos que España alcanza en las personas de más de 70 años.

El gráfico da los resultados, y que hay que leer de la siguiente manera: «si España estuviera en la misma situación de casos que ahora pero que la distribución de casos por edad de Corea del Sur, España contaría ahora con 644.000 positivos testados en vez de los 200.000 que tenía el 20 de abril».

Si siguiera la distribución de edad de los casos declarados de Australia, contaría con 514.000 positivos, si tuviera la de Islandia tendría 1,5 millones de positivos y si fuera la de Nueva Zelanda tendría 935.000 positivos.

test126equivkor

En cambio, de esa traslación directa no se puede afirmar que «si España hubiera aplicado la misma política de test que Corea del Sur, tendría 644.000 positivos en vez de 200.000», porque esa política distinta de test habría influido en el curso de la epidemia en España, y los casos totales serían distintos.

La extrapolación no sirve para decir qué nos habría pasado con otras políticas de test, sino para indicar que la cifra real de casos sintomáticos se acerca más a las que salen de la extrapolación que a los 200.000 contabilizados en España. A esa cifra hay que añadir la de los casos no sintomáticos, que probablemente no han sido medido en ningún país del Grupo de Corea del Sur, salvo el caso de Islandia, que ha aplicado el test al 12% de su población.

7. Tasas de letalidad de España aplicando distintas distribuciones de edad.

Del ejercicio del apartado anterior se llega directamente al de este. En estos momentos la tasa de letalidad del coronavirus en España es del 10,2%: de cada 100 personas detectadas positivas por el virus, 10 de ellas fallecen. Los expertos nos dicen que la tasa real es bien menor. Las extrapolaciones que hemos aplicado, para las que tenemos argumentos para pensar que se acercan más a la realidad conllevan una reducción de la tasa de letalidad para España.

Baja al 3,2% si tuviéramos la distribución por edad de Corea del Sur, a 2,2% con la de Nueva Zelanda y de 1,4% con la de Islandia.

test127letal

8. Los test en las nuevas fases de la epidemia

Este análisis es de corte técnico, pero tiene una vertiente práctica directa para el seguimiento de la crisis. La estructura de casos española actual es la italiana, mientras que la que se acerca más a la realidad de la situación es la coreana. Ahora estamos pasando por fin a una fase de expansión de los test (gráfico de ayer de Ministerio de Sanidad) aunque parece que todavía centrado a los grupos de riesgo (ancianos en residencia) y personal sanitario. Además, ahora ofrece información diaria de distribución casos por edad.

Esa información nos permitirá ver en qué medida los positivos que vayan surgiendo en la desescalada se corresponden todavía con la distribución Italia o si poco a poco nos vamos acercando a la del modelo coreano. Mientras sigamos en el formato italiano, la epidemia nos controla, porque se nos escapan los casos positivos, que siguen contagiando a otros. Cuando tome forma coreana, ahí probablemente estaremos empezando a controlar la situación. De verdad.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 comentarios en “Test de coronavirus y distribución de casos por edad

Deja un comentario