Coronavirus: lo que los datos dicen a un físico

Una de las afirmaciones que más se repiten en esta crisis sanitaria que vivimos es que el análisis epidemiológico es muy complicado y que no se pueden hacer predicciones porque la situación es “dinámica” (expresión muy del gusto del gobierno últimamente), de modo que hay que ir actuando en función de los datos de cada día (y, como corolario, se deduce que nadie habría podido ver venir esto antes del 10 o el 12 de marzo… pero mejor no insistamos).

Todo esto puede que sea cierto si queremos predicciones exactas. Y suele creerse que la ciencia sirve precisamente para eso (otra expresión favorita de los portavoces del gobierno es que “hay que escuchar a los científicos”). Pero es un error muy común, y, lo estamos viendo, muy peligroso. La ciencia sirve, antes que nada, para hacer estimaciones de orden de magnitud. Y, por supuesto, que un fenómeno sea “dinámico” no significa para nada que no se pueda hacer tal cosa. Sólo hay que conocer cómo es esa dinámica. Y basta con conocerla de modo aproximado si sólo buscamos un orden de magnitud.

Esto se hace todos los días y a todas horas en física: nunca hagas un cálculo complicado  si no sabes lo que (más o menos) tiene que salir. Es una actitud tan enraizada en la profesión que el legendario John Archibald Wheeler la llamó “primer principio moral“. Esos complicados modelos epidemiológicos están muy bien, pero primero hay que saber más o menos lo que tiene que salir, y eso nos lo dice una estimación de orden de magnitud.

En el caso de una epidemia es de sobra conocido que la dinámica es aproximadamente exponencial. Y de este simple conocimiento se derivan consecuencias dramáticas. En este post voy a analizar los datos como lo haría un físico, si en lugar de una epidemia se tratara de cualquier otro fenómeno que crece exponencialmente. Me lo exige el principio moral de Wheeler. 

*

Decíamos hace ya una semana que las medidas que tomó el gobierno parecía que se estaban empezando a notar, y ahora se confirma sin ningún género de dudas. Con los datos de la última semana, los contagios se duplican cada 4,1 días y los fallecimientos cada 2,8 días. Antes del estado de alarma, los periodos de duplicación eran de 2,0 y 1,4 días, respectivamente: el ritmo de crecimiento de la epidemia se ha reducido a la mitad.

Es una buena noticia, pero ¿qué significa en concreto? Que los (redondeando) 42.000 contagiados y 3.000 muertos de hoy se convertirán dentro de una semana en unos 137.000 contagiados y 17.000 muertos [1].  Si eso le parece una barbaridad, piense que con las tendencias anteriores al estado de alarma tendríamos dentro de una semana 475.000 casos y 96.000 muertos (y ahora, si la cabeza no le da vueltas, puede calcular como ejercicio los miles de muertos que nos habríamos ahorrado si se hubieran tomado las medidas a la vez que Italia, el 8 de marzo en vez del 14…).

Todo esto lo podemos ver en la gráfica siguiente[2]:

ContagiosyMuertes_dia24_tendencia2

Se han dibujado las tendencias obtenidas con los 7 días anteriores al estado de alarma (“tendencia hasta el 13/03/2020”) y los 7 posteriores (“tendencia desde el 14/03/2020”). Una gráfica logarítmica como esta permite ver a ojo el tiempo en el que los contagios o muertes se multiplican por 10. Con la tendencia actual, por ejemplo, vemos en la gráfica que las muertes tardan unos 9 días en multiplicarse por 10. Ahora, para encontrar el periodo de duplicación basta dividir por 3,32[3]. Así, 9/3,32=2,7 (aproximadamente 2,8 días, como habíamos dicho).

Un detalle importante para que estas gráficas sean significativas es elegir bien el origen de tiempos. Ante todo, no conviene representar los datos en la etapa temprana de la epidemia, porque los números son muy pequeños y la escala logarítmica los magnifica (lo lo olviden: ¡entre 1 y 10 hay la misma distancia en vertical que entre 1.000 y 10.000!). Como siempre hay fluctuaciones que no son significativas, este pequeño “ruido”, nada importante,  se amplifica mucho. Por eso hemos tomado el origen de la gráfica de contagios en 100 y el origen de la gráfica de muertes en 10.

Por otra parte, hay que poner para cada país el origen de tiempos en una fecha equivalente: por ejemplo, el día en el que se alcanzaron los 100 contagios o los 10 fallecimientos. Un detalle sutil pero importante: el retraso no es el mismo si se mide por los contagios que si se mide por los muertos. En los post anteriores (por ejemplo aquí) las dos gráficas tenían el mismo origen de tiempo (el día del contagio nº100), y Alemania resultaba un caso anómalo entre los países europeos porque tenía un número excepcionalmente bajo de fallecimientos (sobre ese “misterio alemán” se había especulado mucho últimamente). Al medir el tiempo desde el fallecimiento nº10, Alemania deja de ser una excepción y está en la misma línea que Italia y Francia.

¿Qué significa esto? Que la epidemia está más atrasada en Alemania de lo que sugería el número de contagios, seguramente porque han hecho muchos más tests que el resto de países europeos (más sobre esto un poco más adelante).

[Un inciso: para interpretar las gráficas puede ser útil el dato de los retrasos: tomando Italia como referencia, los retrasos en la gráfica de contagios son:
España=8,5 días, Alemania=7,5 días, Francia=7 días; Corea está adelantada 2 días a Italia.
Y los retrasos en la gráfica de fallecimientos son:
España:=11 días, Alemania=18 días, Francia=10 días; Corea=0 días]

*

Ahora la cuestión es: ¿cuándo lograremos “frenar la curva”? La mejor manera de verlo es representar los casos nuevos en función del tiempo:

CasosNuevosDiarios

[Nota: no hay que preocuparse porque las gráficas sean más “ruidosas” que las anteriores ni porque falten datos en Corea, es normal -pero sería un poco largo de explicar-]

Las dos gráficas anteriores muestran que Italia llegó a un máximo hace tres días, tanto en casos nuevos como en fallecidos diarios, y pese al repunte del último dato, es lógico esperar que recupere la tendencia descendente. Tenemos tendencias similares a Italia (la tendencia se ve en la pendiente de la gráfica) así que podemos estimar que alcanzaremos el pico de casos nuevos dentro de 5 o 6 días y el pico de fallecidos diarios dentro de 8 (ya que nuestro retraso es, respectivamente, de 8,5 y 11 días).

¿Cuál será la altura de esos picos? Una manera burda de estimarla es suponer que las curvas de Italia y España se van a mantener paralelas, como han venido haciendo a grandes rasgos. En la gráfica de contagios la distancia es, muy grosso modo, un factor 2, y en la de muertes algo más. Seamos optimistas y dejémoslo en 2 para ambos datos. Como el pico en  Italia ha sido de 6.550 casos nuevos y 793 fallecidos en un día, redondeamos a 6.500 y 800 y multiplicamos por 2 para obtener esta estimación: el pico de casos nuevos diarios será de unos 13.000 y se alcanzará el 30 o 31 de marzo; el pico de fallecimientos diarios será de unos 1.600 y se alcanzará en torno al 2 de abril[4].

Son órdenes de magnitud, y ojalá me equivoque (¡por exceso!). Pero eso es lo que me dicen los datos, y me atengo al primer principio moral de Wheeler.

*

Antes he dicho que la evolución de los fallecimientos en Alemania está bastante más retrasada que la evolución del número de casos, y que una explicación verosímil es que allí se han realizado muchos más tests, de modo que se vio venir la epidemia antes.

Eso implicaría que su número de contagios reportados sería más cercano al real que el de España e Italia, que estarían subestimando este dato. Una manera de intentar confirmar esta hipótesis es representar la fracción que representan los fallecidos respecto de los contagiados. Si subestimamos el número de contagiados, esta mortalidad aparente será mayor. Digo “aparente” porque los fallecimientos se producen con cierto retraso sobre los contagios, y no siempre es el mismo para todos los pacientes.

He hecho dos estimaciones burdas, una con números totales, dividiendo el número de muertos por el número de contagiados cinco días antes (gráfica siguiente, a la izquierda); otra, dividiendo los muertos de cada día por los contagiados cinco días antes (gráfica siguiente, a la derecha). La segunda estimación es en teoría algo más correcta que la primera pero tiene más ruido porque los datos diarios fluctúan más que los acumulados. Aquí tienen las gráficas:

MortalidadEstimada

En los dos casos los resultados son similares: la mortalidad se situaría en torno al 15% para España e Italia, al 8 o 10% para Francia, y al 1% para Alemania y Corea (no hagan caso a los últimos datos de la gráfica de la derecha para Corea: tienen mucho ruido porque los números de fallecimientos y contagios son ya muy pequeños).

Suponiendo que los sistemas sanitarios español e italiano no son mucho peores que el alemán o el coreano (de modo que la mortalidad real debería ser similar), y suponiendo que en esos países se detecta el 100% de los casos (un poco optimista, pero es lo más sencillo), resultaría que el número de casos real en España e Italia sería unas 15 veces mayor que el oficial.

*

Repito: todo esto son estimaciones de orden de magnitud. Los fenómenos no son impredecibles por ser dinámicos y los datos hablan. Al tratarse de exponenciales puede haber un error importante, pero no creo que sea de más de un factor 2 más o menos un 50%, o de un par de días más o menos.  Ojalá me equivoque, repito, y que sea por exceso.

NOTAS:

[1] Hay que multiplicar los datos actuales por 2^(7/4,1) y por 2^(7/2,8)]

[2] Quizá sería más correcto representar los datos normalizados a la población (muertes por millón de habitantes) pero lo único que cambiaría es que las curvas se desplazarían ligeramente en vertical, pero también en horizontal, porque el origen de tiempos sería un poco distinto. Ambos desplazamientos casi se cancelan, así que no merece la pena.

[3] 3,32 es el logaritmo en base 2 de 10.

[4] El número total de contagiados y de fallecidos seguirá aumentando después de ese día, claro, pero más despacio. Cuándo empezarán a disminuir los contagiados y cuándo dejará de haber fallecimientos es más difícil de saber: para eso sí necesitamos un modelo epidemiológico.

[Actualización, 06/04/20] ¿Se cumplieron mis predicciones? Estas son las gráficas actualizadas para contagios y muertos diarios:

ResultadoPrediccionesTasasEl famoso “pico” no es  muy picudo (habría que haberlo advertido), pero las fechas son casi exactas en los dos casos. Afortunadamente, me equivoqué por exceso en los valores: en vez de 13.000 contagios diarios (el 30 ó 31 de marzo), hemos alcanzado 8.195 (el 1 de abril) y en vez de 1.600 muertos diarios (el 2 de abril) hemos llegado a 961 (justamente el 2 de abril). Como se aprecia en la figura, hasta la fecha de la predicción las tendencias eran muy parecidas a las de Italia; a partir de ese día, nuestras curvas se “aplanaron” respecto a las suyas: esa es la causa del (bendito) error en los valores absolutos de mis predicciones.

Hay que advertir sin embargo, que no hay motivo para el triunfalismo: haber superado el “pico” en las gráficas de casos diarios no se traduce en ningún cambio llamativo en los casos acumulados. Siguen creciendo, cada vez más lentamente, pero falta mucho para que nos parezcamos a Corea, y lo hemos hecho rematadamente mal en comparación con ellos:ResultadoPrediccionesAbs

 

  1. Lorenzo Hernández Villalobos

    Efectivamente con tan pocos datos no es fiable la predicción. Pero en el caso de Almería las dos últimas predicciones han acertado: ayer fueron 91 contagios (predicción:90) y hoy 115 (predicción 115):

    https://www.lavozdealmeria.com/noticia/12/almeria/189651/el-coronavirus-deja-115-positivos-en-la-provincia-en-su-mayor-incremento-diario

    • JuanMS

      ¡Exponencial en todas partes, incluso con pocos datos! Para que digan que “es muy complicado hacer predicciones”… más adelante será más difícil, pero por ahora el orden de magnitud sale clavado, incluso más que el orden de magnitud.

    • JuanMS

      Bueno, simplemente sería el doble en el peor de los casos o la mitad en el mejor de los casos, pero repasando las cuentas creo que he sido demasiado prudente: apostaría a que la predicción no se desvía en más o menos un 50%. Lo voy a corregir.

  2. Germán Ros

    Magnífico Juan. De tanta gráfica las tuyas me parecen reveladoras. Voy a difundir por twitter. Ojalá tengas razón, si el pico e alcanza 31 de marzo – 2 de Abril, y viendo la tendencia de Corea podemos decir que 10 días después se recupera una cierta normalidad, quizá tras Semana Santa podamos volver a una vida normal. Las clases por internet me tienen deasanimado

  3. DAVID MARIA SANTALICES MARTIN

    Interesante lo de calcular el porcentaje de infectados haciendo un ajuste por la tasa de mortalidad.

    Eso es lo que hace el CMMID [1] asumiendo que la tasa de mortalidad es del 1.4% (y haciendo un ajuste por las curvas demográficas). Como has comentado, el problema de estimarlo así, es que aparece un retraso en de 13 días en esta estimación, así que solo se puede estimar mediante esta técnica cual era el número de contagiados hace trece días. Además, como la tasa de mortalidad es baja, paises donde se reportan ‘pocos’ fallecidos tienen una incertidumbre de casos mas alta.

    En sus cálculos se puede ver que países como Italia o España hace trece días solo reportaban entre un 4 y un 6 % (que de mantenerse en el tiempo, cosa que debería si no cambian las políticas de a quien se le hace un test) es unas 20 veces mas que los casos reportados oficialmente (unos 800000). Se puede ver como otros países como Corea del sur, habrían encontrado entre un 60 y un 95 % de sus casos.

    Porcentaje de casos estimados [1]
    Country Percentage of cases reported (95% CI)
    China 33% (28% – 38%)
    France 7.9% (6.7% – 9.2%)
    Germany 71% (54% – 93%)
    Italy 5% (4.4% – 5.7%)
    South Korea 78% (59% – 100%)
    Spain 4.9% (4.3% – 5.6%)

    Hay que tener en cuenta que estos datos corresponden a la situación de hace trece días, por eso países como Alemania tienen intervalos de confianza tan amplios.

    [1] https://cmmid.github.io/topics/covid19/severity/global_cfr_estimates.html)

  4. JuanMS

    Lorenzo, tus cálculos son un ejemplo de que, en contra de lo que nos están diciendo, la evolución de la epidemia es previsible, incluso con datos sólo de una provincia… yo diría que en cuanto hay más de 20 o 30 casos los datos ya se van alineando en la exponencial (o sea: bastante antes del 8M).

    europeancataclism el número total de fallecidos es difícil de estimar, yo ahí ya recurriría a un modelo mas detallado. Entre otras cosas, porque es previsible que se produzcan repuntes importantes… Mira este informe del Imperial College, pag 11: https://sciencebusiness.net/sites/default/files/inline-files/Imperial-College-COVID19-NPI-modelling-16-03-2020.pdf

    David, me alegro de encontrarte por aquí… Muy buena la referencia, y veo que a pesar de lo burdo de mi estimación, no es demasiado mala. Yo decía que los casos reales son 15 veces más que los reportados y ahí dicen que estos son el 5% de los reales, o sea un factor 20… en fin, peor aún.

    Germán, supongo que nos gustas estas gráficas porque somos físicos… Los que no entienden las gráficas logarítmicas no saben lo que se pierden (y se podían explicar en el bachillerato). Sobre la vuelta a la normalidad… yo me temo que no se van a reanudar las clases presenciales este curso. Así que si se te cae internet estás listo… yo por suerte tengo muy pocas este cuatrimestre, la semana que viene haré una prueba a ver qué tal sale. No te desanimes, seguro que tus alumnos te disculpan.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s