Fuente: SAGE-Ocean
Métodos, Innovación, Habilidades

Sam Gilbert , investigador afiliado del Instituto Bennett de Políticas Públicas de la Universidad de Cambridge, explica cómo se utilizan los datos de búsqueda en Internet en las respuestas a la pandemia de Covid-19, y qué conjuntos de datos de búsqueda y herramientas están disponibles para los investigadores.

Buscar datos durante brotes de enfermedades infecciosas anteriores

La “infodemiología”, el análisis de los datos de Internet generados por los usuarios para informar las políticas de salud pública, ha recorrido un largo camino en los 12 años desde que se lanzó Google Flu Trends .

Cuando revisé la literatura con SAGE en 2019, encontré 265 artículos revisados ​​por pares en revistas académicas que se basan en datos agregados sobre las búsquedas individuales de Google. Los investigadores han utilizado datos de búsqueda para rastrear la propagación del ébola durante la epidemia de 2014 en África occidental, el virus del Zika durante el brote de 2016 en Brasil y la fiebre del Nilo occidental durante un período de once años en Italia.

Incluso en países con bajos niveles de penetración en Internet, el análisis de los datos de búsqueda ha dado a las agencias de salud pistas importantes sobre las necesidades de información del público. Al destacar las brechas entre la orientación de expertos sobre la supresión de enfermedades y lo que la gente común piensa y hace, los datos de búsqueda pueden ayudar a desarrollar estrategias de comunicación efectivas. Durante el brote de Zika, los datos de búsqueda sugirieron que había un enfoque desproporcionado en las búsquedas de microcefalia de las personas, cuando en realidad la fiebre, la erupción cutánea y la conjuntivitis eran síntomas mucho más comunes de infección. También mostró que las personas no buscaban información sobre acciones prácticas que pudieran tomar para reducir el riesgo de contraer el virus, como evitar las áreas de agua estancada donde se reproducen los mosquitos.

Buscar datos y la crisis de Covid-19

Entonces, ¿cómo se utilizan los datos de búsqueda durante la actual pandemia de coronavirus? Los investigadores han demostrado que las búsquedas en Google de los síntomas de Covid-19 pueden rastrear la propagación de la enfermedad antes de las estadísticas oficiales, una técnica denominada «predicción inmediata». Un modelo construido por el científico informático de UCL Bill Lampos y su equipo muestra que las búsquedas de Google predicen los volúmenes de casos de Covid hasta 14 días antes. Entre los más predictivos están las búsquedas de anosmia: la pérdida del olfato.

El logotipo de Google aparece en una colorida calle con imágenes de grafiti

Este síntoma fue el foco de un artículo de médicos otorrinolaringólogos británicos en Guys and St Thomas’s Hospital, Abigail Walker, Claire Hopkins y Pavol Surda, quienes fueron los primeros en llamar la atención. Su análisis basado en Google Trends mostró que las búsquedas de información relacionada con la pérdida de olor estaban fuertemente correlacionadas con el inicio de la infección por Covid-19 en Italia, España, Reino Unido, Estados Unidos, Alemania, Francia, Irán y los Países Bajos. Aparentemente para el equipo de Lampos a mediados de marzo, Public Health England no reconoció la asociación de la anosmia con Covid-19 hasta el 18 de mayo.  

La búsqueda de anosmia es también el foco de herramientas interactivas desarrolladas por el vendedor de búsqueda Patrick Berlinquette. Al ofertar por palabras clave relacionadas con la pérdida del olfato en las subastas de Google Ads, Berlinquette puede mostrar datos mucho más granulares de los que están disponibles a través de Google Trends. Al trazar la ubicación de las búsquedas en un mapa, se genera una imagen de los puntos críticos emergentes. En los EE . UU. , Esto puede dar a las agencias de salud pública una alerta temprana de nuevos brotes de Covid-19 a medida que los estados alivian las restricciones de bloqueo.

El potencial es aún mayor en contextos donde hay menos capacidad de prueba y / o donde las estadísticas oficiales no son confiables. En Tanzania , por ejemplo, los datos de búsqueda de anosmia sugieren que hay muchos más casos de Covid que los 509 que se han informado, lo que confirma los informes sobre el terreno de hospitales desbordados y entierros nocturnos . Como las herramientas de Berlinquette se crean utilizando Google Data Studio, todos sus datos se pueden descargar gratuitamente haciendo clic derecho en el informe .

Retos metodológicos

Una objeción común a estos usos de los datos de búsqueda de síntomas es el efecto de sesgo de los informes de los medios. Cuando las noticias están dominadas por las historias de coronavirus, ¿cómo podemos estar seguros de que la búsqueda de síntomas no está impulsada por la curiosidad y la hipocondría? Hay formas más y menos sofisticadas de lidiar con esto: el modelo Lampos utiliza la autorregresión para ajustar el efecto de los medios, mientras que Berlinquette simplemente excluye las consultas de búsqueda amplias, así como las que contienen palabras clave de coronavirus o Covid. Las búsquedas de «No puedo oler», «perdí el sentido del olfato» y «cuando no puedes oler» están dentro del alcance; las búsquedas de «anosmia» y «coronavirus de pérdida de olfato» no lo son.

Otra objeción es que Google Flu Trends, la primera y más conocida herramienta infodemiológica, dejó de funcionar después de tres años , sin poder predecir el pico de la temporada de gripe 2013. Sin embargo, la conclusión más útil para sacar no es que el análisis de datos de búsqueda no sea confiable, sino que es un complemento de otros métodos y no un reemplazo para ellos. La búsqueda de anosmia puede no ser la mejor base para un modelo predictivo de Covid-19 en tres años, pero esa no es una razón para no utilizarla ahora, cuando la necesidad de cerrar lagunas de datos y triangular otras fuentes es aguda, y Las apuestas son excepcionalmente altas.

Más allá de la epidemiología.

Los datos de búsqueda también tienen algo que decir sobre la experiencia humana de la pandemia. Al analizar 95 casos de países, Jeanet Bentzen de la Universidad de Copenhague descubre que la crisis ha aumentado las búsquedas de oración en Google en un 50%, hasta su nivel más alto jamás registrado. Los datos de búsqueda también pueden proporcionar información sobre la «infodemia» del coronavirus, al permitirnos realizar pruebas empíricas sobre la omnipresencia de la información errónea. El análisis del conjunto de consultas de coronavirus de Bing , un conjunto de datos de búsquedas agregadas y desidentificadas con intención relacionada con el coronavirus, sugiere que los resultados de la encuesta sobre el apoyo a las teorías de conspiración pueden ser menos alarmantes de lo que parecen.

Sin embargo, lo más importante es que los datos de búsqueda revelan las preguntas cotidianas a las que los miembros del público necesitan respuestas. Comience a escribir «¿Puedo …» en Google, y autocompletar le ofrece una ventana a nuestras preocupaciones colectivas . En el Reino Unido, al momento de escribir esto, incluyen «¿Puedo visitar a mis padres?», «¿Puedo ir a la playa?» Y «¿Puedo hacerme una prueba de coronavirus?». Los sitios web del gobierno harían bien en abordarlos explícitamente.

Trayendo datos de búsqueda a su propia investigación

Además de ser una fuente fascinante de información, los datos de búsqueda son fáciles de manejar. Escribí una guía introductoria para usarlo en la investigación de ciencias sociales en una publicación anterior de SAGE Ocean, y los conjuntos de datos de búsqueda relacionados con el coronavirus y los documentos académicos se recopilan en la sección de infodemiología del Manual técnico de Coronavirus.

Como espero que la segunda mitad de este blog aclare, las aplicaciones de los datos de búsqueda a la crisis actual se extienden mucho más allá de la epidemiología: los economistas podrían usarla para monitorear y pronosticar la demanda de los consumidores en un momento en que muchas de las fuentes de datos de las que dependen las agencias de estadísticas son comprometidos; los sociólogos podrían combinarlo con datos de encuestas para investigar los efectos del bloqueo en el bienestar mental. Nunca ha habido un mejor momento para explorarlo.

Sam Gilbert es investigador afiliado en el Instituto Bennett de Políticas Públicas de la Universidad de Cambridge. Experto en marketing basado en datos, anteriormente fue el empleado número 1 y director de marketing de la empresa fintech Bought By Many.

 

Acceda a la fuente original aquí