
Metodología
Este informe se basa en el análisis de la práctica de nueve medios nacionales de información chilenos en redes sociales. Las organizaciones noticiosas incluidas corresponden a medios informativos de alcance nacional y de interés general. Representan diferentes plataformas de medios de comunicación –televisión, radio, periódicos y sitios web de noticias–, se encuentran entre los medios más escuchados, vistos o leídos del país (Reuters Institute Digital News Report, 2020) y mantienen una actividad constante en redes sociales.
Por cada medio escogido, los posteos publicados en sus páginas de Facebook, así como en sus cuentas de Twitter e Instagram se analizaron a lo largo del 2020 para cubrir la evolución de la cobertura del primer año de la pandemia y su relación con fuentes noticiosas específicas. El conjunto de datos recabados comienza el 1 de enero –cuando ya habían comenzado los primeros contagios de COVID-19 en China, pero aún no había llegado el virus a Chile–, y termina el 31 de diciembre de 2020, después de que comenzó la vacunación del personal de las Unidades de Cuidados Intensivos en el país y que el gobierno aprobara el permiso de vacaciones.
Para acceder a las publicaciones que cada medio de comunicación realizó en Facebook e Instagram utilizamos CrowdTangle³, plataforma que rastrea el contenido público de páginas de Facebook verificadas y cuentas públicas de Instagram, incluyendo titulares y textos teaser de sitios enlazados, imágenes o artículos. Para Twitter, también se utilizaron estrategias de rastreo específicas, así como accesos complementarios a través de la API premium para desarrolladores de esta plataforma.

Medidas
Para medir la presencia de diferentes fuentes informativas en la cobertura que los medios nacionales chilenos dieron al COVID-19 en sus redes sociales, se detectaron las entidades presentes en cada post. Nos enfocamos en individuos, organizaciones e instituciones. Las entidades pueden ser analizadas como actores y/o fuentes. Algunos individuos, instituciones u organizaciones se consideran objetos de información (el tema del informe o comentario en la historia) mientras que otros se consideran fuentes de información (entidades que dicen/proporcionan información) (Mellado, 2020). Tras reconocer la presencia o ausencia de diferentes actores en las publicaciones realizadas por los medios de comunicación, se analizó a los actores que se utilizaron como fuentes en cada post. Para que alguien o algo fuera considerado una fuente, frases, hechos o citas debían ser atribuidos a ellos directa o indirectamente (parafraseando).
Preprocesamiento
Los datos globales rastreados por CrowdTangle incluyeron un total de 355.861 publicaciones de Facebook y 44.672 publicaciones de Instagram. El total de datos rastreados en Twitter incluyó 438.085 tweets. Los mensajes relacionados con COVID-19 fueron filtrados en base a expresiones comúnmente usadas para referirse al virus: "COVID", "COVID-19", "Coronavirus", "pandemia", "epidemia", y "SARS-CoV-2". Esto dio lugar a un corpus total de 168.250 posteos que refirieron a la pandemia en el ecosistema informativo de los medios analizados durante 2020 (ver Tabla 1). Estos mensajes fueron preprocesados, eliminando puntuaciones, URLs, y stop words (palabras vacías) para facilitar los análisis automatizados.
Estrategia analítica
Se utilizaron dos estrategias paralelas para encontrar a las fuentes que narraron la pandemia a través de las publicaciones de los medios de comunicación en Chile. Primero, se aplicó un método deductivo que permitió buscar la presencia de fuentes ampliamente reconocidas en las noticias. Basándonos en las medidas usadas por el proyecto internacional Journalistic Role Performance Project⁴ que estudia prácticas periodísticas en 46 países, se operacionalizaron 11 categorías para clasificar los tipos de fuentes: políticas, empresariales, de salud, científicas y académicas, policiales/de seguridad, jurídicas, de la sociedad civil, ciudadanas, medios de comunicación, deportivas y celebridades.
Estas once categorías fueron divididas en diversas subcategorías que representan posiciones formales, nombres de individuos, instituciones, organizaciones y grupos, así como cada uno de sus apodos y/o siglas (en caso de existir). En base a ello, se creó un diccionario manual que para el caso de Chile incluyó más de 2.130 entidades que pertenecían a cada sub-categoría al momento de la recopilación de datos.
Para procesar los datos se utilizó Anaconda, un software de distribución libre y de código optimizado para Python y R para la ciencia de datos y aplicaciones relacionadas con el aprendizaje automático. Para distinguir entre actores y fuentes, elaboramos una lista de reglas y patrones que caracterizan la escritura periodística. Específicamente, se utilizaron 325 verbos declarativos o expresiones comunes utilizadas por los medios de comunicación cuando se cita una fuente, así como la presencia de comillas. Para efectos de localizar una fuente, al menos uno de aquellos verbos/expresiones declarativas, o la presencia de comillas tenía que estar presente antes o después del nombre de la entidad, mientras que tanto el verbo/expresión declarativa como la entidad debían estar fuera de la cita (en caso de existir comillas). El número de fuentes se calculó automáticamente para toda la muestra y, luego de seis iteraciones que permitieron ajustar las reglas o patrones, se filtró por los cinco tipos de fuentes más frecuentemente encontrados.
En un esfuerzo por localizar entidades y actores recurrentes no incluidos en nuestro diccionario manual, se siguió como paso complementario un método inductivo, categorizando el corpus a través de la técnica de etiquetado Part-of-Speech (POS), que nos permitió marcar una palabra en un texto en base a su definición y a su contexto.
5
¹ Si bien TVN no lidera la lista de medios más vistos, nos pareció relevante su inclusión considerando su carácter distintivo de servicio público y vinculación formal con el Estado.
² Aunque dentro de la muestra se había incluido a Emol, este medio fue descartado al no tener una presencia activa en prácticamente ninguna de sus plataformas en redes sociales.
³ https://www.crowdtangle.com/
⁴ www.journalisticperformance.org
5 Una decisión importante a la hora de definir estas categorías tuvo que ver con la frontera entre fuentes de salud y fuentes políticas, ya que instituciones de salud, a distintos niveles, a menudo forman parte de las estructuras gubernamentales. Por lo mismo, intentamos distinguir entre los ministros de salud y otros altos funcionarios políticos responsables de la política de salud, a quienes incluimos entre las fuentes políticas, y los profesionales biomédicos que trabajan dentro de los gobiernos cuyas funciones normalmente no se consideran políticas, a quienes incluimos como fuentes de salud. A nivel transnacional, también categorizamos a la OMS y a su presidente como fuentes de salud, ya que normalmente se citan como información de expertos, en lugar de como responsables políticos.