Programa de Seguimiento Político-Social

El Programa de Seguimiento Político-Social (S.P.S.) es la consecuencia de un trabajo en conjunto realizado por los equipos de investigación de CITIAPS (Centro de Innovación en Tecnologías de la Información para Aplicaciones Sociales) y CISEC (Centro de Investigación Sociedad Economía y Cultura), de la Universidad de Santiago de Chile.

Informes

Bolsas de palabras

A continuación se adjuntan las bolsas de palabras utilizadas para los informes de S.P.S. realizados sobre diversas materias.

Notas sobre las bolsas de palabras:

Fórmula de ponderación

Sea $\boldsymbol{t}$ un término de la bolsa de palabras asociada a un concepto, y $\boldsymbol{n}$ una noticia. La fuerza del término $\boldsymbol{t}$ en la noticia $\boldsymbol{n}$ está dada por: $$FUERZA(t,n)=\log(\textrm{TAMAÑO}(n))-\textrm{FREQ}(t,n)$$

donde:
TAMAÑO$(\boldsymbol{n})$: Número de caracteres de la noticia n.
FREQ$(\boldsymbol{t},\boldsymbol{n})$: Número de veces que aparece el término $\boldsymbol{t}$ en la noticia $\boldsymbol{n}$. Si el término aparece en el titular, se cuenta dos veces.

La fuerza del término $\boldsymbol{t}$ en una lista de $\boldsymbol{m}$ noticias $\boldsymbol{n_1}$, $\boldsymbol{n_2}$, …, $\boldsymbol{n_m}$ está dada por: $$FUERZA(t)=FUERZA(t,n_1)+FUERZA(t,n_2)+...+FUERZA(t,n_m)$$

Las variables de esta fórmula (tamaño de la noticia, frecuencia del término, y su presencia o no en el titular) se inspiran en el trabajo de Borau y García (2014), quienes realizan un análisis cruzado entre los términos “diplomacia” y “protocolo” en la prensa española.

En cambio, como estamos observando medios de prensa electrónicos, otras variables utilizadas para periódicos en papel (por ejemplo, distinción entre páginas pares e impares, distribución de la noticia en la página, presencia de la noticia permanentemente en portada, presencia de contraportadas, etc.), y que vienen de teorías como la de la agenda-setting o el triángulo de Haas, no son aplicables en este contexto. El acceso a las noticias digitales es usualmente directo, y está facilitado por los buscadores y enlaces compartidos en redes sociales.

TAMAÑO y FREQ se multiplican, pues se consideran variables independientes. El logaritmo (en base 10) de TAMAÑO busca lograr una ponderación más cercana a la de FREQ como indicador de relevancia, así como suavizar las diferencias de valores entre noticias. En efecto, como se puede ver en la Figura 1, obtenido a partir de 60891 noticias de los medios Emol, La Segunda, Soy Chile, El Mostrador, La Tercera y La Nación observadas entre el 1 de enero y el 31 de mayo de 2016, el parámetro TAMAÑO puede variar mucho dependiendo de factores como el día en que se haya publicado la noticia.

Caracteres por día
Figura 1. Número de caracteres promedio de noticias por día, para 60891 noticias observadas entre el 1 de enero y el 31 de mayo de 2016, desde seis medios de prensa digitales.

La presencia o no del término en el titular de la noticia, en cambio, es una variable dependiente de FREQ, y por tanto se suma a los valores aportados por dicha variable.

Finalmente, la fuerza mensual de cada término se compone de la sumatoria de sus relevancias diarias.

Bibliografía

* E. Borau y F. García (2014). Análisis comparativo entre la imagen del protocolo y de la diplomacia en la prensa española. Sphera Publica, 1 (14), pp. 97‐123.