Bienvenidos
Materiales preparados para el curso impartido en la plataforma YoSigo UGR de la Universidad de Granada por Sergio Castro-Cortacero y Nicolás Robinson-García el día 8 de noviembre de 2024.
🎯Objetivos de la sesión
Esta web contiene los contenidos del curso de YoSigo UGR Introducción al análisis de textos con Quanteda. En esta sesión queremos iniciarte en el fantástico mundo del análisis de textos. Para ello vamos a utilizar el lenguaje de programación R y el paquete de análisis de textos Quanteda. Para ello vamos a explorar algunas cuestiones básicas para el análisis de textos como es la creación de un corpus, el proceso de tokenización y algunos análisis básicos. Al terminar esta sesión deberías poder hacer lo siguiente:
Entender los fundamentos básicos de minería de datos.
Ser capaz de importar y tokenizar un texto empleando el paquete de R
quanteda
.Realizar un análisis práctico utilizando un corpus de texto real.
🫶Antes de comenzar
Para poder repetir las cosas que vamos a hacer en este curso y poder realizar tus propios análisis, deberás de tener instalado en tu ordenador los siguientes programas (instálalos en el orden que te indico):
- R. Este es el lenguaje programación que emplearemos. Se trata de un lenguaje abierto y gratuito desarrollado específicamente para el análisis estadístico. Aunque como con cualquier otro lenguaje de programación, es muy flexible y puede emplearse para diferentes funciones. Cuenta con una amplia comunidad de usuarios que crean y mantienen sus funcionalidades creando lo que se conoce como paquetes o librerías.
- RStudio. Se trata de una interfaz de R que facilita algunas operaciones. Aunque en principio, R puede emplearse sin interfaz, RStudio incluye los principales paquetes adicionales así como algunas funcionalidades que pueden ser muy útiles para mantenernos cuerdos al adentrarnos en el mundo de la programación.
💡 Aquí te daremos el código muy mascadito, pero si no tienes experiencia programando con R y deseas conocer las bases de su gramática, te recomiendo los siguientes recursos:
El curso de yosigo Introducción práctica a la ciencia de datos en R – REDUX by Wenceslao Arroyo-Machado
El libro online R for Data Science by Hadley Wickham, uno de los máximos exponentes en R
🎒 Material necesarios
El texto al que vamos aplicar el análisis cuantitativo procede del diario escrito por el opositor ruso Navalni durante su encarcelamiento entre 2021 y 2024. Este no es el diario completo, sino fragmentos que hemos extraido de una publicación del diario “The New Yorker” el 11 octubre de 2024.
- ⬇️ Descárgate el archivo con los fragmentos del diario. Una vez en la página cliquea con el botón derecho sobre ella > Selecciona “guardar como” y ubícalo en un lugar de fácil acceso. Recomendamos que lo guardes en el propio escritorio.
Si quieres saber más sobre este tema también te facilitamos el artículo que hemos tenido como referencia.
📰 Artículo The New Yorker: Alexei Navalny’s Prison Diaries
📰 Artículo El País: Los (inéditos) diarios de prisión de Navalni
📖 Libro original con los diarios: Patriota, de Alexéi Navalni
Sobre Navalni
Alekséi Navalni fue un abogado y político condenado a 19 años de prisión por varios delitos relacionados con su activismo opositor al gobierno de Putin. Estas entradas reflejan los pensamientos y reflexiones que Navalni expresó durante su encarcelamiento, que comenzó el 28 de febrero de 2021 y continuó hasta el 16 de febrero de 2024, año en el que se informó su muerte en extrañas circunstancias en la prisión IK-3 de Jarp, en Yamalia-Nenetsia, también conocida como “Lobo Polar” por su ubicación en las cercanías del círculo polar ártico. |