Práctica 7. Análisis del corpus con Voyant Tools


En esta entrada nos sumergimos en el maravilloso mundo del análsis del corpus con la aplicación Voyant Tools.



En este caso, hemos analizado tres obras del escritor nicaragüense Rubén Darío: Azul, Cantos de vida y esperanza y Prosas Profanas. Para ello, convertimos los libros en formato PDF para pasarlos a .txt, así agruparlos en un único ZIP para que Voyant Tools pudiera analizarlos. Este fue el resultado:




Esta aplicación nos indica que, entre los tres documentos, hay un total de 59 020 palabras, de entre las cuales, recoge como términos distintivos los siguiente:

  1. Azul: usted (48), había (80), cantemos (25), veía (19), suzette (19).
  2. Cantos de vida y esperanza: lloro (12), cyrano (11), quijote (7), volver (6), velázquez (6).
  3. Prosas profanas: quirón (12), harmonía (12), princesas (8), isla (8), són (7).

Además, arriba a la izquieda aparecen, en una nube de palabras, los cien términos más usados en este corpus literario:


Asimismo, arriba a la derecha hay un gráfico con las cinco palabras más usadas en Azul, Cantos de vida y esperanza y Prosas profanaa (874 veces); no (311 veces); mi (25 veces); tu (208 veces); más (174 veces).






Aunque los resultados no fueran los esperados (contábamos con que aparecieran palabras con contenido semántico; pero, en su lugar, predominan preposiciones, adverbios y determinantes), esta herramienta es útil para realizar un análisis del corpus exhaustivo. Al pasar el documento al formato .txt, la IA que participa en esta aplicación puede "leer" los ficheros y hacer una recogida léxica de la frecuencia de uso de los términos. Verdaderamente facilita el trabajo de hacerlo a mano. 



Comentarios

Entradas populares de este blog

Práctica 8. Meme

10 herramientas digitales para la docencia y la investigación. PLE de DLL

Práctica 3. Análisis de un blog/web/perfil redes de DLL/LIJ