67 | | El algoritmo que realiza el pre-procesamiento, también permite excluir palabras (que se deben conocer a priori)que no aportan ninguna carga lingüística para el análisis, es importante resaltar que las palabras se excluyen literalmente como se colocan, es decir que si se excluye la palabra '''pueblo''' y en el corpus existe la palabra '''pueblos''' esta última no será excluida ya que es está plural y no es pueblos es distinto de pueblo |
| 68 | El algoritmo que realiza el pre-procesamiento, también permite excluir palabras (que se deben conocer a priori)que no aportan ninguna carga lingüística para el análisis, es importante resaltar que las palabras se excluyen literalmente como se colocan, es decir que si se excluye la palabra '''pueblo''' y en el corpus existe la palabra '''pueblos''' esta última no será excluida ya que es está plural y no es pueblos es distinto de pueblo. |
| 69 | |
| 70 | == Preparación de entradas para el algoritmo LDA |
| 71 | |
| 72 | Entre el pre-procesamiento y la ejecución del LDA existe un paso intermedio, que consiste en tomar la salida de algunos de los archivos resultantes de la ejecución del pre-procesamiento, procesarlos y generar algunos archivos que servirán como entrada para la ejecución del LDA. |
| 73 | |
| 74 | == Ejecutar algoritmo LDA |
| 75 | |
| 76 | El algoritmo LDA se encarga de procesar archivos con un formato exacto (el cuál es generado mediante el pre-procesamiento) complementado con los archivos generados por el Script intermedio (ver sección anterior) el LDA se encargará de construir los tópicos en la cantidad que se le especifique al utilizar el LDA. |
| 77 | |
| 78 | === Definir parámetros de ejecución |
| 79 | |
| 80 | Los parámetros de ejecución del algoritmo se limitan a la colocar la cantidad de tópicos que se quieren, la ruta al archivo de configuración del LDA, la ruta de los archivos pre-procesados, la ruta de uno de los archivos generados por el archivo intermedio (extensión .dat) y el nombre de la carpeta donde generaremos la salida. |
| 81 | |
| 82 | === Ejecutar el LDA |
| 83 | |
| 84 | Con estos parámetros definidos, simplemente es necesario ejecutar el LDA, esperar que realice el procedimiento y visualizar la carpeta con los archivos correspondientes a la salida. |
| 85 | |
| 86 | == Presentar resultados del algoritmo LDA |
| 87 | |
| 88 | Los resultados del LDA pueden ser visualizados mediante una interfaz web, la cuál necesita un documento como semilla (es decir que se coloque el nombre de uno, o se de en el botón que busca uno aleatorio) para mostrar los corpus en un diagrama de barra cuyo cuerpo esta constituido por la aparición de los tópicos (representados en colores distintos). |
| 89 | |
| 90 | [[Image(topicos_1.png, center)]] |
| 91 | |
| 92 | Mientras que en el lado derecho podemos ver los tópicos y su respectiva constitución. |
| 93 | |
| 94 | [[Image(topicos_2.png, center)]] |
| 95 | |
| 96 | Esta misma constitución puede ser inspeccionada más a fondo dando click sobre el documento y viendo la página que muestra a continuación, en la cuál se puede ver la aparición de un tópico en específico o de todos. |
| 97 | |
| 98 | [[Image(topicos_3.png, center)]] |
| 99 | |