Version 4 (modified by rboet, 7 años ago) (diff) |
---|
Tabla de Contenido
Propuesta de Desarrollo del Proyecto
1. Necesidades y/o problemas
Realizar un procesamiento de lenguaje natural en corpus de textos amplios sobre temas comunes y cargas semánticas similares,
2. Solución propuesta
Un sistema que permita la realización de consultas públicas con un módulo que permita realizar el modelado de tópicos de grandes cantidades de corpus y una visualización gráfica agradable.
3. Alcance del software propuesto
- Un sistema que permita realizar una consulta pública de los proyectos del SIPES
- Un módulo que permita realizar el procesamiento de los datos obtenidos de la consulta, y posterior a esto su visualización en tópicos gracias al LDA
4. Descripción general de la arquitectura del software
En la imagen a continuación se describe la arquitectura del software
- Se hace la definición/selección del corpus a ser tratado
- Se le da el formato requerido para ser procesado por las herramientas
- Se realiza el pre-procesamiento que se encarga de limpiar los corpus y tomar sólo las palabras relevantes para el análisis
- Con el corpus pre-procesado se ejecuta el algoritmo LDA tantas veces como corpus necesitemos
- Se configura la aplicación web con las rutas de los archivos resultantes del pre-procesamiento y LDA
- Y por último se pueden visualizar los resultados en la interfaz web
5. Metodología de desarrollo
[En esta sección se indica la metodología a utilizar para guiar el proceso de desarrollo del software]
6. Plataforma de operación
- Aplicación netamente web, para correr a través de un servidor cualquiera.
7. Plataforma de desarrollo
- Python 2.7
- Django 1.10
8. Licencias de código y documentación
[Se indica los tipos de licencias libres a utilizar tanto para el software como para su documentación]
Adjuntos (1)
-
Arquitectura.png
(36.6 KB) -
added by rboet 7 años ago.
Arquitectura del Software
Download all attachments as: .zip