Cambios entre Versión 4 y Versión 5 de ModeladoTopicos_2017/sistematizacion/PropuestaDesarrollo


Ignorar:
Fecha y hora:
31/01/2017 11:34:52 (hace 7 años)
Autor:
lramirez
Comentario

--

Leyenda

No modificado
Añadido
Eliminado
Modificado
  • ModeladoTopicos_2017/sistematizacion/PropuestaDesarrollo

    v4 v5  
    1 [[TOC(heading=This section pages, WikiStart, ModeladoTopicos_2017/sistematizacion_metodologia, noheading, ModeladoTopicos:2017:sistematizacion/AnalisisDominio, ModeladoTopicos_2017/sistematizacion/PropuestaDesarrollo, ModeladoTopicos:2017:sistematizacion/PlanProyecto, ModeladoTopicos_2017/sistematizacion/EstandaresDesarrollo, ModeladoTopicos:2017:sistematizacion/EspecificacionRequerimiento, ModeladoTopicos_2017/sistematizacion/Codificacion, ModeladoTopicos:2017:sistematizacion/AnalisisyDiseno, ModeladoTopicos:2017:sistematizacion/Pruebas, ModeladoTopicos:2017:sistematizacion/Liberacion, heading=Tabla de Contenido)]]
     1[[TOC(heading=This section pages, WikiStart, ModeladoTopicos_2017/sistematizacion_metodologia, noheading, ModeladoTopicos:2017:sistematizacion/AnalisisDominio, ModeladoTopicos_2017/sistematizacion/PropuestaDesarrollo, ModeladoTopicos:2017:sistematizacion/PlanProyecto, ModeladoTopicos_2017/sistematizacion/EstandaresDesarrollo, ModeladoTopicos:2017:sistematizacion/EspecificacionRequerimiento, ModeladoTopicos:2017:sistematizacion/Codificacion, ModeladoTopicos:2017:sistematizacion/AnalisisyDiseno, ModeladoTopicos:2017:sistematizacion/Pruebas, ModeladoTopicos:2017:sistematizacion/Liberacion, heading=Tabla de Contenido)]]
    22
    33= Propuesta de Desarrollo del Proyecto =
     4
     5Este documento constituye la propuesta de desarrollo de la aplicación que será presentada a la comunidad de usuarios que utilizará dicha aplicación.
    46
    57
    68== 1. Necesidades y/o problemas ==
    79
    8 Realizar un procesamiento de lenguaje natural en corpus de textos amplios sobre temas comunes y cargas semánticas similares,
     10[En esta sección se indican los problemas y/o necesidades que se pretenden solventar con el software a desarrollar]
     11
     12El desarrollo de una democracia participativa y protagónica, enmarcada como estamos en una sociedad contemporánea estructurada sobre rasgos fundamentales de la sociedad de la información, demanda la generación de espacios y mecanismos que permitan y promuevan la participación política en todos los sectores de la sociedad mediante la implementación de herramientas digitales que den soporte y agilicen tales procesos.
     13El impulso por parte del Estado venezolano de mecanismos que avancen hacia la conformación de un gobierno electrónico ha conllevado experiencias significativas en materia de consultas abiertas digitales (Plan de la Patria, Consulta Nacional por la Calidad Educativa, entre otras), como parte de la generación de nuevas formas de participación política enmarcadas en una democracia participativa y protagónica.
     14Este tipo de consultas abiertas digitales demandan el uso de herramientas automatizadas para el análisis cuantitativo y cualitativo de resultados, lo que implica un desarrollo y apropiación de aspectos informáticos, estadísticos, y de análisis de discurso, que permitan avanzar hacia la automatización del análisis de resultados de consultas públicas digitales.
     15
    916
    1017
    1118== 2. Solución propuesta ==
    1219
    13 Un sistema que permita la realización de consultas públicas con un módulo que permita realizar el modelado de tópicos de grandes cantidades de corpus y una visualización gráfica agradable.
     20[En esta sección se indica el tipo de software que se plantea para abordar los problemas y/o necesidades planteadas]
     21
     22Entre las herramientas que actualmente se desarrollan, con potencial uso para el procesamiento de amplios cúmulos de datos textuales digitales, que pueden provenir por ejemplo de un sistema de consulta pública digital, podemos encontrar el modelado de tópicos (topic model), una técnica probabilística e informática que ha mostrado ser útil para el tratamiento de textos en la web, permitiendo inferir, analizar y comparar datos e información de distinta índole de manera automatizada.
     23
     24En este sentido, destaca el desarrollo de la Asignación Latente de Dirichlet (LDA por sus siglas en inglés), que consiste en un modelo generativo probabilístico no supervisado para modelar grandes corpus de texto, y generar aleatoriamente los documentos que se observan en este corpus (Blei, Ng y Jordan, 2003). Este modelo, basado en conceptos de Modelos Bayesianos, permite inferir tópicos a partir de un conjunto de documentos, mediante la aplicación de una distribución a posteriori. Tales tópicos pueden ser entendidos como temas estructurantes del corpus y es factible emplearlos para organizar los documentos que constituyen el corpus, según los criterios que se definan como de interés.
     25
     26El uso del LDA requiere sin embargo del desarrollo de una serie de herramientas digitales que permitan al usuario final (en este caso, entes del Estado venezolao que promuevan consultas públicas en diversas áreas de interés) interactuar con esta herramienta de una forma amigable que le permita procesar los resultados de los procesos de consultas públicas.
     27
     28
     29
    1430
    1531== 3. Alcance del software propuesto ==
    1632
    17 * Un sistema que permita realizar una consulta pública de los proyectos del SIPES
     33[En esta sección se indican los componentes, módulos o funciones que componen el software a desarrollar, indicando el alcance que tienes éstos en función de los procesos a automatizar]
    1834
    19 * Un módulo que permita realizar el procesamiento de los datos obtenidos de la consulta, y posterior a esto su visualización en tópicos gracias al LDA
    2035
    2136