Cambios entre Versión 178 y Versión 179 de WikiStart


Ignorar:
Fecha y hora:
07/02/2017 17:18:45 (hace 7 años)
Autor:
lchourio
Comentario

--

Leyenda

No modificado
Añadido
Eliminado
Modificado
  • WikiStart

    v178 v179  
    174174
    175175
    176 == 6.- Modelado de tópicos.
    177 
    178 El modelado de tópicos es una herramienta que articula un conjunto de técnicas estadísticas para modelar las relaciones subyacentes entre las palabras que componen un conjunto de documentos que conocemos como corpus. De esta manera es posible reconocer cómo las palabras que conforman el corpus se agrupan en conjuntos que podemos identificar como tópicos o temas que dan estructura al corpus como un todo semántico y que pueden servir como criterio de organización del mismo. Esta herramienta permite entonces procesar un conjunto numeroso de textos o documentos electrónicos para analizarlos, resumirlos, conocer su contenido y archivarlos.
    179 
    180 La motivación principal del modelado de tópicos es que en las últimas décadas los avances informáticos y tecnológicos han traído consigo que los textos y documentos sean cada vez más numerosos y aparezcan más frecuentemente en formato electrónico. Esto imposibilita que la fuerza humana pueda ser capaz de analizarlos todos y cada uno de ellos, principalmente por la enorme cantidad de tiempo que se requiere invertir para procesar esta gran cantidad de información. Para solucionar este problema, se recurre a automatizar este proceso.
    181 
    182 Para el año 2017 se propone proveer una herramienta informática que permita procesar los resultados de las participaciones de grandes cantidades de personas en procesos consultivos masivos. Para esto se deben combinar algunos modelos matemáticos-probabilísticos del lenguaje natural con técnicas de análisis discursivo provenientes de la lingüística. A partir de las numerosas participaciones escritas en lenguaje natural que resultan de una consulta pública masiva, se espera extraer información estructurada precisa que pueda hacer parte de los procesos de gestión de la administración pública. De esta manera se espera fortalecer las posibilidades de participación del poder popular en la formulación de políticas públicas.
     176== 6.- Proyecto de Modelado de tópicos
     177
     178Este proyecto se propone definir un sistema de análisis del discurso que tomen como referencia conjuntos amplios de texto, con el propósito de automatizar la búsqueda y el análisis de categorías discursivas que aporten datos relevantes para la investigación. Dichos conjuntos pueden consistir en alocuciones de voceros políticos, consultas comunitarias, contenidos mediáticos, documentos académicos, entre otros. El sistema incluye el desarrollo de herramientas informáticas de apoyo para el análisis del discurso, las cuales podrían
     179integrarse en plataformas como portales web para automatizar el análisis del contenido de los mismos y proporcionar una vista rápida y organizada de la información.
     180
     181El proyecto está basado en la utilización de algoritmos para la organización de conjuntos de textos en grupos semánticos, o “modelado de tópicos”. El modelado de tópicos organiza los
     182documentos de acuerdo con la relevancia que ocupe un determinado tópico en los mismos. Esto permitiría acceder a los documentos más pertinentes según un criterio de búsqueda
     183temática, a diferencia de las herramientas de búsqueda por palabras. Con ello se podría pasar de un motor de búsqueda que sólo permite acceder a los documentos en función de si
     184aparece un determinado término, a un recurso que permita buscar los documentos más relevantes para el análisis o estudio de un tema más general.
     185
     186Las potencialidades de un sistema de este tipo pueden ser diversas. Por una parte, pueden ser útiles para el estudio de matrices discursivas contenidas en conjuntos de documentos
     187como titulares de prensa y reportajes. Por lo tanto, puede contribuir con el estudio de matrices mediáticas o comunicacionales. En esta categoría, puede ser que el corpus se
     188encuentre integrado por otro tipo de textos, como discursos políticos, entonces sería posibleestudiar un buen número de alocuciones de una cierta tendencia para extraer los aspectos
     189de significado más constantes. Por ejemplo, como en el ejemplo presentado, sería posible examinar la importancia de diferentes términos en los discursos del Comandante Chávez.
     190
     191Por otra parte, en el área de diseño y evaluación de políticas públicas, el modelado de tópicos puede contribuir como herramienta de organización de documentos recogidos a partir
     192de consultas públicas en las que los ciudadanos expresan sus opiniones en torno a varios temas. Por ejemplo, una consulta pública sobre una iniciativa legislativa o del Ejecutivo
     193podría registrarse y analizarse eficientemente con ayuda de esta herramienta, además de que los textos pueden colocarse a disposición del público. Lo mismo sería válido para
     194diferentes tipos de consulta a nivel nacional, estadal o municipal.
     195
     196Finalmente, el modelado de tópicos puede ser útil para la investigación documental si se cuenta con un corpus de productos de investigación, tales como libros y artículos científicos.
     197La importancia de los repositorios de publicaciones gubernamentales y universitarias podría incrementarse si contáramos con buscadores que no sólo extrajeran los títulos de los
     198artículos, sino que además los “leyeran” entregándonos como resultado un conjunto de tópicos relevantes en función de los temas de interés en campos como la salud y la
     199producción alimentaria.
     200
     201Actualmente CENDITEL está trabajando en el desarrollo de una herramienta web que pueda proporcionar el servicio de análisis del discurso a cualquier persona u organización. Esta
     202herramienta permitiría que un usuario seleccione los textos que desea estudiar y realice análisis de modelado de tópicos con fines de investigación en diferentes áreas. Para el año 2017 se propone proveer una herramienta informática que permita procesar los resultados de las participaciones de grandes cantidades de personas en procesos consultivos masivos. Para esto se deben combinar algunos modelos matemáticos-probabilísticos del lenguaje natural con técnicas de análisis discursivo provenientes de la lingüística. A partir de las numerosas participaciones escritas en lenguaje natural que resultan de una consulta pública masiva, se espera extraer información estructurada precisa que pueda hacer parte de los procesos de gestión de la administración pública. De esta manera se espera fortalecer las posibilidades de participación del poder popular en la formulación de políticas públicas.
    183203
    184204