176 | | == 6.- Modelado de tópicos. |
177 | | |
178 | | El modelado de tópicos es una herramienta que articula un conjunto de técnicas estadísticas para modelar las relaciones subyacentes entre las palabras que componen un conjunto de documentos que conocemos como corpus. De esta manera es posible reconocer cómo las palabras que conforman el corpus se agrupan en conjuntos que podemos identificar como tópicos o temas que dan estructura al corpus como un todo semántico y que pueden servir como criterio de organización del mismo. Esta herramienta permite entonces procesar un conjunto numeroso de textos o documentos electrónicos para analizarlos, resumirlos, conocer su contenido y archivarlos. |
179 | | |
180 | | La motivación principal del modelado de tópicos es que en las últimas décadas los avances informáticos y tecnológicos han traído consigo que los textos y documentos sean cada vez más numerosos y aparezcan más frecuentemente en formato electrónico. Esto imposibilita que la fuerza humana pueda ser capaz de analizarlos todos y cada uno de ellos, principalmente por la enorme cantidad de tiempo que se requiere invertir para procesar esta gran cantidad de información. Para solucionar este problema, se recurre a automatizar este proceso. |
181 | | |
182 | | Para el año 2017 se propone proveer una herramienta informática que permita procesar los resultados de las participaciones de grandes cantidades de personas en procesos consultivos masivos. Para esto se deben combinar algunos modelos matemáticos-probabilísticos del lenguaje natural con técnicas de análisis discursivo provenientes de la lingüística. A partir de las numerosas participaciones escritas en lenguaje natural que resultan de una consulta pública masiva, se espera extraer información estructurada precisa que pueda hacer parte de los procesos de gestión de la administración pública. De esta manera se espera fortalecer las posibilidades de participación del poder popular en la formulación de políticas públicas. |
| 176 | == 6.- Proyecto de Modelado de tópicos |
| 177 | |
| 178 | Este proyecto se propone definir un sistema de análisis del discurso que tomen como referencia conjuntos amplios de texto, con el propósito de automatizar la búsqueda y el análisis de categorías discursivas que aporten datos relevantes para la investigación. Dichos conjuntos pueden consistir en alocuciones de voceros políticos, consultas comunitarias, contenidos mediáticos, documentos académicos, entre otros. El sistema incluye el desarrollo de herramientas informáticas de apoyo para el análisis del discurso, las cuales podrían |
| 179 | integrarse en plataformas como portales web para automatizar el análisis del contenido de los mismos y proporcionar una vista rápida y organizada de la información. |
| 180 | |
| 181 | El proyecto está basado en la utilización de algoritmos para la organización de conjuntos de textos en grupos semánticos, o “modelado de tópicos”. El modelado de tópicos organiza los |
| 182 | documentos de acuerdo con la relevancia que ocupe un determinado tópico en los mismos. Esto permitiría acceder a los documentos más pertinentes según un criterio de búsqueda |
| 183 | temática, a diferencia de las herramientas de búsqueda por palabras. Con ello se podría pasar de un motor de búsqueda que sólo permite acceder a los documentos en función de si |
| 184 | aparece un determinado término, a un recurso que permita buscar los documentos más relevantes para el análisis o estudio de un tema más general. |
| 185 | |
| 186 | Las potencialidades de un sistema de este tipo pueden ser diversas. Por una parte, pueden ser útiles para el estudio de matrices discursivas contenidas en conjuntos de documentos |
| 187 | como titulares de prensa y reportajes. Por lo tanto, puede contribuir con el estudio de matrices mediáticas o comunicacionales. En esta categoría, puede ser que el corpus se |
| 188 | encuentre integrado por otro tipo de textos, como discursos políticos, entonces sería posibleestudiar un buen número de alocuciones de una cierta tendencia para extraer los aspectos |
| 189 | de significado más constantes. Por ejemplo, como en el ejemplo presentado, sería posible examinar la importancia de diferentes términos en los discursos del Comandante Chávez. |
| 190 | |
| 191 | Por otra parte, en el área de diseño y evaluación de políticas públicas, el modelado de tópicos puede contribuir como herramienta de organización de documentos recogidos a partir |
| 192 | de consultas públicas en las que los ciudadanos expresan sus opiniones en torno a varios temas. Por ejemplo, una consulta pública sobre una iniciativa legislativa o del Ejecutivo |
| 193 | podría registrarse y analizarse eficientemente con ayuda de esta herramienta, además de que los textos pueden colocarse a disposición del público. Lo mismo sería válido para |
| 194 | diferentes tipos de consulta a nivel nacional, estadal o municipal. |
| 195 | |
| 196 | Finalmente, el modelado de tópicos puede ser útil para la investigación documental si se cuenta con un corpus de productos de investigación, tales como libros y artículos científicos. |
| 197 | La importancia de los repositorios de publicaciones gubernamentales y universitarias podría incrementarse si contáramos con buscadores que no sólo extrajeran los títulos de los |
| 198 | artículos, sino que además los “leyeran” entregándonos como resultado un conjunto de tópicos relevantes en función de los temas de interés en campos como la salud y la |
| 199 | producción alimentaria. |
| 200 | |
| 201 | Actualmente CENDITEL está trabajando en el desarrollo de una herramienta web que pueda proporcionar el servicio de análisis del discurso a cualquier persona u organización. Esta |
| 202 | herramienta permitiría que un usuario seleccione los textos que desea estudiar y realice análisis de modelado de tópicos con fines de investigación en diferentes áreas. Para el año 2017 se propone proveer una herramienta informática que permita procesar los resultados de las participaciones de grandes cantidades de personas en procesos consultivos masivos. Para esto se deben combinar algunos modelos matemáticos-probabilísticos del lenguaje natural con técnicas de análisis discursivo provenientes de la lingüística. A partir de las numerosas participaciones escritas en lenguaje natural que resultan de una consulta pública masiva, se espera extraer información estructurada precisa que pueda hacer parte de los procesos de gestión de la administración pública. De esta manera se espera fortalecer las posibilidades de participación del poder popular en la formulación de políticas públicas. |