wiki:ModeladoTopicos_2017/topicos

Version 2 (modified by lramirez, 7 años ago) (diff)

--

¿Qué es el modelado de tópicos ?

El modelado de tópicos es una herramienta que permite manejar un gran número de textos o documentos electrónicos para analizarlos, resumirlos, conocer su contenido y archivarlos.

La motivación principal del modelado de tópicos es que en las últimas décadas los avances informáticos y tecnológicos han traído consigo que los textos y documentos sean cada vez más numerosos y aparezcan más frecuentemente en formato electrónico. Esto imposibilita que la fuerza humana pueda ser capaz de analizarlos todos y cada uno de ellos, principalmente por la enorme cantidad de tiempo que se requiere invertir para procesar esta gran cantidad de información. Para solucionar este problema, se recurre a automatizar este proceso.

¿Qué son los tópicos ?

Un tópico en el contexto de modelado de tópicos es una distribución de probabilidades de palabras para un conjunto e indica la probabilidad que una palabra aparezca en un documento sobre un tópico en particular. El modelado de los tópicos en el análisis de un corpus permite observar la distribución de las palabras que lo conforman de acuerdo con relaciones semánticas que se establecen entre ellas para conformar ámbitos temáticos que varían de acuerdo a la naturaleza misma de cada corpus.

Para más información

Si desea saber más al respecto, se deja adjunto un documento que explica de forma más amplía los conceptos del modelado de tópicos y los algoritmos implementados para el mismo.

Adjuntos (1)

Download all attachments as: .zip