source: modelado_topicos/doc/ldac2vsm_readme.txt @ 1a2167d

preprocesamientov1.0
Last change on this file since 1a2167d was 8ebf4a3, checked in by Jorge Redondo Flames <jredondo@…>, 9 años ago

Actualizado muestreogibbs.pdf y agregado pequeña
documentación sobre integración LDA-c y vsm
para la visualización de los resultados del primero
en la interfaz web.

  • Propiedad mode establecida a 100644
File size: 730 octetos
Línea 
1Integración LDA-c y VSM:
2========================
3
4Generar un corpus de entrada para LDA-c (corpus.dat)
5a partir de los archivos contenidos en un directorio,
6cada archivo un texto del corpus:
7python corpusScript.py path_corpus path_salida
8
9Algunos adelantos para visualizar en la interfaz
10gráfica los resultados de LDA-c están contenidos
11en el script: ldac2vsm.py
12
13
14Correr LDA-c:
15-------------
16lda est [initial alpha] [k] [settings] [data] [random/seeded/*] [directory]
17
18Ejemplo:
19--------
20./lda est 0.1 20 settings.txt corpus.dat random output/
21
22Visualizar salida de LDA-c:
23---------------------------
24python topics.py <beta-file> <vocab-file> <num words>
25
26Ejemplo:
27--------
28python topics.py output/final.beta vocab.txt 12
29
Nota: Vea TracBrowser para ayuda de uso del navegador del repositorio.