preprocesamientov1.0
Last change
on this file since 1a2167d was
8ebf4a3,
checked in by Jorge Redondo Flames <jredondo@…>, 9 años ago
|
Actualizado muestreogibbs.pdf y agregado pequeña
documentación sobre integración LDA-c y vsm
para la visualización de los resultados del primero
en la interfaz web.
|
-
Propiedad mode establecida a
100644
|
File size:
730 octetos
|
Línea | |
---|
1 | Integración LDA-c y VSM: |
---|
2 | ======================== |
---|
3 | |
---|
4 | Generar un corpus de entrada para LDA-c (corpus.dat) |
---|
5 | a partir de los archivos contenidos en un directorio, |
---|
6 | cada archivo un texto del corpus: |
---|
7 | python corpusScript.py path_corpus path_salida |
---|
8 | |
---|
9 | Algunos adelantos para visualizar en la interfaz |
---|
10 | gráfica los resultados de LDA-c están contenidos |
---|
11 | en el script: ldac2vsm.py |
---|
12 | |
---|
13 | |
---|
14 | Correr LDA-c: |
---|
15 | ------------- |
---|
16 | lda est [initial alpha] [k] [settings] [data] [random/seeded/*] [directory] |
---|
17 | |
---|
18 | Ejemplo: |
---|
19 | -------- |
---|
20 | ./lda est 0.1 20 settings.txt corpus.dat random output/ |
---|
21 | |
---|
22 | Visualizar salida de LDA-c: |
---|
23 | --------------------------- |
---|
24 | python topics.py <beta-file> <vocab-file> <num words> |
---|
25 | |
---|
26 | Ejemplo: |
---|
27 | -------- |
---|
28 | python topics.py output/final.beta vocab.txt 12 |
---|
29 | |
---|
Nota: Vea
TracBrowser
para ayuda de uso del navegador del repositorio.