source: consulta_publica/utils/corpusScript.py @ 7095598

baseconstituyenteestudiantesgeneralplan_patriasala
Last change on this file since 7095598 was 0ff122b, checked in by rudmanmrrod <rudman22@…>, 7 años ago

Agregado módulo de gestión de perfiles de procesamiento, incorporado el módulo de visualización de modelado de tópicos

  • Propiedad mode establecida a 100644
File size: 1.4 KB
Línea 
1# -*- coding: utf-8 -*-
2"""
3Sistema de Modelado de Tópicos
4
5Copyleft (@) 2014 CENDITEL nodo Mérida - https://planificacion.cenditel.gob.ve/trac/
6"""
7## @package django_topic_explorer.utils
8#
9# Método para crea los archivos copus.dat y vocab.txt
10# @author Jorge Redondo (jredondo at cenditel.gob.ve)
11# @author <a href='http://www.cenditel.gob.ve'>Centro Nacional de Desarrollo e Investigación en Tecnologías Libres
12# (CENDITEL) nodo Mérida - Venezuela</a>
13# @copyright <a href='http://www.gnu.org/licenses/gpl-2.0.html'>GNU Public License versión 2 (GPLv2)</a>
14# @version 1.3
15from vsm.extensions.corpusbuilders import dir_corpus
16from vsm.extensions.interop.ldac import export_corpus
17import sys
18
19def corpus_script(path_corpus,path_output):
20        """!
21        Función para construir los archivos del lda
22       
23        @author Jorge Redondo (jredondo at cenditel.gob.ve)
24        @copyright GNU/GPLv2
25        @param path_corpus Recibe la ruta donde esta ubicado el corpus
26        @param path_output Recibe la ruta de destino donde es secribirán los archivos
27        """
28        corpus_object = dir_corpus(path_corpus)
29        export_corpus(corpus=corpus_object, outfolder=path_output, context_type=corpus_object.context_types[0])
30
31if __name__ == '__main__':
32        if(len(sys.argv)>2):
33                path_corpus = sys.argv[1]
34                path_output = sys.argv[2]
35                corpus_script(path_corpus,path_output)
36        else:
37                print "Debe ingresar (2) argumentos a la funcion: path_corpus y path_output"
Nota: Vea TracBrowser para ayuda de uso del navegador del repositorio.