Detección de sujetos omitidos en el español

A continuación se incluyen las dependencias que son necesarias instalar. Las mismas se basan en la instalación de cero de un ambiente Linux.

Dependencias de sistema:

sudo apt install python-pip python3 python3-dev libboost-dev foma-bin foma libfoma-dev build-essential tial automake autoconf libtool git libboost-regex-dev libboost-program-options libboost-program-options-dev libboost-system-dev libboost-thread-dev

Instalación de Freeling

Clonar el repositorio de freeling:

git clone [https://github.com/TALP-UPC/FreeLing.git](https://github.com/TALP-UPC/FreeLing.git)

Se debe utilizar la branch master, pero una versión bastante mas vieja que la actual. Se supone que funciona con la version 4.0, pero por las dudas para estar seguros usar el commit:

git checkout ff81c77efea3130d2b0a4dda603398da0c65dd96

Para finalizar la instalación hay que seguir los pasos detallados acá , que es básicamente correr los scripts de configuraciones y hacer el make.

Entorno de desarrollo

Para simplificar la instalación de dependencias utilizar un entorno virtual de Python. Es importante que el entorno se cree con Python3 para que los módulos puedan correr.

mkvirtualenv pgrado --python=/usr/bin/python3.5

Una vez dentro del entorno creado instalar las dependencias incluidas en el archivo requirements.txt adjunto.

pip install -r requirements.txt

Se utilizó una versión especifica de sckit-learn por lo que se debe instalar corriendo: pip install git+git://[github.com/scikit-learn/scikit-learn.git@0679bbc3fe6685fddedb5e673a9469caf951d36a](http://github.com/scikit-learn/scikit-learn.git@0679bbc3fe6685fddedb5e673a9469caf951d36a)

Finalmente, es necesario declarar la ubicación de la API Python del modulo Free-Ling. El mismo se encuentra en la ruta APIs/python relativa al directorio donde se clonó el repositorio de la herramienta. Para esto se utilizan la variable de ambiente FREELING API, declarada de la siguiente manera: export FREELING API=/home/usuario/FreeLing/APIs/python

Utilización del modulo

Para ejecutar el programa, con el entorno virtual activado y desde la carpeta raiz del modulo ejecutar:

python pgrado.py

Una vez dentro del programa se presenta un texto de ayuda y se habilita el input del usuario. El comando principal es clasificar. Una vez ingresado ese comando, sin argumentos, se habilita el input para ingresar texto a clasificar. El mismo conviene copiarlo directamente, ya que la interfaz no permite navegar con el cursor hacia atrás. Para comenzar con la clasificación luego de ingresar el texto es necesario agregar una nueva línea con el caracter # y enter. Esto le indica el final del input al programa. Luego, se imprime el listado de clausulas extraídas con el verbo principal identificado y la predicción del clasificador seleccionado.

Es posible cambiar el clasificador a utilizar con el comando clasificador <nombre_clasificador> donde <nombre_clasificador> es uno de los ofrecidos en la lista que se muestra al inicial el programa o al utilizar el comando help.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
ancora		ancora
anotadas		anotadas
anotadas_8		anotadas_8
clasificador_interactivo		clasificador_interactivo
classification_errors		classification_errors
clatex_clauses		clatex_clauses
corin		corin
corpora		corpora
elliphant		elliphant
ev		ev
evaluation		evaluation
features		features
metrics		metrics
pro_trainer_elliphant		pro_trainer_elliphant
results		results
textos_corin		textos_corin
utils		utils
verb_lists		verb_lists
.gitignore		.gitignore
README.md		README.md
get_features_errors.py		get_features_errors.py
get_features_results.py		get_features_results.py
pro_trainer.py		pro_trainer.py
pro_trainer_all.py		pro_trainer_all.py
pro_trainer_all_lemma_vector.json		pro_trainer_all_lemma_vector.json
pro_trainer_all_result.json		pro_trainer_all_result.json
pro_trainer_all_result_ancora.json		pro_trainer_all_result_ancora.json
pro_trainer_all_result_ancora_new_clauses.json		pro_trainer_all_result_ancora_new_clauses.json
pro_trainer_all_result_ancora_no_embeddings.json		pro_trainer_all_result_ancora_no_embeddings.json
pro_trainer_all_result_corin.json		pro_trainer_all_result_corin.json
pro_trainer_all_result_corin_new_clauses.json		pro_trainer_all_result_corin_new_clauses.json
pro_trainer_all_result_elliphant.json		pro_trainer_all_result_elliphant.json
pro_trainer_all_result_elliphant_no_embeddings.json		pro_trainer_all_result_elliphant_no_embeddings.json
requirements.txt		requirements.txt
run_trainer.sh		run_trainer.sh
voting_trainer.py		voting_trainer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Detección de sujetos omitidos en el español

About

Releases

Packages

Languages

lulitados/pgrado

Folders and files

Latest commit

History

Repository files navigation

Detección de sujetos omitidos en el español

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages