Generation of Feature Vectors for Identifying Medical Entities in Spanish
DOI:
https://doi.org/10.13053/cys-29-3-5002Palabras clave:
Information Extraction, Named Entity Recognition, Natural Language ProcessingResumen
Natural Language Processing (NLP) encompasses a range of high impact techniques for enabling computers to interact with humans in a more natural manner. One such technique is the extraction of entities, which allows computers to identify relevant information within a text. This paper presents a methodology for the recognition of medical entities within a texts written in Spanish. The methodology combines syntactic, semantic, and contextual features at the word level. The principal objective of a feature-based approach is the identification of drug, anatomy, and disease entities. A training evaluation was conducted on two types of machine learning algorithms, with an accuracy of 98\% on an external set. Additionally, an accuracy check was performed for each medical class.Descargas
Publicado
Número
Sección
Licencia
Transfiero exclusivamente a la revista “Computación y Sistemas”, editada por el Centro de Investigación en Computación (CIC), los Derechos de Autor del artículo antes mencionado, asimismo acepto que no serán transferidos a ninguna otra publicación, en cualquier formato, idioma, medio existente (incluyendo los electrónicos y multimedios) o por desarrollar.
Certifico que el artículo, no ha sido divulgado previamente o sometido simultáneamente a otra publicación y que no contiene materiales cuya publicación violaría los Derechos de Autor u otros derechos de propiedad de cualquier persona, empresa o institución. Certifico además que tengo autorización de la institución o empresa donde trabajo o estudio para publicar este Trabajo.
El autor, representante acepta la responsabilidad por la publicación del Trabajo en nombre de todos y cada uno de los autores.
Esta Transferencia está sujeta a las siguientes reservas:
- Los autores conservan todos los derechos de propiedad (tales como derechos de patente) de este Trabajo, con excepción de los derechos de publicación transferidos al CIC, mediante este documento.
- Los autores conservan el derecho de publicar el Trabajo total o parcialmente en cualquier libro del que ellos sean autores o editores y hacer uso personal de este trabajo en conferencias, cursos, páginas web personal, etc.