| Programa general, fitxa d'activitat
|
|
| |
|
|
|
Dimecres 27 d'abril de 2016 12:00 a 12:30 |
|
Comunicación |
Extracción y selección de términos en el ámbito de la bioquímica Exposa: Françoise Olmo Cazevieille, Universitat Politènica de València Exposa: Coral López Mateo, Universitat Politècnica de València
Term extraction and selection in the domain of Biochemistry
After compiling texts for developing a corpus, the next stages can be very complicated as well as being decisive and includes the tasks of converting the texts into the appropriate files for the extraction programs, the candidate term extractions themselves and their validation for further linguistics studies.
This article describes, firstly, the candidate term extraction process from German texts in the field of biochemistry and the resolution of any problems that arose. The particular morphology and syntax of the German language makes the extraction difficult. On this occasion, the program chosen for the extraction is Wordsmith Tools. It is well known that this kind of extraction programs produce a lot of noise and silence (Estopà, Cabré & Vivaldi, 1998) that has to be resolved effectively in order to obtain the most suitable list of terms as regards its size and specialized semantic relevance. Secondly, criteria for the selection of terms are stated, as well as the execution itself of the choice or the elimination of specialized term candidates, to identify the most important ones and included in the previously established conceptual structure (López & Olmo, 2015). Lastly, the final list of the selected terms is shown for their linguistic description.
References:
Estopà, R., Cabré Castellví, M. T., & Vivaldi, J. (1998). Sistemes d'extracció automàtica de (candidats a) termes: estat de la qüestió. http://hdl.handle.net/10230/4513
López, C. & Olmo, F. (2015). Compiling Texts for a Specialized Corpus in the Biochemistry Domain: Theoretical and Methodological Aspects. Procedia-Social and Behavioral Sciences, 198, 300-308.
Extracción y selección de términos en el ámbito de la bioquímica
A la etapa de recopilación de textos para la elaboración de un corpus, le siguen otras etapas complicadas y decisivas como son la conversión de textos a formatos compatibles con los programas de extracción, la extracción misma y la validación de candidatos a términos para su posterior estudio lingüístico.
El presente artículo describe, en primer lugar, el proceso de extracción de candidatos a términos de textos alemanes del ámbito de la bioquímica y la resolución de los problemas surgidos. La particular morfología y sintaxis de la lengua alemana dificulta la extracción. En esta ocasión, se opta para la extracción de términos por el programa de concordancias Wordsmith Tools. Es bien conocido que los programas de extracción producen mucho ruido y a la vez silencios (Estopà, Cabré & Vivaldi, 1998) que se han de resolver de manera efectiva con el fin de obtener una lista de términos más idónea en cuanto a su tamaño y relevancia semántica especializada. En segundo lugar, se exponen los criterios fijados para la selección de los términos, así como la consecución misma de la elección o el descarte de los candidatos con el fin de identificar los que sean más relevantes y estén incluidos en el árbol de campo preestablecido con anterioridad (López & Olmo, 2015). Finalmente, se presenta el listado definitivo de términos seleccionados para su posterior descripción lingüística.
Referencias:
Estopà, R., Cabré Castellví, M. T., & Vivaldi, J. (1998). Sistemes d'extracció automàtica de (candidats a) termes: estat de la qüestió. http://hdl.handle.net/10230/4513
López, C & Olmo, F. (2015). Compiling Texts for a Specialized Corpus in the Biochemistry Domain: Theoretical and Methodological Aspects. Procedia-Social and Behavioral Sciences, 198, 300-308.
Més informació: Topic 3 Investigació: el procés i el producte en la traducció especialitzada
|