Dr. Luis Quereda Rodríguez-Navarro (Investigador Responsable)
Proyecto
U.D.I.L.I.O. (Creación de una "Unidad para el Desarrollo de
Investigaciones sobre la Lengua Inglesa a través de Ordenador)
U.D.I.L.I.O.
está concebida como una unidad que promueve investigaciones lingüísticas
aprovechando las grandes posibilidades que la informática ofrece hoy en
día tanto en su aspecto de tratamiento de textos como de bases de
datos. En la actualidad existe un creciente interés en todos los
departamentos de lenguas del mundo por todos los aspectos relacionados
con el tratamiento informático de textos. Está claro que ésta es una
línea de investigación floreciente y de grandes perspectivas, por lo
que cada vez va a ser más necesario disponer de este tipo de material,
si se quiere hacer una investigación operativa y fiable.
Esta unidad tiene dos funciones claramente delimitadas, aunque
evidentemente interrelacionadas. Una primera, la de ALMACENAMIENTO de
corpus lingüísticos y bancos de datos y una segunda la de CREACIÓN de
nuestros propios corpus. La primera nos posibilita el acceso a una
fuente riquísima de información tanto sobre el funcionamiento de la
lengua como de las necesidades concretas para su aprendizaje y enseñanza,
información imprescindible para cualquier trabajo de investigación. La
segunda nos da la posibilidad de crear nuestros propios corpus y
material didáctico, que evidentemente estarán más centrados en
nuestras necesidades específicas.
Para
el desarrollo del proyecto debemos distinguir cuatro apartados
distintos:
(a)
Diseño de corpus lingüísticos: a desarrollar en tres fases:
i.
El
desarrollo del corpus (selección de material: tipos de textos (medio:
lengua hablada, lengua escrita, registro: lenguaje académico, periodístico,
legal, etc., y longitud y variedad de los textos).
ii.
El
procesamiento de los textos: inicialmente con lectores ópticos y luego
con corrección manual, aunque se hará uso de los programas de corrección
automática actualmente en el mercado.
iii.
Clasificación y preparación de los textos para su análisis:
mediante el aprovechamiento de bancos de datos actualmente en el mercado
y el diseño de nuestros propios recursos ajustados a nuestras
necesidades, para que del material se pueda elicitar toda clase de concordances,
análisis de frecuencias de vocabulario y estructuras, reconocimiento de
collocations, estudios estadísticos (a través de programas de
concordancias como el COCOA: Berry-Rogghe, 1973; CLOC: Reed &
Schonfelder, 1979; OCP: Hockey & Marrito, 1979, 1980; WORDCRUNCHER;
CLAN; TACT, etc.), introducción de claves gramaticales para analizar
las estructuras de los textos (The LOB corpus gramatical tagging /
the LOB tagging suite: I. Marshall, 1983 o el TAGGIT:
B.B. Greene & G.M. Rubin, 1971 – Automatic gramatical tagging
of English, Brown University, Providence, RI.), etc.
(b)
Elaboración de materiales a través de información
informatizada: Dependiendo de las necesidades específicas que resulten y
teniendo como base los corpus creados, se procederá a la elaboración,
experimentación y en su caso publicación de materiales didácticos
adecuados a los perfiles establecidos.
(c) Medios necesarios:
i. Recursos materiales:
a.
Adquisición
de nuevos corpus lingüísticos.
b.
Adquisición
de nuevos programas de elicitación de textos.
C.
Adquisición de licencias para el uso de los distintos corpus y
bases de datos en el mercado.
D.
Infraestructura informática.
E.
Lector óptico.
F. Programas
de corrección del material procesado.
G. Programas
de procesos de datos (rank-order & alphabetical order word
frequency lists, concordances, citation files, computer recognition of
collocations, computation of statistical results, tagging corpora).
ii. Recursos humanos:
A. Programadores.
B. Becarios de investigación.
C. Operadores para introducción
y corrección de datos manualmente.
(d) Publicación
de resultados y material producido.
Hasta la fecha la unidad ha funcionado
primordialmente en su primera faceta y se han elaborado diversos
trabajos basados en los materiales lingüísticos disponibles. La Tesis
Doctoral de Juan Santana Lario, "La categoría gramatical de
pronombre: criterios de definición y problemas de clasificación",
ya mencionada en el apartado anterior; los artículos del que soy autor
"Algunas consideraciones teóricas sobre el subjuntivo inglés"
y "el uso del subjuntivo inglés en el Brown Corpus: estudio
sobre su frecuencia y comparación con otras estructuras
paralelas"; las ponencias "El género en inglés moderno:
componentes objetivos y subjetivos" (Juan Santana), "Algunas
consideraciones sobre las formas whom y whose en inglés
moderno a partir de su distribución en el Brown Corpus y en el L.O.B.
Corpus" (Juan Santana); la Memoria de Licenciatura y la Tesis
Doctoral de D. Salvador Valera Hernández sobre "La homomorfia en
adjetivos y adverbios del inglés", dirigida por el Dr. Alfonso
Rizo Rodríguez y basada en gran parte en materiales disponibles en la
Unidad.