1. Introducción
El Proyecto Panhispánico de Disponibilidad Léxica (PPHDL) tiene como objetivo la recogida y la descripción del léxico disponible de los hispanohablantes. Cuenta entre sus logros con varios trabajos nacionales e internacionales, cuyos datos debemos tener en cuenta para poder realizar la programación de la enseñanza de la lengua. La utilidad de este tipo de estudios permitirá conocer el conjunto de unidades léxicas que un aprendiente debe estudiar para manejarse con soltura en esta lengua, sea materna o extranjera.
Los estudios de disponibilidad léxica tienen como objetivo principal recopilar el léxico disponible de una comunidad de habla. Su análisis permite determinar el conjunto de unidades léxicas que los hablantes tienen en su lexicón mental y cuyo uso está condicionado por un tema determinado (López Morales, 1983, p. 213, 1995, p. 245; Ortolano Ríos, 2005, p. 847; Bartol Hernández, 2006, p. 379; Vega Castro, 2006, p. 175).
En otro orden de cosas, lo que se pretende obtener son aquellas palabras más usuales que están comúnmente disponibles para ser utilizadas bajo el influjo de estímulos léxicos denominados centros de interés o áreas nocionales (López Morales, 1986, 1999; Samper Hernández, 2002; Bartol Hernández, 2004; Saralegui & Tabernero, 2008).
Estas unidades léxicas actualizadas por los informantes se obtienen a partir de la aplicación de un test asociativo de disponibilidad léxica, ya que estas pruebas pueden ser muy útiles para trabajos de índole comparativa porque cada prueba de disponibilidad léxica de los encuestados puede ser cotejada con las de otros informantes que hayan participado en la misma encuesta. También, destaca la codificación de los datos de sujetos entrevistados y la aplicación de las normas de edición de los materiales obtenidos (Samper Padilla, 1998).
Las aplicaciones de los métodos lexicoestadísticos han dado lugar a muchísimos estudios en el ámbito panhispánico, tanto en España como en Hispanoamérica, pero a partir del año 2000 algunos investigadores han aplicado la metodología de estos trabajos a informantes extranjeros de español como lengua extranjera fuera de España: Finlandia (Carcedo González, 2000), Alemania (Medina Arejita, 2009), Eslovenia (Sifrar Kalan, 2009), Polonia (López González, 2010), Islandia (Magnúsdóttir, 2012), Marruecos (Serfati & Aabidi, 2013), Turquía (González Fernández, 2013), Rumanía (Sandu, 2014), China (Hidalgo Gallardo, 2018), Taiwán (Rubio Lastra, 2018), Corea del Sur (Mendoza Puertas, 2018), entre otros.
En España se han dedicado varios estudios a estudiantes extranjeros de español como lengua extranjera (Samper Hernández, 2002; Sánchez Gómez, 2005; López Rivero, 2008; Pérez Serrano, 2009; Gallego Gallego, 2014; Sánchez-Saus Laserna, 2016). También en Hispanoamérica, destacan algunos trabajos de disponibilidad léxica en español como lengua extranjera como los de Benavides Segura, Herrera Morera y Saborío Pérez (2011), Cuba, Ester y Cabrera Domecq (2013), Fernández Leyva (2013), Fuentes (2014), Galdames Jiménez, Guerrero González y Toledo Vega (2018), entre otros, que se fijan los mismos objetivos basándose, claro está, en los presupuestos metodológicos del PPHDL.
Con este estudio comparativo y descriptivo de disponibilidad léxica (basado en investigaciones previas [Serfati, 2016; Aabidi, 2020]) en aprendices marroquíes de español como lengua extranjera, queremos seguir esta línea de investigación aplicada a la enseñanza/aprendizaje del léxico español. Los objetivos del presente trabajo son los siguientes: (1) conocer la disponibilidad léxica de los aprendientes marroquíes de español como lengua extranjera mediante la aplicación de la metodología lexicoestadística; (2) comparar cuantitativamente la disponibilidad léxica en diecisiete centros de interés de dos grupos diferentes de español como lengua extranjera: 350 alumnos de secundaria (niveles A1, A2 y B1) y 350 estudiantes de universidad (niveles aproximados B1+, B2 y B2+).
De esta manera, nos proponemos comprobar la validez de las siguientes hipótesis:
la disponibilidad léxica de los alumnos de secundaria es inferior a la de los estudiantes universitarios;
en ambos grupos, algunos centros de interés provocan un mayor número de unidades léxicas; mientras que, en otros, menor cantidad de palabras;
los estudiantes universitarios producen asociaciones más estrechamente conectadas con el tema de los centros de interés que los alumnos de secundaria;
los campos nocionales que podrían alcanzar la mayor productividad serían 10 La ciudad, 06 Objetos colocados en la mesa para la comida y 14 Los animales.
2. Metodología
2.1. La muestra
La muestra analizada en este trabajo de disponibilidad léxica fue de un total de 700 informantes (350 alumnos de secundaria y 350 estudiantes de universidad). En cada grupo se encuentra igual número de participantes que se aproxima al tamaño de las muestras (400 sujetos) acordado por los investigadores en disponibilidad léxica en la reunión de Bilbao (1999). Los escolares de secundaria pertenecen, en el momento de la realización de las encuestas, a los 16 institutos de enseñanza media marroquí en tres Academias Regionales de Educación y Formación de las regiones sureñas del país: Sus-Massa, El Aiún Saquea el Hamra y Dahkla Oued Eddahab, con edades comprendidas entre los 15 y los 18 años. En cambio, en la enseñanza superior, los estudiantes pertenecen a las distintas áreas geográficas que cubre la Universidad Ibn Zohr de Agadir, con edades comprendidas entre los 18 y los 24 años.
En la muestra, objeto de este análisis, los encuestados de secundaria son adolescentes de español como lengua extranjera que corresponden, aproximadamente, a los niveles de referencia A1 (90 alumnos), A2 (120) y B1 (140) establecidos en el Plan curricular del Instituto Cervantes (Instituto Cervantes, 2006). Por el contrario, los universitarios son estudiantes en los tres cursos de formación universitaria (estudios de licenciatura): Curso 1 (142 informantes), Curso 2 (96) y Curso 3 (112). Los encuestados de secundaria representan casi el 9% del total de alumnos que estudian español como lengua extranjera, mientras que los universitarios constituyen un 70.28%. A continuación, vamos a destacar en la Tabla 1 las características más relevantes que hacen diferentes los dos trabajos.
Características | Secundaria | Universidad |
---|---|---|
Informantes | 350 | 350 |
Centros de interés | 17 | 17 |
Variables analizadas |
Sexo (masculino: 156; femenino: 194) Lengua materna (árabe: 236; bereber: 114) Zona geográfica (excolonia francesa: 125; excolonia española: 225) Nivel educativo (Tronco común (A1): 90; 1.° Bachillerato (A2): 140; 2.° Bachillerato (B1): 140 ) Nivel sociocultural (bajo: 188; medio bajo: 140; medio: 17; medio alto: 5) |
Sexo (masculino: 131; femenino: 219) Lengua materna (árabe: 143; tamazight: 207) Curso académico ( Curso 1: 142; Curso 2: 96; Curso 3: 112) Nivel sociocultural (bajo: 244; medio bajo: 82; medio alto: 15; alto: 9) Conocimiento de otra(s) lengua(s) (francés: 246; inglés: 92; alemán: 7 ; italiano 5) |
Tiempo para rellenar la encuesta | 2 minutos | 2 minutos |
Porcentaje de informantes del total de alumnos que estudian español como lengua extranjera | 9% | 70.28% |
Como es bien sabido, el PPHDL analiza factores sociolingüísticos como el sexo, el centro escolar (si es público o privado), la zona geográfica (si es urbana o rural) y el nivel sociocultural. Algunos investigadores como Gómez Devís (2004), Ayora Esteban (2006), Martínez Olmos (2007), Sánchez-Saus Laserna (2016), Fernández Smith, Rico Martín, Molina García y Jiménez Jiménez (2008), entre otros, afirman que las encuestas realizadas en comunidades bilingües recogen, entre otras variables, la lengua materna de los sujetos encuestados. En este sentido, en nuestro trabajo de español como lengua extranjera sí hemos estudiado la lengua materna de nuestros informantes. Además, se analizan otras variables diferentes adaptadas a la población estudiada como el nivel de estudios y el conocimiento de otra(s) lengua(s). En ambos grupos, los encuestados no han sido sometidos a una estratificación predeterminada por la desigualdad en el número de sujetos que componen nuestro corpus.
2.2. La encuesta
La estructura de la prueba asociativa es similar a la que se han empleado para los estudios de disponibilidad léxica, si bien, es cierto, hemos introducido unos cambios con el objeto de adaptarla lo máximo posible a las características de nuestra muestra. El cuestionario que se entregó a cada alumno está compuesto por dos partes muy diferenciadas. La primera parte debía ser rellenada por el informante con sus datos personales, profesionales y académicos. Todo ello nos proporciona información relevante para la posterior estratificación de las variables. La segunda parte sigue el modelo panhispánico, que consta de diecisiete centros de interés. Se mantienen las columnas con la cabecera y unas líneas numeradas por folio para que cada encuestado redacte sus respuestas en un límite temporal de dos minutos por centro de interés.
Tal decisión está de acuerdo con lo recomendado por la profesora Samper Hernández (2002): «la organización en columnas con líneas enumeradas posibilita que se pueda tener en cuenta la posición de la palabra dentro del número total de respuestas de cada encuesta» (p. 21). Además, estas encuestas o pruebas asociativas son abiertas y cuentan con una serie de vocablos asociados a un ámbito temático sin importar la cantidad de palabras actualizadas (López Morales, 1999; Ortolano Ríos, 2005).
Por otra parte, en el momento de la realización de la prueba, al ser nosotros los responsables del grupo de encuestados, fuimos los encargados de otorgarles las instrucciones necesarias para llevarla a cabo correctamente. Para ello, seguimos las directrices recomendadas por López Morales (1999):
los informantes deben completar cada centro de interés en un tiempo máximo de dos minutos;
no dejar de escribir una palabra por el hecho de dudar de su corrección ortográfica;
las pruebas incompletas en el momento de realización de las encuestas deben invalidarse y eliminarse del corpus recogido (p. 39).
2.3. Los centros de interés
El léxico disponible de los informantes marroquíes de enseñanza media y universitaria empezó a recogerse a partir de unos centros de interés que actuaban como estímulos verbales que (aunque modificados en otros estudios en función de las características propias de la comunidad estudiada) se siguen utilizando, hoy en día, en todos los trabajos que forman parte del magno PPHDL.
De este modo, los diecisiete centros de interés habitualmente más empleados en los estudios de disponibilidad léxica son los siguientes: 01 Partes del cuerpo, 02 La ropa, 03 Partes de la casa (sin los muebles), 04 Los muebles de la casa, 05 Alimentos y bebidas, 06 Objetos colocados en la mesa para la comida, 07 La cocina y sus utensilios, 08 La escuela: muebles y materiales, 09 Iluminación, calefacción y medios de airear un recinto, 10 La ciudad, 11 El campo, 12 Medios de transporte, 13 Trabajos del campo y del jardín, 14 Los animales, 15 Juegos y distracciones, 16 Profesiones y oficios y 17 Los colores. Se ha añadido este último ámbito temático con fines investigativos concretos, sobre todo en muestras de español como lengua extranjera (Serfati & Aabidi, 2013; Sandu, 2014; Serfati, 2015, 2016, 2017a, 2017b, 2017c, 2018, 2019a, 2019b; Aabidi, 2020).
Estos ámbitos temáticos nos dan la posibilidad de realizar no solo análisis cuantitativos, sino también estudios de índole cualitativa, ya que podemos saber qué unidades léxicas son actualizadas por nuestros informantes cuando están expuestos a determinados temas concretos en un tiempo límite de dos minutos.
2.4. La edición de los datos
Para la edición de los materiales obtenidos en nuestro trabajo y su volcado en el programa LexiDisp, se han seguido las directrices presentadas en las reuniones de Bilbao1 y de San Millán de la Cogolla2 con el objetivo de realizar futuras comparaciones con otros estudios. Se han puesto pautas comunes para la limpieza de los listados de acuerdo a las normas del PPHDL señaladas en Samper Padilla (1998), tales como las siguientes:
la eliminación de los términos repetidos dentro de un mismo centro de interés;
la corrección ortográfica de ciertos errores debido a las deficiencias en el aprendizaje;
la unificación ortográfica: es decir, se unen bajo una sola entrada las palabras que admiten dos grafías, manteniendo la que aparece básicamente en el diccionario académico (Real Academia Española, 2014);
la neutralización de variantes meramente flexivas: los verbos se recogen en infinitivo, los adjetivos y los sustantivos en singular masculino, con la excepción de los heterónimos o de aquellos nombres cuyo femenino se caracteriza por tener un sufijo específico;
la unificación de los derivados que no suponen alteración del significado: las formas no marcadas del diminutivo y del aumentativo se reducen a la forma regular;
la unificación de formas plenas y acortamientos: las palabras susceptibles de ser acortadas se homogeneizan bajo una sola entrada;
el mantenimiento de las marcas comerciales lexicalizadas: se admiten solo aquellas marcas lexicalizadas en el uso corriente de la lengua.
Esta etapa de investigación ha sido laboriosa y compleja, pues en ella se manifiesta la interferencia de la lengua materna. Samper Hernández (2002) la define como la limpieza de los materiales, porque implica percibir los problemas como la unificación de las distintas variables léxicas y sus asociaciones, el tratamiento de los extranjerismos, etc. (p. 22). La decisión del investigador puede ser decisiva y requiere mucho cuidado. Por todo ello, hemos seguido las pautas del profesor Samper Padilla (1998), con las precisiones que nos exigía el vocabulario recogido. Este trabajo sirve de ayuda a los investigadores que se enfrentan a las mismas decisiones a la hora de editar el léxico disponible.
3. Resultados generales
En este trabajo comparativo pretendemos describir e interpretar los índices cuantitativos generales que resultaron de las pruebas asociativas tomadas en las instituciones educativas públicas de enseñanza media y universitaria. Para ello, se han tenido en consideración los valores cuantitativos siguientes: las palabras totales (PT), el promedio de palabras (PI), las palabras diferentes (PD) y el índice de cohesión (IC).
3.1. Producción de palabras
El número de palabras totales es uno de los cuatro índices primordiales de los estudios de disponibilidad léxica. Es un dato dependiente del tamaño muestral, es decir, el número de palabras recogido varía en función del número de informantes seleccionados. Esto es un dato que engloba todas las respuestas actualizadas por los encuestados e incluso aquellas que están repetidas. En la Tabla 2, la cantidad de palabras aportadas por los alumnos de secundaria es sistemáticamente inferior a la obtenida en la investigación con estudiantes universitarios.
C.I.3 | Secundaria | PI | Rango4 | Universidad | PI | Rango |
---|---|---|---|---|---|---|
01 | 2 711 | 7.75 | 5 | 4 001 | 11.43 | 2 |
02 | 1 756 | 5.02 | 13 | 2 318 | 6.62 | 13 |
03 | 2 319 | 6.63 | 7 | 2 853 | 8.15 | 9 |
04 | 2 547 | 7.28 | 6 | 2 565 | 7.32 | 11 |
05 | 3 191 | 9.12 | 3 | 3 234 | 9.24 | 6 |
06 | 1 366 | 3.91 | 17 | 1 883 | 5.38 | 16 |
07 | 2 014 | 5.75 | 12 | 2 112 | 6.03 | 15 |
08 | 3 490 | 9.97 | 1 | 3 462 | 9.88 | 5 |
09 | 1 640 | 4.69 | 15 | 1 695 | 4.84 | 17 |
10 | 3 428 | 9.79 | 2 | 3 909 | 11.16 | 3 |
11 | 2 081 | 5.95 | 11 | 3 045 | 8.7 | 7 |
12 | 2 308 | 6.59 | 9 | 2 626 | 7.50 | 10 |
13 | 1 589 | 4.54 | 16 | 2 116 | 6.04 | 14 |
14 | 1 739 | 4.97 | 14 | 3 635 | 10.38 | 4 |
15 | 2 319 | 6.63 | 7 | 2 392 | 6.83 | 12 |
16 | 2 882 | 8.23 | 4 | 4 508 | 12.88 | 1 |
17 | 2 082 | 5.95 | 10 | 2 999 | 8.56 | 8 |
Total | 39 462 | - | - | 49 353 | - | - |
Como puede apreciarse en la Tabla 2, hay una diferencia en la cantidad de palabras totales producidas por los informantes. Los alumnos de secundaria emitieron 39 462 palabras, mientras que el grupo de universitarios escribió 49 353 palabras. El promedio de palabras indica que la cantidad de respuestas por cada alumno de secundaria es de 112.75 y 2 321.35 unidades léxicas por área asociativa, mientras que en los universitarios el promedio es de 141.00 respuestas por informante y 2 903.11 por centro de interés. La media de unidades léxicas por informante en el conjunto de la muestra comparativa es de 56.37 en secundaria, mientras que en el grupo de universitarios llega a alcanzar un 70.50. En la comparación de los diecisiete centros de interés, los alumnos de secundaria poseen menor cantidad de palabras que los estudiantes universitarios, es decir, los informantes de secundaria manifiestan una productividad léxica menor en cada uno de los centros de interés cotejados, excepto en 08 La escuela: muebles y materiales.
En la Figura 1 puede observarse claramente que los estudiantes universitarios escribieron más palabras en cada centro de interés. El campo asociativo 16 Profesiones y oficios obtuvo la mayor cantidad de palabras, pues cuenta con un total de 4 508 palabras (9.13%), seguido muy de cerca por 10 La ciudad, con 3 428 palabras (8.69%), y por 05 Alimentos y bebidas, con 3 191 palabras (8.15%). Por el contrario, los ámbitos temáticos que cuentan con una diversidad menor en el número de respuestas son 09 Iluminación, calefacción y medios de airear un recinto, con un total de 1 695 (3.43%), 06 Objetos colocados en la mesa para la comida, con 1 883 (3.82%) y 07 La cocina y sus utensilios, con 2 112 (4.28%).
Respecto a los alumnos de Secundaria, los números de palabras sí cambian mucho, desde 3 409 palabras (8.64%), que contiene el centro más productivo (08 La escuela: muebles y materiales), seguido muy de cerca por 01 Partes del cuerpo, con 4 001 palabras (8.11%), y por 10 La ciudad, con 3 909 palabras (7.92%). En cuanto a los centros de interés que cuentan con un menor número de palabras, cabe mencionar 06 Objetos colocados en la mesa para la comida, con 1 366 palabras (3.46%); en segundo lugar, 13 Trabajos del campo y del jardín, con un total de 1 589 palabras (4.03%), y, en tercer lugar, 09 Iluminación, calefacción y medios de airear un recinto, con 1 640 (4.16%). Esto podría indicar que los estudiantes de universidad tienen mayor cantidad de palabras en su repertorio léxico en la mayoría de los ámbitos temáticos cotejados.
Asimismo, cabe señalar que en el centro 01 Partes del cuerpo se muestra una notable diferencia en la cantidad de palabras de ambos grupos a favor de los universitarios (1 290). Para esto, la explicación se da en el estudio de Samper Hernández (2003), cuando subraya que «el cuerpo humano es uno de los campos que tiene más estrecha relación con el aprendizaje escolar, ya que las listas de disponibilidad favorecen un vocabulario técnico y formal. Todo ello hace que sea uno de los ámbitos nocionales que ofrece menos dificultades»5 (p. 203). La misma concepción se encuentra en Samper Padilla, Bellón Fernández y Samper Hernández (2003): «En la alta cohesión del campo “Partes del cuerpo” puede influir la enseñanza escolar, pues muchos de los términos aportados por los informantes se requieren en las aulas ya que forman parte de los currículos educativos» (p. 108).
También, en el centro 14 Los animales se da una diferencia mayor entre aprendices de secundaria y universidad (1 896), ya que, para los primeros, ocupa el decimocuarto lugar y, para los segundos, el cuarto. El centro de interés 16 Profesiones y oficios ocupa el rango 4 para los alumnos de secundaria y 1 para los estudiantes de universidad; mientras que el centro 08 La escuela: muebles y materiales ocupa el rango 1 en los informantes de secundaria y el rango 5 en los universitarios.
En lo referente al promedio de respuestas (Figura 2), este valor es el resultado de la media de productividad léxica, es decir, se obtiene al dividir el número total de palabras entre el número de informantes. En este caso, el valor más alto en los universitarios aparece en el centro referido a 16 Profesiones y oficios, pues cuenta con 12.88 palabras por informante. Han obtenido valores muy próximos a este los centros de interés 01 Partes del cuerpo, con 11.34, y 10 La ciudad, con 11.16 palabras por informante. Por el contrario, los centros de interés con menos palabras por informante son, en primer lugar, 09 Iluminación, calefacción y medios de airear un recinto con 4.84 palabras, seguido por 06 Objetos colocados en la mesa para la comida con 5.38 palabras por informante y, por último, 07 La cocina y sus utensilios con 6.03 palabras.
Respecto a los alumnos de secundaria, el centro de interés 08 La escuela: muebles y materiales es el más productivo, ya que cuenta con 9.97 palabras por informante, seguido por el 10 La ciudad, con 9.79 palabras, y por el 05 Alimentos y bebidas, con 9.12 palabras por informante. Por el contrario, los centros de interés que cuentan con menos palabras por informante son el 06 Objetos colocados en la mesa para la comida, con 3.91 palabras por informante, el 13 Trabajos del campo y del jardín, con 4.54 palabras, y el 09 Iluminación, calefacción y medios de airear un recinto, con 4.69 palabras por informante.
3.2. Producción de vocablos
Presentamos la competencia léxica de nuestros informantes a través de otro índice cuantitativo: el número de vocablos. Según Gómez Molina (1997), la competencia léxica incluye el proceso de adquisición, aprendizaje y dominio léxico. Esta competencia se refiere a los conocimientos y destrezas, a la organización cognitiva y la forma en que se almacenan estos conocimientos en el lexicón, y a su accesibilidad (p. 71). Para Marconi (2000), la competencia léxica es una familia de destrezas complejas que no se limita a conocer el significado de una palabra. De esta forma, podemos diferenciar dos elementos importantes: por una parte, la capacidad del individuo para almacenar palabras y, por otra, las habilidades para producirlas.
El número total de unidades diferentes que presenta la muestra que nos corresponde se eleva a 4 316 en los alumnos de secundaria, lo que se traduce en una media de 12.33 por informante y de 253.8 por centro de interés. En cambio, encontramos 3 742 vocablos en los universitarios, lo que se traduce en una media de 10.69 por informante y de 220.11 por centro de interés. Además, no existe una proporción entre los totales de palabras y vocablos recogidos para cada uno de los centros de interés.
En la Tabla 3 y la Figura 3 se representan las diferencias entre ambas muestras en relación con la cantidad de vocablos por centro de interés. De manera general, se puede observar que el centro 10 La ciudad es el que mayor riqueza léxica ofrece, con 500 vocablos en el caso de los alumnos de secundaria (11.58%), seguido por el 11 El campo, con 437 vocablos (10.13%) y por el 08 La escuela: muebles y materiales, con un total de 364 vocablos (8.43%). En cuanto a los centros de interés que presentan una menor diversidad léxica, destacan 17 Los colores con 62 vocablos (1.44%) y, en segundo lugar, 06 Objetos colocados en la mesa para la comida con 112 vocablos (2.59%), seguido muy de cerca por 02 La ropa con 180 vocablos (4.17%).
C.I. | Secundaria | Rango | Universidad | Rango |
---|---|---|---|---|
01 | 240 | 8 | 136 | 11 |
02 | 142 | 15 | 129 | 14 |
03 | 180 | 14 | 126 | 15 |
04 | 228 | 9 | 180 | 10 |
05 | 249 | 7 | 256 | 6 |
06 | 112 | 16 | 134 | 12 |
07 | 225 | 10 | 230 | 8 |
08 | 364 | 3 | 255 | 7 |
09 | 194 | 13 | 133 | 13 |
10 | 500 | 1 | 409 | 3 |
11 | 437 | 2 | 422 | 1 |
12 | 219 | 11 | 95 | 16 |
13 | 318 | 5 | 265 | 5 |
14 | 214 | 12 | 190 | 9 |
15 | 285 | 6 | 276 | 4 |
16 | 347 | 4 | 418 | 2 |
17 | 62 | 17 | 88 | 17 |
Total | 4 316 | - | 3 742 | - |
En lo tocante a los universitarios, el centro de interés con mayor número de vocablos es el 11 El campo, pues lo integran 422 vocablos (11.28%), seguido, con una diferencia de cuatro vocablos, por 16 Profesiones y oficios, con 418 (11.17%) y, en tercer lugar, aparece el centro de interés 10 La ciudad con 409 vocablos (10.93%). Estos son los mismos centros de interés más productivos en aprendientes de español como lengua extranjera (Carcedo González, 2000; Samper Hernández, 2002; Sandu, 2014). Respecto de los centros de interés que presentan una variabilidad menor, tenemos, en primer lugar, 17 Los colores con 88 vocablos (2.35%), seguido por 12 Medios de transporte con 95 vocablos (2.54%) y por 03 Partes de la casa (sin los muebles) con 126 vocablos (3.37%). En el resto de los centros, las cifras entre ambos subconjuntos de contraste no son considerablemente distintas (véanse los centros de interés 05 Alimentos y bebidas, 07 La cocina y sus utensilios, 15 Juegos y distracciones, entre otros), aunque sí debemos resaltar que la mayor riqueza léxica se observa en los alumnos de secundaria.
Estos resultados nos llevan a confirmar la idea reiterada en otros estudios de que la mayor o menor riqueza de vocablos no necesariamente se corresponde con la productividad de las unidades léxicas en las diferentes áreas temáticas; es decir, que tal y como expresa Gómez Devís (2004), «no se cumple la máxima: a mayor número de respuestas, mayor número de palabras diferentes» (p. 112). Por lo tanto, no son los universitarios quienes muestran una mayor riqueza léxica, pues el número de vocablos que aportan los alumnos de secundaria (4 316) es superior al de los universitarios (3 742).
A continuación, consideramos la lista de los centros más productivos en número de vocablos (Tabla 4) y exponemos las áreas temáticas que ocupan los cinco primeros puestos en las investigaciones de léxico disponible en español como lengua extranjera para descubrir qué similitudes y divergencias de rango se encuentran.
Rango | Finlandia | Marruecos | ||
---|---|---|---|---|
Preuniversitarios (150) (Carcedo González, 2000) | Universitarios (50) (Carcedo González, 2000) | Secundaria (350) (Aabidi, 2020) | Universidad (350) (Serfati, 2016) | |
1.° | 05. COM | 05. COM | 10. CIU | 11. CAM |
2.° | 11. CAM | 16. PRO | 11. CAM | 16. PRO |
3.° | 10. CIU | 10. CIU | 08. ESC | 10. CIU |
4.° | 15. JUE | 11. CAM | 16. PRO | 15. JUE |
5.° | 16. PRO | 15. JUE | 13. TRC | 13. TRC |
Como se puede observar, en los marroquíes de secundaria, el centro de interés más productivo en número de vocablos (08 La escuela: muebles y materiales) no aparece en la lista de los campos que ocupan los cinco primeros rangos en estudiantes finlandeses. Por su parte, el centro 05 Alimentos y bebidas ocupa la primera posición en los escolares y universitarios finlandeses. Por otro lado, cabe señalar que cuatro de los campos asociativos más productivos en Marruecos (10 La ciudad, 11 El campo, 15 Juegos y distracciones y 16 Profesiones y oficios) aparecen también en la lista de los centros que ocupan los cinco primeros rangos en Finlandia. Por último, llama nuestra atención que el centro 13 Trabajos del campo y del jardín, que aparece en el último rango del listado marroquí, no figura como uno de los centros más productivos en finlandeses. En la Tabla 5 se expone el rango de los cinco centros de interés menos productivos en los dos estudios cotejados.
Rango | Finlandia | Marruecos | |||
---|---|---|---|---|---|
Preuniversitarios (150) (Carcedo González, 2000) | Universitarios (50) (2000) | Secundaria (350) (Aabidi, 2020) | Universidad (350) (Serfati, 2016) | ||
13.° | 06. MES | 06. MES | 17. COL | 09. ILU | |
14.° | 12. TRA | 04. MUE | 06. MES | 06. MES | |
15.° | 04. MUE | 09. ILU | 02. ROP | 07. COC | |
16.° | 07. COC | 07. COC | 03. CAS | 13. TRC | |
17.° | 03. CAS | 13. TRC | 09. ILU | 02. ROP |
Como se puede ver en la Tabla 5, en los ámbitos temáticos que se caracterizan por su menor riqueza léxica, nuestros alumnos de secundaria han aportado pocas respuestas en 09 Iluminación, calefacción y medios de airear un recinto, 03 Partes de la casa (sin los muebles) y 02 La ropa, mientras que en los universitarios encontramos 02 La ropa, 13 Trabajos del campo y del jardín y 07 La cocina y sus utensilios. La pobreza léxica caracteriza también estos campos asociativos en los finlandeses (06. Objetos colocados en la mesa para la comida y 09 Iluminación, calefacción y medios de airear un recinto).
A modo de ejemplo, el centro 13 Trabajos del campo y del jardín ocupa la última posición en los universitarios finlandeses y la penúltima en marroquíes. Casi pasa lo mismo con el centro 03 Partes de la casa (sin los muebles) que figura en el último rango en los preuniversitarios finlandeses, mientras que en los escolares marroquíes aparece en el penúltimo puesto. Por otro lado, en el caso de Marruecos, cabe señalar que dos de los centros más pobres (02 La ropa y 17 Los colores) no aparecen en la lista de los centros menos productivos en Finlandia. Por el contrario, el centro 04 Los muebles de la casa (que figura en el decimocuarto lugar en universitarios y en el antepenúltimo puesto en preuniversitarios finlandeses) no aparece entre los centros más pobres de los marroquíes.
En lo referente al ámbito temático 09 Iluminación, calefacción y medios de airear un recinto, además de la escasa presencia que representa en los manuales marroquíes de español como lengua extranjera, la mayoría de los informantes pertenece al estrato sociocultural bajo y medio-bajo (Tabla 1) y no dispone, por lo tanto, de esos artefactos de calefacción y ventilación en sus hogares. Asimismo, en el centro de interés 13 Trabajos del campo y del jardín, dadas las condiciones climatológicas de algunas zonas áridas y desérticas por escasez de agua y cultivos, la mayoría de las familias se traslada y vive en las grandes ciudades y ya no tiene mucho contacto directo con las diferentes actividades agropecuarias que realizan los agricultores y los campesinos de las áreas rurales.
3.3. Índice de cohesión
Relacionado con lo visto anteriormente, para valorar adecuadamente estas circunstancias, resulta de gran importancia cuantitativa el cómputo del índice de cohesión, porque es un factor capaz de poner en relación el número de palabras y el número de vocablos. De esta manera, podemos averiguar los centros de interés en los que los aprendientes marroquíes demuestran competencia léxica6. Según Echeverría (1991), el índice de cohesión mide la coincidencia de las respuestas de los informantes y se logra al dividir la media de respuestas individuales por la cantidad de vocablos en cada campo asociativo. Los resultados conseguidos van a situarse siempre entre los valores 0 y 1. De esta forma, a mayor número de coincidencias, mayor índice de cohesión (centros de interés cerrados o compactos); si, por el contrario, el número de coincidencia es inferior, el índice de cohesión se acercará a 0 (campos asociativos abiertos o difusos) (p. 62).
Como puede observarse en la Tabla 6, los índices de los alumnos de secundaria oscilan entre 0.095 y 0.013 y el promedio de todos los centros de interés es 0.030; en los universitarios los índices tienen la misma oscilación, pero el promedio de 0.046 es un poco más alto, lo cual indica que los estudiantes universitarios han dado más respuestas iguales que los alumnos de secundaria. El índice de cohesión en los centros de interés es, en general, bajo. En los dos grupos de contraste destaca el centro 17 Los colores como el campo más compacto con un índice de cohesión de 0.095 en secundaria y 0.097 en universidad. Es un área temáticamente muy uniformada de todos los campos léxicos estudiados, mientras que los centros 13 Trabajos del campo y de jardín y 11 El campo son los centros más difusos, ya que provocan asociaciones muy diferentes. Estos resultados coinciden con las investigaciones llevadas a cabo con hispanohablantes (Gómez Molina & Gómez Devís, 2004, pp. 84-85; Samper Padilla, Bellón Fernández & Samper Hernández, 2003, p. 108).
C.I. | Secundaria | Rango | Universidad | Rango |
---|---|---|---|---|
01 | 0.032 | 6 | 0.084 | 2 |
02 | 0.035 | 4 | 0.051 | 6 |
03 | 0.036 | 2 | 0.065 | 4 |
04 | 0.031 | 7 | 0.041 | 7 |
05 | 0.036 | 2 | 0.036 | 10 |
06 | 0.034 | 5 | 0.040 | 8 |
07 | 0.025 | 10 | 0.026 | 14 |
08 | 0.027 | 9 | 0.039 | 9 |
09 | 0.023 | 11 | 0.036 | 11 |
10 | 0.019 | 15 | 0.027 | 13 |
11 | 0.013 | 17 | 0.021 | 17 |
12 | 0.029 | 8 | 0.079 | 3 |
13 | 0.014 | 16 | 0.023 | 16 |
14 | 0.022 | 14 | 0.055 | 5 |
15 | 0.023 | 11 | 0.025 | 15 |
16 | 0.023 | 11 | 0.031 | 12 |
17 | 0.095 | 1 | 0.097 | 1 |
Media | 0.030 | - | 0.046 | - |
En cuanto a la posición relativa de los centros de interés, encontramos coincidencias en ambas muestras en el centro 09 Iluminación, calefacción y medios de airear un recinto, que ocupa el undécimo rango en cada conjunto, el centro 13 Trabajos del campo y del jardín en la decimosexta posición y el centro 11 El campo en el último lugar. Entre los centros más compactos encontramos el 17 Los colores, que ocupa el primer rango, y el 04 Los muebles de la casa en la séptima posición. Las mayores divergencias las encontramos en los centros 05 Alimentos y bebidas, donde los alumnos de secundaria aventajan en ocho puntos a los estudiantes universitarios, y el centro 14 Los animales, donde al contrario de lo que sucede en el centro anterior, los universitarios superan a los alumnos de secundaria en nueve puntos. Con menor distancia se encuentran los centros 10 La ciudad con dos puntos y 16 Profesiones y oficios, con un punto de diferencia en ambas muestras.
4. Conclusiones
El análisis cuantitativo nos ha permitido detectar los centros de interés en los que los informantes incorporan una mayor disponibilidad y en los que presentan una carencia léxica. Tras realizar el análisis cuantitativo de los datos, hemos obtenido un corpus compuesto por 88 815 palabras totales, de las que 39 462 pertenecen a las encuestas realizadas por los alumnos de secundaria y 49 353 a las realizadas por los estudiantes de universidad. En ambos grupos, la diferencia de 9 891 palabras está justificada, pues es necesario tener en cuenta que el índice de cohesión de los universitarios (0.046) es mayor que el de los alumnos de secundaria (0.030).
En cuanto a los vocablos totales, es decir, las palabras que aparecen una sola vez en cada centro de interés, contamos con un total de 8 058 vocablos, de los cuales 4 316 aparecen registrados por los informantes de secundaria y 3 742 por los de universidad. En este caso, sí es una diferencia significativa, lo que indica que los campos asociativos de los alumnos de secundaria son más abiertos o difusos que los de los universitarios debido a su menor índice de cohesión.
Los centros de interés que pueden alcanzar la mayor cantidad de unidades léxicas son 10 La ciudad, 06 Objetos colocados en la mesa para la comida y 14 Los animales. Ante esto, cabe mencionar que, efectivamente, el centro de interés más productivo es el referido a 10 La ciudad, que cuenta con 7 337 palabras. Sin embargo, el centro 06 Objetos colocados en la mesa para la comida, lejos de ser uno de los más productivos, ocupa la última posición con 3 249 palabras, mientras que 14 Los animales se sitúa en un punto intermedio con 5 374 palabras. Probablemente, esto se deba a que el léxico relativo a los animales se estudia durante los primeros años de escolarización y los informantes lo tienen relativamente reciente. Es un centro de interés que presenta menos dificultades y se caracteriza por su mayor concreción semántica (Samper Hernández, 2002, p. 40).
Respecto a la riqueza léxica, el centro 10 La ciudad ocupa la primera posición con 909 vocablos; la segunda la ocupa el campo nocional 11 El campo, que registra 859 palabras diferentes. El centro de interés 06 Objetos colocados en la mesa para la comida posee únicamente 246 vocablos, lo que lo sitúa prácticamente en la penúltima posición. Los centros de interés 14 Los animales y 10 La ciudad han obtenido buenos resultados tanto a nivel del total de palabras como a nivel de la riqueza léxica. Sin embargo, nos sorprende que el centro de interés 06 Objetos colocados en la mesa para la comida ocupe las últimas posiciones en cuanto a productividad y riqueza léxica.
Respecto al índice de cohesión, los centros de interés más difusos en ambos grupos de contraste son 11 El campo, 13 Trabajos del campo y del jardín y 10 La ciudad; mientras que los campos nocionales más cerrados son 17 Los colores y 03 Partes de la casa (sin los muebles).
Entre las limitaciones encontradas en nuestro estudio en cuanto a la comparación con los estudios de disponibilidad léxica, nos topamos con diferentes centros de interés tomados por los investigadores: ya no se usan los dieciséis centros de interés de los primeros trabajos franceses, sino que se modifican, excluyendo algunos e incluyendo otros nuevos (Sánchez Gómez, 2004; Paolini, 2016; Hidalgo Gallardo, 2018).
Por una parte, los centros de interés que han registrado una baja productividad léxica podrían ser analizados y trabajados para encontrar soluciones que permitan superar las carencias léxicas de los aprendices de enseñanza media y universitaria en Marruecos. Por otra parte, pretendemos proporcionar un vocabulario concreto a partir de los centros de interés, ya que se toma en consideración la adecuación de los centros de interés en español como lengua extranjera y las posibles mejoras, como suprimir o modificar algunos campos nocionales, tomando como referencia los propuestos por el Nivel Umbral, el Marco Común Europeo de Referencia para las Lenguas: aprendizaje, enseñanza, evaluación (Consejo de Europa, 2001) y el Plan Curricular del Instituto Cervantes (Instituto Cervantes, 2006). De hecho, ya son muchos los centros de interés coincidentes utilizados en el PPHDL y los temas y subtemas del Consejo de Europa (2001) para soslayar ambigüedades de interpretación.
En definitiva, de todo lo dicho se colige que los estudios de disponibilidad léxica en Marruecos resultan de gran importancia en el ámbito de la educación, especialmente en los planes de enseñanza enfocados hacia el ámbito de español como lengua extranjera. Los resultados que se obtienen permiten adaptar el proceso de enseñanza/aprendizaje a las necesidades de los alumnos a través de la confección y elaboración de materiales didácticos adecuados. En nuestro caso, los errores ortográficos cometidos por los informantes en los test asociativos de disponibilidad léxica podrían ser objeto de estudio y análisis de futuras indagaciones que permitieran subsanar los errores detectados.