Introducción
El acoso escolar o bullying en México es un problema actual. Algunos reportes sugieren que el país ocupa los primeros lugares en cuanto al bullying a nivel mundial (Valadez, 2014). Además, los estudios han demostrado que existe una asociación entre el bullying y los problemas de salud mental que van desde la depresión hasta el suicidio (Bauman, Toomey, & Walker, 2013; Gini & Pozzoli, 2009). Estas consecuencias han motivado que la investigación en años recientes vaya aumentando de forma consistente (Dibomicucci Brazil, Basso Meneghini, de Souza Costa, & Lemes, 2015). Sin embargo, uno de los principales retos que tiene el estudio del bullying es un adecuado diagnóstico, pues sin una correcta medición no se puede asegurar un adecuado plan de intervención (Crothers & Levinson, 2004).
Los estudios de prevalencia del bullying han sido variados, sin embargo, recientemente destaca el trabajo de Modecki, Minchin, Harbaugh, Guerra y Runions (2014), donde sistematizan 80 estudios sobre el bullying y cyberbullying a nivel mundial para realizar un meta-análisis de su prevalencia. Modecki y su equipo analizaron la prevalencia del bullying tradicional (cara a cara) y el cyberbullying, tanto para víctimas como para agresores. En este mismo trabajo, también se analizaron variables que podrían moderar la estimación de la prevalencia, como por ejemplo, si el instrumento proveía una definición o el uso de ejemplos, si utilizó palabras sensibles (como usar bully en los reactivos), o si la muestra fue aleatoria. Los resultados señalaron que, tanto para víctimas como para agresores, la prevalencia del bullying tradicional fue mayor que la del cyberbullying, aproximadamente de un 35 % y 15 % respectivamente. Además, el estudio determinó que estas prevalencias se encontraban correlacionadas, lo que sugiere que el cyberbullying, con una menor prevalencia que el bullying, es un tipo de expresión de éste, y no un fenómeno independiente. El estudio además señala la importancia de algunos aspectos metodológicos que podrían moderar la prevalencia estimada. Por una parte, brindar una definición clara que incluye los tres elementos que componen el bullying aumenta la estimación de la prevalencia. Por el contrario, brindar ejemplos, utilizar la palabra “bullying” o utilizar un muestreo probabilístico, disminuye la estimación de la prevalencia. Estas conclusiones ya habían sido señaladas por estudios previos (Felix, Sharkey, Green, Furlong, & Tanigawa, 2011; Green, Felix, Sharkey, Furlong, & Kras, 2013). Sin embargo, otras variables como el tipo y diseño del muestreo han sido poco abordados previamente.
Otro de los problemas que continuamente se menciona es el tipo de instrumento, debido a que la variedad de instrumentos utilizados también puede afectar la estimación de la prevalencia (Ybarra, Espelage, & Mitchell, 2014). Esto se debe principalmente a que los instrumentos utilizados no siempre evalúan todos los elementos que componen el bullying, que corresponden a (1) la intencionalidad de hacer daño, (2) en un periodo prolongado de tiempo, (3) y la existencia de desbalance de poder (Vivolo-Kantor, Martell, Holland, & Westby, 2014). Este último, un componente esencial para diferenciar el bullying de otras formas de violencia escolar (Ybarra et al., 2014).
A nivel Iberoamérica también destaca el trabajo realizado por Zych, Ortega-Ruiz & Marín-López (2016), donde sintetizan los estudios de acoso escolar realizados en España de 2008 a 2015 sobre cyberbullying. En la revisión sistemática realizada, los autores concluyen sobre la gran influencia que puede tener el diseño del estudio y la instrumentación utilizada (por ejemplo, si el instrumento utilizó un solo ítem o varios para evaluar el ciberbullying). De igual forma, reportan el promedio de la prevalencia para diferentes formas de involucramiento en el cyberbullying. En los estudios que evaluaron el cyberbullying a través de diferentes escalas con varios ítems, el promedio para víctimas y agresores fue bastante similar con una prevalencia promedio de 24 % y 26 % respetivamente. Cuando esta estimación se realizaba con un solo ítem, la prevalencia disminuyó a un 10 % y 14 % respectivamente. Sin embargo, cabe recalcar que el estudio realizado utilizó el promedio simple de las prevalencias, una práctica no recomendada para sintetizar resultados de diversos estudios debido a que la calidad de los estudios no necesariamente es la misma. Por lo que se recomiendan técnicas de ponderación como el meta-análisis para realizar la síntesis del efecto global (Borenstein, Hedges, Higgins, & Rothstein, 2009). Finalmente, hay que recalcar que el estudio no reportó el manejo del sesgo en las publicaciones, por lo que los resultados también deben ser analizados con reservas al generalizar solo a estudios publicados en revistas arbitradas.
En México, los estudios que sinteticen los principales hallazgos sobre bullying son escasos. Valdés Cuervo y sus colaboradores (2016) analizaron 53 estudios realizados en México de 2001-2014. Sin embargo, el estudio es solo un análisis bibliométrico de los estudios de bullying en México, y no integra o sintetiza de ninguna forma los resultados y sus metodologías. Esta falta de síntesis de hallazgos motiva la presente investigación. El propósito entonces fue sintetizar, mediante un meta-análisis, las prevalencias de bullying en los estudios realizados en México. El estudio se basó en la metodología presentada por Modecki et al. (2014) con las adecuaciones correspondientes para integrar los resultados de los estudios realizados en México.
Método
Selección de los estudios
Criterios de elegibilidad. Se consideraron únicamente artículos que abordaran el tema de bullying realizados en México. Para esto, se consideraron los siguientes criterios de inclusión: 1) haber sido realizado con muestra y participantes de México; 2) que abordara el tema de bullying y/o cyberbullying; 3) que brindara información que permitiera estimar la prevalencia (tamaño de la muestra y cantidad de alumnos que realizan o reciben bullying). Los estudios realizados por autores o instituciones mexicanas fueron incluidos, para posteriormente verificar el cumplimiento del primer criterio de inclusión. Se eliminaron todos aquellos estudios que abordaron el bullying laboral, o que fueran estudios de tipo narrativo/teórico. No se fijó una fecha de inicio, pues se intentó abarcar la mayor cantidad de estudios posibles en México. Sin embargo, se consideró una fecha límite para no incluir estudios posteriores que pudieran ser publicados durante la elaboración de este documento, fijando como fecha límite el 1 de marzo de 2017.
Estrategia de búsqueda: Se utilizaron las bases de datos de Scopus, Web of Science, Ebsco, Scielo, Redalyc, así como la búsqueda manual en los perfiles de ResearchGate de los autores más frecuentes, y la revisión de las memorias de investigación del Congreso Mexicano de Investigación Educativa, con el objetivo de evitar el sesgo en la publicación. Para la búsqueda de artículos se utilizaron los términos “bullying”, “acoso escolar”, “hostigamiento escolar”, “cyberbullying” y “maltrato entre pares”. El resultado del proceso de búsqueda dio la inclusión a 27 estudios (ver figura 1).
Codificación de la información
A partir de los artículos hallados, se consideró recoger la siguiente información: el constructo evaluado (bullying o cyberbullying), el tipo de muestreo utilizado; el tipo de instrumentación elegido y sus características (uso de una definición u operacionalización de diferentes tipos de agresión; el uso o no de términos sensibles como bully o acoso en los ítems o definición; y el número de ítems para evaluar el constructo), así como el tamaño de muestra y la prevalencia de bullying (tabla 1). Los estudios fueron revisados por dos evaluadores independientes, y todas las dudas o conflictos sobre su codificación fueron resueltas a través de un tercer revisor, todo esto siguiendo las recomendaciones y lineamientos para realizar estudios meta-analíticos de prevalencia (The Joanna Briggs Institute, 2014).
Análisis de la información
Se recogieron datos sobre la prevalencia, ya sea por víctimas, agresores o ambos, así como por su modalidad (acoso cara a cara o ciberacoso). Aquellos reportes que brindaban más de una modalidad de agresión fueron promediados para obtener una solo. Solo dos reportes brindaban un estimado general (sin especificar si era de víctimas o agresores), los cuales fueron utilizados en ambas categorías para los cálculos. Finalmente, para aquellos reportes que utilizaron la misma muestra para reportar distintos análisis (Valdés Cuervo, Martínez & Torres Acuña, 2012; Valdés Cuervo, Ojeda García, Urías Murrieta & Ponce Segura, 2013; Valdés Cuervo, Sanchez Escobedo & Martínez, 2012), solo se consideró un reporte, tomando en cuenta aquel reporte que haya sido publicado en una revista con revisión por pares, y en caso de haber más de uno, se tomó como referencia aquel con la fecha más reciente.
Se recogieron datos sobre la prevalencia, ya sea por víctimas, agresores o ambos, así como por su modalidad (acoso cara a cara o ciberacoso). Aquellos reportes que brindaban más de una modalidad de agresión fueron promediados para obtener una solo. Solo dos reportes brindaban un estimado general (sin especificar si era de víctimas o agresores), los cuales fueron utilizados en ambas categorías para los cálculos. Finalmente, para aquellos reportes que utilizaron la misma muestra para reportar distintos análisis (Valdés Cuervo, Martínez & Torres Acuña, 2012; Valdés Cuervo, Ojeda García, Urías Murrieta & Ponce Segura, 2013; Valdés Cuervo, Sanchez Escobedo & Martínez, 2012), solo se consideró un reporte, tomando en cuenta aquel reporte que haya sido publicado en una revista con revisión por pares, y en caso de haber más de uno, se tomó como referencia aquel con la fecha más reciente.
Para realizar los análisis se consideró primero una transformación a los datos de prevalencia a partir de la transformación de doble arcoseno de Freeman-Tukey, recomendada para realizar meta-análisis de proporciones (Barendregt, Doi, Lee, Norman, & Vos, 2013). Los datos fueron analizados con el programa estadístico R (R Core Team, 2017) utilizando el paquete estadístico “meta” (Schwarzer, 2007). Para los análisis se consideró un modelo de efectos aleatorios debido a la variación en los estudios y sus metodologías (los artículos utilizaron diferentes instrumentos, niveles educativos e incluso diseños muestrales), además de que la variabilidad de éstos fueron corroborados con los correspondientes diagnósticos de heterogeneidad, demostrando que existían variaciones importantes entre los estudios (Borenstein et al., 2009). Finalmente, también se analizaron los instrumentos utilizados, especialmente con referencia al constructo evaluado y su correspondencia con los componentes de la definición del bullying. Lo anterior se realizó a partir del rastreo de la descripción de los instrumentos utilizados en la sección del método de los artículos analizados, o bien a través de la recuperación de los estudios de validación original en casos en donde habían utilizado instrumentos previamente validados.
Resultados
Descripción de los estudios
De los 27 estudios considerados en esta revisión, el 70,4 % de ellos estudió el bullying cara a cara, y un 44,4 % el cyberbullying. Un 7,4 % fueron realizados con participantes de nivel primaria, 48,1 % secundaria; 37 % bachillerato; y un 11,1 % a nivel superior. De igual forma con respecto al diseño metodológico, se obtuvo que un 44,4 % de los estudios utilizó un diseño de muestreo probabilístico y 55,6 % utilizó un instrumento previamente validado. El promedio de ítems utilizados en los estudios es de 18,55. Sin embargo, dado algunos valores extremos se consideró que la mediana de ítems reflejaba de mejor forma la cantidad de ítems utilizada por la mayoría de los instrumentos, la cual correspondió a 12 ítems.
Cabe recordar que la búsqueda no solo incluyó artículos de revistas arbitradas (63 %), sino también reportes de conferencias (33,3 %), y libros (3,7 %); con la intención de evitar el sesgo de publicación. Lo anterior fue logrado exitosamente, pues al explorar el sesgo en la publicación por medio de la correlación de rangos entre el error estándar y el efecto estimado en cada modelo, también conocido como prueba de Begg y Mazumdar (Schwarzer, 2007), el resultado fue que todos los estadísticos tuvieron un valor estandarizado menor a z = 1,96, por lo que se concluyó la ausencia de sesgo en las publicaciones tanto para la victimización cara-a-cara (z = 1,17, p = 0,242), como para la agresión cara-a-cara (z = 1,58, p = 0,113), la cibervictimización (z = -0,42, p = 0,677), y la ciberagresión (z = -0,45, p = 0,655).
Prevalencia del bullying cara a cara y cyberbullying
En la Figura 2 se puede apreciar la síntesis de la prevalencia del bullying cara a cara, tanto para víctimas (victimización, con una muestra combinada de n = 12,977) como para agresores (agresión; muestra combinada de n = 10,955). Las prevalencias son similares, con una proporción del 20 % (I.C. 95 % = 13 %-28 %) para la victimización, y de 19 % (I.C. 95 % = 11 %-30 %) para la agresión. Con respecto al bullying por medios electrónicos, la cibervictimización (con una muestra combinada de n = 5,763) tuvo una prevalencia similar a la encontrada en la victimización tradicional, con un 21 % (I.C. 95 % = 13 %-30 %). Sin embargo, la ciberagresión (con una muestra combinada de n = 7,033) tuvo una prevalencia menor, con un 11 % (I.C. 95 % = 7 %-15 %) en su estimación. Finalmente, tal como puede observarse en la Figura 2 debajo del análisis de cada subgrupo, existe una gran variabilidad (heterogeneidad) entre los estudios (I2 = 0,97-99 que corresponde del 97 al 99 %), siendo la menor de un 97 %, por lo que resultó apropiado un análisis de moderadores de la prevalencia.
Nota: En el diagrama de bosque (forest plot) se dividen los análisis según el tipo de prevalencia observada en cuatro grupos: A) Victimización, B) Agresión, C) Cibervictimización y D) Ciberagresión. La escala de prevalencia corresponde a una proporción que va de 0 a 1, que en términos de porcentajes equivale del 0 a 100 %. Los resultados individuales de cada estudio están representados con un cuadrado y su correspondiente intervalo de confianza con una línea que atraviesa el cuadrado. A un mayor tamaño del cuadrado, mayor importancia del estudio (peso aleatorio). La prevalencia global que integra la información de todos los estudios de cada grupo es representada por la figura en forma de diamante (tamaño del efecto), cuyo largo corresponde al largo del intervalo de confianza de la prevalencia global. De tal forma, existe una prevalencia global para cada grupo de análisis. Adicionalmente se proporcionan otros datos como el tamaño de la muestra (N), la cantidad de estudiantes involucrados en el acoso (Eventos), y los intervalos de confianza de la prevalencia de cada estudio (Int. Conf. 95 %).
Moderadores de la prevalencia
Se analizaron los siguientes moderadores: forma de medición (uso de definiciones o la operacionalización de indicadores); uso o no de términos sensibles en los ítems o definición; el número de ítems utilizado por el instrumento, el tipo de muestreo realizado (probabilístico o no probabilístico) y la edad de los participantes, todo esto controlado por el subgrupo analizado. A partir de una meta-regresión, se encontró que el uso de una definición vs la operacionalización, explican de forma significativa la prevalencia (β = 0,23; z = 4,17; p < 0,001). El coeficiente obtenido señala que el uso de definiciones presentadas a los participantes aumenta significativamente la estimación de la prevalencia. También se obtuvo que el número de ítems utilizado en los instrumentos modera la prevalencia (β = -0,0036, z = -2,54; p = 0,011). El valor del coeficiente obtenido señala que una menor cantidad de reactivos tiende a sobreestimar la prevalencia del acoso escolar. Finalmente, ni la edad, el tipo de muestreo elegido o el uso de términos sensibles se relacionó con las prevalencias estimadas en los estudios.
Análisis sobre la instrumentación utilizada
Finalmente, también fueron analizados los instrumentos utilizados en los estudios revisados. Se encontró que un 22,2 % (n = 6) de los instrumentos empleó una definición del constructo de bullying o cyberbullying que se presentó a los participantes para determinar su prevalencia. De igual forma, un 29,6 % (n = 8) de los instrumentos utilizó términos sensibles en el instrumento o sus reactivos, tales como bully o acoso.
Los instrumentos empleados en los estudios revisados no son mayoritariamente utilizados según la revisión de Vivolo-Kantor et al. (2014), con excepción de las escalas basadas en el trabajo de Orpinas (2009) y el Test Bull-S (Cerezo, 2000). La mayoría de los instrumentos fueron construidos para investigaciones realizadas en México, o en caso de haber sido validados previamente, habían sido poco utilizados a nivel internacional. Se observó que todos los instrumentos evaluaron el componente de intención de causar un daño, y la repetición de estas conductas. Sin embargo, solamente dos instrumentos evaluaron el componente de desbalance de poder: el CIMEI o Cuestionario sobre Intimidación y Maltrato Entre Iguales (Avilés Martínes, 1999) y el Test Bull-S. Pero, ninguno de ellos lo utiliza para la determinación de la presencia o ausencia del bullying. Es decir, dado de que ningún instrumento utilizado considera los tres componentes del bullying para su evaluación, no se puede considerar en los estudios revisados que hayan medido el bullying de forma estricta, sino quizás constructos relacionados como la victimización por pares. A pesar de lo anterior, la mayoría de los instrumentos reportan valores buenos de consistencia interna que iban de 0,81 hasta 0,92; lo que habla de una buena consistencia para evaluar la victimización por pares en la escuela.
Discusión
Los resultados señalan que los estudios analizados probablemente no hayan evaluado el constructo de bullying, pues los instrumentos utilizados no contemplan todos los elementos del bullying para su respectivo diagnóstico. En particular, no contemplan el componente de desbalance de poder, un componente que las investigaciones internacionales han señalado como esencial para diferenciar el acoso escolar de otras formas de agresión (Green et al., 2013; Volk, Dane & Marini, 2014; Volk, Veenstra & Espelage, 2017; Ybarra et al., 2014). Es muy probable que se hayan evaluado constructos como la victimización entre pares, o incluso la violencia escolar. De hecho, algunos estudios que basan sus mediciones en los instrumentos de Del Rey y Ortega (Valdés Cuervo, Martinez, Tanori Quintana & Wendlandt Amezaga, 2014), deben considerar que las mismas autoras señalan que su instrumento no mide únicamente bullying, sino otros aspectos más amplios de la violencia escolar, específicamente la violencia interpersonal que ocurre en los centros escolares (Del Rey & Ortega, 2005). Esto es similar a lo encontrado por Zych, Ortega-Ruiz y Marín-López (2016) que señalan que los estudios de ciberbullying pueden ser considerados como estudios de un concepto más amplio como la ciberagresión.
Es por tanto necesario enmarcar las prevalencias encontradas en el contexto de la victimización por pares y no específicamente dentro del concepto de bullying. A pesar de lo anterior, los estudios realizados no son menos importantes, ya que la atención a cualquier forma de agresión debe ser considerada como fundamental para el desarrollo adecuado de las personas, por tanto, aunque posiblemente los estudios evaluaron el concepto de victimización por pares, sus hallazgos siguen siendo fundamentales para el entendimiento y prevención de la violencia escolar.
Con respecto a los cálculos de la prevalencia, llama la atención que las estimaciones son menores a las encontradas por Modecki et al. (2014). Lo anterior posiblemente se deba a tres razones: 1) la gran variabilidad en los instrumentos utilizados, 2) los tipos de muestra, y 3) el hecho que posiblemente no se esté midiendo el bullying, sino victimización entre pares. Los resultados de este estudio también contrastan con reportes internacionales que señalan a México como uno de los países con mayor prevalencia de bullying. Es posible que la discrepancia anterior se deba al concepto y tipo de instrumento utilizado para las estimaciones de los estudios internacionales, pues la variabilidad en los instrumentos ha sido un problema comúnmente señalado por los expertos en acoso escolar que comúnmente dificulta la comparabilidad entre países (Furlong, Sharkey, Felix, Tanigawa, & Green, 2010).
Sin embargo, hay que destacar que los intervalos de confianza obtenidos en el meta-análisis contienen las estimaciones propuestas por Modecki. Además, los resultados son más similares a los encontrados por Zych et al. (2016) en España, con reportes cercanos al 20 % para varias medidas de victimización y agresión. Lo anterior quizás sea el reflejo de similitudes culturales en ambos países. Además, las estimaciones encontradas en México son de gran utilidad para la planificación de futuras investigaciones. Las estimaciones pueden ser utilizadas para generar cálculos de muestreos probabilísticos que tomen en consideración la dinámica del acoso escolar en México.
Por otra parte, también destaca que el uso de definiciones afecta los cálculos de prevalencia, al aumentar la proporción estimada cuando se presenta una definición a los participantes. Esto es similar a lo que otros estudios han señalado, en cuanto a que al brindar una definición puede aumentar las estimaciones de la prevalencia (Green et al., 2013; Modecki et al., 2014). Es por esto que se recomienda trabajar en la adaptación de instrumentos ampliamente utilizados o recomendados que permita la evaluación adecuada de la prevalencia, y al mismo tiempo la comparabilidad entre diversos países (Swearer, Siebecker, Johnsen-Frerichs, & Wang, 2010), considerando la adaptación de instrumentos que operacionalicen el constructo en lugar de brindar una definición (Felix et al., 2011; Green et al., 2013).
Otro aspecto relevante es el efecto moderador que tiene la cantidad de ítems de los instrumentos en la estimación de la prevalencia. Contrario a lo reportado por Zych et al. (2016), este meta-análisis encontró que, al menos en México, una menor cantidad de ítems está asociado a una prevalencia mayor. Es posible que esta diferencia hallada se deba a dos factores. Por una parte, el estudio de Zych, Ortega-Ruiz y Marín-López evaluó únicamente cyberbullying, mientras que los análisis presentados también incluyen el bullying cara-a-cara. Por otra parte, la síntesis brindada por Zych, Ortega-Ruiz y Marín-López fue a partir de una media aritmética de las prevalencias (ya que realizaron una revisión sistemática, y no un meta-análisis), a diferencia de éste trabajo que pondera la estimación por la variabilidad del estudio; siendo ésta ultima la técnica más apropiada en la síntesis de resultados (Borenstein et al., 2009). Este efecto presente pero contrario en ambas investigaciones, señala la necesidad de estudiar el efecto de la cantidad de ítems en la estimación de la prevalencia del acoso escolar como señalan las autoras.
En conclusión, los resultados reportados tienen implicaciones importantes para el estudio y atención del bullying y cualquier forma de violencia que se de en las escuelas. Por una parte, es fundamental que los estudios se provean de información suficiente para estimar la prevalencia, pues no todos los estudios realizados fueron susceptibles de incluirse en este meta-análisis. Una recomendación es que los investigadores brinden tamaños de muestra y porcentaje de alumnos que sufren o realizan acoso escolar como parte de la descripción de la muestra de manera rutinaria. Así como también, realizar estudios experimentales para explorar el efecto de la cantidad de ítems en la estimación de prevalencias. Por otra parte, también es importante detallar adecuadamente el tipo de instrumentos utilizados en los futuros reportes (p. ej.: mencionar si se utilizó una definición y cuál fue en su caso; así como la forma de operacionalizar el concepto en caso de no usar una definición; y el número de reactivos para evaluarlo). Esto último es especialmente importante a la luz de que no todos los instrumentos utilizados evalúan los tres componentes esenciales del bullying, por lo que para propósitos de síntesis y desarrollo metodológico reportar estas características de los instrumentos puede ser un gran paso para mejorar los estudios del acoso escolar en México.