Introducción
El Neuroticismo (N) es un dominio que se encuentra ampliamente en la mayoría de modelos teóricos o empíricos de la estructura general de la personalidad normal. En el marco del Modelo de los Cinco Factores - Five Factor Model- (FFM, Costa y McCrae, 1995; Goldberg, 1993) se define como la tendencia del individuo a sentir afectos negativos de una manera intensa y prolongada. Así, personas con elevados niveles de N manifiestan preocupaciones frecuentemente, sentimientos de inseguridad, baja autoestima e insatisfacción consigo mismos y con el contexto; por lo que también tienden a establecer relaciones conflictivas. Resultan proclives a manifestar problemas en la autorregulación de emociones, lo que afecta de forma negativa a su capacidad de toma de decisiones y su manejo del estrés (McCrae y Costa, 2010). Algunos autores mencionan esta dimensión como Estabilidad Emocional, prefiriendo enfatizar el polo opuesto del dominio (Tackett y Lahey, 2017).
A pesar de que el N constituye un rasgo de personalidad normal, es abundante la evidencia empírica que muestra el impacto del N en el campo de la salud pública (Lahey, 2009; Vittengl, 2017; Widiger y Oltmanns, 2017). Su asociación con distintas psicopatologías ha llevado a concebirlo como un factor de vulnerabilidad común para el desarrollo y mantenimiento de diversos trastornos mentales (Barlow et ál., 2014; Gore y Widiger, 2018) y a diseñar tratamientos con objetivos centrados en la modificación de los niveles elevados de este rasgo (Drake et ál., 2017; Tackett y Lahey, 2017).
Las implicaciones del N en el sistema de salud pueden ser rastreadas por su vinculación con una gran variedad de enfermedades físicas como cardiopatías, diabetes, asma o enfermedades inflamatorias intestinales (Lahey, 2009). Niveles altos de N no solo son un factor de riesgo para la aparición de estas patologías, sino que también se ha observado un aumento en la tendencia a exagerar la importancia de los síntomas físicos y a obstaculizar la respuesta al tratamiento. Asimismo, el N se relaciona con el deterioro en la calidad de vida que repercute en las distintas áreas del individuo: problemas de rendimiento laboral o académico, dificultades interpersonales en los vínculos familiares, entre otros (Menéndez et ál., 2019; Vittengl, 2017).
Con la quinta versión del Manual de diagnóstico y estadística de los trastornos mentales (DSM-5; American Psychiatric Association [APA], 2013a) se ha generado un debate en el campo de la personalidad. Tomando como base el FFM se propuso un modelo dimensional para los Trastornos de Personalidad - Five Factor Model Personality Disorder - (FFMPD, Clark, 2007, Widiger et ál., 2017; Widiger y Mullins-Sweatt, 2009). El FFMPD asume que para cada dominio de la personalidad normal es posible reconocer un polo desadaptativo o patológico. Esto incluye evidencia de una estructura jerárquica compartida entre rasgos normales y desadaptativos, al menos a nivel de los dominios (Al-Dajani et ál., 2015; Gore y Widiger, 2013; Widiger et ál., 2019).
Siguiendo el FFMPD, la APA (2013a) definió una variante desadaptativa del N llamada Afectividad Negativa (AN). Conceptualmente, este dominio guarda estrecha relación con el N, aunque con un mayor nivel de intensidad. La AN se caracteriza por la tendencia a vivenciar experiencias frecuentes e intensas de una amplia gama de emociones negativas; tales como la ansiedad, depresión, sentimiento de culpa o vergüenza, preocupación y enfado. Sus manifestaciones a nivel comportamental incluyen la autolesión y, en lo que respecta a lo interpersonal, se destaca la dependencia como forma de vincularse con otros (APA, 2013a).
La hipótesis que subyace a la nueva propuesta del DSM-5 supone la existencia de un continuo entre N y AN aunque establece que el límite entre ambos sería difuso y flexible (Sánchez y Ledesma, 2013). Los esfuerzos actuales se han centrado en aportar evidencias robustas sobre esta continuidad estudiando la relación de los diferentes instrumentos desarrollados para la medición del N y su variante desadaptativa. Al respecto, en la literatura se reconocen diversos abordajes metodológicos que apuntan a verificar este supuesto utilizando un enfoque correlacional (por ejemplo, Griffin y Samuel, 2014; Quilty et ál., 2013) o uno factorial (Wright y Simms, 2014). Sin embargo, estas estrategias metodológicas no permiten concluir que los rasgos de personalidad anormal son simplemente rasgos normales exacerbados (Walton et ál., 2008).
La aplicación de la Teoría de Respuesta al Ítem (TRI) como soporte metodológico permite alcanzar una mayor profundidad en la comprensión de esta continuidad (Balsis et ál., 2017). Los modelos de la TRI ofrecen la ventaja de estimar los parámetros que caracterizan a los ítems en una misma escala aun cuando pertenecen a distintos instrumentos (Reise y Waller, 2009; Walton et ál., 2008). Así, es posible comparar la información que proporcionan los distintos tests de personalidad normal y patológica (Samuel et ál., 2013; Samuel et ál., 2010; Stepp et ál., 2012) con el fin de analizar si los comportamientos más extremos de AN representan los niveles exacerbados del continuo que conforman N / AN. Más específicamente, con la TRI es factible determinar si, como se espera, los ítems que miden rasgos normales tienen capacidad discriminativa máxima en niveles medios de la variable mientras que los ítems que evalúan rasgos disfuncionales aportan información considerable en el nivel extremo superior del continuo (Suzuki et ál., 2015; Walton et ál., 2008).
Si bien son sólidas las evidencias que demuestran la existencia de una estructura dimensional común entre los dominios de los rasgos de personalidad normal y patológica (Clark, 2007; Widiger et ál., 2017; Widiger y Mullins-Sweatt, 2009) este tipo de investigaciones son poco frecuentes en el contexto latinoamericano y están limitadas a instrumentos en inglés. Mucho más escasos son aún los estudios que persiguen indagar esta continuidad haciendo uso de la TRI (Suzuki et ál., 2015; Walton et ál., 2008). A la luz de estas consideraciones teóricas y metodológicas, en este trabajo se propone estudiar el supuesto de continuidad entre la dimensión de N y su variante desadaptativa según el FFMPD aplicando la TRI en escalas adaptadas al contexto local que miden cada uno de estos constructos.
Método
Participantes
Se contó con la participación de 619 personas residentes en el área metropolitana de Buenos Aires, Argentina (64.3 % género femenino). Se usó un muestreo no probabilístico por accesibilidad. La edad de los participantes osciló entre 18 y 77 años con una media de 35.30 años (DE = 12.62). El 76.3 % reportó estar empleado y el 46.5 % se encontraba estudiando al momento de ser evaluado. El 38.7 % de los individuos alcanzó un nivel de estudios superior (Terciario o Universitario), el 56.2 % reportó tener un nivel de estudios de secundario completo y sólo un 5 % no alcanzó este nivel.
Instrumentos
Cuestionario de datos sociodemográficos. Encuesta breve diseñada ad-hoc que indaga datos aspectos tales como género, edad, cantidad de hijos, lugar de nacimiento y residencia, situación laboral y nivel educativo.
Ítems de la Escala de Afectividad Negativa del Personality Inventory for DSM-5 (PID-5, American Psychological Association, 2013b; Krueger et ál., 2012, adaptación de Fernández Liporace y Castro Solano, 2015). Si bien la escala original identifica nueve facetas anidadas jerárquicamente en AN (APA, 2013b) estudios posteriores conservaron solo tres debido a que las restantes mostraron asociaciones cruzadas con otros dominios del FFMPD (Morey et ál., 2013; Watters et ál., 2019). En consecuencia, se incluyeron los 23 ítems que componen las facetas Ansiedad (9 ítems, alfa de Cronbach = 0.82), Labilidad Emocional (7 ítems, alfa de Cronbach = 0.77) e Inseguridad Separación (7 ítems, alfa de Cronbach = 0.77). La consistencia interna de la escala total calculada a partir de los datos de la presente investigación resultó elevada (alfa de Cronbach = 0.87).
Ítems de Neuroticismo del International Personality Item Pool (IPIP-NEO, Goldberg et ál., 2006, adaptación de Cupani et ál., 2014). La escala completa está conformada por 48 elementos organizados en seis facetas, aunque para los fines de esta investigación se utilizó la versión del instrumento compuesta por una selección de 20 ítems (alfa de Cronbach = 0.87) que permiten una medición unidimensional del constructo.
Procedimiento
Se diseñó un protocolo autoadministrable en el que se alternaron los ítems de N del IPIP-NEO y AN del PID-5. Con el objetivo de lograr una mayor coherencia, todos los ítems fueron respondidos con una escala Likert de cuatro opciones: En desacuerdo, Ligeramente en desacuerdo, Ligeramente de acuerdo y De acuerdo. Esta elección se debe a estudios previos que mostraron que cuatro opciones pueden resultar una cantidad óptima para garantizar un equilibrio entre el grado de ajuste del modelo de la TRI y la precisión de la medida (e. g. Abal et ál., 2018).
La aplicación de los cuestionarios se realizó de forma individual y en un entorno adecuado, es decir, un setting de evaluación. Se informó a los participantes sobre los propósitos de la investigación, siendo su colaboración voluntaria. Se garantizó en todo momento el anonimato y la confidencialidad, así como el bienestar de los examinados, quienes fueron advertidos sobre la posibilidad de abandonar la evaluación si así lo deseaban. Se notificó previamente sobre la imposibilidad de recibir una devolución individual de los resultados del protocolo.
Tanto el protocolo como el diseño de la investigación fueron aprobados por el Comité de Conductas Responsables de la Facultad de Psicología de la Universidad de Buenos Aires, sede en la que desarrolló este proyecto.
Análisis de Datos
En una primera fase se efectuó una depuración progresiva por separado de los ítems de N y de AN contemplando los criterios de calidad psicométrica de la TRI: independencia local, unidimensionalidad y ajuste al modelo. Se eliminó uno de los ítems de cada uno de los pares señalados como localmente dependientes por el estadístico χ2LD. Siguiendo la recomendación de Reise y Rodríguez (2016), se consideró χ2LD > 10 para determinar la dependencia local de los elementos. La unidimensionalidad se verificó con un Análisis Factorial Exploratorio (AFE) a partir de la matriz de correlaciones policóricas. Se aplicó el método de mínimos cuadrados no ponderados (ULS) para la extracción de factores y la implementación óptima de análisis paralelo de Horn como criterio de retención. También se analizó la proximidad a la unidimensionalidad con los índices ECV (Explained Common Variance) y MIREAL (Mean of Item Residual Absolute Loadings). Se contemplaron como aceptables valores de ECV > .85 y MIREAL < .30 (Ferrando y Lorenzo-Seva, 2018).
Finalmente, se calibraron los ítems con el Modelo de Respuesta Graduada (MRG) de Samejima (2016). La elección del MRG por sobre otros modelos politómicos de la TRI se asienta en su frecuente aplicación exitosa en tests de rendimiento típico (Reise y Revicki, 2015). Los parámetros se estimaron con el método de Máxima Verosimilitud Marginal con un criterio de convergencia de .0001 y el ajuste se examinó ítem por ítem con el índice S-χ2 (Kang y Chen, 2011). Adicionalmente, se examinó el ajuste global del MRG con el M2, aunque dada la sensibilidad de este estadístico frente a pequeños desajustes de los datos al modelo también se complementó con el RMSEA (Maydeu-Olivares, 2015). De manera similar al criterio de interpretación definido para los modelos de ecuaciones estructurales (Maydeu-Olivares et ál., 2011) el RMSEA refleja un ajuste óptimo cuando presenta valores iguales o inferiores a 0.05.
En una segunda fase se procedió a calibrar conjuntamente los ítems retenidos para AN y N. Esto garantizó que la estimación de los parámetros de los ítems se encontraba en la misma métrica. En esta etapa se aplicaron los mismos criterios de depuración contemplados previamente. En ambas fases el conjunto de datos fue analizado haciendo uso del software IRTPRO 4.2 (Cai et ál., 2011) a excepción del AFE para el cual se utilizó el programa Factor 10 (Ferrando y Lorenzo-Seva, 2017).
Además, se utilizaron pruebas U de Mann Whitney con el objetivo de analizar si los parámetros de los ítems de los instrumentos difieren en función de su procedencia. Para hacer comparaciones que representen globalmente la zona de actuación de cada ítem se consideraron: a) los parámetros b2 de cada ítem, b) el valor promedio de los parámetros de un mismo ítem (bprom) y c) las amplitudes entre los valores de los parámetros b (i.e. b3-b1). También se cotejaron las Funciones de Información de los ítems que componen cada instrumento a fin de estudiar para qué niveles del rasgo resultan más precisas las escalas.
Resultados
Fase 1: Depuración de los instrumentos
Con respecto a la escala de AN, la depuración progresiva llevó a la eliminación de 11 de los 23 ítems originales. Siete de estos elementos fueron descartados debido a que mostraron dependencia local con otros reactivos (χ2LD > 10). Otros dos ítems mostraron valores de b poco razonables (por encima de ± 3) y los restantes no lograron ajustar al MRG según el índice S-χ2 (p < 0.001). Por último, el estudio factorial (KMO = 0.88; Prueba Bartlett, X2= 1775.3; gl = 66; p < 0.001) permitió verificar la unidimensionalidad del constructo con los ítems retenidos con base en los resultados obtenidos en la implementación óptima del análisis paralelo de Horn, el ECV = 0.86 y el MIREAL = 0.26.
En cuanto a la depuración de la escala de N, se descartaron 10 de los 20 ítems. Siete de estos reactivos fueron descartados por mostrar dependencia local con otros elementos (χ2LD > 10) además de presentar parámetros de umbral con valores que excedían el rango esperable. Los últimos tres restantes se eliminaron por desajustar al MRG según los valores del índice S-χ2 (p < 0.001). En el AFE realizado (KMO = 0.88; Prueba Bartlett, X2 = 1669.5; gl = 45; p < 0.001), la implementación óptima del análisis paralelo de Horn sugirió la extracción de un único factor, en consonancia con los índices de proximidad a la unidimensionalidad (ECV = 0.86, MIREAL = 0.20).
A modo de conclusión, en esta fase se eliminó el 48 % de los ítems de AN y el 50 % de los ítems de N. Se corroboró que los ítems conservados para cada escala formaron constructos unidimensionales y no presentaron dependencia local. Se obtuvieron evidencias de ajuste al MRG ítem por ítem con el índice S-χ2 así como también se corroboró el ajuste global tanto para AN (M2 = 1183.9, gl = 582, p < 0.001; RMSEA = 0.04) como para N (M2 = 734.2, gl = 395, p < 0.001; RMSEA = 0.04).
Fase 2: Calibración conjunta de los instrumentos
Los 22 ítems retenidos en la depuración de cada escala por separados fueron calibrados conjuntamente. Este análisis demandó una nueva depuración, en principio, por registrar problemas de dependencia local en pares de ítems provenientes de las escalas del AN y N. En este sentido, debieron descartarse dos ítems de AN y un elemento de N. Asimismo, tres ítems fueron suprimidos por evidenciar problemas de ajuste al MRG, dos pertenecientes a AN y dos provenientes de N.
En suma, para esta fase de calibración fueron conservados 16 ítems, 9 de estos de AN y los 7 restantes de N. El AFE aplicado (KMO = 0.92; Prueba Bartlett, X2= 2881.1; gl = 120; p < 0.001) corroboró la unidimensionalidad del constructo (ECV = 0.87, MIREAL = 0.21, implementación óptima del análisis paralelo de Horn) y el χ2LD de todos los pares resultó inferior a 10. Con relación al ajuste del MRG, los S-χ2 obtenidos para los ítems de AN y N mostraron un ajuste satisfactorio (tabla 1). Así también, el análisis de ajuste global registró un índice de adecuado (M2 = 1799.8, gl = 1064, p < 0.001; RMSEA = 0.03).
La tabla 1 reporta los resultados de la calibración conjunta de los 16 ítems retenidos de AN y N. El hecho de que los ítems provenientes de distintos instrumentos sean calibrados conjuntamente habilita la comparación de sus parámetros en virtud de que fueron estimados en la misma métrica. La estimación de los 64 parámetros del MRG requirió de 50 iteraciones para alcanzar el criterio de convergencia de 0.0001. Por cada uno de los reactivos se estimó un parámetro de pendiente (a) y tres parámetros de umbral b (b1, b2 y b3). En tal sentido, el parámetro de b1 es entendido como el valor de umbral (medido en la escala del rasgo) que separa a la categoría En desacuerdo de las categorías superiores (Ligeramente en desacuerdo, Ligeramente de acuerdo y De acuerdo). Es decir, es el mínimo valor del rasgo necesario que requiere el individuo para tener una probabilidad igual o mayor a 0.50 de contestar la opción Ligeramente en desacuerdo (o una superior) en lugar de responder En desacuerdo. El resto de parámetros b de un mismo ítem se interpretan considerando una segmentación acumulativa de la respuesta politómica.
Una inspección de los contenidos de los ítems conservados luego de la depuración muestra que ni la escala N ni la AN se han visto perjudicada su cobertura a pesar de haberse reducido considerablemente. La escala N propone la medición de un dominio unidimensional y ha quedado representada la variedad de emociones negativas que describen a este constructo. En el caso de AN, al comparar el contenido de los 9 ítems retenidos se observa que las subdimensiones de este dominio aparecen representadas en una proporción similar a la identificada en el constructo original (4 ítems de Labilidad Emocional, 3 ítems de Ansiedad y 2 ítems de Inseguridad/Separación). En conclusión, las tres subdimensiones de la AN aparecen representadas en forma relativamente equitativa tras la reducción del instrumento.
Comparación de los resultados
No se registraron diferencias al comparar las zonas de actuación de los ítems provenientes de estos instrumentos. Ni las comparaciones de los parámetros b2 (U = 29, p = 0.791), ni la de los bprom promedio de los reactivos (U = 31, p = 0.958) fueron estadísticamente significativas en las pruebas U de Mann Whitney. Esto implica que, globalmente, los ítems de AN no se localizaron en niveles del rasgo más elevados que los ítems de N.
Sin embargo, se encontraron diferencias estadísticamente significativas en las amplitudes entre los parámetros b (i.e. b3-b1) de un mismo ítem (U = 10, p = 0.023). Estos resultados evidenciaron entonces que los reactivos pertenecientes a la escala de AN tienden a cubrir una mayor amplitud en el espectro del rasgo que los ítems provenientes de N. Este hallazgo resulta más comprensible al comparar Funciones de Información (FI) obtenidas para cada uno de los conjuntos de reactivos (figura 1). Aunque ambas FI se maximizan en torno a un θ de 0.8, la FI de los ítems de AN alcanza un menor grado de información (4.40) y se mantiene constante en un intervalo más amplio del rasgo latente.
Discusión
La continuidad entre rasgos normales y patológicos es un tema que en la literatura actual ha retomado su relevancia a partir del nuevo modelo dimensional propuesto por el DSM-5 para el estudio de los trastornos de la personalidad. En esta línea el presente trabajo permite aportar evidencia sobre esta hipótesis de continuidad, específicamente respecto al dominio de N y su variante desadaptativa. Al mismo tiempo, contribuye a generar conocimiento sobre esta temática en la población hispanohablante de Latinoamérica.
La depuración realizada en la primera fase permitió garantizar la calidad psicométrica con la que cada una de las escalas mide el constructo para el que fue construida. Se eliminó una gran cantidad de ítems como consecuencia de la aplicación del MRG. Esto se debe a que los supuestos que requiere la TRI tienen un mayor nivel de exigencia que los criterios que son usados por la Teoría Clásica de Test (Muñiz, 2018). Particularmente es común la violación del supuesto de dependencia local en escalas como el IPIP o el PID-5 que incluyen una gran cantidad de ítems redundantes para favorecer el aumento de la consistencia interna (Abal et ál., 2019; Abal et ál., 2010; Reise y Revicki, 2015; Reise y Rodríguez, 2016).
La calibración conjunta de los ítems de las dos escalas con TRI brindó resultados relevantes en dos sentidos. En primer lugar, permitió corroborar la continuidad hipotetizada entre N y AN, en tanto rasgos definidos desde una perspectiva normal y patológica. En segundo lugar, al tomar en consideración la ubicación de los ítems de ambos constructos en un mismo continuo, ofrece información sobre las zonas de actuación de los reactivos de cada instrumento (Krueger et ál., 2011; Reise y Waller, 2009; Walton et ál., 2008).
Si se toma en cuenta que el PID-5 fue construido para medir rasgos desadaptativos en población clínica, cabría esperar que sus reactivos midieran en distintos niveles del rasgo respecto de los que operacionalizan N con el IPIP, el cual se elaboró para población general. Es decir, los ítems del IPIP deberían ubicarse en los niveles medios del continuo que conforman N y AN. No obstante, los resultados de la comparación de los ítems en función de su instrumento de procedencia no reflejaron esta hipótesis. Por el contrario, es notorio el solapamiento encontrado en la ubicación de los ítems provenientes de cada técnica. Esto significa que los ítems de IPIP y PID-5 discriminan en similares niveles del rasgo latente. Consistentemente en diversos estudios se alcanzaron conclusiones idénticas a partir de la comparación de otros instrumentos que también miden rasgos normales y desadaptativos (Samuel et ál., 2010; Suzuki et ál., 2015; Walton et ál., 2008; Widiger y Costa, 2012).
Una posible explicación para este solapamiento se asienta en la selección realizada de las facetas de AN que son representadas en el PID-5. Es considerable la falta de consenso en la formulación teórica de las facetas que componen el dominio de AN (Watters y Bagby, 2018). Facetas como Tendencia depresiva, Desconfianza, Afectividad restringida y Hostilidad tienen una vinculación teórica relevante con la AN, pero fueron desestimadas por sus asociaciones con otros dominios desadaptativos del FFMPD (Watters et ál., 2019). Esta delimitación podría haber generado la pérdida de aquellos indicadores más extremos y, en consecuencia, que la versión de AN del PID-5 no esté incluyendo ítems relevantes de los niveles desadaptativos del rasgo para la población local. En efecto, los estudios que usaron instrumentos con contenidos más extremos, como la ideación suicida o la autolesión, sí reportaron diferencias en los niveles en que resultan más precisas cada una de las escalas comparadas (Samuel et ál., 2010; Samuel et ál., 2013). En este sentido, sería conveniente revisar la operacionalización de las facetas que componen la dimensión de AN en la PID-5.
Otra posible interpretación del solapamiento registrado resulta de considerar que los ítems del IPIP estén proporcionando mayor información para la medición de niveles patológicos del rasgo, los cuales corresponderían al PID-5. Como concluyeron Ormel, Riese y Rosmalen (2012), los ítems con que habitualmente se mide N representan el mismo contenido que los instrumentos usados para evaluar sintomatología psicológica, por lo que la diferenciación entre los constructos parece borrosa. A esto se suma que la calibración conjunta realizada en este trabajo derivó en la eliminación de numerosos ítems que presentaron dependencia local, lo que refleja la fuerte semejanza entre los indicadores usados para la medición de N y AN.
Un punto importante para resaltar es la incidencia que podría tener las características inherentes del constructo que conforman N y AN. Diversas investigaciones reportaron dificultades a la hora de encontrar indicadores que logren representar el extremo inferior del dominio y sugieren que, en realidad, podría tratarse de un cuasi-rasgo y no de un constructo con dos polos como se plantea teóricamente (Abal et ál., 2019; Abal et ál., 2019; Gutiérrez et ál., 2017). Tanto las pruebas que miden N (Abal et ál., 2019) como AN (Gutiérrez et ál., 2017; McCrae et ál., 2005) fueron más precisas en la medición de niveles elevados del rasgo dado que registraron variaciones significativas para los puntajes altos, mientras que los puntajes bajos solo reflejan la ausencia de manifestaciones de este (Reise y Waller, 2009). El hecho de no alcanzar una correcta delimitación del polo inferior del constructo (Estabilidad Emocional) podría redundar en una dificultad para reconocer cuáles constituyen los indicadores comportamentales que caracterizarían los niveles medios de N y, consecuentemente, identificar conductas más extremas para definir AN.
El análisis realizado se ha centrado exclusivamente en el estudio de la continuidad entre N y AN aunque el modelo FFM y su variante patológica (FFMPD) incluyen otros cuatro dominios más. Los resultados aquí presentados respecto al solapamiento de los ítems en N y AN podrían no ocurrir en los otros rasgos que componen este modelo. En efecto, otros autores han encontrado diferencias en la localización de los ítems al comparar las versiones normales y desadaptativas de las dimensiones Agradabilidad y Responsabilidad (Samuel et ál., 2010). La decisión de priorizar N por sobre los demás dominios de la personalidad se basa en que ha sido señalado como un constructo clave para la descripción de la personalidad en el ámbito clínico y son justamente estos niveles elevados los que cobran relevancia por su vinculación con trastornos mentales y físicos (Brandes y Tackett, 2019; Jeronimus et ál., 2016; Widiger et ál., 2019). En este sentido, durante los últimos años se ha acumulado evidencia robusta de la asociación existente entre el N y un factor p o factor general de psicopatología propuesto en el modelo de Taxonomía Jerárquica de la psicopatología (Hierarchical Taxonomy of Psychopathology) (Brandes y Tackett, 2019; Kotov et ál., 2017).
En conclusión, los resultados de este estudio corroboran la continuidad entre N y AN, pero parece evidente que los límites entre ambos constructos resultan tan difusos que se presentan indistinguibles. Ahora bien, no es posible determinar si este fenómeno es inherente a las construcciones teóricas subyacentes o a sus respectivas operacionalizaciones. En sus formatos actuales, la escala AN del PID-5 y la escala N del IPIP podrían ser usadas indistintamente para la medición del gradiente entre lo normal y patológico del rasgo.
En cuanto a las limitaciones del presente estudio, en el plano metodológico cabe mencionar que los análisis se realizaron a partir de una muestra de población general. Futuros estudios se encaminarán en la aplicación de los ítems de ambos instrumentos también en población clínica con el fin de evaluar si existe un funcionamiento diferencial de los ítems al ser respondidos por ambos grupos. Asimismo, para descartar el potencial efecto de los instrumentos en las conclusiones sobre la continuidad de los constructos se considerará la inclusión de los ítems pertenecientes a las facetas no contempladas para la operacionalización de la AN con el PID-5. Esto podría ampliar la cantidad de reactivos de AN que se localizan en el extremo superior del continuo. Asimismo, convendría considerar la inclusión de ítems de otros instrumentos para la operacionalización de N, como el NEO-PI-R (McCrae y Costa, 2010).
Se espera que la consecución de esta línea de investigación no sólo contribuya a clarificar las relaciones existentes entre el N y su variante desadaptativa, sino además se desarrollen pruebas más sensibles para la detección de pacientes que presenten niveles de N / AN clínicamente relevantes.