Introducción
Según la Cámara Nacional de la Industria de Restaurantes y Alimentos Condimentados (CANIRAC, 2012), el sector restaurantero en México ostenta el segundo lugar como proveedor de empleos en México. De acuerdo con los datos que este organismo provee, este sector genera un total de 4,5 millones de empleos directos e indirectos, contribuyendo con el 12,5% del PIB dentro de la industria del turismo, así como el 1,4% con respecto al PIB nacional de México (CANIRAC, 2012).
Dada la importancia, tanto económica como cultural, de la industria restaurantera en México, este estudio se enfoca en el desarrollo minucioso de un instrumento para medir el desempeño del servicio en restaurantes de asistencia a mesa (más adelante se aclarará la diferencia entre calidad en el servicio y desempeño en el servicio). Se decidió no partir de instrumentos previamente diseñados como el DINESERV (Stevens, Knutson y Patton, 1995) y el DinEx (Antun, Fras, Costen y Runryan, 2010), ni de los propuestos por Weiss, Feinstein y Dalbor (2004), Kim y Han (2008), Heung y Ngai (2008), Kim, Joung, Yuan, Wu, y Chen (2009) y Chang, Chen, Hsu y Kuo (2010), con el propósito de identificar particularidades que pudieran no haberse contemplado en escalas anteriores. Este trabajo inicia con una revisión de conceptos relevantes relacionados con la medición de calidad y de desempeño en el servicio y, posteriormente, presenta el desarrollo de dicha escala, desde las exploraciones preliminares hasta las pruebas empíricas para confiabilidad y validez. Finalmente, se presentan los reactivos que componen la Escala Mexicana de Calidad en el Servicio en Restaurantes (EMCASER).
La contribución académica de este trabajo radica en la identificación de factores que componen, en el contexto mexicano, la noción de calidad en el servicio en restaurantes, así como en el ofrecimiento de una escala para la medición de esta. La contribución práctica radica en que este instrumento podrá ser utilizado por dueños y gerentes de restaurantes para identificar puntos específicos del servicio que pudieran mejorarse para impactar favorablemente en la percepción del comensal. Asimismo, podría utilizarse para realizar comparaciones entre marcas de restaurantes, o entre diferentes establecimientos de una misma cadena, y para la detección de fortalezas y debilidades de los restaurantes en la prestación de sus servicios.
Calidad en el servicio
La calidad en el servicio es un concepto que ha sido abordado de diferentes formas, por lo que no existe un consenso sobre su definición (Radomir, Plaias y Nistor, 2012), aunque se ha propuesto como un constructo multidimensional compuesto por diversos componentes o atributos del servicio (Grönroos, 1984; Parasuraman, Zeithaml y Berry, 1985). Estos componentes pueden variar dependiendo del sector de negocios (Ladhari, 2008) o de la cultura (Raajpoot, 2004; Ladhari, 2009; Cui, Lewis y Park, 2003; Fujun, Hutchinson, Li y Changhong, 2007; Etemad-Sajadi y Rizzuto, 2013). Sin embargo, una de las definiciones más aceptadas es la de Parasuraman, Zeithaml y Berry (1988), quienes la definen como "[...] una forma de actitud, relacionada pero no equivalente a la satisfacción, y resulta de la comparación de las expectativas con la percepción de desempeño" (p. 15). Esta definición ha sido la base para muchos otros estudios (Radomir et al., 2012).
El instrumento de medición de calidad en el servicio más citado en la literatura es el SERVQUAL (Parasuraman et al., 1988), que ha sido ampliamente retomado como base para el diseño de otras escalas de calidad en el servicio (Seth, Deshmukh y Vrat, 2005); sin embargo, la aplicabilidad genérica de una misma escala para medir la calidad del servicio en todos los sectores y culturas ha sido cuestionada (Babakus y Boller, 1992; Van Dyke, Kappelman y Prybutok, 1997; Jabnoun y Khalifa, 2005; Akbaba, 2006; Caro y García, 2007). De ahí la importancia de contar con escalas diseñadas particularmente para cada sector y para cada contexto cultural específico.
El interés de medir calidad en el servicio radica en buena medida en que se ha encontrado empíricamente, de forma muy consistente, que la calidad en el servicio es un antecedente importante para la formación de lealtad hacia la marca (Devaraj, Matta y Conlon, 2001; Fullerton y Taylor, 2002; Chao, 2008; Vera y Trujillo, 2009; Ladhari, 2009; Wahyuni y Mulyanto, 2014; Lotayif, 2014).
Calidad en el servicio en restaurantes y su medición
Conceptualmente, se puede considerar que aquello que ofrece un restaurante a un comensal se tiende a ubicar en un punto intermedio de un continuo producto (tangibles) -servicio (intangibles), con referencia a la escala de entidades de mercado propuesta por Shostack (1977). Es decir, aquello por lo que paga el comensal está compuesto por bienes tangibles producidos en la empresa (la comida) y por aspectos intangibles de la entrega del servicio, como la consistencia en el servicio y la atención personal (Jain y Gupta, 2004). De esta forma, a pesar de que los restaurantes son comúnmente considerados como una categoría de servicio, representan un sector donde ambos tipos de componentes pueden tener pesos equiparables en la decisión de compra del consumidor.
Desde hace dos décadas, se han publicado estudios sobre calidad en el servicio en restaurantes. En la tabla 1, se muestran las dimensiones de calidad en el servicio que han sido identificadas en este sector.
La escala más utilizada en la literatura para medir calidad en el servicio en restaurantes es el DINESERV (Stevens et al., 1995), que básicamente es una adaptación del instrumento SERVQUAL para medir calidad en el servicio en restaurantes. El DINESERV fue probado en el contexto mexicano, en donde se hallaron evidencias de ciertos problemas en la escala: se encontró una agrupación factorial de los reactivos distinta a las cinco dimensiones originales, así como indicadores no aceptables de confiabilidad (Trujillo, 2006). Aunque es posible que estos problemas se deban a dificultades en la adaptación al idioma, también es posible que estos resultados obedezcan a que las expectativas de los clientes tienden a variar de acuerdo a distintos valores culturales (Raajpoot, 2004; Etemad-Sajadi y Rizzuto, 2013). Por eso, este estudio plantea el instrumento EMCASER diseñado específicamente para medir la calidad en el servicio en restaurantes en México y para comensales mexicanos.
Proceso de desarrollo de la escala
En la noción original de Parasuraman et al. (1985) sobre medición de calidad en el servicio, se sostiene que por cada atributo de calidad en el servicio se deben contemplar dos reactivos: uno sobre la expectativa del cliente con respecto al atributo (qué espera) y otro sobre el desempeño de ese atributo (qué recibió). La diferencia entre estos dos valores, normalmente conocido como brecha o gap, es a lo que bajo este enfoque se le llama calidad en el servicio. Sin embargo, Cronin y Taylor (1992 y 1994) propusieron que, en lugar de medir las brechas, se midiera solo el desempeño, y a esta adaptación se le llamó SERVPERF (de service performance). Esta medición ha demostrado ser una forma más válida de medir la calidad en el servicio (Brady, Cronin y Brand, 2002; Carrillat, Jaramillo y Mulki, 2007; Radomir et al., 2012), por lo que la EMCASER fue diseñada bajo la propuesta de medir el desempeño de los atributos (Cronin y Taylor, 1992), no la brecha entre expectativas y desempeño (Parasuraman et al., 1988).
Fase preliminar para la detección de atributos relevantes del servicio
En una primera fase del estudio, se realizaron entrevistas a profundidad a gerentes de restaurantes con servicio a mesa (8) y a comensales que acostumbran comer en un restaurante de servicio a mesa por lo menos cuatro veces al mes (24). Los comensales seleccionados no tenían que haber acudido a los restaurantes de los gerentes entrevistados, es decir, fueron procedimientos independientes. Tanto los gerentes como los comensales fueron seleccionados mediante conveniencia, recurriendo a redes de conocidos. La alta consistencia y similitud de la información obtenida entre las diferentes entrevistas realizadas hicieron considerar que no hacía falta llevar a cabo un mayor número de estas.
Las entrevistas se condujeron con base en tópicos encaminados a explorar cuáles son las características clave que toman en cuenta los comensales de un restaurante de servicio a mesa para hacer una evaluación general de este y considerarlo si es o no un servicio de "calidad". Posteriormente, se retomaron los atributos de calidad en el servicio en restaurantes identificados en la tabla 1, para corroborar la inclusión de estos atributos en la escala. Por último, se recurrió a preguntas que permitieran a los entrevistados manifestar de forma libre nuevos atributos no contemplados previamente en la literatura, lo que permitió encontrar atributos que fueran específicamente importantes para comensales mexicanos y, con ello, darle mayor originalidad a la escala aquí presentada.
En el análisis se extrajeron los atributos clave para cada persona entrevistada, para después compararlos entre las distintas entrevistas. Esto permitió eliminar atributos que fueron mencionados aisladamente y detectar otros que sí fueron mencionados consistentemente. Una vez identificados todos los atributos, fue muy notoria una primera separación de estos en dos tipos: atributos tangibles y atributos intangibles. Estos dos grupos se pueden ver respectivamente en la tabla 2 y en la tabla 3. Esta división en elementos tangibles e intangibles es consistente con lo encontrado en otros instrumentos de medición de calidad y desempeño del servicio (Jain y Gupta, 2004).
Dado el número de atributos detectados bajo cada grupo, se determinó hacer esta separación en las pruebas empíricas, de manera que se desarrollaron dos subescalas: una de atributos tangibles, que dio ciertas dimensiones, y otra de atributos intangibles, que proporcionó otras dimensiones. Estas subescalas se fueron desarrollando paralelamente, por lo que se puede decir que el EMCASER está compuesto por dos baterías de reactivos que se aplican simultáneamente.
Metodología y pruebas preliminares
Por cada atributo de calidad en el servicio incluido en las tablas 2 y 3 se formularon tres reactivos, con el fin de lograr mediciones confiables y de validez aceptables a través de las pruebas empíricas, esto es: se tiene confiabilidad si los tres reactivos muestran grados altos de asociación estadística; al correlacionarlos, indican que están midiendo lo mismo: si los tres reactivos fueron redactados de forma aislada, pero con el propósito de medir la misma variable (atributo), se tienen evidencias de que se está midiendo lo que se quiere medir (confiabilidad). El hecho de que los reactivos de un mismo atributo correlacionen en alto grado también es indicador de validez convergente. Para su validez, estos tres reactivos relacionados al mismo atributo deben mostrar una baja asociación estadística hacia otros reactivos redactados para medir otros atributos. De esta forma se puede decir que se está midiendo algo distinto que lo que se mide con otros reactivos (validez discriminante).
En cada prueba piloto se pidió a comensales de restaurante de servicio a mesa que respondieran a cada una de las subescalas (tangibles e intangibles). Para darle mayor validez a la medición, los cuestionarios se suministraron al final de la experiencia de consumo. Aquí debían evaluar precisamente al restaurante en el que acababan de comer. Para lograrlo, se recurrió a los gerentes de los restaurantes participantes, pidiendo su autorización para realizar el levantamiento de información; a cambio, se les ofreció contar con los resultados de las evaluaciones de calidad en el servicio que habían hecho los comensales de su restaurante.
Los criterios para incluir un restaurante en la prueba es que debían ser restaurantes de servicio a mesa propiamente (no comida rápida, ni fonda, entre otras) y legalmente establecidos. Se evitaron restaurantes de cadenas de marcas altamente conocidas para evitar, en la medida de lo posible, la afectación de la imagen y el reconocimiento de la marca en las evaluaciones de los comensales.
Por otro lado, los comensales que participaron en el estudio debían ser adultos económicamente independientes y que asistieran a comer a un restaurante de servicio a mesa por lo menos cuatro veces al mes. Ellos debían haber pagado el servicio de su propio dinero y estar comiendo ahí por elección propia o en conjunto con las otras personas. Si los comensales iban en grupos de dos o tres personas, solo podía participar uno de ellos; si iban en grupos de tres o más personas, solo podían participar dos. Esta precaución se tuvo para evitar influencia excesiva de variables desconocidas atribuibles a la pertenencia del comensal a grupos sociales muy particulares.
Para ir corrigiendo los reactivos de la escala, se recurrió a varias pruebas empíricas preliminares o pruebas piloto (tablas 4 y 5). En cada prueba empírica se testearon por separado ambas subescalas (tangibles e intangibles) y con los resultados de cada prueba empírica se realizaron análisis factoriales. Cada análisis factorial se llevó a cabo con rotación de tipo varimax, adecuado para este tipo de pruebas, ya que sus algoritmos buscan maximizar la dispersión de los reactivos en los diferentes factores subyacentes obtenidos. Si los tres reactivos que pretenden medir el mismo atributo son adecuados, se espera que estos se junten en un mismo factor. De forma ideal, se esperaría que el análisis factorial arrojara tantos factores subyacentes como atributos se tenían planteados originalmente. En muchos casos no se encontró una separación perfecta debido a que muchos de los atributos no son independientes entre sí, esto es: hay atributos que pueden tener una asociación estadística natural que no permita la separación, sino que ambos atributos se junten en una sola dimensión. Por ejemplo, aunque "higiene de los alimentos" es en origen un atributo distinto a "apariencia del platillo", si un comensal percibe que hay poca higiene en los alimentos, es esperable que no tenga una percepción favorable de la apariencia del platillo. De esta forma, el análisis factorial permite, adicionalmente, identificar las dimensiones en las que se agrupan los atributos -por lo tanto, las dimensiones del instrumento-. En total, se reportan los hallazgos de cuatro pruebas preliminares (piloto). Los resultados de cada piloto se pueden ver en la tabla 4 para la subescala de atributos intangibles y en la tabla 5 para la de atributos tangibles.
Conforme fueron avanzando las pruebas piloto, se fue incrementando en cada una el número de restaurantes participantes, esto es: en las primeras pruebas piloto los comensales provenían de un número reducido de restaurantes distintos, mientras que en las últimas se recurrió a una amplia variedad de restaurantes. Esto se hizo con el propósito de mantener al principio controlada la variabilidad proveniente del número de restaurantes. Inicialmente, se esperaba mucha variabilidad por la inmadurez de los reactivos. Ampliar el número de restaurantes en las últimas pruebas permitió verificar que se tenía estabilidad en las mediciones a pesar de esta diversidad. Los resultados de cada prueba empírica se utilizaron para determinar si el contenido de cada reactivo era adecuado, y así se fueron corrigiendo las redacciones de los reactivos para lograr que cada uno midiera lo que pretende medir (confiablidad). Como se puede ver en las tablas 4 y 5, con las correcciones realizadas a los instrumentos después de cada prueba, se logró obtener mejores resultados en cuanto a criterios de validez y fiabilidad estadística; así, en estas tablas, se explica cómo se fueron obteniendo mejores agrupaciones de los reactivos que debían medir la misma variable, mediante análisis factoriales con rotación varimax, como una forma de medir validez de convergencia. Así mismo, en las mismas tablas se muestran cómo, a través de las pruebas, fueron incrementándose los coeficientes del alfa de Cronbach como indicadores de fiabilidad estadística.
La prueba final
Para mostrar tanto la validez convergente como la validez discriminante y la fiabilidad alcanzada en los reactivos mediante las pruebas piloto, se llevó a cabo una prueba final. Esta constó de una muestra de 111 comensales de restaurantes (seleccionados bajo los mismos criterios ya descritos). A ellos se les pidió que respondieran el instrumento completo (las dos subescalas integradas en el mismo cuestionario). Los datos obtenidos se procesaron mediante dos análisis factoriales, uno por cada sub-escala. Estos mismos análisis factoriales se utilizaron para mostrar las dimensiones resultantes en ambas subescalas. Para verificar la fiabilidad de cada subescala, se utilizó la prueba alfa de Cronbach, considerado un coeficiente altamente confiable como prueba de consistencia interna entre reactivos (Gliem y Gliem, 2003). El alfa de Cronbach debe dar un resultado superior a α = 0,70 para considerar que se tiene una fiabilidad aceptable; valores superiores a α = 0,80 indican una fiabilidad buena, y valores superiores a α = 0,90 indican una fiabilidad excelente (Darren y Mallery, 2003; Gliem y Gliem, 2003).
Resultados
Resultados de la prueba final subescala intangibles
En la tabla 6 se muestra la agrupación de reactivos en factores subyacentes para los atributos denominados aquí como intangibles. Se puede apreciar que se obtienen con nitidez ocho factores. Los tres reactivos por cada atributo tienden a converger en el mismo factor a excepción de los reactivos para los atributos iluminación, empatía y conocimiento. En el caso de estos tres atributos, solo dos de los reactivos respectivos convergen. Los reactivos para rapidez, estandarización, empatía (2), conocimiento (2) y cumplimiento convergen en el mismo factor. Todos estos atributos tienen relación con el personal. Por otra parte, los atributos sobre el lugar físico (temperatura del restaurante y aroma del restaurante) convergen en el mismo factor. Música ambiental y presentación del personal convergen en otro factor. Los reactivos sobre los atributos autoidentificación, prestigio, iluminación y atención a quejas convergen claramente en su propio factor, formando factores unidimensionales. Los reactivos sobre recepción se unen notoriamente en un factor; sin embargo, tienen una ligera carga de otros dos reactivos (uno de personal presentable y otro de empatía). En la tabla 6 también se puede apreciar un resultado factorial lo suficientemente nítido como para aceptar estos reactivos de aspectos intangibles de la calidad en el servicio.
Nota. Reducción de 42 reactivos a 8 componentes principales que explican el 78% de la variabilidad original. Rotación varimax. Rotación converge en 8 iteraciones. n = 111.
Fuente: elaboración propia.
Con respecto a la confiabilidad de los reactivos en esta subescala, la mayoría de los que fueron diseñados para medir el mismo atributo se conjuntaron en un mismo factor. En los casos de los reactivos de los atributos empatía y conocimiento, solamente dos reactivos se juntan en un mismo factor; en cada caso uno de los reactivos queda contenido en un factor distinto.
Resultados de la prueba final subescala tangibles
En relación con los reactivos para los atributos tangibles, en la tabla 7 se puede ver que convergen en nueve factores. Se obtienen siete factores unidimensionales donde se conjuntan reactivos de un solo atributo: opciones de pago, estacionamiento, temperatura de la comida, variedad de platillos, consistencia en el servicio, tamaño del platillo y ubicación del restaurante. Se obtiene un factor que agrupa los atributos frescura de los alimentos, higiene de la comida, olor de la comida, apariencia del platillo (apetecible) y sabor de la comida. Se genera un factor que conjunta a los reactivos de los atributos lo confortable del mobiliario y el aspecto del lugar. En el factor tamaño del platillo solo se cargan dos de los reactivos desarrollados para medir este atributo. Aunque aparecen cargas factoriales aisladas de algunos de los reactivos en otros factores, estas tienden a ser bajas (mostrando algunos problemas ligeros de separabilidad); en términos generales, se aprecia un resultado factorial con suficiente nitidez como para argumentar la validez tanto convergente como discriminante de los reactivos.
Nota. Reducción de 45 reactivos a 9 componentes que explican el 83% de la variabilidad original. Rotación varimax. Rotación converge en 11 iteraciones. n = 111.
Fuente: elaboración propia.
Para referirse a la confiabilidad alcanzada en los reactivos de la subescala de aspectos tangibles de la calidad en el servicio, en la tabla 7 también se puede apreciar que solo los reactivos para el atributo tamaño del platillo no se agruparon en un mismo factor. Uno de los reactivos quedó por fuera del factor respectivo. En todos los demás casos, los tres reactivos de cada atributo sí se conjuntan en un mismo factor (tienden a medir lo mismo). El que los reactivos de algunos de los atributos quedaran asociados al mismo factor implica la no independencia de estos atributos; en otras palabras, correlacionan a tal grado que con el análisis factorial, utilizando inclusive el método de rotación varimax, no se separaron. Si se observa el factor 1 en la tabla 7, se observa que se conjuntan atributos como frescura, olor e higiene de los alimentos, aunque en principio fueron distintos atributos detectados. Se puede entender por qué se juntan: si la comida no se percibe fresca y de buen olor, es natural pensar que el cliente lo asocie con falta de higiene. Esto permite darle una interpretación amplia a la dimensión resultante, así como entender cómo se interrelacionan diferentes aspectos en la percepción del cliente.
Análisis de confiabilidad
Para corroborar la fiabilidad de las subescalas, se recurrió a tres pruebas: una que mide la confiabilidad general mediante la consistencia en la variabilidad de los reactivos (alfa de Cronbach) y dos (Sperarman-Brown y Guttman) sirven para detectar inestabilidad de los reactivos. Los resultados que se pueden ver en la tabla 8 indican que se tienen indicadores muy buenos tanto de fiabilidad como de estabilidad en cuanto a lo que los reactivos miden (Darren y Mallery, 2003; Gliem y Gliem, 2003). Las pruebas de consistencia interna de mitades divididas como Sperman-Brown, y Guttman son útiles cuando la escala contiene dimensiones múltiples (Hair, Bush y Ortinau, 2010) como en este caso. En la mayoría de los casos, todos los coeficientes de constancia interna comienzan a considerarse satisfactorios a partir de valores de 0,60 hacia arriba (Hair et al., 2010).
Reactivos finales
Se desarrollaron tres reactivos por cada atributo (por confiabilidad y validez, como ya se explicó), pero para hacer más fácil la aplicación de la escala es recomendable usar un solo reactivo por cada atributo. Para seleccionar el mejor reactivo por atributo, se realizaron análisis factoriales, introduciendo en cada análisis los tres reactivos del mismo atributo. La tabla de cargas factoriales permitió identificar dos cosas: 1) si los reactivos se juntan en un mismo factor, lo que permite confirmar la validez convergente - que miden lo mismo-, y 2) cuál es el reactivo con la mayor carga dentro del factor. Las cargas factoriales son correlaciones entre los atributos y el factor resultante. En todos los casos los conjuntos de tres reactivos se agruparon en un mismo factor con cargas altas (0,80 o mayor). Se decidió así seleccionar el reactivo que generó en cada caso la carga más alta. Estos reactivos finales (afirmaciones para escalas de actitud) pueden verse en las tablas 9 y 10.
En todas las pruebas preliminares, así como en la prueba final, los reactivos usados en los cuestionarios se asociaron a escalas de Likert de cinco categorías que se leen como sigue: totalmente de acuerdo, de acuerdo, indiferente, en desacuerdo y totalmente en desacuerdo. Adicionalmente cada una de estas categorías de respuesta se asoció a valores numéricos de 5 a 1 respectivamente, forma en la que se recomienda que sean aplicados los reactivos en estudios futuros con la EMCASER.
Dimensiones subyacentes
Para determinar las dimensiones subyacentes que componen el EMCASER, se realizó una aplicación del instrumento ya con los reactivos finales. La muestra fue de 162 comensales de restaurantes de servicio a mesa seleccionados bajo mecanismos similares a las pruebas piloto. La muestra de comensales se dividió equitativamente en cuatro restaurantes distintos que no pertenecían a alguna cadena. El cuestionario utilizado presentó por separado las baterías de reactivos de las subescalas (intangibles y tangibles). Finalmente, se realizaron análisis factoriales para determinar la agrupación de los atributos en cada subescala.
En la tabla 11 se muestra el resultado del análisis factorial para la subescala de atributos intangibles. Como se puede observar, se presenta una solución factorial con dos dimensiones: aseguramiento (cumplimiento) y ambiente. En la primera se agrupan principalmente aspectos básicos del servicio relacionados al personal. La segunda dimensión agrupa principalmente aspectos sobre el entorno como el olor, la música y la temperatura ambiente. Sin embargo, de forma menos clara quedan agrupados en esta segunda dimensión los atributos de conocimiento del personal y rapidez en el servicio (con cargas bajas), dos atributos que se hubieran esperado que se conjuntaran en la primera dimensión.
Nota. Matriz de componentes rotados con rotación varimax. Solución forzada a dos componentes. Tres componentes originales de forma no forzada. La rotación convergió en tres iteraciones. n = 162. Total de varianza explicada: 56%.
Fuente: elaboración propia.
En la tabla 12 se observa que los atributos tangibles se conjuntaron en tres dimensiones, que por su contenido se nombraron comida, instalaciones y conveniencia.
Nota. Matriz de componentes rotados con rotación varimax. La rotación convergió en cinco iteraciones. n = 162. Total de varianza explicada: 58%.
Fuente: elaboración propia.
De esta forma, los 29 atributos de la EMCASER se agrupan en cinco dimensiones. Como las dimensiones provienen de dos procedimientos de análisis factorial distintos, es de esperarse que no haya total ortogonalidad entre las dimensiones de los aspectos intangibles y las dimensiones de aspectos tangibles.
En la tabla 13 se muestran las correlaciones entre las cinco dimensiones. Evidentemente, al utilizarse rotación varimax, que es un método que asegura ortogonalidad, las dimensiones dentro de cada subescala correlacionan cero. Sin embargo, se dan correlaciones bajas a moderadas entre las dimensiones de las distintas subescalas.
Nota. * Correlación significativa al nivel 0,05. ** Correlación significativa al nivel 0,01. n = 162
Fuente: elaboración propia.
La correlación más alta (r = 0,44) se da entre la dimensión de instalaciones y la de ambiente. Esta relación se entiende consistente, ya que ambas dimensiones hacen referencia al entorno del restaurante: una desde una perspectiva de intangibles y otra desde una perspectiva de tangibles.
Aunque la correlación entre estas dos dimensiones tiene significancia estadística, no es lo suficientemente alta como para presumir que son parte de una sola dimensión.
Relación de las dimensiones con opinión general, satisfacción e intención
En el mismo levantamiento de datos que en la sección anterior (n = 162), se incluyeron en el cuestionario reactivos para medir tres variables en las que la EMCASER puede tener alguna incidencia. Esto permite, por un lado, examinar un aspecto adicional de la validez de la escala y, por otro, introducirse al análisis de la relación entre la calidad en el servicio en restaurantes y la percepción general de los comensales hacia el mismo. Las tres variables fueron: opinión general hacia la calidad en el servicio del restaurante, satisfacción del cliente e intención de recomendar el restaurante. Cada una de estas variables fue medida a través de un único reactivo en forma de escala de actitud de cinco categorías que van de totalmente de acuerdo a totalmente en desacuerdo, en congruencia con el resto de los reactivos del cuestionario. Las afirmaciones de estos reactivos pueden verse en la tabla 14.
Para mostrar la relación entre las dimensiones de calidad en el servicio de la escala con las variables de opinión, satisfacción e intención, se realizaron análisis de regresión. Para ello, se elaboraron tres modelos, uno por cada variable dependiente, cuyos resultados se pueden ver en la tabla 15.
En términos generales, las dimensiones de la escala muestran una relación positiva con las variables dependientes. Asimismo, estas dimensiones tienden a generar un grado de explicación considerable sobre tales variables. No en todos los casos todas las dimensiones muestran una relación significativa con todas las dependientes. Pero cada una de las dimensiones muestra al menos una relación significativa con alguna de estas variables dependientes. Por ejemplo, la dimensión aseguramiento del servicio tiene los coeficientes más altos para explicar tanto la opinión general como la satisfacción y, al mismo tiempo, no logra un coeficiente significativo para explicar la intención de recomendar. Comida es la dimensión que se mantiene con coeficientes significativos de forma más clara como elemento explicador de las tres variables dependientes planteadas.
Dado que las variables dependientes utilizadas en los modelos de regresión lineal tienen un nivel de medición ordinal, se determinó realizar análisis de regresión logística ordinal para confirmar los resultados. Este tipo de análisis sería más adecuado, dado el nivel de medición de las tres variables dependientes (Long y Freese, 2006).
Adicionalmente, pudiera haber dudas sobre la existencia de una relación lineal entre las variables de la calidad del servicio con variables relacionadas a la satisfacción y a la lealtad de los clientes, lo que también le daría pertinencia al uso de análisis de regresión ordinal (Long y Freese, 2006). Así, se realizaron tres modelos de regresión ordinal siguiendo la misma idea que en los modelos de regresión lineal. De esta manera, se introdujeron los cinco factores de calidad en el servicio mostrados en las tablas 11 y 12 como variables independientes, y las variables mostradas en la tabla 14 como variables dependientes (opinión, satisfacción e intención).
En la tabla 16 se muestran los resultados de los análisis de regresión ordinal para cada una de las variables dependientes. En general, todos los modelos pasan las pruebas estadísticas para ser aceptados. Solo el modelo 6, referente a la intención de recomendar, no pasa una de las dos pruebas de bondad de ajuste de los datos al modelo. También, en general, los resultados de las regresiones ordinales tienden a confirmar los de los análisis de regresión lineal que se muestran en la tabla 15: todas las dimensiones de la calidad del servicio en restaurantes (variables independientes) tienden a tener un efecto positivo significativo en algunas de las variables dependientes del desempeño; conveniencia no muestra un efecto significativo hacia la opinión general; aseguramiento y ambiente no muestran un efecto significativo hacia la intención de recomendar. Con respecto al grado de explicación sobre las variables dependientes, los coeficientes r2 de determinación (que en regresión ordinal se tienen de tres tipos) muestran un comportamiento variado, en algunos casos se obtienen coeficientes más elevados que los coeficientes de determinación de los análisis de regresión lineal y, en otros casos, coeficientes menos elevados.
Nota. Ajuste del modelo: Prueba χ2 para determinar que existe efecto de las variables independientes (debe ser significativa). Bondad de ajuste Pearson: prueba para determinar si los datos se ajustan al modelo (debe ser no significativa). Bondad de ajuste Deviance: prueba para determinar si los datos se ajustan al modelo (debe ser no significativa). r2 C&S: coeficiente r2 de Cox y Snell para determinar grado de explicación sobre la dependiente (0 a 1; .5 ≈ 50%). r2 N: coeficiente r2 de Nagelkerke para determinar grado de explicación sobre la dependiente (0 a 1; .5 ≈ 50%). r2 Mc: coeficiente r2 de McFadden para determinar grado de explicación sobre la dependiente (0 a 1; .5 ≈ 50%). Parallel: prueba de líneas paralelas para determinar igualdad de explicación sobre los valores (debe ser no significativa).
*Significancia a 0,05. ** Significancia a 0,01. n = 162.
Fuente: elaboración propia.
Discusión y conclusiones
La EMCASER propone la medición de 29 atributos (14 intangibles y 15 tangibles). De esta forma, este instrumento final estaría conformado por un total de 29 reactivos, que se presentan en las tablas 9 y 10. Así, quedarían 14 reactivos para la subescala de aspectos intangibles y 15 para la de atributos tangibles. Si se desea utilizar este instrumento en estudios futuros, se sugiere asociar cada uno de estos reactivos a escalas de actitud que vayan de totalmente de acuerdo a totalmente en desacuerdo.
En comparación con otras mediciones propuestas para restaurantes (tabla 1), la EMCASER enfatiza más los atributos tangibles (tabla 10). Este mayor número de atributos se considera relevante debido a la naturaleza del servicio de restaurantes a mesa que, como se argumentó, se ubica en un punto intermedio entre servicio y producto. Se puede interpretar que los enfoques anteriores ubican a este sector más como un servicio, razón por la cual probablemente definieron la mayoría de sus dimensiones sobre aspectos intangibles.
Como el DINESERV (Stevens et al., 1995) es una escala basada directamente en las dimensiones del servqual (Parasuraman et al., 1988), involucra conceptos genéricos de calidad en el servicio (no específicos sobre este tipo de negocio), como el aseguramiento, la empatía, la confiabilidad, la respuesta y los tangibles. Se puede ver en las tablas 11 y 12 que estos aspectos son retomados en el EMCASER, tanto en los atributos que incluye como en las dimensiones que los agrupan; sin embargo, esta nueva escala abarca aspectos muy específicos del sector de restaurantes de servicio a mesa.
Como ya se ha mencionado, las dos subescalas (tangibles e intangibles) fueron desarrolladas de forma paralela. Cada una se divide estadísticamente en dimensiones que se pueden ver en las tablas 11 y 12. En estudios anteriores sobre calidad del servicio en restaurantes ya se ha hecho la separación de aspectos tangibles (Stevens et al., 1995; Cheng, 2005). Sin embargo, debe mencionarse que la separación entre aspectos tangibles e intangibles viene más bien de una idea conceptual sobre la naturaleza de los atributos que componen la calidad del servicio que de dimensiones estadísticamente separables. Como se puede ver en la tabla 13, hay cierta correlación entre las dimensiones de ambas subescalas, lo que implica que lo tangible y lo intangible no es estocásticamente separable de forma perfecta, sobre todo cuando los atributos tangibles han sido tan ampliamente desarrollados en comparación a estudios anteriores. Al correr análisis factoriales combinando los ítems de ambas subescalas, aunque hay cierta separación, algunos atributos tangibles se integran a algunos factores mayoritariamente intangibles y viceversa. De esta forma, es discutible la existencia de lo tangible y de lo intangible como aspectos enteramente separables, de manera que aquí se admite como una limitante del estudio esta separación con la que se ha fundamentado este trabajo. No obstante, esta separación un tanto arbitraria sirvió en el presente estudio como elemento de organización del trabajo de clarificación sobre la naturaleza de lo que se quería medir, tratando de separar aspectos más concretos -como la comida o las instalaciones (tangibles)- de aspectos más subjetivos -como la empatía y el prestigio (intangibles)-.
La EMCASER puede ser utilizada en el futuro no solo con propósitos de investigación académica, sino también en la detección minuciosa de problemas en la atención a clientes por parte de la gerencia de restaurantes de servicio a mesa, por su amplio espectro de atributos.
Para efecto de estudios a futuro, en este trabajo se han ofrecido evidencias de que las dimensiones de calidad en el servicio que componen la EMCASER pueden tener un efecto explicativo sobre otro tipo de variables relevantes, como los indicadores generales del desempeño de un restaurante. Así, se podrían realizar estudios utilizando las variables del EMCASER asociándolas a variables dependientes y moderadoras relacionadas, por ejemplo, a involucramiento y bienestar de un cliente específico, como proponen Kim, Jeon y Hyun (2012).
Con respecto a un uso generalizado del instrumento, se debe tener en cuenta que la presente escala fue desarrollada con clientes y restaurantes de Ciudad de México. Sin embargo, la escala puede ser aplicable en general para clientes de restaurantes con servicio a mesa en otras localidades, inclusive en otros países, sin dejar de realizar pruebas preliminares para verificar la confiabilidad y la validez de la escala en ese nuevo ámbito. Cabe aclarar que las pequeñas variaciones en el uso de lenguaje por localidad o por país podrían hacer que algunos reactivos no se entendieran de la misma forma en lugares diferentes a la población para la que se desarrolló la escala, por lo que su aplicación en países que no sean de habla hispana podría requerir una adaptación mayor de los reactivos más allá de una simple traducción. Como ya se ha dicho, la EMCASER es válida para el sector de restaurantes de servicio a mesa, lo que excluye a otros servicios de restaurantes y comida, como negocios de comida rápida, o de entrega de comida a domicilio.
De cualquier forma, se ofrece la EMCASER para que otros académicos y practicantes puedan utilizarlo como un instrumento de medición que ya ha dado evidencias empíricas de validez y confiabilidad. Los autores del presente artículo otorgan el consentimiento para que los reactivos sean usados por otros; solamente se solicita, por un lado, ser propiamente reconocidos y citados como los autores de la escala y, por otro, que los estudios que se realicen se apeguen a los principios y códigos de ética para investigación con personas.