Regresión logística: modelos y métodos

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. La regresión logística y análisis discriminante se utilizan cuando es necesario diferenciar claramente los encuestados categorías específicas. Además, estos grupos son un solo niveles de los parámetros univariados. а также выясним, для чего она нужна. Examinar más detalladamente modelo de regresión logística, así como averiguar qué era.

visión de conjunto

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Un ejemplo del problema, en la solución que se utiliza la regresión logística, puede ser una clasificación de los encuestados mediante la compra de grupo y no comprar la mostaza. La diferenciación se realiza de acuerdo a las características socio-demográficas. Estos incluyen, en particular, incluyen la edad, el género, el número de miembros de la familia, los ingresos y así sucesivamente. Hay criterios para diferenciar y la variable en la operación. El último codifica la categoría objetivo para el que, de hecho, la necesidad de dividir los encuestados.

matices

, значительно уже, чем для дискриминантного анализа. Hay que decir que el rango de casos en los que la logística de regresión aplicadas, mucho más estrecho que el análisis discriminante. En este sentido, se considera el uso de este último como un método universal para la diferenciación más preferido. Por otra parte, los expertos recomiendan comenzar con un análisis discriminativo estudio de clasificación. Y en caso de incertidumbre de los resultados se puede utilizar la regresión logística. Esta necesidad es causada por varios factores. используется при наличии четкого представления о типе независимых и зависимых переменных. La regresión logística se utiliza cuando hay una idea clara sobre el tipo de variables independientes y dependientes. En consecuencia, el seleccionado uno de los 3 procedimientos posibles. Cuando el análisis discriminante, el investigador está siempre tratando con una operación estática. Se trataba de uno variables categóricas dependientes e independientes de varios con la escala de cualquier tipo.

tipos

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. la investigación estadística objetiva, que utiliza una regresión logística, es determinar la probabilidad de que se le asignará un encuestado particular a un grupo en particular. La diferenciación se lleva a cabo de acuerdo con ciertos parámetros. En la práctica, de acuerdo con los valores de una o más independientes factores pueden clasificarse en dos grupos de encuestados. . En este caso, hay una regresión logística binaria. También parámetros especificados se pueden utilizar en la asignación al grupo es mayor que dos. En tal situación, hay una regresión logística multinomial. El grupo resultante expresó niveles de cualquier variable.

ejemplo

Supongamos que hay respuestas de los encuestados a la pregunta de si están interesados en una oferta para adquirir la tierra en las afueras de Moscú. En este caso, las opciones son "no" y "sí". Tenemos que averiguar qué factores tienen una influencia predominante sobre la decisión de los compradores potenciales. Por esta encuestado se hacen preguntas acerca de la infraestructura del territorio, la distancia a la capital, la superficie terrestre, la presencia / ausencia de edificios residenciales y así sucesivamente. El uso de regresión binaria, puede distribuirse en dos grupos de encuestados. El primero incluirá aquellos que están interesados en la compra – los compradores potenciales, y la segunda, respectivamente, los que no están interesados en dicha oferta. Para cada encuestado, además, se calcula la probabilidad de asignación a una u otra categoría.

características comparativas

A diferencia de las dos realizaciones anteriormente consiste en un número y tipo de grupos dependientes y variables independientes diferentes. En una regresión binaria, por ejemplo, estudiado el factor dicotómica dependencia de uno o más independientes condiciones. En este caso, este último puede ser de cualquier tipo de escala. regresión multinomial se considera una especie de versión de la clasificación. Se relaciona con la variable dependiente para más de 2 grupos. Los factores independientes deben tener ya sea una escala ordinal o nominal.

Regresión logística en SPSS

El 11-12 paquete estadístico, introdujo una nueva versión del análisis – secuencia. Este método se utiliza cuando el factor dependiente se refiere al mismo nombre escala (ordinal). En este caso las variables independientes seleccionadas de un tipo particular. Deben ser ordinal o nominal. La clasificación en varias categorías se considera el más versátil. Este método se puede utilizar en todos los estudios que utilizaron la regresión logística. , однако, можно только с помощью всех трех приемов. Mejorar la calidad del modelo, sin embargo, sólo es posible mediante el uso de los tres métodos. la calidad de regresión logística adecuada validación

clasificación ordinal

Se dice que antes en el paquete estadístico no se proporcionó la oportunidad de realizar un análisis especializado típico de los factores dependientes con una escala ordinal. Para todas las variables, con el número de grupos de más de 2 usado opción multinomial. Introducido hace relativamente poco análisis de la secuencia tiene un número de características. Se toman en cuenta las características específicas de la escala de la misma. часто не рассматривается как отдельный прием. Mientras tanto, en los manuales metodológicos de regresión logística ordinal a menudo no es tratada como una recepción separada. La razón es la siguiente: análisis en serie no tiene ninguna ventaja significativa sobre multinomial. El investigador puede muy bien utilizar el último en presencia y ordinal, y variable dependiente nominal. De este modo, el proceso de clasificación son casi indistinguibles entre sí. Esto significa que el análisis de orden de retención no causará ningún problema.

análisis de las opciones

Considere el caso simple – una regresión binaria. Por ejemplo, en el proceso de investigación de la demanda estimada de marketing para los graduados de cierta universidad metropolitana. En el cuestionario, los encuestados se les hicieron preguntas, incluyendo:

¿Estás trabajando? (Ql).
Especificar la graduación del año (q 21).
¿Cuál es la puntuación media de la salida (aver).
Género (q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. La regresión logística evaluará el impacto de los factores independientes aver, q 21 y q 22 en ql variable. En pocas palabras, el propósito del análisis es determinar la probable empleo de los graduados sobre la base de la información en el campo, al final del año, y la puntuación media. indicador de regresión logística sigmoidal

regresión logística

Para establecer los parámetros utilizando regresión binaria, utilice el menú Analyze►Regression►Binary logística. En la regresión logística para elegir en la lista de la izquierda de las variables disponibles factor dependiente. Que es ql. Esta variable debe ser colocado en el campo Dependiente. Después de eso, debe introducir los Covariables sitio factores independientes – Q 21, Q 22, aver. Luego hay que elegir una forma de incluirlos en el análisis. Si el número de factores independientes de más de 2, no utilice el método de administración simultánea de todas las variables, que se instala por defecto, y paso a paso. La manera más popular es considerada hacia atrás: LR. Usando el botón de selección, no se puede incluir en el estudio de todos los encuestados, y sólo una categoría específica de la diana.

Definir variables categóricas

botón categórica a utilizar en el caso de que una de las variables que tiene el número de categorías de más de 2. En esta situación, ventana Definir variables categóricas en la estación categóricas Covariables colocado exactamente esa opción. En este ejemplo, tal variable no se encuentra. Después de que la lista desplegable, seleccione el contraste Desviación elemento y haga clic en el botón Cambiar. Como resultado, algunas de las variables dependientes se generarán a partir de cada uno de los factores nominal. Su número se corresponde con el número de los términos originales de las categorías.

Guardar variables nuevas

Utilice el botón Guardar en el estudio principal está configurado para crear cuadro de diálogo nueva configuración. Contendrán números calculados en el proceso de regresión. En particular, es posible crear variables que determinan:

La pertenencia a una categoría particular de clasificación (Groupmembership).
La probabilidad de la clasificación de los encuestados en cada grupo de estudio (probabilidades).

Cuando se utiliza el botón Opciones investigador no recibe ningún oportunidades significativas. En consecuencia, puede ser ignorada. Después de pulsar el botón "OK" en la ventana principal se mostrarán los resultados del análisis. coeficiente de regresión logística

El control de calidad de la adecuación de regresión logística

Tenga en cuenta los coeficientes de mesa Ómnibus Testsof Modelo. Muestra los resultados del análisis de la calidad del modelo de aproximación. Debido al hecho de que la opción incremental, que necesita para ver los resultados de la última etapa (Paso 2) se ha establecido. Sería considerado un resultado positivo, en el que el aumento detectado índice de Chi-cuadrado en la transición a la siguiente etapa en un alto grado de significancia (Sig. <0,05). La calidad del modelo se estima en línea Modelo. Si se obtiene un valor negativo, pero no se considera significativa si el modelo global de alta importancia relativa, la última se puede considerar prácticamente utilizable.

tablas

Resumen del modelo proporciona una estimación del índice de dispersión total, que describe el modelo construido (figura R Square). Se recomienda aplicar el valor Nagelker. indicador positivo se puede considerar como un parámetro Nagelkerke R Square, si es superior a 0,50. Después de que evaluaron los resultados de la clasificación en el que los indicadores reales de pertenecer a una u otra categoría del estudio se comparan con los predichos por el modelo de regresión. Para este propósito la tabla de clasificación mesa. También le permite sacar conclusiones sobre la exactitud de la diferenciación para cada uno del grupo en cuestión. Un modelo de regresión logística . La siguiente tabla hace que sea posible encontrar factores independientes estadísticamente significativos introducidos en el análisis, así como un factor de regresión logística no estandarizado. Sobre la base de estos indicadores puede predecir la afiliación de cada encuestado en la muestra a un grupo específico. Nuevas variables pueden introducirse utilizando el botón Guardar. Que contendrán información sobre la pertenencia a una determinada categoría de clasificación (Predictedcategory) y la probabilidad de inclusión en estos grupos (probabilidades predichas de miembros). Después de pulsar el botón "OK" en la ventana principal aparecerá Regresión logística multinomial resultados del cálculo.

La primera tabla, que contiene indicadores importantes para el investigador, – Modelo Información de ajuste. Un alto nivel de significación estadística se apuntan a la alta calidad y la idoneidad de la utilización de modelos para resolver problemas prácticos. Otra mesa importante es el pseudo R-cuadrado. Se le permite estimar la proporción de la varianza total en el factor dependiente, que es causada por las variables independientes seleccionadas para su análisis. De acuerdo con pruebas de coeficiente de la tabla de probabilidad puede sacar conclusiones acerca de la significación estadística de este último. Los parámetros estimados reflejan los coeficientes no estandarizados. Se utilizan en la construcción de la ecuación. Además, para cada combinación de variables se determina la significación estadística de su impacto en el factor dependiente. Mientras tanto, la investigación de mercado es a menudo necesario diferenciar las categorías de los encuestados no por separado, sino como parte del grupo objetivo. Para este propósito la mesa Observedand frecuencias predichas.

aplicación práctica

método considerado de análisis es ampliamente utilizado en el trabajo de los operadores. En 1991, se desarrolló el indicador sigmoide de regresión logística. Él es una herramienta fácil de usar y eficiente que puede ser utilizado para predecir los precios que probablemente su "recalentamiento". Indicador se presenta en un gráfico en la forma de un canal formado por dos líneas que se extienden en paralelo. Se quitaron la misma distancia de la tendencia. La amplitud de la banda dependerá únicamente en el marco de tiempo. El indicador se utiliza cuando se trabaja con casi todo el activo – a partir de pares de divisas para metales preciosos.

Regresión logística en SPSS

En la práctica, se produjo 2 estrategias clave para el uso del instrumento: ruptura y una reversión. En este último caso, el comerciante se centrará en la dinámica de los cambios de precios dentro del canal. ON es la probabilidad de que el movimiento se inicia en la dirección opuesta cuando se acerca al costo de un soporte o resistencia velocidad de línea. Si el precio es de cerca ajuste al límite superior, entonces el activo puede ser eliminado. Si está en el límite inferior, usted debe pensar acerca de la compra. desglose estrategia implica el uso de órdenes. Se instalan fuera de los límites de la distancia relativamente corta. Teniendo en cuenta que el precio en algunos casos las violan por un corto tiempo, usted debe jugar a lo seguro y fijar el stop-loss. Al mismo tiempo, por supuesto, independientemente de la estrategia elegida requiere que el comerciante para maximizar la frialdad percibir y evaluar la situación que ha surgido en el mercado.

conclusión

Por lo tanto, el uso de regresión logística le permite clasificar de forma rápida y fácilmente los encuestados en categorías de acuerdo con los parámetros especificados. Al analizar el posible uso de una determinada manera. En particular, la versatilidad de diferente regresión multinomial. Sin embargo, los expertos recomiendan el uso de todos los métodos descritos anteriormente en el complejo. Esto se debe al hecho de que en este caso la calidad del modelo será significativamente mayor. Esto, a su vez, ampliar el alcance de su aplicación.