Двоичный логарифм

dvoichniy_logarifm

С помощью двоичного лагарифма можно исследовать зависимость (номинальной) дихотомической  переменной от независимых переменных, имеющих любой вид шкалы.

Как правило, в случае с дихотомическими переменными речь идёт о некотором событии, которое может произойти или не произойти; бинарная логистическая регрессия в таком случае рассчитывает вероятность наступления события в зависимости от значений независимых переменных.

Ø       в список «зависимый» вносим дихотомическую номинальную переменную;

Ø       в список «ковариаты» вносим любые переменные;

Ø       в графе «метод» выбираем метод построения уравнения регресии – вперед LR:

     ввод – включение в регрессионное уравнение всех указаных предикторов независимо от того, имеют они значимое влияние на зависимую переменную или нет;

     вперед LR – пошаговое включение в уравнение предикторов, оказывающих наибольшее воздействие на зависимую переменную, до последнего предиктора, чье влияние окажется значимым;

     назад LR – вначале в уравнение регресии включаются все выбранные предикторы, а затем происходит пошаговое исключение тех предикторов, влияние которых на зависимую переменную оказывается недостаточным согласно установленному критерию…

Если в списке «ковариаты» есть номинальные переменные, необходимо выбрать метод построения уравнения регресии для номинальных переменных в меню «дискретный»:

Ø       в меню «дискретный» в список «котегориальные ковариаты» вносим все номинальные переменные, которые есть в списке «ковариаты». В графе «контраст» выбираем метод построения уравнения регресии для номинальных переменных – отклонение. Подтверждаем метод  кнопкой «заменить»;

Ø       галочки в меню «установки»: графики классификации, корреляции оценок.

Сводка обработки наблюдений

1.       Отобранные наблюдения – наблюдения (респонденты) результаты которых принимают участие в исследовании;

1.1.       Включенные в Анализ – наблюдения (респонденты), где есть ответы на все вопросы (переменные);

1.2.       Пропущенные наблюдения – наблюдения (респонденты), где нет ответов на все вопросы (переменне);

1.3.       Итого – общее количество наблюдений (респондентов) принимающих участие в исследовании;

2.       Не отобранные наблюдения – наблюдения, не принимающие участие в исследовании;

3.       Итого – общее количество наблюдений (респондентов).

Кодировка зависимой переменной

Перекадировка для зависимой переменной происходит автоматически. Числа переменной меняются на 0 и 1, однако, значение чисел исспользуемых в дихотомической зависимой перемнной не меняються.

Кодировки категориальных переменных

Для независимых номинальных переменных, для которых отдельно был выбран метод построения уравнения регресии, формируются дополнительные переменные (1, 2, 3 итд.) представляющие собой серию контрастов между подгруппами номинальных переменных.

Блок 0: Начальный Блок

Таблици этого блока не представляют для нас интереса, так как начальный блок лишь дает нам возможность наглядно педставить процес формирования уравнения регрессии.  

1.       Таблица классификации;

2.       Переменные в уравнении;

3.       Переменные, не включенные в уравнение.

Блок 1: Метод = Включение (Отношение правдоподобия)

Объединенные тесты для коэффициентов модели

1.       Шаг 1 (2,3 итд.) – праграмма использует несколько шагов, чтобы включить все нужные переменные в уравнение регресии;

2.       Хи-Квадрат – это критерий статистической значимости воздействия на зависимую переменую всех предикторов заданной модели, блока или шага. Большие значения критерия Хи-Квадрат говорят о том, что включенные переменные (на данном шаге) оказывают существенное влияние на зависимую переменную;

3.       ст.св. – вспомогательная величина;

4.       р – статистическая значимость (не больше 0,05 считается значимым).

Сводка для модели

1.       Шаг 1 (2,3 итд.) – праграмма использует несколько шагов, чтобы включить все нужные переменные в уравнение регресии;

2.       -2 Log Правдоподобие – эта величина характеризует модель и показывает, на сколько хорошо она соответствует исходным данным. Чем меньше это значение, тем адекватнее сформированная модель;

3.       R квадрат Кокса и Снелла – показывает долю влияния всех предикторов модели (включенных в уравнение на данном шаге) на дисперсию зависимой переменной. Лежит в пределах до 1 (значения меньше 0,3 показывает малую долю влияния всех предикторов модели на дисперсию зависимой переменной);

4.       R квадрат Нэйджелкерка – тот же критерий, показывающий долю влияния всех предикторов модели (включенных в уравнение на данном шаге) на дисперсию зависимой переменной. Лежит в пределах до 1 (значения меньше 0,3 показывает малую долю влияния всех предикторов модели на дисперсию зависимой переменной).

Таблица классификации

1.        Наблюдаемое – фактические значения зависимой номинальной переменной;

2.        Предсказанное – предсказаные значения зависимой номинальной переменной.

Значения в строке одной категории номинальной переменной, а столбике другой категории номинальной переменной означают, что такое количество предсказаний для категории указаной в строке не совподает с фактическими значениями этой же категории номинальной переменной.

Переменные в уравнении

1.       Константа – для каждого шага соответствует константе В0 регрессионного уравнения (это значение использует программа для построения уравнения регрессии);

2.       В – коэффициенты регрессионного уравнения, отражающие влияние соответствующих предикторов на зависимую переменную. Значения больше 0,5 означают большое влияние соответствующих предикторов на зависимую переменную;

3.       Стандартная ошибка – характеристика точности, стабильности величины. Чем меньше значение стандартной ошибки, тем стабильнее величина;

4.       Вальд – критерий значимости коеффициента В для соответствующего предиктора. Чем выше это значение (вместе с числом степеней свободы) тем выше значимость.

5.       ст.св. – вспомогательная величина;

6.       р – статистическая значимость по критерию Вальда (не больше 0,05 считается значимым);

7.       Exp(B) – величина, которая может использоватся для интерпретации результатов анализа наравне с коеффициентом В.

Матрица корреляций

Обычная корреляционная матрица для всех переменных, вошедших в уравнение регрессии.

Корреляция (r) – два органа считаются коррелируемые, если изменение одного из них сопровождается большим или меньшим изменением другого в том же направлении – Ф.Гальтон. Коэффициент Пирсона всегда лежит в пределах от -1 (отрицательная корреляция) до 1 (положительная корреляция). Значения близкие 0 свидетельствует о том, что переменные практически не коррелируемы между собой.

В случае значительных корреляций между пердикторами нарушается условие независимости, что может означать некорректность анализа.

Модель при исключении члена

1.       Log Правдоподобие Модели – вспомогательная величина;

2.       Изменение в -2 Log Правдоподобие – вспомогательная величина;

3.       ст.св. – вспомогательная величина;

4.       р изменений – статистическая значимость (не больше 0,1 считается значимым).

В данной таблице отображаются независимые переменные которые оказывают значимое влияние на зависимую переменную – имеют статистическую значимость р не больше 0,1, и автоматически включаются в уравнение регресии.

Переменные, не включенные в уравнение

1.       Балл – влияние независимой переменной на зависимую переменную (чем больше значение, тем больше влияние);

2.       ст.св. – вспомогательная величина;

3.       р – статистическая значимость влияния независимой переменной на зависимую переменную (не больше 0,1 считается значимым).

В данной таблице отображаются независимые переменные которые не оказывают значимое влияние на зависимую переменную – имеют статистическую значимость р больше 0,1, и автоматически исключаются из уравнение регресии.

Графическое представление

1.       Классификационная диаграмма (для каждого шага состовляется отдельно) – в диаграмме используются первые буквы градации зависимой переменной. По горизантальной оси отложены значения прогнозируемой вероятности, вычисляемые по уравнению регрессии, а по вертикальной оси – частоты. Таким образом, каждый столбик на диаграмме соответствует определенной предсказаной вероятности, а его высота – количеству объектов, для которых предсказана данная вероятность. Столбики, включающие в себя обе буквы, говорят об ошибках предсказания (высота в 2 символа соответствует одному объекту).

О количестве правильных и неправильных предсказаний позволяет судить классификационная таблица. 


Экскурс в мир терминологии

ПРОИГРЫВАНИЕ РОЛИ (англ. role-playing) — метод групповой психотерапии, в котором участники группы принимают роль некоторого лица (родителя, ребенка, учителя, начальника, девианта и т. д.) для того, чтобы достичь более адекватного понимания причин и мотивов его поведения, взглядов и состояний. В социальной психологии обнаружен значительный эффект П. р. на изменение аттитюдов. Так, в одном из исследований (Mann L., Janis I. L., 1968), проведенном на курящих амер. студентках, установлено, что П. р. курящего пациента, у которого обнаружен рак легких, приводило к более глубокому убеждению во вреде курения и к реальному долгосрочному уменьшению количества выкуренных сигарет (в среднем на две трети). (Б. М.)