II Применение в маркетинге Корреляционного и регрессионного анализа
2.1 Анализ корреляционный. Регрессионный анализ линейный и нелинейный
Анализ корреляционный
Фото из источника в списке литературы [3]
В качестве корреляционного анализа принято понимание статистического метода анализа взаимосвязи между случайными переменными-величинами в количестве двух и более. Случайные переменные-величины – это свойства изучаемых объектов наблюдения, являющиеся измеряемыми.
При проведении корреляционного анализа предусматривается исчисление коэффициентов корреляции, принимающих обычно либо отрицательные, либо положительные значения. По знаку коэффициента судят о направлении имеющейся связи, а по абсолютному значению – силу имеющейся связи.
Для оценивания направления связи между анализируемыми переменными, измерение которых производилось в шкале порядковой, прибегают к использованию ранговых непараметрических коэффициентов корреляции: коэффициентов ранговой корреляции Кендалла и коэффициента корреляции Спирмена. Применение нередко находит и исчисление коэффициентов: Фехнера (корреляция знаков), конкордации (множественная ранговая корреляция). Между переменными дихотомическими также измеряют связи посредством соответствующих метрик.
Для исчисления коэффициентов корреляции применяют способ расчета, зависящий от шкалы измерения тех из переменных, взаимосвязь между которыми исследуют.
Если переменные измерены в шкале количественного типа (шкала отношений либо шкала интервальная), то обеспечивается расчет ковариации или корреляционного момента, а на его базе – исчисление линейного коэффициента корреляции (коэффициента Пирсона).
Исчисление коэффициентов корреляции – относительно не трудное, к тому же их легко интерпретировать. Применять их могут даже люди специально не подготовленные. Однако, у рассматриваемого вида анализа – корреляционного – имеется собственная своя специфика и методика. Необходимо соблюдать предпосылки исчисления каждого из коэффициентов корреляции, а также проверять их значимость, которая базируется на принципе необходимости проверки статистических гипотез, нужно также правильно строить интервальные оценки коэффициентов. Надо также помнить, что иногда исследователям приходится сталкиваться с «ложными корреляциями», приводящими к ложным (обманчивым) выводам. Поэтому нужно практиковать расчет не только общих коэффициентов корреляции, но и частных.
На базе корреляционного анализа невозможно определение формы связи между переменными и предсказание значения одной зависимой переменной по одной либо ряду переменных независимых. Если говорить о переменных количественных, то для решения данной задачи можно прибегнуть к применению линейного регрессионного анализа.
В маркетинге корреляционный анализ в основном применяют в альянсе с анализом регрессионным. Посредством первого вида анализа определяют наличие связи и степень ее тесноты, а регрессионный анализ служит для математического моделирования формы связи.
Регрессионный анализ линейный
Регрессионный анализ понимается в качестве метода исследования статистической взаимосвязи между одной количественной зависимой переменной (результирующей) и одной либо ряда количественных независимых переменных-факторов (предикторов или переменных объясняющих).
Уравнение регрессии, по сути, является выражением взаимосвязи между усредненным значением переменной результирующей и усредненными значениями переменных объясняющих. Оно представляется математической функцией, подбираемой на базе статистических исходных данных зависимой переменной и предикторов. Чаще всего прибегают к использованию функции линейного вида и осуществляют линейный регрессионный анализ.
Имеет место очень сильная связь регрессионного анализа с анализом корреляционным, предусматривающим изучение направления и тесноты связи между количественно выраженными переменными. В анализе регрессионном исследуют форму зависимости между данными переменными. То есть при применении обоих методов осуществляют исследование одной и той же взаимосвязи, но с различных сторон, эти методы, в принципе, являются взаимодополняющими. Причем практикуется выполнение корреляционного анализа производить перед проведением анализа регрессионного. После того, как посредством корреляционного анализа доказано наличие взаимосвязи, исследователь может обеспечить выражение формы данной связи, применив регрессионный анализ.
Целью регрессионного анализа является цель предсказания (прогнозирования) ожидаемого усредненного значения результирующей переменной посредством соответствующего уравнения. В маркетинге довольно часто необходимо прогнозировать разные важные показатели (к примеру, объема продаж или прибыли, или числа клиентов и т.д.).
2.2 Регрессионный анализ нелинейный. Регрессия категориальная
Регрессионный анализ нелинейный
Под регрессией нелинейной принято понимать регрессионную модель зависимости переменной результативной от одной либо нескольких переменных объясняющих, выражаемую в виде нелинейной функции. Нелинейная модель (как и линейная) может быть парной и множественной.
Нелинейная регрессия согласно ее целям и задачам подобна регрессии линейной. Отличие обусловливается лишь формой связей и методами оценивания параметров. Выбрать форму связи зависимости нелинейного вида можно посредством: содержательного изучения исследуемого конкретного явления; опоры на итоги изучения взаимосвязи между переменными, к примеру, с применением графического метода.
Оценивание параметров нелинейной регрессии может базироваться: на линеаризации уравнения благодаря подходящим преобразованиям и оценки его параметров посредством применения метода наименьших квадратов; на оценке параметров на базе метода максимального правдоподобия и применения процедур оптимизационных методов.
Регрессии нелинейные различают согласно: включаемым в эти регрессии предикторам (такие нелинейного вида регрессии являются линейными по параметрам); включаемым в регрессии предикторам и подвергаемым оценке параметрам.
Если функции являются нелинейными по переменным объясняющим, возможно сведение их к линейным посредством замены переменных.
Если функции являются нелинейными по переменным-факторам и подвергаемым оцениванию параметрам, их сведение к линейным моделям происходит благодаря логарифмированию и замене переменных.
Если подобрать линеаризующее преобразование невозможно, для оценивания параметров прибегают к использованию методов нелинейной оптимизации на базе исходных данных.
Наилучшая нелинейная модель обычно выбирается на базе наименьшей стандартной остаточной ошибки, исчисленной для разных моделей. Если имеет место наличие ряда нелинейных моделей с сопоставимой точностью, рекомендуется останавливать выбор на модели, отличающейся большей простотой.
Регрессия категориальная
Фото из источника в списке литературы [4]
В качестве регрессии категориальной принято рассмотрение статистического метода моделирования взаимосвязи между категориальными переменными: зависимой и независимыми. Для построения модели рассматриваемой регрессии прибегают к шкалированию либо оцифровке переменных путем присвоения категориям числовых значений. После этого идет построение оптимального уравнения линейной регрессии относительно преобразованных новых переменных.
В данной модели и переменная и ее предикторы – категориальные.
Применение категориальной регрессии в маркетинге происходит, когда нужно описать покупательскую удовлетворенность в зависимости от таких факторов как простота совершения покупки, цена, качество товара. Посредством уравнения категориальной регрессии возможно прогнозирование уровня покупательской удовлетворенности в зависимости от всевозможных сочетаний значений категориальных независимых переменных.
2.3 Регрессия логистическая. Регрессия мультиномиальная логистическая
Регрессия логистическая
Под регрессией логистической или логит-регрессией понимают статистическую модель, используемую, чтобы предсказывать вероятности возникновения какого-то события посредством логистической функции. Эта регрессия относится к классу моделей бинарного выбора, в которых зависимая переменная является дихотомической (бинарной).
Зависимой переменной могут приниматься только значения в количестве двух и означать, к примеру, принадлежность к конкретной группе (скажем, к группе надежных клиентов либо ненадежных клиентов), совершаемое действие (покупка либо непокупка товара),ответы «да» либо «нет» (рекламный ролик нравится либо не нравится).
Построение обыкновенной регрессионной модели линейного типа с зависимыми бинарными переменными не допускается ввиду того, что если это построение будет иметь место, предсказанные значения зависимой переменной интерпретировать окажется практически невозможно.
Измерения значений факторов в моделях бинарного выбора – только количественные. В эти модели допускается включение категориальных переменных (выступающих в качестве факторов). В данных моделях обеспечивается построение регрессионной модели зависимости с принятием во внимание вероятности, что результативной дихотомической переменной будет принято значение 0 или 1, если значение факторов – заданное.
Для того чтобы смоделировать вероятность зависимой дихотомической переменной, нужно произвести подбор специальной монотонно возрастающей функции, значения которой могут варьироваться лишь от 0 до 1.
В моделях бинарного выбора в качестве специальной функции может быть выбрана функция: 1) логистическая; 2) стандартного нормального распределения.
Если модель бинарного выбора построена на базе логистической функции, то она рассматривается как логистическая регрессия или логит-модель. Если модель бинарного выбора построена на базе функции, стандартного нормального распределения, то ее рассматривают как пробит-модель.
Посредством логистической регрессии осуществляется прогнозирование вероятности отклика для зависимой переменной от переменных независимых, которые включены в модель. Прогнозные значения вероятности можно использовать для разделения наблюдений на две группы.
При построении модели регрессии логистической можно осуществить отдельный анализ – анализ Receiver Operator Characteristic (ROC-кривых). Посредством данного анализа можно осуществить выбор оптимального порогового значения вероятности для классификации. ROC-кривую используют, чтобы представить результаты бинарной классификации и оценки уровня ее эффективности.
Использование логистической регрессии распространяется на решение задач, связанных с моделированием взаимосвязи и классификацией наблюдений. Она находит применение в скоринге: банковском (на ее основе возможно построение рейтинга заемщиков и управления кредитными рисками); потребительском (для моделирования потребительского поведения).
Регрессия мультиномиальная логистическая
Фото из источника в списке литературы [5]
В качестве логистической регрессии мультиномиальной рассматривают общий случай модели логистической регрессии, в ней у зависимой переменной имеются категории в количестве более двух.
Измерение зависимой переменной (ковариаты) в рассматриваемой регрессии возможно в таких шкалах, как порядковая и номинальная. В качестве нее может выступать переменная потребительского выбора торговой марки. Переменные независимые (факторы) могут быть количественными либо категориальными.
В данной модели для каждой из категорий переменной зависимой предусматривается построение уравнения логистической бинарной регрессии. Причем одной из категорий переменной зависимой отводится роль переменной опорной, и происходит сравнение с ней всех других категорий.
Посредством уравнения мультиномиальной логистической регрессии прогнозируется показатель вероятности принадлежности к каждой категории зависимой переменной согласно значениям переменных независимых.
2.4 Пробит-модель регресси. Регрессия Кокса. Анализ временных рядов
Пробит-модель регрессии
Фото из источника в списке литературы [6]
Пробит-модель является статистической моделью бинарного выбора, используемой для того, чтобы предсказывать вероятность возникновения какого-то события на базе функции нормального стандартного распределения.
Модель пробит-регрессии, подобно модели логистической регрессии, относят к виду моделей бинарного выбора. По этой причине задачи ее построения и функции такие же, как в логит-модели.
В модели пробит-регрессии выражение расчетного значения зависимой переменной выступает в качестве значения функции нормального стандартного закона распределения. Пробит является значением, для которого исследователи вычисляют функцию нормального стандартного распределения. Имеет место зависимость значения пробита от комбинированных линейных значений факторных переменных. Для пробит-модели (также как и для логит-модели) зависимая переменная – дихотомическая. К факторам в пробит-модели предъявляется требование, чтобы они были количественно выраженными либо категориальными, но преобразованными в переменные дихотомические.
Применение пробит-модели относительно сферы аналогично применению логистической регрессии. Если осуществить моделирование и классификацию по пробит-модели и также по модели логистической регрессии, то результаты окажутся весьма сходными. Но в некоторых случаях результаты могут разниться.
Регрессия Кокса
Фото из источника в списке литературы [7]
Регрессионную модель Кокса считают статистической моделью зависимости функции риска от переменных-факторов независимого вида.
Регрессию Кокса рассматривают в качестве модели отличающихся пропорциональностью рисков. Благодаря ей прогнозируют риск наступления события для какого-то объекта и оценивают влияние определенных заранее независимых предикторов (переменных) на данный риск. Риск рассматривают в качестве зависящей от времени функции. Риск не является вероятностью, поэтому его значения могут превышать единицу.
Объектом может быть клиент, для которого в маркетинге практикуется прогнозирование риска наступления некого события. Объект находится в поле зрения априори (то есть его постоянно наблюдают), в любой временной отрезок возможно наступление события, приводящего к его выбытию из группы риска. К примеру, таким событием может оказаться отказ клиента от товара либо услуги компании или его неспособность оплаты кредита.
Конец ознакомительного фрагмента.