РЕГРЕССИОННЫЙ АНАЛИЗ техника DUMMY | АНАЛИЗ ДАННЫХ #18

  Рет қаралды 6,665

СТАТИСТИКА STATISTICA

СТАТИСТИКА STATISTICA

8 жыл бұрын

Техника DUMMY в регрессионном анализе. Как проводить регрессионный анализ, используя технику фиктивных переменных, (dummy переменных).
Вспомним, в регрессионной модели факторы могут быть количественными и номинальными двухуровневыми. Что делать, если в номинальной шкале уровней больше двух, но фактор необходимо включить в модель?
Сформулируем правило: если качественный фактор имеет k значений, то необходимо ввести k - 1 фиктивную (DUMMY) переменную.
Например, есть номинальный 7-уровневый фактор Цвет. Введем вместо него 6 фиктивных переменных.
Выясним, зависит ли объем продаж АЗС от количества персонала и типа АЗС.
Введем в регрессионную модель номинальный фактор «Тип АЗС» с тремя значениями (уровнями) с помощью двух фиктивных (DUMMY) переменных Brand и Sovrem, которые заменят собой трёхуровневый фактор.
Брендовый тип АЗС закодирован комбинацией 1 0, современный 0 1, устаревшему типу соответствует 0 0.
В результате вместо номинального фактора «Тип АЗС» с тремя значениями в регрессионную модель следует включить две DUMMY переменные Brand и Sovrem.
В программе Statisica такие переменные появляются следующим образом. Создается переменная Brand, значения которой заполняются нулями.
Далее, значения переменной Brand перекодируются с помощью условия: если значение переменной Тип АЗС равняется 1, то присвоить новое значение 1.
Аналогично создается переменная Sovrem: если значение переменной Тип АЗС равняется 2, то присвоить новое значение 1.
Таким образом, переменные Brand и Sovrem заменяют переменную TYPE.
После построения регрессионной модели коэффициенты при DUMMY переменных интерпретируются следующим образом:
1) объем продаж брендовых АЗС больше, чем устаревших в среднем на N денежных ед.
2) объем продаж современных АЗС больше, чем устаревших в среднем на K денежных ед.
3) Разница между брендовыми и современными АЗС в среднем составляет N-K = Z денежных ед.
Термин регрессия в статистике впервые был использован Френсисом Гальтоном (1886) в связи с исследованием вопросов наследования физических характеристик человека. В качестве одной из характеристик был взят рост человека; при этом было обнаружено, что в целом сыновья высоких отцов, что не удивительно, оказались более высокими, чем сыновья отцов с низким ростом. Более интересным было то, что разброс в росте сыновей был меньшим, чем разброс в росте отцов. Так проявлялась тенденция возвращения роста сыновей к среднему (regression to mediocrity), то есть «регресс». Этот факт был продемонстрирован вычислением среднего роста сыновей отцов, рост которых равен 56 дюймам, вычислением среднего роста сыновей отцов, рост которых равен 58 дюймам, и т. д. После этого результаты были изображены на плоскости, по оси ординат которой откладывались значения среднего роста сыновей, а по оси абсцисс - значения среднего роста отцов. Точки (приближённо) легли на прямую с положительным углом наклона меньше 45°; важно, что регрессия была линейной.
Цели регрессионного анализа
Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)
Предсказание значения зависимой переменной с помощью независимой(-ых)
Определение вклада отдельных независимых переменных в вариацию зависимой
Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа.
Регрессионный анализ - статистический метод, с помощью которого можно построить модель с одной зависимой переменной (откликом) и одной или несколькими независимыми переменными (факторами).
Регрессионный анализ позволяет:
1) Выявить, какие из факторов действуют на отклик, а какие - нет.
2) Ранжировать факторы по степени влияния на отклик.
3) Спрогнозировать значение отклика при определенных значениях факторов.
Для обеспечения приемлемой точности модели минимальный объем выборки не должен быть меньше величины «число факторов, умножить на 10».
Приведем примеры постановок задач для регрессионного анализа.
Определить, какие факторы влияют на расход электроэнергии на предприятии, и построить прогноз расходов электроэнергии на ближайший квартал.
Планируется строительство нового торгового центра.

Пікірлер: 2
@user-hg1qt7oh2m
@user-hg1qt7oh2m 2 жыл бұрын
Жаль, что не продолжили снимать ролики. Очень познавательно было.
@statistica8687
@statistica8687 8 жыл бұрын
АНАЛИЗ ДАННЫХ #18 Техника DUMMY в РЕГРЕССИОННОМ анализе Содержание: регрессионный анализ, техника фиктивных (Dummy) переменных, интерпретация коэффициентов при Dummy переменных.
РЕГРЕССИОННЫЙ АНАЛИЗ техника dummy STATISTICA #13
18:53
СТАТИСТИКА STATISTICA
Рет қаралды 6 М.
РЕГРЕССИОННЫЙ АНАЛИЗ STATISTICA #12
15:15
СТАТИСТИКА STATISTICA
Рет қаралды 45 М.
Wait for the last one! 👀
00:28
Josh Horton
Рет қаралды 111 МЛН
ROCK PAPER SCISSOR! (55 MLN SUBS!) feat @PANDAGIRLOFFICIAL #shorts
00:31
Luck Decides My Future Again 🍀🍀🍀 #katebrush #shorts
00:19
Kate Brush
Рет қаралды 8 МЛН
Wait for the last one! 👀
00:28
Josh Horton
Рет қаралды 111 МЛН