Первичная обработка данных. Выявление выбросов. Описательная статистика. Корреляционный анализ. Мультиколлинеарность. Линейная регрессия. Нелинейная регрессия. Инструменты Excel для корреляционно-регрессионного анализа данных.
Пікірлер: 88
@noizucht27464 ай бұрын
Господи, как же ты доходчиво объяснил, прям по-человечески, в универе так не преподают !
@learningmeansdoing4 ай бұрын
Благодарю за отзыв!
@lydiamax35732 ай бұрын
Здравствуйте , как можно связаться с вами ? Мне нужно помощь а этот анализ на десиртации
@learningmeansdoing2 ай бұрын
@@lydiamax3573Здравствуйте, напишите на почту, указанную в описании канала.
@lydiamax35732 ай бұрын
@@learningmeansdoing youtube.com/@learningmeansdoing Там так написано эта почта ? Можно пожалуйста писать ваша почта здесь ?
@learningmeansdoing2 ай бұрын
@@lydiamax3573 vfdekan@gmail.com
@kvazarx8 ай бұрын
Вы один из лучших в инете объясняете такие вещи простым и доходчивым языком. С практическими примерами в экселе. Это очень важно, чтобы понимать сам механизм расчетов. А потом уже использовать специализированные пакеты в том же R или Python.
@learningmeansdoing8 ай бұрын
Благодарю! Полностью с вами согласен!
@FrauLIV9 күн бұрын
Большое человеческое спасибо!
@user-eh6rq5zr2b2 жыл бұрын
Очень информативное видео ❤️❤️❤️ Спасибо 🙏🏻
@viclukchik25 күн бұрын
СПАСИБО ВАМ ОТ ВСЕЙ ДУШИ это именно то что нужно!! успехов вам, здоровья крепкого🙏
@learningmeansdoing24 күн бұрын
Рад помочь!
@myoldgames9999 Жыл бұрын
Огромное спасибо за видео! Если бы наш преподаватель также хорошо объяснял и показывал, то эконометрика, наверное, стала бы одним из моих любимых предметов! ТОП!👍
@learningmeansdoing Жыл бұрын
Благодарю за хороший отзыв о моей работе!
@myoldgames9999 Жыл бұрын
Сейчас вот сделал всё это самостоятельно и только одного не понял - как у Вас в самой последней таблице коэффициент при Y-пересечении равен 0, а все остальные ячейки данной строки получились #Н/Д ? Я правильно понимаю, что если P-значение для Y-пересечения больше 0,05 (в нашем случае, 0,6), то мы всё равно оставляем столбец Y для дальнейшего регрессионного анализа? Просто от X у которых P-значение было больше 0,05 мы избавлялись. А то я ради интереса пытался не выделять столбец Y в качестве входного интервала, чтобы у меня тоже получилось в конце как у Вас в последней таблице, но Эксель не позволял мне это сделать. Если можете, подскажите пожалуйста.
@myoldgames9999 Жыл бұрын
если кому-то стало интересно, то я вроде нашёл ответ на вопрос. Y-столбец для регрессии конечно надо выбирать - без него excel откажется считать, но надо нажать на галочку напротив "константа-ноль" - тогда и получится как у автора
@learningmeansdoing Жыл бұрын
@@myoldgames9999 В анализе данных ставится галочка "Константа-ноль" и значение Y-пересечение не рассчитывается, соответственно для него нет никаких статистик.
@learningmeansdoing Жыл бұрын
@@myoldgames9999 Уже увидел, что вы сами нашли ответ на свой вопрос ))
@user-ej5ng7sn3m Жыл бұрын
Спасибо большое за простую терминологию. Очень приятно слушать и понимать!
@learningmeansdoing Жыл бұрын
Рад помочь!
@user-ej5ng7sn3m Жыл бұрын
А где ещё видео ? А еще вопрос, вы берете учеников ? . Я экономист ,нужны знания для составления прогнозов . Математику совсем забыла
@learningmeansdoing Жыл бұрын
Можете зайти в плейлисты на канале, там есть видео по разным направлениям. В том числе видео по анализу данных. Мои ученики - это мои студенты в вузе, других у меня нет. Ну и онлайн-аудитория конечно.
@lerushka8 Жыл бұрын
Большое спасибо за подробное объяснение!💌
@nina_chern Жыл бұрын
Спасибо! Самое лучшее объяснение
@sudipravo Жыл бұрын
Лайк и мое почтение за столь доступное изложение материала
@learningmeansdoing Жыл бұрын
Благодарю за отзыв о моей работе !
@alekotot9454 Жыл бұрын
Благодарю, всё понятно и находчиво
@anarabis2 жыл бұрын
Спасибо большое, отличное видео!
@user-nl2fs3rf8m11 ай бұрын
Ура! Спасибо, разобрался. Здоровья Вам!
@learningmeansdoing11 ай бұрын
Рад помочь!
@user-ni7wi9dc1v2 жыл бұрын
Спасибо вам) вполне доходчиво)
@radmilabozieva29962 ай бұрын
Большое спасибо за простое понятное видео 🌹🔥🔥🔥
@learningmeansdoing2 ай бұрын
Рад помочь!
@afaqquliyeva Жыл бұрын
Большое большое спасибо, все доступным языком
@learningmeansdoing Жыл бұрын
Благодарю за отзыв. Рекомендую из этого плейлиста посмотреть и другие видео.
@user-xs9ki4pv9k2 жыл бұрын
спасибо за видео
@vitaliysamartsev9142 жыл бұрын
Очень крутой урок
@alexandrsokolov6464 Жыл бұрын
Благодарю!
@siguerhakim47232 жыл бұрын
Отличная работа
@learningmeansdoing2 жыл бұрын
Спасибо!
@magicmaestro31092 жыл бұрын
Супер!!!!
@tuxedomooned11 ай бұрын
Большое спасибо за подсказку как сделать нелинейную регрессию через линейную. Ничего адекватного и одновременно простого для ее подсчета нет в одном статпакете. А тут нате - все просто оказывается.
@learningmeansdoing11 ай бұрын
Рад помочь!
@andreyg.81172 жыл бұрын
Толково
@user-oe4rv8nh8t Жыл бұрын
Посмотрите пожалуйста в гистограммах распределений Х2 - в границах какая то ошибка.... А вообще очень интересное видео. Если бы еще файл прилагался с данными, чтобы повторить. Вообще было бы замечательно. Спасибо за объяснения
@learningmeansdoing Жыл бұрын
По поводу гистограммы для Х2. Да, действительно, там неверные ссылки на ячейки, из-за чего получились не те числа. Благодарю, что заметили! Если там сделать по-нормальному, то частоты будут 5,6,4,4,4. Вот ссылка на исходный файл, в котором можно потренироваться disk.yandex.ru/i/rPmG826WN3YKmg
@user-oe4rv8nh8t Жыл бұрын
Огромное спасибо за файл!!!!
@DrobotAnton Жыл бұрын
Здравствуйте. Есть ли способ проводить подобный анализ, когда вместо части переменных у нас не числовые значения, а текстовые? К примеру есть несколько тысяч записей о продажах, и кроме числовых значений, у нас есть столбцы с названиями районов города, где эти продажи были. Очевидно есть влияние района на объем продаж, но как его рассчитать?
@learningmeansdoing Жыл бұрын
Здравствуйте. Есть разные методы - описательная статистика, дисперсионный анализ, корреляции и регрессии. Есть разные методы работы с категориальными данными. В двух словах не опишешь.
@alekseyd96356 ай бұрын
При построение нелинейной модели, как понять какие математические операции использовать(умножение, деление) если у меня 12 факторных переменных. В excel регрессионная модель не строится, если количество переменных больше 16. Может подскажите ПО в котором, я бы мог обработать все возможные комбинации для построения модели.
@learningmeansdoing6 ай бұрын
Можете освоить модуль python scipy. Там есть функция linregress. Не знаю точно, какие там ограничения по числу регрессоров, но явно больше 16.
@arse1037 Жыл бұрын
А вот эта ошибка в процентах, можно ли ,например, если на отдельные расчитаные значения Y ошибка более 30%, отбраковать эти значения из массива? есть ли в математике и статистике какое то обоснование таким действиям или это исследователь как вы говорите решает?
@learningmeansdoing Жыл бұрын
Есть множество алгоритмов выявления выбросов. И да, они математически обоснованы. Это, пожалуй, тема для отдельного видео. В самом простом случае исследователь может принять решение забраковать единичные данные, которые отклоняются от общей регрессии более, чем на какую-то величину.
@learningmeansdoing Жыл бұрын
Может когда-то руки дойдут сделать видео о первичной обработке данных: обнаружение выбросов, замещение недостающих данных и прочие вопросы.
@learningmeansdoing Жыл бұрын
kzbin.info/www/bejne/j6DEdaacbs56gdU
@sudipravo Жыл бұрын
Пересматриваю еще раз и проецирую все что есть в видео на свою работу (я - оценщик, в основном оцениваю объекты коммерческой недвижимости). У меня возникает вопрос. Что будет, если по какому-либо объекту нет данных по одному или нескольким X, но при этом Y данного объекта известен? Можно ли принимать в расчеты такой объект? Если да, то как измениться модель? Чем заменить неизвестный X. Данный вопрос очень актуален в оценке недвижимости, когда, например, на рынке предлагается к продаже некий объект, сопоставимый в целом с оцениваемым, но в тексте предложения по продаже отсутствует, например: этаж расположения или наличие отдельного входа, состояние и качество отделки и т.д.
@learningmeansdoing Жыл бұрын
Этот вопрос в видео действительно не поднимается. Это, наверное, тема для отдельного видео. Но вообще есть способы импутации данных. В самых простых случаях можно заменить недостающие данные средними или медианными значениями по данному признаку среди всех объектов, либо самыми частыми значениями, либо использовать метод ближайшего соседа, то есть взять взвешенное значение признака с наиболее похожих объектов. Может когда-то сподоблюсь на создание такого контента.
@sudipravo Жыл бұрын
@@learningmeansdoing К сожалению в нашей предметной области заменить нельзя (федеральные стандарты оценочной деятельности не позволяют). Говоря о замене я имел ввиду именно учет неизвестности. Нет ли методик позволяющих просто учесть, что эти характеристики (Х) объекта неизвестны? В любом случае, если на эту тему будет видео, будет ОЧЕНЬ интересно
@learningmeansdoing Жыл бұрын
Не встречался с методиками, где можно было бы учесть, что какого-то значения просто нет в наличии. По сути вычислительный алгоритм должен взять какое-то значение в расчет. А вот если никакого значения нет, то алгоритм должен что-то с этим делать. В предыдущем сообщении я описал ряд вариантов, как алгоритм может это недостающее значение найти на основе значений других объектов.
@learningmeansdoing Жыл бұрын
Возможно, в вашей предметной области есть какая-то особая методика обращения с отсутствующими значениями. Методика, не противоречащая стандартам. Я в этой области не специалист.
@sudipravo Жыл бұрын
@@learningmeansdoing назрел еще вопрос, как мне кажется не освещенный в видео. На этот раз про Y. Есть ли разница когда использовать весь Y, а когда его удельный показатель? Например, в оценке в качестве Y может быть цена объекта, а может быть цена за 1 кв.м. объекта. Что лучше использовать?
@yevhentaranenko2372 Жыл бұрын
👍👍👍, А можна файл с видео скачать ?❤❤
@khatuntsovmikhail6223 Жыл бұрын
То чувство когда шёл по улице и нашёл сотку? Лично я нашёл от 10 до 100 косраей вечно зеленых и мертвых амреканских президентов. Спасибо за отличный видос.
@learningmeansdoing Жыл бұрын
Спасибо за хороший отзыв! Можете посмотреть другие видео из этого плейлиста по анализу данных.
@khatuntsovmikhail6223 Жыл бұрын
@@learningmeansdoing если не сложно можите гте-то выложить ваши примеры? Яндекс диск или еще где-то? А отзыв не "хороший" он "обьективный" ;) . Просто когда сталкиваешься с проблемой и понимаешь, что знания это деньги которые я могу заработать - всё меняется. Когда то сидел за партой и скучал слушая всё это. Теперь сижу и учу - потому, что это мой хлеб. Еще раз спасибо!
@user-vu7eu1ck7t29 күн бұрын
Добрый день! А если весь массив мультикоррениарен, как построить регрессионную модель?
@learningmeansdoing28 күн бұрын
Здравствуйте. Если есть мультиколлинеарность, то нужно либо исключать некоторые переменные Х, которые сильно связаны с другими переменными, либо находить линейную комбинацию переменных методом главных компонент. В общем нужно снижать размерность признакового пространства.
@kvazarx8 ай бұрын
Автор, сделайте пжл ролик на метод главных компонент в Экселе.
@learningmeansdoing8 ай бұрын
В планах есть. Пока по срокам нет ясности.
@user-qb8gi2cn8u4 ай бұрын
Здравствуйте, при составлении уравнения регрессии в Excel выдаёт ошибку в столбце P-значении #ЧИСЛО! В столбце стандартная ошибка везде 0. Значимость F тоже 0. Раньше делал всё тоже самое используя такие же данные и ошибки не было. Помогите пожалуйста с решением данной проблемы.
@learningmeansdoing4 ай бұрын
Здравствуйте. Похоже где-то деление на ноль получилось. По описанию тяжело понять.
@user-ep1vq7eg2g4 ай бұрын
подскажите пожалуйста, почему у меня У расчет. становится равен У и не имеет ошибок
@learningmeansdoing4 ай бұрын
Так получится, если вам удалось подобрать модель, которая в точности проходит через все точки. То есть погрешность такой модели равна нулю а коэффициент R2=1
@Just_dont_Shoot2 жыл бұрын
у меня не определилась значимость F, а также P-значение
@learningmeansdoing2 жыл бұрын
Возможно, у вас Y связан c X линейной зависимостью или есть линейная зависимость между переменными Х
@AdvancedStudio6 ай бұрын
А как сделать так, чтобы при регрессии y тоже отображался?
@learningmeansdoing6 ай бұрын
Не совсем понял вопроса. При получении регрессии отображаются коэффициенты уравнения, по которым соответственно можно составить зависимость Y от всех Х
@user-ir8md1tv9t7 ай бұрын
А может быть 5 факторных переменных и 2 результативных?
@learningmeansdoing7 ай бұрын
Может. Только для каждой результативной переменной придется делать свою модель.
@globalworldmigrant3 ай бұрын
Надо было оставить файл на таблицу
@nina_chern Жыл бұрын
правда, хотелось бы еще как построить кривую по полученной формуле
@learningmeansdoing Жыл бұрын
Это одна из проблем многофакторной регрессии. Можно построить только семейство кривых, зафиксировав какие-либо факторные переменные. Ну это если очень надо визуализировать результат.