XGBoost, LightGBM

  Рет қаралды 10,196

이수안컴퓨터연구소

이수안컴퓨터연구소

Күн бұрын

Пікірлер: 24
@Jerry-e7p
@Jerry-e7p 3 жыл бұрын
감사합니다~~
@suanlab
@suanlab 3 жыл бұрын
네 감사합니다.
@네바크론
@네바크론 3 жыл бұрын
오늘도 감사합니다.
@suanlab
@suanlab 3 жыл бұрын
네 감사합니다. ^^
@물처럼-r1y
@물처럼-r1y 3 жыл бұрын
정말 감사합니다 큰 도움을 받고 있습니다
@suanlab
@suanlab 3 жыл бұрын
네 감사합니다 ^^
@user-zs5cv4kk7h
@user-zs5cv4kk7h 2 жыл бұрын
선생님 제가 플젝을 진행하고 있는데 모델은 부스팅 기반 분류기들입니다. 트리기반 알고리즘 자체가 변수선택 기능이 있는거로 기억하는데, 그러면 모델 학습 전 굳이 라쏘로 변수를 먼저 선택할 필요는 없는건가요?
@suanlab
@suanlab 2 жыл бұрын
네 변수 선택 없이 그대로 쓰셔도 됩니다.
@박영빈-p9l
@박영빈-p9l 2 жыл бұрын
강의 감사합니다. 궁금한 게 있는데, Feature Importance 막대 그래프에서 x축의 수치가 의미하는 것은 무엇인가요? 구글링 해보니 각 Feature가 모델에서 사용된 횟수를 의미한다고 하는데 잘 이해되지 않습니다.
@haneulkim4902
@haneulkim4902 3 жыл бұрын
좋은영상 감사합니다 :) @26:27 에서 당뇨병 데이터셋에 XGBRegressor 해서 test score 가 나왔는데 30%라는게 어떤걸 의미하나요? 위에 보면 "squaredError" 사용했는데 SE=0.3이 아닌가요?
@suanlab
@suanlab 3 жыл бұрын
저 질문을 잘 이해못했습니다.
@dasolkang1743
@dasolkang1743 3 жыл бұрын
영상 시청 중에 11:32 에서 질문드립니다. dtrain, dtest를 이용하지 않고 앞에서 이용했던것처럼 model.fit(X_train, y_train)을 하여도 문제없이 실행은 되더라구요 그런데, 모델 성능이 전체적으로 0.02씩 떨어지는 현상을 발견하게 되었습니다. 혹시 xgboost에서는 dtrain, dtest을 사용하시는지, 그리고 이를 이용하면 왜 성능이 올라가는지 여쭤도 될까요?
@suanlab
@suanlab 3 жыл бұрын
DMatrix는 XGBoost에서 사용되는 전용 데이터셋입니다. 학습 데이터 세트와 테스트 데이터를 합쳐서 DMatrix로 변환하는데, 혹시 dtrain, dtest 말고 어떻게 사용하신 건가요?
@dasolkang1743
@dasolkang1743 3 жыл бұрын
@@suanlab linear model 학습 시킬 때처럼 train test split을 이용하여 데이터를 분리하였습니다
@박주형-s5h
@박주형-s5h 3 жыл бұрын
안녕하세요! 좋은 영상 감사합니다! 혹시 질문하나만 드려도 괜찮을까요? 38:30 에서 보스턴 데이터로 lgbm regressor 수행하시고 cross validation으로 마지막 줄에 test score 구하셨는데 regression 문제의 경우 test score는 어떤 의미를 가지나요? classification 문제의 경우 cross validation으로 구한 test score가 분류를 얼마나 잘 하는지를 측정하는 도구라면 regression 문제의 경우 cross validation으로 구한 test score은 어떻게 해석하는 것이 좋을까요? 영상 시청 중 너무 궁금해서 문의드립니다 ㅠㅠ
@suanlab
@suanlab 3 жыл бұрын
좋은 질문이네요. ^^ regression의 경우에는 test dataset에 대해서 얼마나 회귀하는지를 score로 측정한겁니다. 예를 들어, 예측이라고 하면 얼마나 잘 예측하는지에 대한 척도라고 볼 수 있겠네요.
@ilmecha_ju7937
@ilmecha_ju7937 3 жыл бұрын
항상 좋은 강의영상 감사드립니다_! 20:06 에서 Feature importance에 관하여 질문이 있습니다_! graphviz(Tree)에서는 가장 중요한 feature가 f2인데, subplot(막대그래프)에서는 가장 중요한 feature가 f1으로 나오네요 어떤 모델이 더 정확한건가요??
@suanlab
@suanlab 3 жыл бұрын
트리 구분을 보시면 될꺼같아요.
@MConstantine
@MConstantine Жыл бұрын
Салют, спасибо за видео
@shk5253
@shk5253 2 жыл бұрын
콜랩 링크를 열어보니, 셀이 전부 비어있어서 그런데, 혹시 다른 링크 있을까요
@suanlab
@suanlab 2 жыл бұрын
아! 교육에 활용되고 있어서 비어있는 노트북을 영상을 보고 채우는 과정입니다.
@yujinjeon795
@yujinjeon795 Жыл бұрын
LightGBM 26:55
@유영재-c9c
@유영재-c9c 3 жыл бұрын
파라미터 값 셋팅은 어느정도 정해져 있나요?
@suanlab
@suanlab 3 жыл бұрын
좋은 질문이네요. 정해진건 없지만 모델마다 어느정도 적절한 range는 있습니다.
군집화 Clustering
58:01
이수안컴퓨터연구소
Рет қаралды 7 М.
[핵심  머신러닝] Boosting
38:33
‍김성범[ 교수 / 산업경영공학부 ]
Рет қаралды 14 М.
ПРЯМОЙ ЭФИР. Золотой мяч France Football 2024
4:41:06
MY HEIGHT vs MrBEAST CREW 🙈📏
00:22
Celine Dept
Рет қаралды 94 МЛН
Wait for the last one 🤣🤣 #shorts #minecraft
00:28
Cosmo Guy
Рет қаралды 18 МЛН
추천 시스템 Recommender System
49:10
이수안컴퓨터연구소
Рет қаралды 19 М.
[Paper Review] XGBoost: A Scalable Tree Boosting System
1:01:00
서울대학교 산업공학과 DSBA 연구실
Рет қаралды 5 М.
결정 트리 Decision Tree
1:08:08
이수안컴퓨터연구소
Рет қаралды 7 М.
Can one do better than XGBoost? - Mateusz Susik
23:47
PyData
Рет қаралды 52 М.
How to train XGBoost models in Python
18:57
Lianne and Justin
Рет қаралды 38 М.
04-7: Ensemble Learning - XGBoost (앙상블 기법 - XGBoost)
33:16
서울대학교 산업공학과 DSBA 연구실
Рет қаралды 14 М.
#6-4. 앙상블(Ensemble) XGBoost의 이해
35:40
박홍규
Рет қаралды 1,1 М.
04-6: Ensemble Learning - Gradient Boosting Machine (GBM) (앙상블 기법-그래디언트 부스팅)
34:30
서울대학교 산업공학과 DSBA 연구실
Рет қаралды 10 М.
ПРЯМОЙ ЭФИР. Золотой мяч France Football 2024
4:41:06