ENSEMBLE LEARNING : BAGGING, BOOSTING et STACKING (25/30)

  Рет қаралды 85,762

Machine Learnia

Machine Learnia

Күн бұрын

Пікірлер: 366
@hmissafatima3206
@hmissafatima3206 4 ай бұрын
en 2024,en tant qu'une débutante en data science j'ai vu tout tes video et je les trouve vraiment bien présenter tout en réspectant la pédagogie de représenter l'information..bravo et j'aimerai bien voir tes nouveaux concérnant la machine learning...
@ayongolouisalbert723
@ayongolouisalbert723 5 ай бұрын
Bonjour je suis la en 2024 et je t'assure que t'a fais un travail de ouf !! 👌👌👌👌
@adrienloridan
@adrienloridan 4 жыл бұрын
J'ai dévoré les 11 vidéos, en deux fois, je recommande la qualité de ce youtubeur pour sa pédagogie et facilité de compréhension.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup !
@caumauethjacques-emile3124
@caumauethjacques-emile3124 4 жыл бұрын
Comme tu l'avais annoncé, une vidéo qui changera votre manière de faire du machine learning. Mille fois merci.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
J’espère que cela vous aidera toute votre vie !
@mondherelmufti6930
@mondherelmufti6930 3 жыл бұрын
J'apprend la ML à partir de vos séries de vidéo, je suis un peut en retard par rapport au groupe, mais je m'accroche bien; les informations sont devenues tellement nombreuses et mélangées dans ma tête , je pense que l'application ou le projet dans la prochaine vidéo va beaucoup m'aider à dépasser ce problème. Encore merci pour tous ce que vous faite pour diffuser cette science à travers vos géniales vidéos aux pays francophones.
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Bravo a vous pour votre motivation, ne vous en faites pas pour votre "retard", vous n'etes en faites pas si en retard que ca :)
@madaragrothendieckottchiwa8648
@madaragrothendieckottchiwa8648 4 жыл бұрын
Salut chère Guillaume ça fais du bien de toujours écouter tes excellente explications big up à toi !!! Pour ma part je propose le dataset du cancer du sein pour établir un modèle de machine learning capable de prévenir , diagnostiquer et aider la médecine moderne dans la lutte contre ce cancer qui fais tant souffrir des familles . sur ce Merci beaucoup pour la force que tu mets pour produire de très belle vidéos portez -vous bien !!!!!!
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup et bravo c'est une belle proposition. En lisant les commentaires j'ai l'impression qu'elle est en compétition avec le Covid-19 qui est lui aussi tres demandé ! Si les résultats sont 50/50 je ferai évidemment les 2 !
@madaragrothendieckottchiwa8648
@madaragrothendieckottchiwa8648 4 жыл бұрын
@@MachineLearnia en effet j'ai d'abord penser au covid-19 mais après je me suis rappelé que c'est une maladie infectieuses donc elle atteindra forcément son pic d'après le Modèle SIR et SEIR des que cela arrivera ont va tendre vers une immunité collective après suivra un vaccin et après on recommence à vivre sainement tandis que le cancer lui il est très imprévisible et continu jusqu'alors à causé d'énormes chagrin dans les familles malgré les progrès logistique car il détruit nos mère, soeur, femme intérieurement, psychologiquement , corporellement en clair vous laisse une trace indélébile d'où j'ai préféré le thème du cancer pour prévenir, diagnostiquer et traiter grâce à certaine méthodes avancé en deep learning
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Tres bonne réflexion. En fait le léger soucis avec le Covid-19 c'est que les meilleurs moyens de prédire l'évolution de la pandémie est d'utiliser des modèles comme SIR comme tu le soulignes, et de prendre en compte des facteurs externes qui ne seront pas disponibles dans les données publiques. Avec ce projets, mon but est d'aider efficacement les gens qui ont suivit cette série depuis le début avec un projet réalisable pour eux !
@ismailelabbassi7150
@ismailelabbassi7150 2 жыл бұрын
The best teacher ever j'ai bien compris merci infiniment. while True: print("Thank u ,i really appriciate it")
@ousmanelom6274
@ousmanelom6274 4 жыл бұрын
Excellent job je ne jamais fait du machine learning dans ma vie mais j'arrive à comprendre sans suivre les vidéo précédentes. Je vais devoir recommencer à zéro.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Ca me fait très plaisir de savoir que mes vidéos ont la force et la pédagogie pour aider tout le monde ! Oui si vous prenez depuis le début vous allez apprendre beaucoup de choses ! :)
@moussabamba6216
@moussabamba6216 4 жыл бұрын
wahou guillaume tu es incroyable tu viens de résoudre mon problème avec cette vidéo car avec je testais plusieurs algo un à un mais avec ta technique tu viens de résoudre mon problème merci infiniment .comme projet un dataset de kaggle sur le covid ne sera pas mal .vraiment comme note je te donnerai 10/10
@MachineLearnia
@MachineLearnia 4 жыл бұрын
C'est magnifique ! Merci ca me fait super plaisir de savoir que j'ai pu t'aider une fois de plus ! Nous formons vraiment une belle communauté !
@mohammedjenhi6505
@mohammedjenhi6505 2 жыл бұрын
Guillaume ,vous êtes formidable, avec vous je commence a comprendre.
@MachineLearnia
@MachineLearnia 2 жыл бұрын
J'en suis ravi !
@abtouil
@abtouil 4 жыл бұрын
Bonjour Guillaume. Un grand grand grand merci pour ces excellentes vidéos. Prenez soin de vous.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup
@jean-pierrericci3019
@jean-pierrericci3019 4 жыл бұрын
Merci Guillaume pour ces tutos vraiment très bien explicités. En tant que novice, j'aimerais contribuer à ce projet. c'est pourquoi je propose le dataset Covid pour établir ce modèle de Machine Learning. Bravo!
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup ta voix est prise en compte :)
@automatescellulaires8543
@automatescellulaires8543 4 жыл бұрын
Bonjour, je suis juste un curieux / amateur. Et je trouve ta vidéo vraiment excellente !
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup :)
@hamed8167
@hamed8167 4 жыл бұрын
Franchement chapeau bas, l'artiste. Les explications, la pédagogie, la mise en scène, tout est au parfait.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup ! :)
@lassouedhela8627
@lassouedhela8627 4 жыл бұрын
Merci beaucoup Monsieur..vos vidéos me donnent la volonté d’apprendre le machine learning..c’est grâce à vous que j’ai appris une panoplie intéressante des connaissances. Je vote pour le projet du covid19 et tout projet en rapport avec les décisions cliniques.. Je suis impatiente pour recevoir vos nouvelles..bon courage, pleins du succès et beaucoup d’énergie..
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup c'est un immense plaisir de savoir que j'ai réussi a vous aider de la sorte ! Vous pouvez être sure que je serai toujours présent pour vous aider ! :)
@herveballa4692
@herveballa4692 4 жыл бұрын
Ton explication du "wisdom of the crowd" est géniale!
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup, je l'ai travaillée longtemps pour qu'elle soit bien, je suis content de savoir que l'explication est utile du coup :)
@FokouLuciano
@FokouLuciano Ай бұрын
Je découvre cette chaîne en 2024 et c'est juste la mei-lleure
@FokouLuciano
@FokouLuciano Ай бұрын
J'ai bien envie de dire , ON EN VEUX ENCORE PLUS 😂 Pourrais tu en faire une sur NLP (c'est à la mode ) ?
@Mamoune
@Mamoune 2 жыл бұрын
Tu est le meilleur des meilleure moi depuis que j'ai 12 ans je suis interesé par les IA mais je netrouvais personne sur le net mais toi t m'a guidé
@MachineLearnia
@MachineLearnia 2 жыл бұрын
ca me fait bien plaisir ! :)
@Mamoune
@Mamoune 2 жыл бұрын
@@MachineLearnia Tu est trop cool
@cyrilww3750
@cyrilww3750 3 жыл бұрын
Moi, humble élément d'une foule d'abonnés à ta chaîne, te remercie encore pour ces explications d'une clarté exceptionnelle, et d'un intérêt inégalé !!
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Merci, je ne suis qu'un humble membre de la foule moi-même :)
@elmoukhtafikhadija9216
@elmoukhtafikhadija9216 2 жыл бұрын
Un grand merci à vous, une très bonne explication avec une meilleure organisation de cours.
@MachineLearnia
@MachineLearnia 2 жыл бұрын
Je vous en prie !
@guesmiimen2350
@guesmiimen2350 4 жыл бұрын
Salut chère Guillaume ça fais du bien de toujours écouter tes excellente vidéos . Pour ma part je propose faire un projet qui détecte si une personne a le corona virus ou non
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Salut et merci pour ton message :) Et une voix de plus sur le Covid-19 ! (je ne sais en revanche pas s'il y a un dataset public qui permet de détecter si une personne a le virus ou non, ce qu'on fait a l'heure actuelle c'est d'utiliser les tests chimiques, tout simplement)
@donaldtchato4568
@donaldtchato4568 4 жыл бұрын
Bonsoir Monsieur Guillaume vraiment Merci encore pour ce élan que vous nous offrés , nous passionnés de ce domaine. je vous tire un coup de chapeau surtout pour cette video ce qui ma epoustoufflés cest "the wisdom of crowd" bravo et merci encore
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci ! Je suis content de pouvoir vous aider avec mes vidéos :)
@aminekinde6774
@aminekinde6774 2 жыл бұрын
Incroyable la pédagogie ! MERCI !
@abdelkaderhamadi7422
@abdelkaderhamadi7422 4 жыл бұрын
Salut Guillaume franchement du bon contenu, bien expliqué, chapeau, j'ai pu apprendre avec toi le BAGGING ET LE BOOSTING tant mystifiés pour moi.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Ca me fait super plaisir d'avoir pu démystifier cela ! Il est vrai que la plupart des explications sur Internet ne reprennent jamais les bases avec la sagesse des foules. C'est pourtant cela qui explique le pourquoi du comment !
@mohamedseddik965
@mohamedseddik965 4 жыл бұрын
Merci cher Pr Guillaume, je suis pour data set prédiction de l'immobilier. Cordialement
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup :) Je ferai ce genre de dataset a l'avenir :)
@goatsoffootball5494
@goatsoffootball5494 3 жыл бұрын
best teacher ever..... monsieur, nous voulons la série de deep learning
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Merci beaucoup :) Je suis en train de monter le premier épisode
@zinebhmd9067
@zinebhmd9067 10 ай бұрын
tu es le meilleur Guillaume
@brahimakone1860
@brahimakone1860 4 жыл бұрын
@Machinelearnia, t'es un génie. Quand je vois comment tu abordes les notions de boosting, de bagging et de hacking dans la vidéo 25 avant d'entrer dans le fond, je me dis tiens, voilà un vrai pédagogue.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup, ca me fait super plaisir de savoir ca ! :)
@theor5677
@theor5677 4 жыл бұрын
Une magnifique série de vidéo qui touche à sa fin, vivement la suite ! Merci Guillaume ;)
@MachineLearnia
@MachineLearnia 4 жыл бұрын
La suite sera Épique Théo ! je peux te l'assurer ! :)
@augusmaanderson2439
@augusmaanderson2439 4 жыл бұрын
J'adore ce cours !!! Il est trop fort !! Good job ! Merci !
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci :)
@jeanphilippelarre4218
@jeanphilippelarre4218 4 жыл бұрын
Super formation, le data set sur le coronavirus m'intéresse pour le projet. Merci pour tout.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Je vais le faire (annonce dans quelques jours !) :)
@yveskouakou3434
@yveskouakou3434 4 жыл бұрын
Bonjour Guillaume, Merci pour cette vidéo. Merci pour le contenu et la qualité. Je propose les données liées au COVID 19 (CORONAVIRUS ). Chacune de t’es vidéo est une motivation pour moi. Encore félicitations pour tous 👏👏👏
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci ca me fait tres plaisir de savoir que je suis une source de motivation ! C'est mon plus grand but avec cette chaine youtube ! :)
@meteoresongs2575
@meteoresongs2575 Жыл бұрын
Super vidéo, merci beaucoup, je suis aussi data-scientist mais junior ^^ tes vidéos m'aides beaucoup à me remettre à niveau je t'en suis très reconnaissant (pour le dernière exemple sur le Stacking tu as fit et score avec model et non model_4 mais le score reste similaire) :)
@jay_osy
@jay_osy 3 жыл бұрын
trop hâte de suivre la série sur le deep learning
@MachineLearnia
@MachineLearnia 3 жыл бұрын
It's coming :)
@ftmagicart
@ftmagicart 3 жыл бұрын
Encore une excellente vidéo. Je vais enchainer sur le projet final avant de débuter la série du Deep Learning. Merci pour la clarté des explications.
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Merci a vous ! :)
@lollmao249
@lollmao249 2 жыл бұрын
EXCELLENTE EXPLICATION!!!!!!!!!!! c'est juste excellent
@MachineLearnia
@MachineLearnia 2 жыл бұрын
Merci :)
@t_geek9211
@t_geek9211 4 жыл бұрын
You are amazing at explaining stuff! Greeting from Poland!
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Many thanks! :)
@lililili9361
@lililili9361 3 жыл бұрын
Rozumiesz francuski ? Nie wiem jak bys robil inaczej xD
@t_geek9211
@t_geek9211 3 жыл бұрын
@@lililili9361 Tak, rozumiem i mowie po francusku. Tak jak tysiace innych Polakow. Pozdro!
@coulibalyaziz6824
@coulibalyaziz6824 4 жыл бұрын
Bonjour, top comme d'habitude. pour ma part je penche pour le covid 19 sujet d'actualité qui concerne tout le monde. un projet a été lancé sur kaggle. Encore merci pour tout
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Salut et merci pour ta proposition ! J'ai l'impression que vous etes nombreux a vouloir le covid-19 ! ahah (mais il y a aussi le cancer du sein qui est beaucoup demandé, du coup on fera peut-etre les 2, qui sait !?)
@coulibalyaziz6824
@coulibalyaziz6824 4 жыл бұрын
@@MachineLearnia Hello merci pour ta réponse et tes vidéos . Les 2 sujets sont intéressants visiblement la santé est la préoccupation de tes abonnés. Les enjeux ici sont intéressants car d'actualité et aussi pourrait intéresser tes abonnés dans le monde medical, assurantiel/économie ( réel enjeux actuellement tant pour les entreprises d'assurances de réassurances et les politiques d'arriver à analyser le risque pandémique, prédire le pic de la pandémie, impact si deconfinement ou pas avec les enjeux économiques derrière bref un casse tête intéressant )😊.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Je vais faire ma petite investigation, mon but est avant tout de vous proposer un projet réalisable par tout le monde qui a suivit cette série ! Si jamais je dois séléctionner un projet plus simple, je ferai a coup sur des vidéos sur les projets plus complexes par la suite
@coulibalyaziz6824
@coulibalyaziz6824 4 жыл бұрын
@@MachineLearnia good 👌 la prédiction du nombre d'infectés ou de cas grave serait pas mal également et ' simple' vu la série de vidéos. Après comme tu dis le plus important c'est que ça parle à tout le monde et qu'on puisse être 'inspiré', et ' motivé' on verra les sondages 😊 Encore merci
@korosife
@korosife 4 жыл бұрын
C'est Encore Mon Ide qui vas pleuré \o/ merci encore excellent taff comme d'habitude =)
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci John :)
@Rouliousin
@Rouliousin 4 жыл бұрын
20:41 Lorsque tu entraînes le modèle stackingclassifier() tu fais un copié collé mais tu n'aurais pas du mettre model_4.fit() à la place ?
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Chut... personne ne l'a vu... (même pas moi au montage) Oui tu as raison, en allant trop vite j'ai fait une erreur. Bien vu !
@aziz-h4u
@aziz-h4u 4 жыл бұрын
merci c était aussi ma remarque
@ggldmrd5583
@ggldmrd5583 4 жыл бұрын
@@MachineLearnia Question : Sur les logiciels d'empilement d'images en Astrophotographie, le "stacking" que l'on fait sur les images a-t-il un rapport ? En effet similairement au lieu d'additionner des modèles pour en faire un meilleur, on additionne des images pour en faire une meilleure. En fait ma question est : peut-on utiliser ce module de stacking pour créer une image de meilleure qualité à partir de plein d'images de qualité moyenne ? ça m'intéresserait beaucoup pour comprendre comment mon logiciel de traitement de photographies planétaires fonctionne.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Je ne crois pas que ca soit mathématiquement le meme concept non.
@ggldmrd5583
@ggldmrd5583 4 жыл бұрын
@@MachineLearnia Merci pour la réponse. C'est étrange car cette méthode d'empilement d'images s'appelle aussi du stacking et ça fait à peu près la même chose, sauf qu'au lieu de le faire avec des modèles ça le fait avec des images. Je trouve cela assez analogue. Je me demande comment le stacking d'images marche du coup. C'est sur un logiciel d'Astrophoto appelé Registax.
@nawelmahmoudi5393
@nawelmahmoudi5393 4 жыл бұрын
Salut , ça fais du bien de toujours écouter tes excellente vidéos . Pour ma part je propose faire un projet qui détecte la presence d'un objet dans l'image ou nn exmaple d'image de carte electronique
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup, ca me fait très plaisir :) Je pense qu'on va faire ca dans la prochaine série de vidéo (pour très tees bientôt, tu ne vas pas être déçu !)
@emmanuelkoupoh7979
@emmanuelkoupoh7979 4 жыл бұрын
Merci, la video est tres interessante... j'avais comme programme de la semaine de faire du Stacking et du Voting en utilisant le wrapper Keras pour l'API de Scikit-Learn
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Eh bien ton programme va se réaliser ! :)
@kousseilarekkam6762
@kousseilarekkam6762 4 жыл бұрын
Je vous remercie beaucoup, très belle vidéo, puisque je travaille sur un projet sur le churn des clients d'une entreprise de télécommunications, je propose de traiter le dataset du churn.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup ! Voila une proposition intéressante également !
@leoclauzel4490
@leoclauzel4490 4 жыл бұрын
Vraiment le top du top votre chaîne pour se former ! Bravo pour votre investissement :) Pour le projet, je trouve intéressant les thématiques liées à une évolution temporelle. Je propose donc l'étude de l'évolution des températures dans le temps, et selon d'autres paramètres (météos et géographiques) avec le dataset ''Historical Hourly Weather Data 2012-2017'' sur Kaggle Bon courage pour la prochaine ;)
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Ce projet me plait beaucoup !
@andreakue9549
@andreakue9549 4 жыл бұрын
Bonjour Guillaume Félicitations pour ce long chemin. Je rejoins la proposition de Leo CLAUZEL.
@imanezeroual5711
@imanezeroual5711 4 жыл бұрын
Une série de vidéos très bien organisée, très bien expliquée ! Top ! Keep it up (y)
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup :)
@Mohamed-Maghrebi
@Mohamed-Maghrebi 4 жыл бұрын
BRAVOOOO Monsieur GUILLAUME XD, tu es le meilleur, que dieu vous bénifie Insha allah. Pouvez vous un jour nous parler du Stacknet si c'est possible de votre part ? Et merci beaucoup à toi de mettre ces videos éducatif gratuitement
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup ! Oui je compte parler de cela :)
@Mohamed-Maghrebi
@Mohamed-Maghrebi 4 жыл бұрын
@@MachineLearnia Merci Monsieur GUILLAUME.
@mohamedabdelhedi9373
@mohamedabdelhedi9373 4 жыл бұрын
Bravo Guillaume, tu es le meilleur
@MachineLearnia
@MachineLearnia 4 жыл бұрын
merci beaucoup :)
@philippecosphil8589
@philippecosphil8589 4 жыл бұрын
Merci pour la video, je vote pour un projet sur le covid19
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Un vote de plus pour le covid !
@jice1230
@jice1230 4 жыл бұрын
25 vidéos, chapeau ! J'ai beaucoup appris et un grand merci pour ce travail remarquable. N'étant pas du tout issu du domaine scientifique, bien qu'étant informaticien et utilisant couramment Python, ça a été un défi de mettre tout ça en pratique. Du coup j'ai repris les stats du COVID 19 pour la Suisse, puis tenté de reproduire les graphiques proposés par le site corona-data.ch, et j'y suis arrivé. Tes explication ont été précieuses, surtout lors de moments de solitude (fichu reshape ...). D’un point de vue un peu égoïste, j’ai deux propositions en aparté de cette série de vidéos : - comment enregistrer un training pour le réutiliser ensuite - j’ai lu quelques explications qui ne me semblent pas évidentes au premier abord - quelques pistes sur le traitement du texte - j’ai pour objectif de traiter des emails d’alertes / infos provenant de centaines de machines, et c’est l’enfer pour isoler les messages importants que chaque machine envoie (je le fais actuellement avec des regex, mais j’arrive aux limites du concept) - sans entrer forcément dans le domaine de l’analyse de langage (ex. sentiment), quels seraient les traitements et classificateurs qui permettraient de quantifier des emails provenant de machines (texte seulement) ? Quand une machine envoie le titre « la sauvegarde n’a pas réussi », au lieu de « la sauvegarde a échoué », ça risque de poser problème avec un classement strictement bayésien - d’autres solutions ? Concernant le projet, je penche aussi sur le COVID-19, actualité oblige. Toutefois, j’espère qu’on puisse obtenir de meilleurs résultats que ce que nous diffuse la presse. Les nombres absolus par pays me semblent sans intérêt, et la prévalence est omise par la presse (www.worldometers.info/coronavirus/ donne ces stats). Si le COVID-19 est retenu, pourrais-tu nous guider sur comment déterminer les corrélations significatives, et surtout si elles sont pertinentes ? Peut-être aussi une explication de ton point de vue sur la prudence quant à l’interprétation de la r-value ou la p-value ? Tout le monde en parle, mais je ne suis pas sûr de comprendre correctement. Je me suis arrêté sur l’explication que le curseur de la p-value est empirique selon le domaine de recherche.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Salut et merci pour ton commentaire. Bravo a toi d'avoir suivit les 25 vidéos ! :) Concernant ta demande : - Pour sauvegarder un modele entrainé, le plus courant est d'utiliser Joblib ou bien pickle (je vais montrer comment faire cela dans les vidéos suivantes !) - Pour ton projet de classification d'emails : tu peux faire un Bag of Words de chaque email avec sklearn (sklearn.feature_extraction.text.CountVectorizer) puis ensuite faire 2 choses. 1) La premiere c'est de prendre par exemple les 10 mots les plus importants de chaque bag-of-word et de faire du clustering ou bien du PCA pour visualiser en 2D la répartition dans l'espace des bag of words de tes milliers d'emails (pour essayer de voir si des emails se regroupent ensemble). Ca peut etre intéressant de voir comment la machine classe elle-meme les email selon leur ressemblance. Avec cette technique, il faudra cependant éliminer les petits mots du types ('de' 'et',...). 2) la deuxieme chose a faire c'est de créer toi-meme un dataset en placant des étiquettes y que tu crés de la facon suitante : chercher dans le bag of words la présence de certains mots. Par exemple écrire if 'réussi' in bag_of_words : .... et tous les emails qui sortent avec ce genre de résultats tu peux leur donner la valeur y='réussi'. En donnant des étiquettes de cette maniere a tous tes emails, tu peux apres faire un train_set et un test_set et entrainer un modele de classification. Si tu as peu d'emails (genre
@jice1230
@jice1230 4 жыл бұрын
@@MachineLearnia Merci beaucoup pour cette réponse très détaillée. Je vais explorer ces différentes approches.
@LMGaming0
@LMGaming0 4 жыл бұрын
Meilleure chaine de machine learning .
@MachineLearnia
@MachineLearnia 4 жыл бұрын
merci beaucoup :)
@douourediaby5324
@douourediaby5324 4 жыл бұрын
Toujours aussi excellent.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup :)
@mathhack8647
@mathhack8647 4 жыл бұрын
Bravo pour la bonne préparation de cette vidéo bien réussie.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup :)
@michaelcarre7815
@michaelcarre7815 4 жыл бұрын
Bonjour guillaume encore une excellente video, pour le projet je partirai bien aussi sur le covid 19, c'est vrai que c'est un gros dataset mais on est pas obligé de travailler sur tout le dataset mais seulement une partie.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
J'y réfléchis. J'ai téléchargé un dataset intéressant et qui ne serait ni trop simples ni trop compliqué pour la communauté. En tant que professionnel je ne veux pas vous guider vers de mauvaises idées en essayant de résoudre un problème de timeseries simplistes et erroné. Je dois donc trouver un projet d'analyse intéressant, et qui vous donnera confiance en vos compétences par la meme occasion ! (comme dit dans la video je n'ai pas proposé le covid-19 mais des dataset simples!)
@thibaultl4413
@thibaultl4413 4 жыл бұрын
Encore une vidéo très intéressante ! Bravo !
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup :)
@loic4678
@loic4678 4 жыл бұрын
A 20:41 au lieu de fit le Stacking, tu as ré-entraîné le model précédent (Adaboost je crois s'il y a pas eu de chunck supprimé entre temps),
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Oui c'est une petite pépite de ma part. Bravo pour l'avoir remarqué (tu fais parti des gens attentifs !) :)
@paulbelissont3306
@paulbelissont3306 4 жыл бұрын
Hello, ta série de vidéos et ta méthode d'explication sont vraiment tops! Merci de rendre accessible aussi clairement et synthétiquement tous ces concepts :)
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup Paul, c'est un plaisir :)
@Alpha-zf1tw
@Alpha-zf1tw 3 жыл бұрын
Merci pour vos explications... 14.55, 70+60+10 = 140 !!
@MachineLearnia
@MachineLearnia 3 жыл бұрын
quel est ce calcul ? ^^
@Alpha-zf1tw
@Alpha-zf1tw 3 жыл бұрын
@@MachineLearnia dans 14:55, tu as mis 70+60+10 = 130
@hananechliah4308
@hananechliah4308 4 жыл бұрын
merci beaucoup Guillaume pour ma part je penche pour le covid 19 merci
@MachineLearnia
@MachineLearnia 4 жыл бұрын
ca marche on va se lancer sur ce projet je pense ! :)
@salahsaadni8549
@salahsaadni8549 3 жыл бұрын
Merci beaucoup, des leçon très bien expliquées, Bravo
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Merci a vous :)
@dethiesarr
@dethiesarr 4 жыл бұрын
Quelle hyper méga superbe vidéo! Alors la, tout comme les autres, cette vidéo va m’être super utile. Encore merci beaucoup pour tout très cher Guillaume! Pour ma part ça sera le dataset concernant le cancer du sein. Et si le temps nous le permet, peut être y ajouter le covid-19 comme c'est d'actualité aussi!
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup ! :) Je prends ta demande en compte !
@anneloeuillet6426
@anneloeuillet6426 3 жыл бұрын
Merci Guillaume. Tes vidéos sont hyper pédagogiques. Grâce à ta pédagogie tout devient plus clair ! Ceci dit j'ai encore un peu de mal à cerner la notion de modèle faible. Jai une définition qui indique qu'il s'agit d'un modèle avec une rège de décision dont le taux d'erreur est meilleur que celui d'une règle purement aléatoire. Mais elle n'est pas claire pour moi. Si je n'arrive pas à l'exliquer avec des mots intelligibles par tous (comme tu le fais) c'est que je n'ai pas bien compris ! Merci de ton aide et encore merci pour tes super séries de vidéos !
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Bonjour Anne et merci ! Un modele faible est un modele qui a raison un peu plus souvent que de simplement répondre au hasard (ta définition). Voici un exemple : tu lances une piece en l'air et tu cherches a prédire si c'est pile ou face. Bien sur c'est impossible de prédire le résultat (en principe) et donc tu réponds au hasard. Tu as donc 50% de chance d'avoir raison sur ta prédiction. Si tu fais 1000 prédictions, tu auras peut-etre raison 530 fois et tu te seras trompé 470 fois. Un modele faible, ca serait un modele qui sera juste un peu meilleur que ca. Par exemple il arrive a atteindre 51% de performance, parce qu'il arrive en fait a analyser la facon dont tu lances la piece en l'air. C'est donc ca un modele faible. D'apres la théorie des grands nombre, si on regroupe tout pleins de modeles a 51% de performance, alors ensemble ils vont tendre vers de tres bonnes réponses.
@anneloeuillet6426
@anneloeuillet6426 3 жыл бұрын
@@MachineLearnia merci 10000 fois . C'est très clair !!!
@frbaucop
@frbaucop Жыл бұрын
Je ne comprends pas pourquoi il n'y a pas 2M de vue par vidéo... Je suis aussi un peu triste de constater que cette formidable source de formation, d'information et d'inspiration soit tarie. Fait suer mais bon merci, merci, merci. Cordialement 40tude
@huguesakre2829
@huguesakre2829 4 жыл бұрын
tai le meilleur coach
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Quel honneur ! :)
@lamalaesttoujoursgangx
@lamalaesttoujoursgangx 5 ай бұрын
T'es le GOAT que tu penses être GRRRR PAW
@LaurentD90
@LaurentD90 3 жыл бұрын
Le Maître a parlé ! Merci.
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Ahah, c'est un peu trop pour moi, je préfère rester a ma place (sauf si c'est pour être un maître Jedi, la je dis oui !)
@lucayapi3412
@lucayapi3412 4 жыл бұрын
Merci pour toutes ces explications !! Très Belle vidéo. Le dataset sur le cancer du sein pour moi
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Je le ferai également, merci :)
@RichelieuSohtetchafoking
@RichelieuSohtetchafoking 4 ай бұрын
Une de plus merci professeur pour tous les efforts consentis pour nous édifier en data science, s'il vous plait j'aimerais que vous m’orienter sur comment utiliser le PCA ou Le CAH(classification ascendante hiérarchique) pour classifier les données de précipitations mensuelles, journalières ou annuelles en météorologie. S'il vous plaît une orientation
@k-vinh7856
@k-vinh7856 4 жыл бұрын
Excellent comme d'habitude !
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci !
@Tristan-ny2ov
@Tristan-ny2ov 3 жыл бұрын
Salut, à 20:40 il me semble qu'il faudrait que tu écrives model_4.fit et model_4.score et non juste model. C'est pour ça que tu obtiens le même score que dans la cellule précédente. Merci pour tes vidéos et cette série.
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Oui j'ai fait une erreur !
@YGPT
@YGPT Жыл бұрын
Un enorme merci pour tes videos !
@hassenedjadja7020
@hassenedjadja7020 4 жыл бұрын
Top, Excellent et Parfait.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
merci :)
@90fazoti
@90fazoti 4 жыл бұрын
Merci Guillaume toujours des vidéos intéressantes
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup :)
@prestigiuseppe2659
@prestigiuseppe2659 4 жыл бұрын
Bonjour Guillaume. Excellente vidéo comme d'habitude. Je trouve qu'un sujet d'actualité serait sympa. J'opte donc pour un projet en relation avec le covid19 . Je propose également le projet suggéré par Léo CLAUZEL "l'évolution des températures dans le temps, et selon d'autres paramètres (météos et géographiques) avec le dataset ''Historical Hourly Weather Data 2012-2017'' sur Kaggle" qui a l'air fort intéressant (de manière générale tout ce qui touche au secteur énergétique) .
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup. Je vais retenir les 2 options, et si je retiens l'une mais pas l'autre, alors je ferai tout de meme une vidéos sur ce dataset a l'avenir :)
@guillaumedesurville2760
@guillaumedesurville2760 2 жыл бұрын
Génial cette série !
@christ-marieanzianbrou7564
@christ-marieanzianbrou7564 4 жыл бұрын
Merci beaucoup, Je vote pour le data_set du Covid_19. Aidez nous a obtenir un haut niveau en ML
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Je vais prendre votre avis en compte :) merci
@mohameddahmani4589
@mohameddahmani4589 4 жыл бұрын
Très subtile ca tombe à pique. Je vote pour le data_set du Covid_19 qui vient d'etre publié sur kaggle
@coulibalyaziz6824
@coulibalyaziz6824 4 жыл бұрын
faut donc mettre un like à mon commentaire pour que notre sujet soit sélectionné ( on est en compétition avec le cancer du sein à 9 j'aime chacun lol)
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup ! :) un vote de plus pour le covid-19 !
@ItsMinepG
@ItsMinepG 4 жыл бұрын
Excellente vidéo comme d'hab !
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci ! Ca fait tres plaisir de voir que tu fais toute la série de vidéo ! Big up a toi !
@ItsMinepG
@ItsMinepG 4 жыл бұрын
Merci à toi tu m'as appris tant de choses !
@TheRemiRODRIGUES
@TheRemiRODRIGUES 4 жыл бұрын
Super ! C'est vraiment super de montrer des éléments très puissant et qu'on voit peu. Merci ! Pour le dataset, étant donné que j'aime bien le cinéma, je propose : Box Office Data (2017 - 2019) que l'on trouve sur Kaggle www.kaggle.com/yjeong5126/box-office-data-20172019 On peut faire par exemple un modèle qui fait une régression sur les revenus d'un film en fonction des éléments suivant : - Nombre de salles - Notation de protection de l'âge - Le genre
@MachineLearnia
@MachineLearnia 4 жыл бұрын
j'adore ce dataset ! Il change un peu du covid-19 ! ^^
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup :)
@YoannBomal_Dessin
@YoannBomal_Dessin 4 жыл бұрын
Bravo pour cette vidéo !
@MachineLearnia
@MachineLearnia 4 жыл бұрын
merci ;)
@hayetselmane4603
@hayetselmane4603 4 жыл бұрын
Bonsoir, comme d'habitude, la video est très intéressante. Bon, pour ma part je propose deux dataset : 1_Dataset de la détection histologique du cancer de site Kaggle (Histopathologic Cancer Detection), surtout le cancer aujourd'hui s'est largement imposé un problème majeur de santé dans le monde et l'intelligence artiffi cielle joue un role clef dans le diagnostic et le traitement de la maladie surtout dans le cas des cancers. 2_Dataset de la crise du moment (coronavirus covid19), c'est un sujet d'actualité. Et c'est aussi un projet lancé par site kaggle. Merci.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Bonjour et merci pour tes 2 propositions vraiment intéressantes ! Je suis quasiment sur qu'une des deux propositions sera retenue, et peut-être même les 2 !
@hayetselmane4603
@hayetselmane4603 4 жыл бұрын
@@MachineLearnia merci encore fois.
@ayoubkassi2658
@ayoubkassi2658 4 жыл бұрын
merci pour la video guillaume
@MachineLearnia
@MachineLearnia 4 жыл бұрын
de rien :)
@nourelhoudadhiab3126
@nourelhoudadhiab3126 4 жыл бұрын
Bravo à toi Guillaume! je salue ton éloquence et la méthodologie que tu as adoptée pour développer ces vidéos! le machine learning n'a jamais été aussi limpide!Bravo Bravo et encore Bravo pour le temps et l'énergie employés à le faire et la clarté foudroyante de tes vidéos!! sur ce, je me permets de faire une demande, est-il possible que vous abordiez prochainement les algorithmes d'optimisation? tel que les algorithmes évolutionnaires par exemple..un bon nombre des problèmes d'ingénierie sont aujourd'hui approchés selon l'optimisation multi-objective et comme tu es toi-meme ingénieur, je n'ai nul doute que tu sais de quoi je parle..alors je serai plus que ravie de regarder de prochaines vidéos à ce sujet si ça intéresse du monde! et encore une fois, Bravo et Merci!
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci a toi ! Vraiment merci :) Oui je vois de quoi tu veux parler, mais le domaine est tres vaste ! As-tu une envie en particulier ?
@nourelhoudadhiab3126
@nourelhoudadhiab3126 4 жыл бұрын
@@MachineLearnia D'abord merci pour ta réponse rapide. En fait, je veux apprendre à prgrammer des MOGA (Multi-Objective Genetic Algorithms) ou encore des PG ( Programmation Génétique) qui s'inspirent tous deux de la sélection naturelle pour faire évoluer une population initiale de solutions faisables vers un set de solutions Pareto-Optimales ou dans le cas des PG aboutir à une équation symbolique pour un problème d'optimisation. si tu peux me conseiller des lectures aussi, je suis preneuse! :)
@dancarbone6508
@dancarbone6508 3 жыл бұрын
The king of pedagogia!
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Thanks a lot
@Rimajamli
@Rimajamli 3 жыл бұрын
Si possible d'expliquer le random forest plus svp et merci pour vos vidéos sont vraiment riche
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Merci. Oui je vais le faire sur mon site bientot :)
@Rimajamli
@Rimajamli 3 жыл бұрын
@@MachineLearnia merci infiniment
@ijeffking
@ijeffking 4 жыл бұрын
Very well presented. Thank you
@MachineLearnia
@MachineLearnia 4 жыл бұрын
You are welcome!
@benlep6494
@benlep6494 4 жыл бұрын
Bonjour Guillaume, Premièrement, un grand merci pour ce partage de connaissance et cette grande pédagogie dont tu fais preuve pour expliquer un domaine ma fois inconnu du plus grand nombre et pour autant avec beaucoup de detail. Je suis attentivement ta chaîne et essaie de transposer tes tutos sur un cas qui m’est propre. Jusqu’à présent tes dataset utilisés présentaient au moins une similarité, l’indépendance des données. Chaque cas est independant des autres, une personne du titanic ou bien une fleur d’iris, un digit, tous sont independant les uns des autres et leurs données ne dependant pas des données des autres. Quid lorsque ton dataset comporte une temporalité de type « time series » et ou les valeurs de chaque événement influe sur les événements à posteriori et sont eux-mêmes influencés par les évènements à priori? Et Comment mesurer ces influences ? Je serais très intéressé pas ta méthodologie d’application et de traitement d’un dataset de ce type?
@mohamedboumedyane7509
@mohamedboumedyane7509 3 жыл бұрын
Amazing explanation !
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Thank you!
@serrhini
@serrhini 4 жыл бұрын
Bravo a toi tu es au top
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci !
@___matt__
@___matt__ 3 жыл бұрын
Bonjour, très bonne vidéo et très bonne chaine. J'ai pu comprendre pas mal de choses depuis que j'ai commencé à me plonger dedans. Pour cette vidéo, au niveau du stacking, tu as estimé ton modèle en l'appelant model et non pas model_4. C'est pour ça qu'il a le même score que le précédent. Petite coquille
@MachineLearnia
@MachineLearnia 3 жыл бұрын
Oui je me suis trompé en codant en live dans la vidéo ahah Merci beaucoup ! :)
@sidalidjebline4369
@sidalidjebline4369 4 жыл бұрын
Thanks, You're the best
@MachineLearnia
@MachineLearnia 4 жыл бұрын
You're welcome!
@salahboussaid3043
@salahboussaid3043 4 жыл бұрын
Bonjour, je vous remercie beaucoup pour vos vidéos je les ai regardées toutes. J'ai une petite question concernant le Bagging à 17:18. En fait vous avez entré l'estimateur de base qui est le Kneighborclassifier seulement, puis vous avez comparer le résultat du Bagging avec celui de Votingclassifier qui regroupe 3 estimateurs à la fois : KNN, Tree et SDG. Comment est ce possible ? D'après ce que j'ai compris le Bagging peut regrouper différents estimateurs à la fois aussi non ??
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Le principe du Bagging est d'utiliser un seul type de modele (par exemple les arbres de décision) et d'échantillonner le dataset en plusieurs lots aléatoires pour entrainer plusieurs copies de ces modeles de ML. Donc en principe le Bagging utilise un type de modele (pour répondre a la question)
@harounatv8989
@harounatv8989 4 жыл бұрын
Guillaume au niveau du Stacking vers les 22:34 ...tu as utilise model au lieu de model_4. Je pense que tu devrais utiliser model_4... vu que c'est avec lui tu as forme le model.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Oui, me suis trompé ^^ Sorry.
@shequet
@shequet 4 жыл бұрын
Bonjour, il existe pas la même chose pour améliorer de la régression linéaire ?
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Oui, il suffit d'utiliser les modeles de Regressor tels que RandomForestRegressor, ou bien AdaboostRegressor
@shequet
@shequet 4 жыл бұрын
@@MachineLearnia merci il faut que je test.
@douourediaby5324
@douourediaby5324 4 жыл бұрын
Avez vous une idée sur le type d'algorithmes derrière le modèle de crédit social chinois ? Merci d'avance
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Le crédit social chinois ? J'ai fait une petite recherche google, mais je ne vois pas exactement de quoi il s'agit.
@oumarmahamat3156
@oumarmahamat3156 4 жыл бұрын
salut chere guillaume, et merci beaucoup pour le travail que tu fait , moi j'aimerais qu'on choisisse le dataset du cancer du sein.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Merci beaucoup ! Un vote de plus en faveur du cancer du sein, bravo
@ibrahimabarry8839
@ibrahimabarry8839 4 жыл бұрын
merci beaucoup Guillaume serait il possible que tu nous fasses de video(s) tensorflow 2 stp merxi
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Comme je l'ai annoncé, oui c'est prévu et je vais faire une playlist toute entière a ce sujet !
@ibrahimabarry8839
@ibrahimabarry8839 4 жыл бұрын
Machine Learnia merci beaucoup Dieu te bénissent
@sywareinformatique1745
@sywareinformatique1745 2 жыл бұрын
Merci pour ces vidéos!. Juste pour info: A 20:42, tu as une petite erreur. Tu tombes sur 88% car c'est le précédent model que tu affiches. Le StackingClassifier est chargé dans la variable model_4 et non pas model. J'espère que tu vas continuer à faire des séries de vidéos. Les shorts c'est pas mal mais ça n'apprend pas grand chose ;-)
@carnocarelukiza9843
@carnocarelukiza9843 Жыл бұрын
merci pour tes videos Guillaume. Est ce que vous pourrez nous faire des videos pour le NLP(Natural LanguageProcessing)
@mmehdibououda9458
@mmehdibououda9458 4 жыл бұрын
Salut ! Le cancer du sein est très intéressant cependant il est basé essentiellement sur des clichés numériques donc des images qui va faire intervenir des images, l'idée d'avoir en plus de ces images des marqueurs biologiques quantitatifs est je pense un peu plus large est très intéressante car on peut mêler du deep et du machine learning.
@MachineLearnia
@MachineLearnia 4 жыл бұрын
Oui, je faisais référence au dataset disponible dans sklearn, qui est uniquement basé sur des mesures quantitatives.
@DarkSCtv
@DarkSCtv 2 жыл бұрын
Hello, merci pour cette vidéo! Peux-tu expliquer ce qu'est le Pasting stp? qui est une variante du bagging je crois...
DATA SCIENCE ET DÉMARCHE DE TRAVAIL (26/30)
16:57
Machine Learnia
Рет қаралды 68 М.
It’s all not real
00:15
V.A. show / Магика
Рет қаралды 20 МЛН
VIP ACCESS
00:47
Natan por Aí
Рет қаралды 30 МЛН
Enceinte et en Bazard: Les Chroniques du Nettoyage ! 🚽✨
00:21
Two More French
Рет қаралды 42 МЛН
RÉSEAU DE NEURONES PROFOND - DEEP LEARNING 10
26:59
Machine Learnia
Рет қаралды 82 М.
CROSS-VALIDATION SKLEARN PYTHON (Techniques expliquées en Français)
21:11
MATPLOTLIB - Graphiques Importants (15/30)
24:39
Machine Learnia
Рет қаралды 131 М.
FORMATION DEEP LEARNING COMPLETE (2021)
30:57
Machine Learnia
Рет қаралды 1 МЛН
APPRENTISSAGE NON-SUPERVISÉ avec Python (24/30)
41:13
Machine Learnia
Рет қаралды 136 М.
Comment CHOISIR LE BON MODÈLE de Machine Learning ?
20:16
Machine Learnia
Рет қаралды 93 М.
LE PERCEPTRON - DEEP LEARNING (02)
24:45
Machine Learnia
Рет қаралды 316 М.
NEURONE ARTIFICIEL - CHAT VS CHIEN - DEEP LEARNING 6
58:29
Machine Learnia
Рет қаралды 122 М.
PYTHON SKLEARN: KNN, LinearRegression et SUPERVISED LEARNING (20/30)
20:07
It’s all not real
00:15
V.A. show / Магика
Рет қаралды 20 МЛН