Clustering Jerarquico en Python

  Рет қаралды 15,501

Rocio Chavez Ciencia de Datos

Rocio Chavez Ciencia de Datos

Күн бұрын

Si te sirvió el vídeo y deseas apoyarme directamente, te dejo mi cuenta Paypal 😊:
www.paypal.com...
Mis cursos en línea:
======================
Aplica SQL al Mundo del Data Science
Creación de Reportes Visuales con RMarkdown
rociochavezml....
Descarga los archivos que voy analizando en: github.com/roc...
Blog "Aprende Ciencia de Datos con Rocío Chávez": rociochavezml....
Espero que mis videos te estén siendo de utilidad. Si gustas cooperar por medio de PayPal para poder seguir creando contenido, puedes hacerlo en la página de mi Blog
Como te comentaba en el video “Clustering Jerárquico en R”, el objetivo de las técnicas de clustering es encontrar las similitudes que existan entre individuos u objetos, por medio del análisis de sus características.
El dia de hoy te explico como llevar a cabo esta técnica de Machine Learning en Python.
Si te interesa conocer más acerca de la interpretación del dendrograma y las matemáticas detrás de la generación del mismo, en mi canal tengo un video que habla acerca de esto y lleva por nombre “Clustering Jerárquico Aglomerativo (Explicación Matemática)”
Los archivos que voy utilizando los puedes encontrar en:
github.com/roc...
Algunos archivos no los encontrarás en el link, ya que se van creando al correr los códigos que vienen en los videos y estos se grabarán en tu computadora.
#machinelearning #datascience #statistics

Пікірлер: 61
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 2 жыл бұрын
Obtén los scripts, archivos y diapositivas que se muestran en mis videos en: www.patreon.com/rociochavezcienciadedatos
@tomasgerzenstein4051
@tomasgerzenstein4051 Жыл бұрын
Lo pude solucionar!
@jorge1869
@jorge1869 2 жыл бұрын
Una de las cosas que me enoja de KZbin, es q canales como estos no tengan como mínimo un millón de suscriptores. Saludos, excelente contenido.
@tensoescalar1
@tensoescalar1 Жыл бұрын
No sé cómo no había visto este video, Excelente, muchas Gracias
@ricardosebastian9085
@ricardosebastian9085 9 ай бұрын
muchas gracias por tu ayuda, me fue de mucho apoyo
@calebmedrano3733
@calebmedrano3733 2 жыл бұрын
Eres genial Rocio!!!!!😊😊 ya te ganaste un suscriptor más
@franklinriabanimercadoflor3093
@franklinriabanimercadoflor3093 4 ай бұрын
Muchas Gracias por tu ayuda
@joseluisvillalpandoaguilar2613
@joseluisvillalpandoaguilar2613 2 жыл бұрын
EXCELENTE VIDEO GRACIAS
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 3 жыл бұрын
Si te fue de utilidad este video y deseas ayudarme a seguir creando contenido, puedes hacerlo de varias formas: - Compartiendo mi canal en tus redes sociales - Dejándome un comentario (aunque sea un "Hola!"... ;) ) - Dando clic en "Me gusta" para incrementar la probabilidad de que el algoritmo de youtube promueva mi contenido - Suscribiéndote a mi canal - Presionando el ícono "Gracias" y haciendo una donación Si estás interesado en aprender acerca de algún algoritmo en especial, házmelo saber en los comentarios
@cristianlaiho
@cristianlaiho 3 жыл бұрын
wow muy clara tu explicación!! mil gracias!!
@Se-pk8lg
@Se-pk8lg 4 жыл бұрын
Muy bien explicado. Muchas gracias por el video :D
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Es un placer Aarón ;)
@alexisjose7515
@alexisjose7515 3 жыл бұрын
agregar a que cluster pertenece cada registro es genial!
@Estampadosconserigrafia
@Estampadosconserigrafia 3 жыл бұрын
Como validar los cluster??
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Hola! Acabo de correr el código y me dí cuenta de que ya hicieron una modificación al paquete mglearn. En caso de que te dé problemas, puedes teclear pip install --upgrade mglearn (con doble guión) en Powershell Prompt de Anaconda. Si tienes dudas acerca de como hacerlo, envíame un correo a rociochavezmx@yahoo.com ;)
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Para llevar a cabo el pre-procesamiento de tus datos y poder obtener información confiable en tus análisis, visita mi lista de reproducción llamada Pre-procesamiento de Datos en Python kzbin.info/aero/PLUofJx5RUeFqAIVdzfnJayenwZFEGtCmg
@edutubersmexico8605
@edutubersmexico8605 4 жыл бұрын
Saludos
@kimberlyjohanarinconvalenc8650
@kimberlyjohanarinconvalenc8650 3 жыл бұрын
estuvo genial me gustaria saber como generar el dendograma con los clusters definidos en el corte. gracias !!!
@nicolasvinuesa8276
@nicolasvinuesa8276 4 жыл бұрын
Excelente!
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Muchas gracias Nicolás! ;)
@jorge1869
@jorge1869 2 жыл бұрын
Sólido contenido. Yo estoy tratando de hacer este análisis con un millón de rows pero no he encontrado la forma de ver por ejemplo elementos adyacentes en un mismo clúster.
@LuisLopez-sc1qc
@LuisLopez-sc1qc Жыл бұрын
Se puede hacer un grafico jertarquico como el de power bi en python
@madsanty8745
@madsanty8745 4 жыл бұрын
Genial video, como conozco las caracteristicas por las que han sido agrupadas de esa manera a la hora de explicarlo?
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Hola! En estos momentos no podría decirte el código que necesitarías utilizar, pero lo que podrías hacer es: Una vez que tengas la información incluyendo la columna del cluster en el que se ubicó cada individuo en el archivo csv, obtienes el promedio de cada una de las características de los individuos que forman cada uno de los clusters, es decir, obtienes los centroides de cada cluster. Para que sea más claro lo que te quiero decir, te recomiendo que veas el video Clustering Jerárquico Aglomerativo explicación matemática, que está en kzbin.info/www/bejne/mpCaoYhvr9aenK8. Ahí explico lo que son los centroides. Espero que esta información te sea de utilidad ;)
@alanhernandez7201
@alanhernandez7201 2 жыл бұрын
Hola! Se puede hacer un Cluster Jerarquico con variables cualitativas o categoricas en Python? Muchas gracias!
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 2 жыл бұрын
Hola Alan! Ya te contesté por el LinkedIn ;)
@jonathanr.amadorarellano1021
@jonathanr.amadorarellano1021 3 жыл бұрын
Hola, estaba siguiendo tus instrucciones, pero al momento de "Crear el dendrograma del clustering jerárquico" obtube un error que no he logrado corregir, podrías ayudarme? Clustering_Jerarquico = linkage(calificaciones, 'ward') NameError Traceback (most recent call last) in ----> 1 Clustering_Jerarquico=linkage(calificaciones, 'ward') NameError: name 'linkage' is not defined linkage es la impostación que se hizo al inicio de scipy.cluster.hierarchy Gracias.
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 3 жыл бұрын
Si estás interesado en adquirir alguno de mis cursos en línea, vista mi página web rociochavezml.com/cursos-en-linea/ ;)
@samuelceciliochucuyamamani561
@samuelceciliochucuyamamani561 4 жыл бұрын
Excelente video! , tendrás uno de Análisis Factorial ? Saludos
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Muchas gracias Samuel! Todavía no he creado un video acerca de análisis factorial. Te invito a visitar mi página rociochavezml.com, en la pestaña BLOG encontrarás los temas de este canal de forma más organizada ;)
@libardochanchy8292
@libardochanchy8292 3 жыл бұрын
Rocio como se puede exportar a JPG o PNG el grafico del dendograma?
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 3 жыл бұрын
Hola Libardo! Puedes utilizar el comando plt.savefig. Aquí te dejo una página en la que mencionan como hacerlo chartio.com/resources/tutorials/how-to-save-a-plot-to-a-file-using-matplotlib/ Espero que te sea de utilidad ;)
@libardochanchy8292
@libardochanchy8292 3 жыл бұрын
@@RocioChavezCienciadeDatos Rocio gracias, desafortunadamente no me a funcionado o no e podido.
@Estampadosconserigrafia
@Estampadosconserigrafia 3 жыл бұрын
si tengo aprox 200000 registros y 10 variables seria factible ??
@ghumeresh7621
@ghumeresh7621 5 жыл бұрын
Hola Rocio. Alguna idea o ayua para realizar el : coeficiente de concordancia de Lin? seri de gran ayuda. muchas gracias
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 5 жыл бұрын
En cuanto tenga una oportunidad, investigo y te aviso. Si gustas puedes enviarme un correo a rociochavezmx@yahoo.com para que no se me olvide... jejeje
@rodrigoperalta5778
@rodrigoperalta5778 4 жыл бұрын
Para poder normalizar o estandarizar los datos (Z), que código debo utilizar y donde. saludos
@nesivapama
@nesivapama 4 жыл бұрын
Puedes utilizar parte del preprocessing data del paquete sklearn (SciKit-Learn), tienen algoritmos para normalizar y para estandarizar.
@jxccLP
@jxccLP 3 жыл бұрын
from sklearn.preprocessing import StandardScaler
@javieramontecino1674
@javieramontecino1674 3 жыл бұрын
ola sabes que hice todo lo que pusiste en el video pero me sale el siguiente error = module 'scipy.cluster.hierarchy' has no attribute 'dendogram' qué hago :(
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 3 жыл бұрын
Hola! La función correcta es dendrogram, no dendogram ;)
@javieramontecino1674
@javieramontecino1674 3 жыл бұрын
@@RocioChavezCienciadeDatos ohh ya veo gracias
@dr.mariogonzalezsilva877
@dr.mariogonzalezsilva877 4 жыл бұрын
Como puedo graficar los datos con los clusters?? muy buen video gracias!!
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Hola Mario! Me puedes escribir a rociochavezmx@yahoo.com para poder ayudarte más fácilmente, por favor?
@dr.mariogonzalezsilva877
@dr.mariogonzalezsilva877 4 жыл бұрын
@@RocioChavezCienciadeDatos Muchas gracias, ya te mande correo
@libardochanchy8292
@libardochanchy8292 4 жыл бұрын
Como se puede realizar el mismo análisis con variables cualitativas?
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Hola Libardo! Podrías utilizar variables dummy y sobre ellas aplicar el clustering. Tengo un video acerca de las variables dummy aquí kzbin.info/www/bejne/jXO8aqyoiN-hhpY&ab_channel=RocioChavezCienciadeDatos
@libardochanchy8292
@libardochanchy8292 4 жыл бұрын
@@RocioChavezCienciadeDatos gracias excelente tutoríal.
@mariaarbelaez1501
@mariaarbelaez1501 2 жыл бұрын
Hola. ¿Es posible tener una clase contigo?
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 2 жыл бұрын
Hola María! Desafortunadamente me encuentro muy ocupada :(
@tomasgerzenstein4051
@tomasgerzenstein4051 Жыл бұрын
Cuando abro el archivo en Excel me aparecen todos lo datos en distintas filas, pero en la misma columna. Alguien sabe por que?
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos Жыл бұрын
Hola Tomas! Es un archivo de tipo csv, lo que significa que sus valores están separados por comas
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos Жыл бұрын
En este enlace puedes ver como abrirlo en Excel help.cliengo.com/hc/es/articles/360020203574-C%C3%B3mo-abrir-un-archivo-CSV-en-Excel
@tomasgerzenstein4051
@tomasgerzenstein4051 Жыл бұрын
@@RocioChavezCienciadeDatos Muchas Gracias!
@MsBlasster
@MsBlasster 3 жыл бұрын
Saludos Rocio! nos ayudas mucho con tus videos. Estoy haciendo el ejemplo, este es mi codigo Estudiantes=pd.read_csv('C:\Users\NANCY\Desktop\Rocio-Chavez-youtube-Files-master\Ejemplo Estudiantes.csv', engine='python',index_col=0) Me sale este error: File "", line 1 Estudiantes=pd.read_csv('C:\Users\NANCY\Desktop\Rocio-Chavez-youtube-Files-master\Ejemplo Estudiantes.csv', engine='python',index_col=0) ^ SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape No entiendo cual es el error. Estaría muy agradecido si me ayudas.
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 3 жыл бұрын
Hola Rafael! Muchas gracias por tus palabras. Habría que cambiar las diagonales invertidas de la ruta en donde se encuentra el archivo por diagonales normales / Espero que esta información te sea de utilidad ;)
@nicolasvinuesa8276
@nicolasvinuesa8276 4 жыл бұрын
Rocio, no encuentro el error, quizas puedas aclararme:
@nicolasvinuesa8276
@nicolasvinuesa8276 4 жыл бұрын
File "", line 1 Estudiantes=pd.read_csv('C:/Users/nvinu/Archivos en Jupiter/Bases de datos a Analizar/ejemplo estudiantes.csv', engine'python', index_col=0)#Con index_col indicamos que las filas tienen un nombre ^ SyntaxError: invalid syntax
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
@@nicolasvinuesa8276 a simple vista, le falta un signo= entre engine y python. Otra cosa que puedes hacer es usar comillas dobles en lugar de sencillas. Espero que te sea de utilidad ;)
@nicolasvinuesa8276
@nicolasvinuesa8276 4 жыл бұрын
@@RocioChavezCienciadeDatos Muchisimas gracias por tu pronta respuesta.
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
@@nicolasvinuesa8276 Un gusto! Si tuvieras más dudas, me puedes enviar un correo a rociochavezmx@yahoo.com ;)
Clustering Jerárquico Aglomerativo (Explicación Matemática)
13:03
Rocio Chavez Ciencia de Datos
Рет қаралды 34 М.
КОНЦЕРТЫ:  2 сезон | 1 выпуск | Камызяки
46:36
ТНТ Смотри еще!
Рет қаралды 3,7 МЛН
Pre Procesamiento de Datos en Python: Detección de Outliers
13:47
Rocio Chavez Ciencia de Datos
Рет қаралды 18 М.
K-Means Clustering with Python
26:53
Rocio Chavez Ciencia de Datos
Рет қаралды 81 М.
All Machine Learning Models Clearly Explained!
22:23
AI For Beginners
Рет қаралды 35 М.
Agglomerative Hierarchical Clustering | Python Code Example
37:23
Agrupamiento de k-medios y jerárquico
17:22
Serrano.Academy en Español
Рет қаралды 4,4 М.
K-means algoritmo de clustering en python
20:30
Atecnea
Рет қаралды 4,9 М.
DBSCAN Clustering | Python | Clustering
16:19
Stats Wire
Рет қаралды 32 М.
StatQuest: K-means clustering
8:31
StatQuest with Josh Starmer
Рет қаралды 1,8 МЛН
Aprende Python para ciencia de datos
1:05:44
A2 Capacitación: Excel
Рет қаралды 664 М.