Muhammad Abdillah Arba (5C) Bagaimana cara menggunakan model statistika seperti analisis faktor eksploratori (EFA) dalam data mining untuk mengidentifikasi hubungan kompleks antara sejumlah besar variabel yang saling terkait?
@cindykirana7721 Жыл бұрын
1. Pemahaman Tujuan 2. Persiapkan Data 3. Analisis Faktor Eksploratori 4. Interpretasi Hasil 5. Rotasi Faktor 6. Validasi Model 7. Interpretasi Variabel 8. Analisis Tambahan 9. Dokumentasi dan Komunikasi Cindy Kirana Zarry(5B)
@muhammadikrom5922 Жыл бұрын
Bagaimana analisis regresi dan klasifikasi dapat membantu dalam memahami hubungan antara variabel dalam data?(Muhammad iqrom)
@JaneAstridAriani Жыл бұрын
Bagaimana cara menentukan jumlah iterasi yang optimal dalam EM algoritma? (Jane Astrid Ariani, 5B)
@AMANDAIKSANULPUTRISISTEMINFORM Жыл бұрын
Amanda Iksanul Putri (12150320068) kelas 5c Ada beberapa pendekatan yang dapat membantu dalam proses iterasi dalam EM antara lain: 1. Plot Likelihood: kita dapat memantau perubahan likelihood model terhadap jumlah iterasi. Biasanya, likelihood akan meningkat dengan iterasi, tetapi pada suatu titik akan mencapai suatu plateau di mana perubahan yang signifikan tidak terjadi. Jumlah iterasi optimal adalah ketika perubahan ini sudah cukup kecil. 2. Kriteria Konvergensi: kita dapat menetapkan suatu kriteria konvergensi, seperti perubahan likelihood atau parameter model yang lebih kecil dari suatu ambang tertentu. Ketika kriteria ini terpenuhi, dapat menghentikan iterasi. 3. Cross-Validation: kita dapat menggunakan metode cross-validation untuk memilih jumlah iterasi optimal. Dengan membagi data menjadi training dan validation set, kita dapat memantau kinerja model pada validation set seiring dengan jumlah iterasi. Jumlah iterasi yang memberikan hasil terbaik pada validation set bisa dianggap sebagai jumlah iterasi optimal. 4. Information Criteria: kita juga bisa menggunakan kriteria informasi seperti Akaike Information Criterion (AIC) atau Bayesian Information Criterion (BIC) untuk memilih jumlah iterasi. Model dengan nilai AIC atau BIC yang lebih rendah dianggap lebih baik, jadi kita dapat mencoba berbagai jumlah iterasi dan memilih yang menghasilkan nilai AIC atau BIC terendah. Selalu penting untuk memahami bahwa tidak ada aturan baku untuk jumlah iterasi yang optimal dalam EM. Itu bisa bervariasi tergantung pada masalah dan data yang di hadapi. Oleh karena itu, eksperimen dan pemantauan terus-menerus akan membantu kita menentukan jumlah iterasi yang paling sesuai untuk situasi yg terjadi.
@rismamutiasisteminformasi4752 Жыл бұрын
(Risma Mutia, kelas 5B) Pertanyaan: Mengapa unsupervised learning tidak memiliki data latih? Sebutkan alasannya?
@NASYAAMIRAHMELYANISISTEMINFORM Жыл бұрын
Pada Algoritma Classification and Regression Trees (CART), terdapat pembagian variabel dependen yang bertipe kategorik dan numerik kemudian menghasilkan Pohon Klasifikasi dan Pohon Regresi, sebutkan kegunaan dari kedua pohon tersebut! (Nasya Amirah Melyani - 5C)
@MerianaPrihatiNingrum Жыл бұрын
(Meriana Prihati Ningrum, 5B) 1. Pohon Klasifikasi digunakan untuk memprediksi kategori atau kelas dari variabel dependen yang bersifat kategorik. 2. Pohon Regresi digunakan ketika variabel dependen yang ingin diprediksi bersifat numerik, yang berarti nilainya tidak terbatas pada kategori tertentu.
@zhevinalfian4532 Жыл бұрын
Zhevin Alfian : 5C Pertanyaan : Jika data yang telah di lakukan pembersihan / cleaning dan hanya berjumlah sebanyak kurang dari 50% dari data keseluruhan ketika belum dilakukan cleaning, apakah data masih bisa dipakai untuk penelitian?
@desvitahendri6448 Жыл бұрын
(Desvita Hendri | 5C) Apa peran visualisasi data dalam membantu pemahaman hasil dari proses data mining?
@fadlanarrazaksisteminforma1020 Жыл бұрын
(Fadlan Arrazak | 5C) 1.Mengungkapkan Pola dan Insight 2.Memudahkan Pemahaman 3.Perbandingan dan Analisis 4.Identifikasi Outlayer 5.Orientasi pada Tujuan 6.Pemantauan Kinerja Model
@diananadha1873 Жыл бұрын
(DIANA NADHA, 5C) Pertanyaan : Jelaskan konsep statistika yang penting dalam data mining beserta contohnya!
@alikarahmarsyarahrizaldesi7279 Жыл бұрын
apakah terdapat kekurangan pada penerapan metode K-Nearest Neighbor? (Alika Rahmarsyarah Rizalde, 5B)
@desvitahendri6448 Жыл бұрын
Ya, terdapat beberapa kekurangan pada penerapan metode k-Nearest Neighbor (k-NN): 1) Sensitif terhadap Outlier: K-NN rentan terhadap pengaruh data outlier karena menghitung jarak berdasarkan titik data terdekat. Outlier dapat memengaruhi hasil klasifikasi secara signifikan. 2.)Sensitif terhadap Skala: K-NN juga sensitif terhadap skala variabel. Jika variabel memiliki skala yang berbeda, variabel dengan skala besar akan memiliki dampak yang lebih besar dalam perhitungan jarak. 3) Komputasi yang Mahal: K-NN memerlukan perhitungan jarak antara titik data, yang dapat menjadi mahal komputasinya jika datasetnya besar. Selain itu, perlu menyimpan seluruh dataset dalam memori. (Desvita Hendri | 5C)
@auliawulandari3981 Жыл бұрын
(Aulia Wulandari : 5 B) Pertanyaan : Di dalam algoritma Supervised Learning terdapat 2 pengelompokkan data, yaitu Data Training dan Data Testing, apa perbedaan dari kedua data tersebut?
@faishalkhairibasrisistemin1559 Жыл бұрын
(Faishal Khairi Basri: 5C) 1. data training adalah data yang sudah ada / data yang sudah diketahui kelasnya 2. data testing adalah data yang belum diketahui kelasnya
@ayunifachrunisalubissistem8315 Жыл бұрын
(Ayuni Fachrunisa Lubis | Kelas : 5C) Pertanyaan => Mengapa pada algoritma K-Means untuk clustering dapat dilakukan sesuai keinginan, sedangkan pada beberapa algoritma salah satunya seperti dbscan menentukan clustering nya itu sendiri?
@rismamutiasisteminformasi4752 Жыл бұрын
Izin menjawab (Risma Mutia, kelas 5B) Perbedaan dalam kemampuan untuk menentukan jumlah cluster dalam algoritma clustering seperti K-Means dan DBSCAN berkaitan dengan karakteristik masing-masing algoritma dan pendekatan yang mereka gunakan Jadi, perbedaan ini terletak pada sifat algoritma. K-Means adalah algoritma yang memerlukan pengguna untuk menentukan jumlah cluster sebelumnya, sedangkan DBSCAN adalah algoritma berbasis kerapatan yang dapat menemukan cluster secara otomatis. Pilihan antara kedua algoritma ini tergantung pada masalah yang ingin di selesaikan dan seberapa baik kita memahami data kita sendiri. Kedua algoritma memiliki kelebihan dan kelemahan masing-masing, dan pemilihan tergantung pada karakteristik data dan tujuan dari analisis.
@AMANDAIKSANULPUTRISISTEMINFORM Жыл бұрын
Dalam tahap data mining seperti yang bapak jelasin terdapat tahap validasi, Apakah validasi yang digunakan di setiap algoritma berbeda? (Amanda Iksanul Putri 12150320068, kelas C)
@rismamutiasisteminformasi4752 Жыл бұрын
Izin menjawab (Risma mutia, kelas 5B) Tahap validasi dalam data mining adalah proses penting untuk mengukur sejauh mana model atau hasil dari algoritma data mining dapat diandalkan. Jenis validasi yang digunakan dapat bervariasi tergantung pada algoritma yang digunakan, tujuan analisis data, dan data yang tersedia. Beberapa metode validasi yang umum digunakan dalam data mining antara lain: 1. Validasi Silang (Cross-Validation) 2. Validasi Holdout 3. Validasi Bootstrap 4. Validasi Out-of-Sample 5. Validasi Terpantau (Holdout Validation with a Validation Set) Jadi, ya, metode validasi yang digunakan dapat berbeda di setiap algoritma dan tergantung pada situasi dan tujuan analisis data yang spesifik. Pemilihan metode validasi yang tepat penting untuk memastikan hasil yang andal dari proses data mining.
@windyjunitasari5553 Жыл бұрын
( Windy Junita Sari, 5 C ) Bagaimana cara memilih model statistika yang tepat untuk data yang dianalisis?
@mutaalimah2933 Жыл бұрын
izin menjawab (Muta'alimah, kelas B) 1. Pertama-tama, pahami dengan jelas tujuan dari analisis data 2. Pahami asumsi-asumsi yang diterapkan oleh model statistika tertentu 3. Lakukan eksplorasi data dengan visualisasi dan analisis deskriptif 4. telusuri literatur atau sumber arikel jurnal untuk memperkuat atau meyakinkan midel statistika apa yang akan dipilih 5. perlu menguji beberapa model yang berbeda dan membandingkan kinerjanya menggunakan metrik evaluasi yang sesuai. 6. Gunakan teknik cross-validation untuk menguji seberapa baik model Anda bekerja pada data yang belum pernah dilihat sebelumnya.
@mutaalimah2933 Жыл бұрын
(kelas B, Muta'alimah 12150323778) Pertanyaannya : Bagaimana data diproses dalam unsupervised learning tanpa adanya label atau target yang jelas?
@cindykirana7721 Жыл бұрын
Bagaimana proses pemilihan sampel yang diberi bobot pada setiap iterasi Adabost? (Cindy Kirana Zarry)
@DANURLESTARISISTEMINFORMASI Жыл бұрын
(Kelas B, Danur Lestari 12150321355) Jenis masalah seperti apa yang dapat dipecahkan dengan menggunakan unsupervised learning?
@vinawulandari4432 Жыл бұрын
(Vina Wulandari,kelas C) Pertanyaan: bagaimana cara kita dapat menilai kinerja dari model klasifikasi pada data mining?
@alikarahmarsyarahrizaldesi7279 Жыл бұрын
izin menjawab (Alika Rahmarsyarah R, 5B) menilai kinerja dari model klasifikasi pada data mining dapat dilakukan dengan cara menerapkan beberapa metode, metode tergantung pada jenis data yang anda miliki dan tujuan analisis anda, contohnya : Confusion matrix adalah tabel yang digunakan untuk mengukur kinerja model dengan membandingkan prediksi model dengan nilai sebenarnya dari data. Ini mencakup empat komponen utama: True Positive (TP), True Negative (TN), False Positive (FP), dan False Negative (FN). Dari confusion matrix, Anda dapat menghitung metrik seperti akurasi, presisi, recall (sensitivitas), dan F1-score.
@ahmaddhanisisteminformasi4807 Жыл бұрын
yaitu dengan menggunakan beberapa metrik evaluasi yang dapat digunakan untuk mengukur kinerja model klasifikasi. Berikut ini adalah beberapa cara untuk menilai kinerja model klasifikasi: 1. Confusion Matrix: Confusion matrix adalah tabel yang digunakan untuk menghitung sejumlah metrik evaluasi dasar seperti True Positives (TP), True Negatives (TN), False Positives (FP), dan False Negatives (FN). Dari confusion matrix ini, kita dapat menghitung metrik-metrik lain seperti akurasi, presisi, recall, F1-score, dan lainnya. 2. Akurasi (Accuracy): Akurasi mengukur sejauh mana model berhasil memprediksi dengan benar kelas-kelas pada dataset. Akurasi dihitung sebagai (TP + TN) / (TP + TN + FP + FN). Namun, akurasi bisa menjadi kurang informatif jika dataset memiliki ketidakseimbangan kelas. 3. Presisi (Precision): Presisi mengukur sejauh mana prediksi positif yang dibuat oleh model benar-benar benar. Presisi dihitung sebagai TP / (TP + FP). 4. Recall (Sensitivity atau True Positive Rate): Recall mengukur sejauh mana model berhasil mendeteksi semua instansi positif yang sebenarnya. Recall dihitung sebagai TP / (TP + FN). 5. F1-Score: F1-score adalah metrik yang menggabungkan presisi dan recall untuk memberikan gambaran yang lebih baik tentang kinerja model. F1-score dihitung sebagai 2 * (Presisi * Recall) / (Presisi + Recall). Pilihan metrik evaluasi yang tepat tergantung pada jenis data dan masalah klasifikasi yang kita hadapi. Selain itu, penting juga untuk mempertimbangkan konteks bisnis dan tujuan akhir dalam menilai kinerja model klasifikasinya. (Ahmad Dhani 12150311729)
@DANURLESTARISISTEMINFORMASI Жыл бұрын
(Kelas B, Danur Lestari 12150321355) Izin menjawab: Salah satu cara menilai kinerja dari model klasifikasi dengan menggunakan metode ROC Curve dan Area Under the Curve (AUC-ROC). ROC Curve adalah kurva yang menunjukkan kinerja model pada berbagai ambang batas. AUC-ROC mengukur area di bawah kurva ROC, memberikan gambaran keseluruhan kinerja model.
@ahmaddhanisisteminformasi4807 Жыл бұрын
(Ahmad Dhani 12150311729) Bagaimana cara kita dapat mengidentifikasi variabel yang paling penting atau berkontribusi signifikan dalam suatu klasifikasi tertentu?
@bangjeckofficial Жыл бұрын
Ada file CSVnya mas?
@dirgamedia8404 Жыл бұрын
mantap 👍🏼
@novrianpratama9179 Жыл бұрын
Mantap penjelasannya, sangat membantu 🙌
@Hpdrr Жыл бұрын
Mantap, penjelasannya sangat mudah dimengerti👍
@nisaica5907 Жыл бұрын
makasih ilmunya pak
@clayherz_2 жыл бұрын
link dataset nya ada ga?
@predatechuinsuskariau33132 жыл бұрын
😁😃😃
@hamdisyukron50702 жыл бұрын
keren
@redevil-27-92 жыл бұрын
Abhista suka pelajaran ini☝🤓
@johnoagain32412 жыл бұрын
Dumai nyimak pak 😁
@adesobur14702 жыл бұрын
Bisa dikirim file nya
@muhamadnursarifudin135202 жыл бұрын
Nama NIM : Muhamad Nur Sarifudin (12150311897) Kelas : SIF 2D 2021 Apakah Geographic Information System (GIS) merupakan implementasi dari contoh Visualisasi Data(Geospasial) Heatmap saja, Kartograf Saja ataupun bisa merupakan gabungan dari keduanya?
@faishalkhairib11782 жыл бұрын
Nama : Faishal Khairi Basri Kelas : 2C NIM :12150311981 Pertanyaan: Apakah ada visualisasi data secara 3 Dimensi dan jika ada digunakan dalam data yang seperti apa?
@ayunifachrunisalubissistem83152 жыл бұрын
Nama : Ayuni Fachrunisa Lubis Kelas : 2C Pertanyaan : Bagaimana cara menentukan untuk membuat kasus bahwa visualisasi data diperlukan/yang sangat penting?
@muhammadabdillaharba9812 жыл бұрын
Nama : Muhammad Abdillah Arba Kelas : 2C Pertanyaan: "Jika data visualisasi sangat penting dalam perkembangan bisnis, apa pengaruh buruknya jika data visualisasi tidak digunakan dalam suatu bisnis?"
@vinawulandari44322 жыл бұрын
Assalamualaikum,saya Vina Wulandari dari kelas 2c akan menjawab pertanyaan dari saudara Muhammad Abdilah Arba Visualisasi data adalah teknik yang ampuh untuk memahami data dengan mudah. Data yang sudah divisualisasikan akan memudahkan siapa saja yang membacanya, termasuk para pebisnis. Visualisasi data bisnis dapat memudahkan Anda untuk memahami variabel yang dapat menunjang usaha, misalnya menganalisis perilaku konsumen. Pengaruh buruk yang di rasakan jika tidak menggunakan visualisasi data adalah 1. partner bisnis sulit memahami data yang diberikan karna manusia lebih cepat merespon dan memahami data berupa gambar di banding sebuah teks . 2.kurang efisien,dikarena kan untuk membaca data yang terlalu banyak membutuhkan waktu yang lama , sehingga memperlambat proses kerja apa lagi para pebisnis biasanya tidak memiliki banyak waktu untuk membaca laporan data yang sangat banyak 3.proses pengambilan keputusan jauh lebih rumit karena data tersaji dalam bentuk teks yang banyak
@vinawulandari44322 жыл бұрын
Nama :Vina Wulandari Kelas 2c Nim :12150321942 Diantara 8 visualisasi data yang umum digunakan pasti ada beberapa yang paling sering di gunakan,kenapa visualisasi data tersebut lebih sering digunakan dari pada visualisasi data yg lain?
@desvitahendri64482 жыл бұрын
Nama:Desvita Hendri Kelas:2C NIM:12150320281 Question: Tipe data apa saja yang didukung oleh Tableau? ?
@elsaharmaniola44762 жыл бұрын
nama : elsa harmaniola (12150322126) kelas : 2 D izin menjawab, Perangkat lunak Tableau mendukung Boolean True / False, nilai data dan waktu, pemetaan geografis, bilangan cacah, nilai teks atau string, dan angka desimal.
@fadlanarrazaksisteminforma10202 жыл бұрын
Nama : Fadlan Arrazak Kelas : 2C NIM : 12150312250 Pertanyaan: Apakah yang menjadi ciri utama tipe visualisasi data hierarchy dan apa kelebihan visualisasi data tipe ini?
@muhamadnursarifudin135202 жыл бұрын
Nama NIM : Muhamad Nur Sarifudin 12159311897 Kelas : SIF 2D 2021 Izin Menjawab Ciri utama dari Tipe Visualisasi Data Hirarki ialah Pembagian atau Percabangan, Biasanya untuk menunjukkan hubungan antar satu kelompok data awal dgn kelompok data lain yang Percabangan nya lebih besar (banyak), oleh karena itu visualisasi ini cocok untuk menunjukkan data" baru yang berasal dari suatu sebab sebelumnya (mudah menambahkan cabang" dari data) Kelebihan penggunaan tipe data hirarki ini ialah data yang dipaparkan lebih detail, jelas dan terkelompok layaknya suatu diagram pohon yang bermula dari satu kelompok data hingga bercabang ke kelompok data lain yg lebih kecil dan detail Sekian Terimakasih
@muhammadrizkydharmawan9022 жыл бұрын
assalamualaikum nama : muhammad rizky dharmawan kelas : 2D pertanyaan : jika visualisasi data contohnya menggunakan histogram, terdapat kesalahan data bagaimana cara memperbaikinya ?
@diananadha27632 жыл бұрын
Assalamualaikum wr.wb Nama : Diana Nadha Nim. : 12150325125 Kelas : 2c -Sistem Informasi Pertanyaan: Apa yang menjadi masalah terbesar dalam visualisasi data?
@sucinuradillah47452 жыл бұрын
Waalaikumussalam, saya Suci nur Adillah 12150321429 dari kelas 2D izin menjawab. Masalah terbesar dalam visualisasi data yaitu: - Tidak bisa dijangkau oleh orang yang berkebutuhan khusus. - Pemilihan charts tidak disesuaikan dengan kebutuhan. - Gagal menentukan kebutuhan audiens. - Penambahan detail yang tidak diperlukan. - Firsr impression yang tidak memikat/menarik.
@mahfuzohfuzoh30932 жыл бұрын
Assalamua'laikum warahmatullahi wabarakatuh. Nama : MAHFUZOH Nim : 12150321274 Kelas : 2D Pertanyaan : Apa itu aplikasi Tableau?
@auliakartikadwi2 жыл бұрын
Nama : Aulia Kartika Dewi NIM : 12150323546 kelas : 2D Izin menjawab, Secara umum, Tableau berfungsi untuk mempercepat pembuatan visualisasi interaktif dari pengolahan data tertentu. Tableau juga dengan mudah digunakan untuk proses implementasi data serta mudah dipelajari. Tableau juga secara khusus dapat menerjemahkan data ke dalam bentuk visual atau presentasi dan mengolah metadata.
@muhammadrizkydharmawan9022 жыл бұрын
izin menjawab pertanyaan mahfuzoh : tableau adalah platform Business Inteligence untuk membantu dalam melihat dan memahami data. tujuan dibuatnya tableau ini adalah untuk meningkatkan aliran analisis dan membuat data lebih dapat diakses oleh orang-orang melalui visualisasi.
@adityanugrahayesasisteminf82492 жыл бұрын
Assalamua'laikum Nama : Aditya Nugraha Yesa Nim : 12150312429 Kelas : 2D Prody : Sistem Informasi Pertanyaan: Apa Perbedaan tren dengan outliers dalam sebuah data?
@mascolx2 жыл бұрын
Nama : Muhammad Zacky Raditya NIM : 12150311608 Jawaban : Analisis trends merupakan suatu metode analisis statistika yang ditujukan untuk melakukan suatu estimasi atau peramalan pada masa yang akan datang, sedangkan Outlier adalah kasus atau data yang memiliki karakteristi unik yang terlihat sangat berbeda jauh dari observasi-observasi lainnya dan muncul dalam bentuk nilai ekstrim baik untuk sebuah variabel tunggal atau kombinasi.
@hafizaryansisteminformasi19722 жыл бұрын
Assalamua'laikum Nama: Hafiz Aryan Siregar NIM: 12150310904 Kelas: 2D - Sistem Informasi Pertanyaan: Dari tipe visualisasi data., Apa itu Visualisasi yang Jelek, Buruk, dan Salah? dan apa alasan yang menyertainya?
@adityanugrahayesasisteminf82492 жыл бұрын
Perkenalkan saya aditya nugraha Yesa (12150312429) Diagram yang jelek akan memiliki estetika yang tidak enak dipandang, seperti pemilihan warna kurang tepat. Diagram yang buruk berkaitan langsung dengan persepsi orang ketika melihatnya. Singkatnya, orang bisa salah tangkap waktu melihat diagram jenis ini. Bisa jadi infonya kurang jelas, membingungkan, terlalu rumit, maupun mengecoh, dan diagram yang salah ini punya masalah langsung dengan kalkulasinya. Sehingga, ketika orang mengecek grafik yang ditampilkan, objektif yang terpampang memang sudah salah dari awalnya.
@mascolx2 жыл бұрын
Assalamua'laikum Nama : Muhammad Zacky Raditya Nim : 12150311608 Kelas : 2D - Sistem Informasi Pertanyaan : Apakah Visualisasi Data berdasarkan gambar harus menggunakan gambar berupa ikon? apakah bisa kita menggunakan contoh gambar lain untuk tipe visualisasi data tersebut?
@hafizaryansisteminformasi19722 жыл бұрын
Perkenalkan saya Nama: Hafiz Aryan Siregar NIM: 12150310904 Kelas: 2D - Sistem Informasi Jawaban untuk pertanyaan Zacky adalah. Sebenarnya tidak harus menggunakan gambar ikon saja, tapi supaya lebih simpel & mudah dipahami, maka digunakanlah ikon untuk kebanyakan data visualisasi dengan gambar.