No video

Apa itu Web Scraping? | Sigit Dewanto | Python Developer | Scrapinghub

  Рет қаралды 7,917

Indonesia Belajar

Indonesia Belajar

Күн бұрын

Apa itu Web Scraping? Apa itu Scrapinghub?
Dalam sesi bincang-bincang kali ini, kita kedatangan tamu istimewa yaitu Mas Sigit Dewanto. Mas Sigit adalah seorang Python Developer untuk Scrapinghub. Beliau juga terbilang aktif di komunitas Python dan saat ini Mas Sigit adalah community lead untuk komunitas Python Jogja.
Nah dalam sesi podcast kali ini, Mas Sigit akan berbagi banyak informasi menarik seputar web scraping.
Berikut adalah topik bahasan yang diangkat dalam sesi podcast ini:
00:00 - Intro
01:23 - Apa itu web scraping?
03:31 - Pemanfaatan data hasil web scraping
06:50 - Awal mula terjun di bidang web scraping
12:14 - Apa itu Scrapinghub?
15:17 - Web scraping project yang berkesan
17:41 - Tools dan bahasa pemrograman yang umum digunakan dalam web scraping
23:11 - Tantangan dan kendala dalam web scraping
27:44 - Tips menghadapi perubahan layout pada halaman web
30:41 - Implementasi cloud computing dalam web scraping
33:33 - Pertumbuhan akan tenaga ahli dalam bidang web scraping
35:23 - Persiapan untuk mulai terjun di bidang web scraping
40:31 - Aspek legalitas dan etika dalam web scraping
49:52 - Closing statement
Reach-out Sigit Dewanto:
- Linkedin: / sigitdewanto
- Twitter: / seagatesoft
- Github: github.com/sea...
- Wordpress: seagatesoft.wo...
- Kisah bergabung bersama Scrapinghub: seagatesoft.wo...
Oh ya teman-teman, channel KZbin Indonesia Belajar juga memiliki Discord server, silakan teman-teman untuk bergaubung: / discord
Links terkait:
- Buku "Web Data Mining": www.amazon.com...
- Scrapinghub: www.scrapinghu...
- Scrapy: scrapy.org/
- Splash Headless Web Browser: splash.readthe...
- Telegram Komunitas Python Jogja: t.me/pyjogja
Keywords:
- Sigit Dewanto
- Web Scraping
- Web Data Extraction
- Scrapinghub
- Legalitas Web Scraping
- Etika Web Scraping
- Python Developer
- Komunitas Python Jogja
#SigitDewanto #WebScraping #Scrapinghub

Пікірлер: 52
@boodlebsd
@boodlebsd 3 жыл бұрын
Terimakasih sekali. Bagus sekali cerita dr Mas Sigit Dewanto, dan pancingan2 Mas Budi. Membuka wawasan bahwa ada lapangan pekerjaan lain untuk web programmer :-). Apakah berarti kita harus berhati2 dalam menyimpan secret keys, passwords API dan database yg digunakan di web portal kita supaya nggak ke crawler?
@belajaridn
@belajaridn 3 жыл бұрын
Sama-sama, semoga sesi ini bisa bermanfaat. Untuk proteksi terhadap bot, kita perlu menerapkan anti bot protection; salah satunya dengan recapcha :)
@sigitdewanto6702
@sigitdewanto6702 3 жыл бұрын
Sama2. Kalau penyimpanan secret keys/password biasanya diset sebagai environment variables dan tidak disimpan dalam file dev.to/biplov/handling-passwords-and-secret-keys-using-environment-variables-2ei0
@boodlebsd
@boodlebsd 3 жыл бұрын
@@sigitdewanto6702 Terimakasih linknya. Kl gitu makin mantap pakai .env sj. Saya add di LinkedIn ya Mas.
@boodlebsd
@boodlebsd 3 жыл бұрын
@@belajaridn Mantap, tepat banget waktunya. Terimakasih sekali lg. Semakin sukses sesi podcastnya.
@indrapurna532
@indrapurna532 3 жыл бұрын
Menarik banget isi podcast nya bang, terimakasih banyak, semoga sehat selalu dan sebarkan terus ilmu yang bermanfaat bang 🙏
@belajaridn
@belajaridn 3 жыл бұрын
Banyak informasi berharga yang dibagikan oleh Mas Sigit di sesi ini :)
@DimasSadiman
@DimasSadiman 2 жыл бұрын
Sangat bermanfaat... 👍👍
@belajaridn
@belajaridn 2 жыл бұрын
Banyak insight menarik yang disampaikan oleh Mas Sigit dalam sesi ini 😊☕
@hady7152
@hady7152 2 жыл бұрын
asyiik sekali Mas diskusinya... salam kenal Mas Budi
@belajaridn
@belajaridn 2 жыл бұрын
Semoga bermanfaat ya sesi bincang2 ini ☺️☕🙏
@cintarasuryaelidanto1942
@cintarasuryaelidanto1942 3 жыл бұрын
Wah mantep, auto nonton ^_^
@belajaridn
@belajaridn 3 жыл бұрын
Semoga bisa dinikmati dan memberikan manfaat :)
@SuwandaKurnia
@SuwandaKurnia 3 жыл бұрын
ini nih bg, aku lagi butuh banget metode iniiii makasih bang 😊 alhamdulillah
@belajaridn
@belajaridn 3 жыл бұрын
Syukurlah, bisa pass banget ya :)
@SuwandaKurnia
@SuwandaKurnia 3 жыл бұрын
@@belajaridn iyaa bg, aku lagi butuh metode utk ngambil data website gitu bg... metode yg aku temui itu baru ngambil data melalui web service atau web API nya website itu kak
@SuwandaKurnia
@SuwandaKurnia 3 жыл бұрын
eh bg, wkwk
@belajaridn
@belajaridn 3 жыл бұрын
Ingat pesan Mas Sigit ya, polite scraping dan jangan excessive scraping :)
@SuwandaKurnia
@SuwandaKurnia 3 жыл бұрын
@@belajaridn okee bang, siapp.. makasih bg
@kunying4037
@kunying4037 3 жыл бұрын
Sukses selalu bang
@belajaridn
@belajaridn 3 жыл бұрын
Sesi podcast ini rilis di Hari Senin pukul 10 pagi :)
@kunying4037
@kunying4037 3 жыл бұрын
@@belajaridn okee😁
@belajaridn
@belajaridn 3 жыл бұрын
Gimana sesinya? Semoga bermanfaat ya :)
@kunying4037
@kunying4037 3 жыл бұрын
@@belajaridn sangat menginspirasi bang, mantap :)
@MuhamadFuad
@MuhamadFuad 3 жыл бұрын
bang, next podcast boleh how to become QA manual/automations gak :D
@belajaridn
@belajaridn 3 жыл бұрын
Topik QA belum pernah dibahas di sesi podcast Indonesia Belajar. Nanti kami akan carikan narasumber yang memiliki keahlian di bidang ini ya :)
@MuhamadFuad
@MuhamadFuad 3 жыл бұрын
@@belajaridn sip makasih bang XD
@gianshugie
@gianshugie Жыл бұрын
Mau tanya mas, kalo untuk programmer pemula bagus nya cari kerja on-site atau freelance/remote ? Minta arahan road map nya
@sosrobahu2485
@sosrobahu2485 3 жыл бұрын
Yg ngisi pycon id kemarin bukan ya ini?
@belajaridn
@belajaridn 3 жыл бұрын
Betul, mas Sigit pernah menjadi pembicara di PyconID 2019 dan menjadi moderator di PyconID 2020 :)
@hady7152
@hady7152 2 жыл бұрын
kalau boleh tahu web browser yang tidak mempunyai GUI bisa didownload dimana ya? mungkin Mas Budi ada refrensi Terimakasih Mas Budi atas info dan ilmunya
@caareystore4858
@caareystore4858 Жыл бұрын
Ada phantom JS bikinan mas ariya hidayat setauku
@bimagv
@bimagv 3 жыл бұрын
Saya mau melakukan web scrapping, untuk mencari bahan contekan dari suatu website saat lagi di Ubuntu Server. Ada tool yang sekiranya bagus untuk saya korek-korek tidak mas budi?
@belajaridn
@belajaridn 3 жыл бұрын
Sudah pernah coba Scrapy atau BeautifulSoup?
@bimagv
@bimagv 3 жыл бұрын
@@belajaridn Terimakasih mas budi sarannya saya lagi coba, tapi belum eksplorasi lebih lanjut, saat ini masih memakai gitlab.com/gardenappl/readability-cli untuk mendapatkan artikel via CLI.
@belajaridn
@belajaridn 3 жыл бұрын
@@bimagv Terus semangat mas dalam bereksplorasi :)
@cangguk10
@cangguk10 3 жыл бұрын
Bagus materinya, saya ingin belajar lebih jauh lagi mengenai scrapinghub, dimana saya harus belajar dengan mas Sigit, mungkin ada CP atau fan pagenya? Trimksh
@belajaridn
@belajaridn 3 жыл бұрын
Tamu kita kali ini memang sudah 7 tahun berpengalaman secara profesional dalam bidang web scraping. Mantap memang Mas Sigit ini.
@sosrobahu2485
@sosrobahu2485 3 жыл бұрын
Scraping berantem sama perimeter x baru puyeng 😁
@belajaridn
@belajaridn 3 жыл бұрын
LoL, makanya solusi untuk common problems dalam scraping gak dibahas dalam sesi podcast ini :)
@elissilviani6775
@elissilviani6775 2 жыл бұрын
Bedanya scraper sama crawler apa yaa?
@binixsinematografi
@binixsinematografi Жыл бұрын
Scraper untuk mengambil data spesifik dari satu website, sedangkan Crawler untuk menjelajahi dan mengambil data dari berbagai halaman website.
@rexosjr4230
@rexosjr4230 3 жыл бұрын
print("keren bang")
@belajaridn
@belajaridn 3 жыл бұрын
Mas Sigit banyak berbagi informasi berharga di sesi podcast ini :)
@endremurti
@endremurti 3 жыл бұрын
untuk stalking email address bisa ya gan?
@belajaridn
@belajaridn 3 жыл бұрын
Lebih tepatnya untuk scrape data email addresses dari halaman web secara otomatis 😊
@endremurti
@endremurti 3 жыл бұрын
@@belajaridn nah penting skali brti ya om, bkin tutor nya dong hehe
@belajaridn
@belajaridn 3 жыл бұрын
@@endremurti kebetulan saat ini kami sedang berfokus pada materi terkait Machine Learning :)
@endremurti
@endremurti 3 жыл бұрын
@@belajaridn wah keren apakah ada kontak mas atau forum tertentu ? sy ingin ikutan terlibat hehe sy jg pngn bljr big data untuk marketing
@belajaridn
@belajaridn 3 жыл бұрын
Bisa bergabung dengan komunitas Python ID mas. Biasa aktif di group Telegram :)
@ekosetiawan_indo
@ekosetiawan_indo 3 жыл бұрын
keropi
@belajaridn
@belajaridn 3 жыл бұрын
He3... iya keroppi :D
Кадр сыртындағы қызықтар | Келінжан
00:16
Kind Waiter's Gesture to Homeless Boy #shorts
00:32
I migliori trucchetti di Fabiosa
Рет қаралды 8 МЛН
小蚂蚁被感动了!火影忍者 #佐助 #家庭
00:54
火影忍者一家
Рет қаралды 54 МЛН
Little brothers couldn't stay calm when they noticed a bin lorry #shorts
00:32
Fabiosa Best Lifehacks
Рет қаралды 18 МЛН
These Illusions Fool Almost Everyone
24:55
Veritasium
Рет қаралды 2,4 МЛН
Ngobrol seru bareng Kang Onno W. Purbo (Pakar Teknologi Informasi)
1:12:07
Tedi Supardi Muslih
Рет қаралды 1,6 М.
Apa itu Data Science? | Lilian Tjong | Senior Data Scientist | Tokopedia
24:42
Lukashenko: Escalation may end with destruction of Ukraine
24:20
Информационное агентство БелТА
Рет қаралды 1,4 МЛН
Кадр сыртындағы қызықтар | Келінжан
00:16