6.1 Repartition and Coalesce | Spark Interview questions

  Рет қаралды 12,289

Data Savvy

Data Savvy

Күн бұрын

Пікірлер: 21
@SunilKottha
@SunilKottha 5 жыл бұрын
You are rocking boss..Its helping me a lot
@ajinkyahatolkar294
@ajinkyahatolkar294 Жыл бұрын
Is it possible to a make switch into big data without prior/relevant exp. ?
@nehabansal677
@nehabansal677 5 жыл бұрын
Finally got the concepts cleared
@DataSavvy
@DataSavvy 5 жыл бұрын
Thanks Neha
@DataSavvy
@DataSavvy 5 жыл бұрын
Thanks
@pandurangbhadange25
@pandurangbhadange25 7 ай бұрын
repartition: 1. is used to increase or decrease the RDD/DataFrame partitions 2. More shuffle Coalesce : 2. Reduce the partition 2. No shuffle 3. Less expensive
@mohans3143
@mohans3143 5 жыл бұрын
Well explained but it would be explained by using some use cases.. We can get definitions in google. Now a days it is needed to explain everything in practical.
@aparnashrivastava4882
@aparnashrivastava4882 4 жыл бұрын
in which use case repartition and coalesce be used?
@DataSavvy
@DataSavvy 4 жыл бұрын
Repartition calls full shuffle to create equal size partitions... Coalesce tries to combine existing partitions and reduce no of partitions... Coalesce is used for decreasing no of partitions... Repartition can be used to decrease or increase partitions
@Kassadhy
@Kassadhy 5 жыл бұрын
Well explained!!!!!
@gauravpathak7017
@gauravpathak7017 5 жыл бұрын
Harjeet-On what basis this partition happens?
@surenderraja1304
@surenderraja1304 4 жыл бұрын
Does Coalesce() happen in map side or reduce side ? Does repartition() happen in map side or reduce side ().
@Nikita-fy7js
@Nikita-fy7js 3 жыл бұрын
there is no map reduce in spark....everything happens in memory so there is no concept of map reduce here
@vkd9442
@vkd9442 4 жыл бұрын
Dude.. Audio is too low.. Can u pls rectify it
@DataSavvy
@DataSavvy 4 жыл бұрын
I tried changing it... Somehow KZbin is not allowing to do so... This is improved in New videos
@ampolusantosh5350
@ampolusantosh5350 6 жыл бұрын
how can w know one partiton has high data,one partition has low data
@DataSavvy
@DataSavvy 6 жыл бұрын
Following will give you a new RDD which will help u get size of each partition in terms of records rdd.mapPartitions(iter => Array(iter.size).iterator, true)
@ampolusantosh5350
@ampolusantosh5350 6 жыл бұрын
expalin diff between linage vs DAG
@DataSavvy
@DataSavvy 6 жыл бұрын
Here is your video my friend... kzbin.info/www/bejne/hHiydWqAg5uUsK8
@ampolusantosh5350
@ampolusantosh5350 6 жыл бұрын
in wide transfermation also we can give no.of partition.so what is diff groupByKey(8) vs repartition(8)
@DataSavvy
@DataSavvy 6 жыл бұрын
Will create a video on this
6.2 Apache Spark Tutorial | Spark Read Json |Multiline Json
6:36
6.8 Catalyst Optimizer | Spark Interview questions
9:53
Data Savvy
Рет қаралды 32 М.
😜 #aminkavitaminka #aminokka #аминкавитаминка
00:14
Аминка Витаминка
Рет қаралды 2,1 МЛН
Wait for the last one 🤣🤣 #shorts #minecraft
00:28
Cosmo Guy
Рет қаралды 15 МЛН
Sigma baby, you've conquered soap! 😲😮‍💨 LeoNata family #shorts
00:37
This dad wins Halloween! 🎃💀
01:00
Justin Flom
Рет қаралды 30 МЛН
Spark  - Repartition Or  Coalesce
10:02
Data Engineering
Рет қаралды 19 М.
Spark Tutorial | repartition VS coalesce | Spark Interview Questions
6:22
Repartition vs Coalesce in Apache Spark | Rock the JVM
11:50
Rock the JVM
Рет қаралды 4,9 М.
Think Fast, Talk Smart: Communication Techniques
58:20
Stanford Graduate School of Business
Рет қаралды 41 МЛН
Spark Shuffle service | Executor Tuning
10:22
Data Savvy
Рет қаралды 17 М.
Repartition Vs Coalesce: Apache Spark Interview Questions
7:25
Mayank Malhotra
Рет қаралды 1,9 М.
😜 #aminkavitaminka #aminokka #аминкавитаминка
00:14
Аминка Витаминка
Рет қаралды 2,1 МЛН