OS 5 PASSOS PARA ORGANIZAR SEU DATALAKE | Data Engineering

  Рет қаралды 8,465

Big Data Masters

Big Data Masters

Күн бұрын

Пікірлер: 16
@washingtonholandadeoliveir4784
@washingtonholandadeoliveir4784 Жыл бұрын
Gostaria de dar os parabéns pelo vídeo! Vi que já faz 1 ano desde o último vídeo no canal e queria dizer que seu conteúdo é ótimo e espero que volte a gravar mais vídeos sobre a área. Estou desenvolvendo meu TCC da faculdade na área e esse vídeo foi uma porta de entrada pra eu começar a entender melhor o assunto e me aprofundar mais no meu tema! Muito obrigado pelo vídeo, de coração, tenho ctz que muitos assim como eu compreenderam um pouco melhor o assunto graças aos seus vídeos!
11 ай бұрын
Muito bom conteúdo, parabéns!
@frankribeiroandrade4940
@frankribeiroandrade4940 8 ай бұрын
Show! Parabéns!
@DaniloDonizetiSantos
@DaniloDonizetiSantos 2 жыл бұрын
Excelente vídeo. Muito obrigado e parabéns!
@mauriciomodestotoscanbrand7008
@mauriciomodestotoscanbrand7008 2 жыл бұрын
Obrigado
@josepaulo9054
@josepaulo9054 2 жыл бұрын
Vitor, boa noite, excelente iniciativa e voce está de parabens. Queria tirar uma duvida que a escrevo abaixo: Voce citou as 3 grandes areas: Inbound Zone , Raw Zone e Trusted Zone. Imaginando uma empresa que vende serviços e os mesmo são comercializados pelo Magazine Luiza, Extra, Pão de Açucar e Lojas CEM e o processo para todas e a seguinte: 1 - Diariamente elas postam suas vendas e cada uma em seu forte:planilhas, CSV e TXT e esses arquivos cairiam na Inbound Zone. 2 - Na manha seguinte, esses arquivos seriam ingeridos e carregados na area da Raw Zone. 3 - No final da ingestão na area da Raw Zone e iniciado o processo para gerar os arquivos parquet na Trusted Zone. E ai vem a duvida, vamos iomagina que eu tenho um registro com informações de vendas, itens de vendas e dados dos compradores, tudo isso estará no formato parquet na Trusted Zone e posteriormente eu quero gerar informações como por exemplo produtos vendidos por faixa etaria, estado civil e sexo do comprador e como produto final eu teria uma Fato de Vendas com as suas dimensões. Na sua visão tudo isso poderia ficar na Trusted Zone e faria sentido ter uma tabela Fato Vendas e suas dimensões? E outro ponto caso voce tenha ou conheça cursos a respeito desse tema, peço a gentileza de informar-me, abaixo deixo o meu e-mail para contato. E para os demais integrantes do grupo, eu tenho muita saudades de 20 anos atrás , pois formavamos grupos e nos reuniamos para falar a resdpeito de assunto de interesse comum, como é o caso de Data Lake e hoje fala-se muito a respeito de Lak House e creio que essa duvida que eu tenho, deve ser a duvida de algumas pessoas. E aquela famosa frase, juntos somos mais fortes. Grande abraço Vitor e mais uma vez Parabens pela sua iniciativa.
@anasaravia9397
@anasaravia9397 2 жыл бұрын
Parabéns pelo vídeo, mto esclarecedor e didático!
@MarioBevenuto
@MarioBevenuto 2 жыл бұрын
Show… muito obrigado
@patriciadelima_
@patriciadelima_ 2 жыл бұрын
Ótima didática!
@felipef6300
@felipef6300 3 жыл бұрын
Excelente ! Parabéns, didática mil !
@zeneto2157
@zeneto2157 2 жыл бұрын
Colega, existem drivers (jdbc e outros de bancos de dados) que fazem a conexão e import tanto de arquivos em diversos formatos quanto de outros SGBDs. Tvz fosse o caso de criar rotinas que tanto trabalhasse o dados fora da camada do banco quando uma transformação destes dados dentro de uma staging area, usando linguagens procedurais e SQL mesmo. Desculpe, sou meio purista em relação aos dados pois sou DBA oracle e tudo penso em usar um SGBD como solução final.
@gustavorocha9774
@gustavorocha9774 3 жыл бұрын
Muito top!!! 👏🏻
@gabrielfigueiredo6037
@gabrielfigueiredo6037 2 жыл бұрын
Conteúdo sensacional!! Amigo, você poderia me indicar um livro que possua esse assunto?
@EvandroLuisAlves
@EvandroLuisAlves 2 жыл бұрын
Excelente vídeo, muito obrigado!! Uma pergunta: esta divisão em "zonas" e áres de negócio não faz o datalake ser o mesmo que um data mesh? Outra dúvida: nesse processo de tirar da zona "inboud" para a "trusted" é como se eu tivesse no meu datalake três arquivos/conjunto de arquivos referentes ao mesmo dado, certo? Ele fica, de certa forma, triplicado na nuvem, certo?
@biomelo8501
@biomelo8501 3 жыл бұрын
Show! Inscrito!
@josegeraldocoutinho5011
@josegeraldocoutinho5011 2 жыл бұрын
Olá, quais são os autores de referência sobre o assunto DATA LAKE ?
CARREIRA EM ENGENHARIA DE DADOS | TUDO QUE VOCÊ PRECISA SABER
32:12
Big Data Masters
Рет қаралды 12 М.
Como Ler Arquivos CSV usando Databricks + PySpark - Iniciante
23:49
Big Data Masters
Рет қаралды 9 М.
When Cucumbers Meet PVC Pipe The Results Are Wild! 🤭
00:44
Crafty Buddy
Рет қаралды 64 МЛН
Disk Partition | Como Otimizar seu LakeHouse | PySpark + Databricks
25:34
Big Data Masters
Рет қаралды 3,6 М.
Data Lakehouse: Tudo que você precisa saber!
16:54
Stack
Рет қаралды 8 М.
Inovação vertical, horizontal e transversal
24:45
Prof. Manfrim
Рет қаралды 18
A MELHOR FERRAMENTA DE ETL PARA ENGENHEIRO DE DADOS | Azure Data Factory
28:12
Data Lake Simplificado
19:13
Instituto ECOA PUC-Rio
Рет қаралды 5 М.
AWS re:Invent 2021 - Building a data lake on Amazon S3
54:52
AWS Events
Рет қаралды 31 М.
Azure Cosmos DB - Melhores Práticas | Big Data Masters
11:51
Big Data Masters
Рет қаралды 2,6 М.
ПРАВДА ЛИ ТЕЛЕФОНЫ 2000х БЕССМЕРТНЫ ?
28:53
Fake Samsung Galaxy S25 Ultra Plus на iOS
0:59
Wylsacom
Рет қаралды 1,1 МЛН
Вилка  SONY Англия
1:00
Tehnovlog
Рет қаралды 1,7 МЛН