Data Lake, Data Mesh, Data was'n das?! // deutsch

  Рет қаралды 6,475

the native web GmbH

the native web GmbH

Күн бұрын

Пікірлер: 34
@robertbutscher6824
@robertbutscher6824 Жыл бұрын
super Video, hervorragend erklärt. Die geschilderten Probleme rund um DWH und DL sehe ich im Prinzip ähnlich, weil oftmals ein Metadaten-Management in Unternehmen unterentwickelt ist. Viele Unternehmen etablieren derzeit auch Ansätze wie Data Lakehouse, was in der Theorie die Vorteile von DWH und DL kombinieren soll. Data Mesh klingt vielversprechend, aber hier sehe ich die Herausforderung, in Fachabteilungen entsprechend technisches Know-how aufzubauen, um die hohen Anforderungen an die Spezifikation eines Data Mesh umsetzen zu können. Es geht ja auch darum, hier Code mitauszuliefern, damit der Verwender möglichst schnell das Datenprodukt nutzen kann. Wenn ich es richtig verstehe, ist ein solches Datenprodukt ja ein bereits sehr gut aufbereiteter Informationsbaustein, der alles befür benötigte quasi in sich trägt. Hier finde ich übrigens auch den Data Mesh Ansatz sehr weise, Daten nicht per se als wertvoll zu sehen, sondern die darin liegende Information, die sich in Form eines Data Product manifestiert. Wie gesagt, die technischen Hürden in den Fachabteilungen sehe ich (als stemmbare) Herausforderung
@mk2k685
@mk2k685 Жыл бұрын
Das "Teilen mit den Kolleginnen und Kollegen" war bisher für mich ein Problem - 90% in meinem Umfeld können überhaupt kein Deutsch. Sehr gut, dass sich das nun durch euren Zweitkanal erledigt hat 🎉
@atcen
@atcen Жыл бұрын
Und das jetzt wo KZbin doch endlich mehrere Audiospuren unterstützt
@mk2k685
@mk2k685 Жыл бұрын
@@atcen das wäre aber kein Use-Case für solche Videos
@yt7042
@yt7042 Жыл бұрын
Danke für die interessante "Datenanalyse". Data Mesh klingt auf den ersten Blick vernünftig, allerdings wird es auch hier Überschneidungen geben und Daten die nicht eindeutig einem Bereich zuordenbar sind. Ich glaube die Datenspeicherung/-verwaltung sollte man an das Unternehmen anpassen und nicht andersherum an Buzzwords. Schöne Woche!
@tobiasnickel3750
@tobiasnickel3750 Жыл бұрын
hab noch mit keinem solcher architecturen gearbeitet. es hoert sich fuer mich an als ob die entscheidung fuer das eine oder andere eher eine personen und firmen entscheidung ist, als eine Technische entscheidung. ich denke das ist gut mit den mashes, denn so koennen daten zusammengefuert werden ohne sie in ein risiges Hadoop oder Cassandra monster zu schmeissen. danke fuer das Video
@dataintelligencegmbh351
@dataintelligencegmbh351 Жыл бұрын
Sehr gute Erklärung der wesentlichen Unterschiede in den Ansätzen mit dem wichigen Hinweis auf das Fach- bzw. Prozesswissen. Data Lake hat mich nie überzeugt. Erstmal alles sammeln, um erst bei Verwendung ans Strukturieren zu denken, ist viel zu aufwendig. Besser man strukturiert eine Datenquelle zuerst nach einem automatisierbaren Standardverfahren zur Einlagerung und Historisierung. Erst danach wird die Fachlogik zur Integration angesetzt. Wenn man dazu noch jede Datenquelle streng unabhängig von anderen verarbeitet, ist man nicht weit von einem Data Mesh entfernt. So gehen wir seit über 10 Jahren vor. Man könnte das Datawarehouse nennen, ich bevorzuge mittlerweile den Begriff Datenintegration.
@aristor2926
@aristor2926 Жыл бұрын
Sehr interessant.
@19nik91
@19nik91 Жыл бұрын
ich habe den Schmerz von data lakes selber kennen lernen dürfen. Man arbeitete seit Jahren an einer Datenstruktur die alles abbilden können soll, wobei jedes Feld optional ist damit auch jeder Kunde seine individuellen Daten in das system einspielen kann. Gleichzeitig muss das Datenmodell auch jede noch so kleine Datenvariante aller Kunden abbilden können. Auf der Basis sollten Berechnungs- und Analyseprozesse laufen können. Jahre sind vergangen und es läuft immer noch nichts, zumindest nicht auf basis des data lakes ;-)
@thomaspolzer9103
@thomaspolzer9103 Жыл бұрын
Wie immer auf diesem qualitativ hochwertigen Kanal ein sehr interessanter Beitrag. Allerdings bin ich in diversen Punkten anderer Meinung. Ich persönlich habe nicht den Eindruck, dass der Trend zum Data Lake bereits vorüber ist. Im Gegenteil: Sehr viele Enterprise-Kunden überführen gerade ihr Data Warehouse in ein Data-Lake-Konstrukt in der Cloud und gehen vom ETL- in den ELT-Ansatz über. Der Trend geht eher dahin, Data Lake und DW zu kombinieren ("Data Lakehouse"), wobei hier Anbieter wie Databricks eine große Rolle spielen. Und es gibt durchaus Mechanismen, die verhindern, dass im Data Lake der Business-Kontext verlorengeht, der Überblick zu den Daten fehlt oder Berechtigungen unklar sind. Es gibt hierzu Software-Produkte mit integriertem Data Catalog und Lineage, die genau das verhindern. Viele Kunden unterschätzen allerdings diesen Aspekt bei einem Data-Lake/DW-Projekt und werden dann später mit solchen Problemen konfrontiert - mit dem Data Lake an sich hat das aber in der Regel wenig zu tun. Zu Data Mesh: Ein durchaus interessanter Ansatz. Allerdings steht dieser nicht im Widerspruch zum Data Lake, sondern kann mit diesem kombiniert werden (zentrale Datenerfassung und Ablage im Raw Layer, spätere dezentrale Ablage und Übergabe der Ownership an die Fachbereiche). Data Mesh stellt allerdings sehr hohe Anforderungen an die IT-Skills der Fachbereiche und den Reifegrad der dortigen IT-Organisation. Die Zukunft wird zeigen, ob sich der Ansatz durchsetzt. Bislang gibt es meines Wissens nach nur sehr wenige Kunden, die einen Data Mesh bereits produktiv im Einsatz haben.
@robertbutscher6824
@robertbutscher6824 Жыл бұрын
das war ein sehr schön fundierter Kommentar - meines Wissens nach setzen Zalando und adidas auf Data Mesh, zumindest wurden diese Unternehmen als Beispiele genannt. Ich halte auch das hohe IT-Skill-Level in der Fachabteilung für eine zentrale Herausforderung bei der Umsetzung von Data Mesh. Das muss jetzt kein Hinderungsgrund sein, aber der damit einhergehende Paradigmen-Wechsel ist nicht zu unterschätzen, insbesondere auch, weil etliche Unternehmen ihre IT-Abteilungen eher herunterfahren wollen als neue Entwickler:innen einzustellen
@WittRaider
@WittRaider Жыл бұрын
Wenn ich es richtig verstanden habe bedeutet ein DataMesh auch immer dass das jeweilige Team mit fachlicher Kenntnis der Daten diese nun über einen einheitlichen Mechanismus bereitstellt und in der Art welche Abfragen gestellt werden können die Interpretationsarbeit macht die ansonsten „fachfremde“ Personen machen müssen. Glaubt ihr, dass das wirklich von den Fachteams geleistet werden kann? Also rein zeitlich? In der Regel werden ja „fachfremde“ die Fragen haben und deshalb Daten mehrerer Fachbereiche zusammenbringen müssen. Liegt da nicht genauso viel Interpretation drin? Ich finde die Idee gut, kann mir aber noch nicht ganz vorstellen wie eine Organisation als gesamtes ticken muss um das erfolgreich umzusetzen.
@T0kwe
@T0kwe Жыл бұрын
Üblicherweise baut man seine Teams ja nach dem Spotify-Modell auf. Also jedes Team besteht aus Menschen mit verschiedenen Skills, sodass alle Rollen ausgefüllt werden. Man kann also das Team einfach um die Rolle des Datenanalysten erweitern, der dann genau diese Auswertungen für das eigene und für andere Teams übernimmt
@WittRaider
@WittRaider Жыл бұрын
@@T0kwe : was funktioniert Deiner Meinung nach besser: eher als zusätzliche Rolle im bestehenden Team oder dediziert über Einstellung. Klar kommt es drauf an, wie nahe der Skill bereits im Team vorhanden ist, aber wie siehst Du es in der Praxis?
@T0kwe
@T0kwe Жыл бұрын
In der Praxis nutzt noch niemand Data Mesh soweit ich weiß. Deswegen kann ich hier nicht aus Erfahrung sprechen. Üblicherweise gibt es ja aber schon jetzt ein Data-Team und das würde ich auflösen oder stark in der Größe reduzieren und die Leute dann in die jeweiligen fachlichen Entwicklungsteams integrieren.
@philippkunz4263
@philippkunz4263 Жыл бұрын
Das Konzept des Data Mesh ist mir soweit klar, macht auch irgendwo Sinn. Es ist aber meiner Meinung nach nichts anderes, als der "holistischere" Ansatz vom zehn Jahre alten (demokratischen) Self Service BI Ansatz; Man nutzt im Unternehmen quasi ein Self-Service BI Tool, mit dem der Fachbereich (nach erfolgter Schulung) modulare Data Products (Kundenstamm, Artikelstamm, Etc. im Sinne eines Datenkatalogs) zu einem Datenmodell (Data Mart) verknüpft und dieses dann auch für die Dashboards nutzt. Für den Mittelstand absolut ausreichend. Bei Enterprise Kunden wird das Ganze mit einer "Data Fabric" als technische Plattform halt zusätzlich umspannt, damit ich bei Bedarf neben dem BI Tool auch Datenintegrationslösungen, ETL-Tools, etc. einsetzen kann. Alter Wein in neuen Schläuchen...
@markusbreitinger5508
@markusbreitinger5508 Жыл бұрын
Genau wegen der Spannung aus unflexibler Semantik bei SQL bis hin zur fehlenden Semantik beim Data Lake, habe ich mich vor 6 Jahren Graph DBs zugewandt. Dort kann ich alle Varianten von Semantik gleichzeitig haben und können Prozesse eine passende Abbildung finden und Prozesse zur Analyse entwickeln.
@realrlg
@realrlg Жыл бұрын
Gibt es eigentlich Begriffe, die "eigene Daten" (Produktmerkmale, Preise, Artikelnummern, ...) und "statistische Daten" (Wie oft wurde Produkt X angeklickt/angesehen, wie oft wurde Y gekauft, wie haben sich die Verkaufszahlen verändert nach Einführung von Z) unterscheiden? Data Warehouse hatte ich in der Vergangenheit für diese "eigenen Daten" ganz praktisch gefunden, wobei ich irgendwann dachte, dass man den Aufwand sich sparen könnte, wenn man einen GraphQL Layer drüberlegen würde. Vor ein paar Wochen mussten wir einen Prototypen in der Richtung basteln, da fand ich dann "GraphQL Mesh" - kannte den Begriff Data Mesh davor aber noch nicht 😅
@maxjung6845
@maxjung6845 Жыл бұрын
bzgl der Begriffe: "Daten" und "Meta-Daten" sind gebräuchlich zumindest in meiner Bubble. Ich mag auch diese Erklärung von "Meta-Daten" gern: M.D. sind Daten über Daten. Wobei du eben auch schon in Richtung "statistischer bzw. aggreggierter Meta-Daten" beschreibst. War das die Frage?
@realrlg
@realrlg Жыл бұрын
@@maxjung6845 d.h. Daten sagt man zu den Produkt-/Featuredaten und Meta-Daten zu den erhobenen Daten? 🤔 Hätte das eher andersherum vermutet...
@maxjung6845
@maxjung6845 Жыл бұрын
@@realrlg ja, das würd ich so bestätigen. Im Kontext "(Big) Data (Warehouse, Lake, Mesh)" sind vielleicht auch die Abkürzungen OLTP, OLAP eine Erwähnung wert. Unter OLTP stell *ich* mir die "normalen Daten", OLAP sind die Daten zu Analyse-Zwecken.
@BenjaminWagener
@BenjaminWagener Жыл бұрын
Da ich bisher nur mit kleineren Anwendungen zu tun hatte, hatte ich noch nie mit Data Warehouse oder Data Lakes zu tun. Es ist aber erschreckend, dass da überhaupt jemand mal dachte, dass derartige Architekturen sinnvoll seien. Es ist doch eigentlich eine klare Grundlage der Informationsverarbeitung, dass Informationen ohne den Kontext kaum etwas bis gar nichts wert sind. Das Data Mesh klingt hingegen sinnvoll.
@suikast420
@suikast420 Жыл бұрын
I am with you
@FilmfanOliver1992
@FilmfanOliver1992 Жыл бұрын
Automatisch generierte Untertitel, haben was von English for insiders - Englisch für reingefallene ;-)
@devchannel5232
@devchannel5232 Жыл бұрын
Top!
@jonasbehringer3859
@jonasbehringer3859 Жыл бұрын
Hab’s eben im masterstudium gehört 😅
@bsdooby
@bsdooby Жыл бұрын
Data Lakes machen aber doch schon Sinn, wenn man denn die nötige Rechenpower hat, um damit zu arbeiten. Es finden sich in jedem Fall statistische Muster, die abgegriffen werden können (LLMs werden ja so trainiert).
@jeyt436
@jeyt436 Жыл бұрын
Toller Videotitel
@thenativeweb
@thenativeweb Жыл бұрын
[gr] Danke schön 😊 (War nicht meine Idee, aber ich geb's weiter!)
@jeyt436
@jeyt436 Жыл бұрын
'Data Lake" aufbDeutsch: Finde die Nadel im Heuhaufen (so jlhabe ich es zumindest durch dich verstanden)
@marcello4258
@marcello4258 Жыл бұрын
Oh oh oh.. du weißt ich liebe deinen Kanal, aber bei diesem Video hast du viele Sachen durcheinander gebracht und Begriffe falsch verwendet 🙈 Ich will nicht sagen, dass du dich dazu nicht äußern solltest, aber ich denke du solltest das Video noch mal komplett überarbeiten. :/
Die beste Architektur für Deine Software // deutsch
23:10
the native web GmbH
Рет қаралды 8 М.
Junior vs Senior: Die traurige Wahrheit // deutsch
16:40
the native web GmbH
Рет қаралды 11 М.
VIP ACCESS
00:47
Natan por Aí
Рет қаралды 30 МЛН
小丑女COCO的审判。#天使 #小丑 #超人不会飞
00:53
超人不会飞
Рет қаралды 16 МЛН
Что-что Мурсдей говорит? 💭 #симбочка #симба #мурсдей
00:19
Sind Microservices überbewertet? // deutsch
18:13
the native web GmbH
Рет қаралды 6 М.
OLTP und OLAP einfach erklärt // deutsch
10:38
the native web GmbH
Рет қаралды 4,9 М.
So verarschen Dich Unternehmen bei der Bewerbung // deutsch
10:47
the native web GmbH
Рет қаралды 35 М.
Data Lakehouse and Data Mesh-Two Sides of the Same Coin
40:48
Databricks
Рет қаралды 9 М.
Sei kein Steinzeit-Entwickler // deutsch
11:26
the native web GmbH
Рет қаралды 10 М.
Introduction to Data Mesh with Zhamak Dehghani
1:05:31
Stanford Deep Data Research Center
Рет қаралды 35 М.
Clean Code vs Performance: Der große Irrtum?! // deutsch
24:37
the native web GmbH
Рет қаралды 11 М.
Softwareentwicklung ist viel zu teuer?! // deutsch
17:37
the native web GmbH
Рет қаралды 16 М.
Data Fabric Explained
13:34
IBM Technology
Рет қаралды 100 М.
Organize Your Home With These Must-Have Smart Gadgets #shorts  Pt-2
0:22
iPhone SE 2020 пролежал в коробке 4 года
0:54
ТЕХНОБЛОГ ГУБАРЕВ СЕРГЕЙ
Рет қаралды 3,4 МЛН
Хитрость с айфоном!
0:19
По ту сторону Гугла
Рет қаралды 241 М.
ПРАВДА ЛИ ТЕЛЕФОНЫ 2000х БЕССМЕРТНЫ ?
28:53
Samsung water test 💀☠️ #samsung #water #viralshort #edit
0:30