Thiết kế Database đáp ứng 400 triệu người tại Quora | System Design Wecommit

  Рет қаралды 34,468

Learning Database with Tran Quoc Huy

Learning Database with Tran Quoc Huy

Күн бұрын

Пікірлер: 97
@tranquochuywecommit
@tranquochuywecommit Ай бұрын
Gửi mọi người Group Telegream Wecommit Public Community : www.wecommit.com.vn/wecommitcommunity ,anh em có thể trao đổi những câu hỏi , vấn đề khi xem Video và kết nối với tôi trong Group nhé (trường hợp click trực tiếp bị lỗi thì ae copy link ra browser nhé)
@baodo549
@baodo549 7 ай бұрын
Trong video này, Anh Huy chỉ nói cách họ làm sao để giải quyết vấn đề mà không nói ra tên của phương pháp đó. Cách họ làm gọi là Sharding architecture. Zookeeper(directory based sharding), key-based, range-based sharding chỉ là những cách để chia database. Hy vọng anh có thêm nhiều videos chia sẽ nhung kiến trúc và cách họ áp dụng trong thực tế.
@mykun8737
@mykun8737 6 ай бұрын
đúng chuyên gia DB nói chuyện nghe khác bọt thật, em thật sự hiếm khi nghe mấy ông thợ code youtube VN, có mỗi anh nên em xem.
@davidmedia961
@davidmedia961 11 ай бұрын
Quả join ở phần ứng dụng thì bản chất cũng phải có dữ liệu đc query vào db . sau đó join xử lý dữ liệu dưới ứng dụng . Nói chung bài viết cũng ý nghĩa . Với lại em cũng từng làm các hệ thống lớn như vậy cũng chia nhỏ thêm nữa là query vào các database standby và chỉ insert vào master . Tối ưu nữa là cahe là kinh điển và index partion hợp lý. Có hệ thống hằng ngày hàng tuần tạo ra các bảng để phục vụ điều này thay vì partion
@tranquochuywecommit
@tranquochuywecommit 11 ай бұрын
Ở Việt Nam thì đa phần là chỉ cần chia mức độ Read sang hệ thống dự phòng (Slave). Nhưng ở các bài toán làm dữ liệu đa quốc gia, yêu cầu đọc ghi rất cao thì sẽ cần tới việc sử dụng kiến trúc phân tán như trong Video mình nói. Thật ra thì trong mô hình trong video, các database đều được sử dụng Master - Slave luôn anh em nhé.
@suale2475
@suale2475 10 ай бұрын
Chắc chưa chưa đủ lớn rồi :D
@sontrinhvan1024
@sontrinhvan1024 4 ай бұрын
Rất bổ ích. Mình nhớ chia nhỏ để nhẹ như làm excel. Còn xử lý joi thì chắc chọn một nơi trung gian và ngay trên giao diện ẩn. Bạn xem😄?
@premium2979
@premium2979 11 ай бұрын
Tuyệt vời quá anh ơi. Video cực kỳ thực tế và hữu ích. Giá trị mang lại lớn hơn rất nhiều những clip kiểu tutorial getting started
@tranquochuywecommit
@tranquochuywecommit 11 ай бұрын
Cảm ơn sự ủng hộ của anh em. Mình rất vui vì thấy nó mang lại giá trị cho anh em. Anh em đăng ký kênh để nhận thông báo các video mới nhất của mình nhé
@chinhvd
@chinhvd 7 ай бұрын
Mặc dù chưa hiểu lắm nhưng cảm ơn anh đã chỉ đường!
@dinhvanty3385
@dinhvanty3385 10 ай бұрын
em thấy khá giống cách tiếp cận của môn cơ sở dữ liệu phân tán ở trường em, thầy sẽ dùng 2 phương pháp đó là phân mảnh ngang và phân mảnh dọc để chia nhỏ dữ liệu ra
@viettin3571
@viettin3571 10 ай бұрын
Thầy Kỳ Thư à
@tranquochuywecommit
@tranquochuywecommit 8 ай бұрын
đúng rồi đó em. Những thứ học trên trường đều là các cấu thành để xây dựng nên những hệ thống lớn, phức tạp đấy. Học chắc các kiến thức em nhé.
@cautran7536
@cautran7536 7 ай бұрын
Em cảm ơn anh. Kênh của anh rất nhiều kiến thức hữu ích và thú vị. Anh có thể làm video về tối ưu csdl cho các doanh nghiệp hay dùng với SAP được không ah?
@nguyennghialan
@nguyennghialan 2 ай бұрын
Anh Huy hoặc ai đó có thể cho tôi ví dụ làm sao để thực hiện JOIN tại application level? Xin cảm ơn
@hoanghieu3842
@hoanghieu3842 10 ай бұрын
ơi cát chầm tít chầm tít ơi cát mao cát mao . bằng tình cảm yêu thương, chúc anh muôn đời bình an, chúc anh sống trong ánh sáng hào quang của 10 phương chư phật! kiến thức của anh hay quá thực ra kiến thức có nhưng anh là người tóm gọn và truyền lại kiến thức hay anh ạ
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cảm ơn người anh em nhé
@NhatNguyen-eo4tn
@NhatNguyen-eo4tn 5 ай бұрын
Bạn đã chia sẽ kiến thức thiết kế db quá hay. Rất cảm ơn bạn.
@datdat5504
@datdat5504 4 ай бұрын
Anh Huy có thể giải thích giúp em kỹ hơn phần join trên phần ứng dụng khi tách bảng ra nhiều server được không ạ. Em cảm ơn anh
@phattrinh1241
@phattrinh1241 2 ай бұрын
Cho em hỏi, chia các bảng vào từng server khác nhau như thế thì làm sao tạo khóa chính khóa ngoại được nhỉ, rồi với các công nghệ ORM như hibernate, JPA của spring boot phải adapt như thế nào, em là sinh viên nên em kiến thức của em còn hạn hẹp ạ, mong được giải đáp
@ucchauminh5793
@ucchauminh5793 11 ай бұрын
Hay quá anh ơi, hi vọng anh sẽ còn ra nhiều video về việc phân tích csdl của các hệ thống lớn thêm nữa. Thank bro!
@tranquochuywecommit
@tranquochuywecommit 11 ай бұрын
Cảm ơn sự ủng hộ của anh em. Anh em đăng ký kênh nhé, thời gian tới mình có nhiều thứ hay ho sẽ chia sẻ cho mọi người
@sandichhuu
@sandichhuu 9 ай бұрын
Thực tế triển khai chắc chắn là rất thử thách. Mình nghĩ ứng dụng connect nhiều db sẽ tốn nhiều thời gian để lấy dữ liệu từ nguồn về.
@tranquochuywecommit
@tranquochuywecommit 9 ай бұрын
bài toán tối ưu luôn có thử thách và rất thú vị anh em ah
@chuongnx
@chuongnx 7 ай бұрын
Với CSDL như mysql thì khi dữ liệu của db lên đến hàng TB là xử lý chậm, nếu giải pháp là sử dụng những csdl như oracle thì như thế nào(lý do họ vẫn chọn mysql có phải do chi phí không?)
@khanhsb15
@khanhsb15 8 ай бұрын
Cảm ơn anh, video rất hay và dễ hiểu, bổ ích
@vankhanhnguyen2514
@vankhanhnguyen2514 7 ай бұрын
Việc chia nhỏ ntn thì giải quyết bài toán tìm kiếm như thế nào v anh?, vd tạo tài khoản mới email ko trùng, username ko trùng???
@havanlong2206
@havanlong2206 8 ай бұрын
bên em trước đây cũng đã phải tối ưu như vậy, đánh đổi lại bằng việc dữ liệu có thể không chính xác nữa, các kiểu filter, sort cũng sấp mặt và phải kết hợp các tech, sử dụng uuid thay cho id, Outsource thì sấp mặt chứ Prod thì em k biết, =)) hóng mọi người góp ý ạ
@weak5205
@weak5205 9 ай бұрын
cho em hỏi cách mình đồng bộ dữ liệu ở các server khác nhau nằm trên những vị trí địa lý khác nhau sao cho hiệu quả ạ, em cám ơn.
@t702al
@t702al 4 ай бұрын
Join ở ứng dụng có cơ chế như thế nào vậy anh
@TinooT
@TinooT 11 ай бұрын
Mình có câu hỏi về tách mỗi bảng ở 1 database khác nhau: 1. JOIN bảng ở tầng ứng dụng nôm na là join bằng code ngôn ngữ lập trình đúng không? Mình có vài câu hỏi về việc tách 1 bảng ra ở nhiều database khác nhau. 1. 1 database có 1 bảng Comments 300GB thì có khác 1 database có 2 bảng Comments , mỗi bảng 150GB không? 2. Ở phút 7:54 mình thấy 2 bảng trong 1 database, anh nói các bảng sau khi tách có cùng tên, vậy 2 bảng trong 1 database này có cùng tên không? 3. Mình có thể chia theo cả chiều ngang và chiều dọc đúng không? Một câu hỏi thêm: anh có thể chia sẻ cách tìm kiếm thông tin về cấu trúc hệ thống, công nghệ sử dụng, ngôn ngữ mà 1 trang web, 1 ứng dụng,...sử dụng được không? Thông tin trong video anh tìm hay quá, mình cũng search tiếng Anh nhưng không có kết quả mong muốn. Xin cảm ơn anh.
@tathanh203
@tathanh203 11 ай бұрын
thay vì 1 thằng nó tìm comment trong 300GB thì bây h sẽ có 2 thằng tìm comment nhưng mỗi thằng chỉ cần tìm trong 150GB
@minhchienle2711
@minhchienle2711 10 ай бұрын
Join ở tầng ứng dụng nghĩa là thông qua code tạo ra truy vấn, load vô bộ nhớ. Sau đó code đọc cái đó rồi tự xử lý hiểu nôm na là z. Mình đoán các framwork web hiện đại chắc có hỗ trợ chuyện đó khi giao tiếp với database. Cái này sâu quá nên cũng ko có thời gian tìm hiểu kĩ.
@ngocanhfox
@ngocanhfox 10 ай бұрын
A Huy ơi, ban đâu Table chưa được partition db, nhưng sau này có nhiều data lên rồi thì mình có thể chia nhỏ được không ạ. E đang nói về Postgresql
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
thoái mái anh em nhé. Anh em chỉnh lại table partition sau cũng được.
@leoan1066
@leoan1066 10 ай бұрын
A Huy có khoá học SQL online không ạ?
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
Anh em tham khảo khoá học này nhé Từ điển tối ưu 100x hiệu năng Link: wecommit.com.vn/tu-dien-toi-uu-100x-hieu-nang/
@vietronaldo23w
@vietronaldo23w 10 ай бұрын
Quá hay.
@hungletri3550
@hungletri3550 10 ай бұрын
Cho e hỏi. Tại sao họ ko triển khai hadoop luôn mà lại phân tán kiểu phân nhỏ mà dùng tiếp mySQL?
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
hệ thống càng lớn thì càng phải cân nhắc khi chuyển đổi anh em ah. Chuyển đổi nó có rất nhiều chi phí ẩn a rủi ro, đông thơi có cả yếu tố ảnh hưởng tới khách hàng khi chuyển đổi nữa, ví dụ: downtime
@andyNice
@andyNice 11 ай бұрын
cho mình hỏi nếu chia nhỏ cơ sở dữ liệu vậy thì ứng dụng cũng phải sửa lại phải không? làm sao để đảm bảo tính toàn vẹn của các tables trong môi trường phân tán
@tranquochuywecommit
@tranquochuywecommit 8 ай бұрын
Ah, có 1 lưu ý rằng: khi thực hiện phân tán database sử dụng kỹ thuật sharding, nếu ứng dụng mà tìm kiếm không có sharding key là toạch nhé anh em (vì nó phải tìm ở tất cả các database)
@VinhNguyen-zg7lu
@VinhNguyen-zg7lu 11 ай бұрын
Hay quá, anh làm thêm video về cái mem cache Redis đi anh
@thaiducquang2318
@thaiducquang2318 10 ай бұрын
Cho em hỏi ngu là việc tách nhỏ DB theo từng năm ra từng server riêng vậy thì việc search theo từ khóa sẽ như thế nào? Làm sao người dùng nhập tìm kiếm tên bài viết mà zoo keeper biết tìm kiếm ở server DB nào và tối ưu như thế nào vậy anh?
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
phần này em tìm hiểu về lý thuyết của kỹ thuật sharding database sẽ thấy rõ hơn nhé
@metransformer
@metransformer 10 ай бұрын
việc tách DB ra nhiều DB nhỏ, lúc dự án nhỏ mình chưa thấy, khi dự án phình to thì mới thấy đc thì lúc này chia có vấn đề gì không vậy ad. Chưa kể nếu tách ra như vậy việc lấy data liên bảng sẽ rất khó (join) thì mình giải quyết thế nào vậy. Thanks bro
@tranquochuywecommit
@tranquochuywecommit 8 ай бұрын
cảm ơn anh em đã ủng hộ kênh của mình nhé
@codewithme305
@codewithme305 7 ай бұрын
dạ anh ơi, anh cho em hỏi xíu là đẩy phần join lên tầng application nghĩa là mình không join bằng lệnh mysql mà join bằng code chạy nhiều thread hoặc async rồi loop để join hay như thế nào ạ?. Em cảm ơn anh nhiều!
@quocluuphan7498
@quocluuphan7498 5 ай бұрын
Theo mình nghĩ là vẫn join trên mysql giống như các hệ thống c..ờ b..ạc online tà…i sỉ.,u chẳn lẻ thấy join trên application
@bernadinadasha7104
@bernadinadasha7104 8 ай бұрын
Video hay a à
@quanphamanh957
@quanphamanh957 8 ай бұрын
Khi chia nhỏ bảng thành các bảng con cùng tên thì chỉ số ID nó đánh như thế nào ạ
@havanlong2206
@havanlong2206 8 ай бұрын
dùng uuid thay cho id nha bạn, nếu như chưa triển khai uuid thì sẽ rất vất vả đây
@tungleggo714
@tungleggo714 7 ай бұрын
@@havanlong2206 tức là uuid thường mình sẽ tạo ra trước khi tách bảng rồi ấy bạn nhỉ. T đang nghĩ nếu baayh muốn tạo ra uuid cho 1 bảng chưa có thì mình sẽ kiểu kết hợp thời gian bản ghi đó được tạo + 1 vài ký tự random có ok ko nhỉ ??
@nguyenhoanganh2k1
@nguyenhoanganh2k1 11 ай бұрын
ở đây tách các bảng ra server riêng là tương ứng với việc dưng lên 1 con service riêng ak anh?
@tranquochuywecommit
@tranquochuywecommit 11 ай бұрын
Đúng rồi anh em, database trên server riêng biệt luôn nhé.
@ThoLe-yw6rb
@ThoLe-yw6rb 11 ай бұрын
làm thêm bài về telegram với a
@tranquochuywecommit
@tranquochuywecommit 11 ай бұрын
Anh em đăng ký kênh nhé, sắp tới mình cũng còn nhiều nội dung thú vị chia sẻ cho mọi người. Cảm ơn anh em đã quan tâm và ủng hộ nhé.
@khanhnd157
@khanhnd157 10 ай бұрын
thank anh chia se
@reviewtotnhat
@reviewtotnhat 10 ай бұрын
muốn thống kê báo cáo thì họ dùng công nghệ nào vậy ạ(e nghĩ họ dùng DWH)
@tranquochuywecommit
@tranquochuywecommit 8 ай бұрын
các hệ thống lớn hiện tại sẽ có xu hướng xây dựng Data Lake và DWH anh em nhé
@nghiapham6000
@nghiapham6000 10 ай бұрын
Giải thích rất tường minh, video hay lắm anh.
@tranquochuywecommit
@tranquochuywecommit 8 ай бұрын
cảm ơn anh em. Chúc anh em năm mới thật tuyệt vời nhé
@NamNguyen-wv7zv
@NamNguyen-wv7zv 10 ай бұрын
Các anh cho em hỏi là e muốn tìm kiếm 1 danh sách các công nghệ kiểu như zookeeper thì có website nào không ạ ? Em xin cám ơn ạ
@hungletri3550
@hungletri3550 10 ай бұрын
Bạn thử xem cơ bản về hadoop và apache ecosystem xem
@tranquochuywecommit
@tranquochuywecommit 8 ай бұрын
mình đang làm 1 chuỗi các video để chia sẻ về những công nghệ, kỹ thuật đang được ứng dụng thực tế hiện nay. Có thể sẽ giúp ích được cho anh em đấy.
@HaiTran-ol2fu
@HaiTran-ol2fu 11 ай бұрын
Hay quá a ❤
@namngo3927
@namngo3927 11 ай бұрын
Rất bổ ích tks anh❤
@atTran-xv5iz
@atTran-xv5iz 10 ай бұрын
thường những thông tin về cấu trúc cũng như concept mà các công ty công nghệ đang sử dụng có thể tìm kiếm ở đâu nhỉ, cũng muốn biết người ta đang áp dụng những gì mà tìm ra ít kết quả quá quá, cảm ơn anh
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
các nội dung này thường rải rác, đọc ở nhiều diễn đàn khác nhau như reddit, quora, một số thông tin mình có tổng hợp từ các chia sẻ trên linkedin từ các kỹ sư đang làm việc tại các Big tech anh em ah
@HongHaiNguyenx
@HongHaiNguyenx 10 ай бұрын
đọc trong documentations của các db, chẳng hạn với mongodb thì docs có hết các cách triển khai hệ thống, sau đó bạn sẽ nắm đc các keyword để tìm hiểu cách cài đặt cụ thể từ người khác nữa. ko cần phải đọc mấy bài nói cách làm của cty này kia đâu vì có đọc cũng chả hiểu đc, quan trọng bạn phải nắm được lý thuyết nền tảng trc rồi làm dần từ đơn giản nhất. mấy khái niệm về partitioning hay sharding, indexing ko biết thì 🤷
@minhquangngo8875
@minhquangngo8875 10 ай бұрын
@@HongHaiNguyenx đọc -> k hiểu -> tìm hiểu về các keyword nói như ông thì phải hiểu hết tất cả các công nghẹ trên đời rồi mới đi đọc mấy cái blog kiểu này chắc
@HongHaiNguyenx
@HongHaiNguyenx 10 ай бұрын
@@minhquangngo8875 trc h t toàn làm vậy, ko thì sao bắt kịp 15 năm vừa qua. đúng là phải hiểu từng keyword đó, hồi mới ra trường t cũng phải đọc nhiều lắm, giờ cũng có ngừng đâu, vừa rồi còn làm audit source code dapp eth solidity mà cũng tự học đấy. bạn ko có kiến thức cơ bản thì có vào cty họ cũng ko thể đào tạo bạn đc.
@hungnguyenquoc710
@hungnguyenquoc710 10 ай бұрын
Fb thì sao ạ. Cũng chia vậy à bác
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
fb để một video khác mình sẽ phân tích với anh em nhé
@duyngo8608
@duyngo8608 10 ай бұрын
Cơ chế backup ntn nhỉ chắc backup phần cứng =))
@tranquochuywecommit
@tranquochuywecommit 8 ай бұрын
đi kèm với từng database lại có sử dụng cơ chế dạng Master - slave. Đáp ứng hoàn toàn về tính sẵn sàng anh em ah
@herohoang4717
@herohoang4717 10 ай бұрын
Hay quá a🎉🎉🎉
@tranquochuywecommit
@tranquochuywecommit 8 ай бұрын
cảm ơn anh em đã ủng hộ kênh của mình nhé
@tri_ho
@tri_ho 11 ай бұрын
Bổ ích
@iohk_
@iohk_ 10 ай бұрын
nếu được bạn làm video hướng dẫn deploy PostgREST và series lập trình PL/pgSQL nữa nha, mình cảm ơn
@banhgao3521
@banhgao3521 10 ай бұрын
A có thể cụ thể phần JOIN ở ứng dụng thay vì ở database là như nào không anh ?
@namngo5726
@namngo5726 10 ай бұрын
thay vì bạn dùng câu query join thì mình chuyển qua dùng where in
@minhchienle2711
@minhchienle2711 10 ай бұрын
where in 2 phát ở database. Sau đó code nhận dữ liệu load vô ram rồi tự xử.
@tungtran4019
@tungtran4019 11 ай бұрын
thanks anh
@tranquochuywecommit
@tranquochuywecommit 11 ай бұрын
Cảm ơn sự ủng hộ của anh em nhé. Anh em đăng ký kênh để sớm nhận thông báo các nội dung thú vị sắp tới nha.
@hyugatoru7329
@hyugatoru7329 10 ай бұрын
hờ hờ 😂
@vannguyenanh4003
@vannguyenanh4003 11 ай бұрын
hệ thống mình như quần què mà hàng tháng vẫn chịu tải bằng nửa quora 🤣
@lenamduytuan
@lenamduytuan 10 ай бұрын
ở đây k có quần què, xóa comment giờ. :)
@anhchung7340
@anhchung7340 9 ай бұрын
trình bày rất là dài dòng, có thể rút gọn video từ 11p xuống 2p được . cái quan trọng nhất thì ko nói . tư duy chia nhỏ thì sinh viên năm 2 cũng biết
@tranquochuywecommit
@tranquochuywecommit 8 ай бұрын
tư duy chia nhỏ là gốc rễ của tối ưu. Bản thân mình cũng đã làm tối ưu nhiều năm, chỉ một số ít người (trong phạm vi những dự án mình từng làm) thật sự hiểu và làm được phần chia nhỏ này ngon nghẻ.
@dangviethung88
@dangviethung88 3 ай бұрын
Mình thấy nói như này thấy hiểu hơn á
@duykhuongnguyen3258
@duykhuongnguyen3258 11 ай бұрын
nó khác gì partition nhỉ
@dunx8423
@dunx8423 11 ай бұрын
Partition vẫn nằm trên cùng 1 server, không giải quyết được việc nghẽn hiệu năng
@tranquochuywecommit
@tranquochuywecommit 8 ай бұрын
Về tư duy thì Partition cũng là tách nhỏ các Table thành những phần riêng biệt (để tăng tốc hiệu năng), tuy nhiên các Partition đó đều nằm trên 1 database và cùng thuộc 1 server. Tại lúc này nó vẫn bị giới hạn. Tư duy trong video mình nói là tách thành nhiều server riêng biệt.
@softgreen8150
@softgreen8150 9 ай бұрын
Phá vỡ cấu trúc nhằm mục đích tối ưu tốc độ
Loại Database giúp Generative AI  bùng nổ | Vector Database Wecommit
17:12
Trần Quốc Huy - Databases
Рет қаралды 41 М.
When u fight over the armrest
00:41
Adam W
Рет қаралды 23 МЛН
Trapped by the Machine, Saved by Kind Strangers! #shorts
00:21
Fabiosa Best Lifehacks
Рет қаралды 35 МЛН
CAN YOU DO THIS ?
00:23
STORROR
Рет қаралды 49 МЛН
Xây dựng kiến trúc chịu tải lớn ở Tiki
48:23
Grokking Vietnam
Рет қаралды 85 М.
Bí mật TOP 1% những lập trình viên giỏi nhất | Trần Quốc Huy Wecommit
26:47
Which Database Model to Choose?
24:38
High-Performance Programming
Рет қаралды 60 М.
Design System: Payment System cơ bản - 3k RPS
12:37
Việt Trần
Рет қаралды 15 М.
When u fight over the armrest
00:41
Adam W
Рет қаралды 23 МЛН