Gửi mọi người Group Telegream Wecommit Public Community : www.wecommit.com.vn/wecommitcommunity ,anh em có thể trao đổi những câu hỏi , vấn đề khi xem Video và kết nối với tôi trong Group nhé (trường hợp click trực tiếp bị lỗi thì ae copy link ra browser nhé)
@baodo5497 ай бұрын
Trong video này, Anh Huy chỉ nói cách họ làm sao để giải quyết vấn đề mà không nói ra tên của phương pháp đó. Cách họ làm gọi là Sharding architecture. Zookeeper(directory based sharding), key-based, range-based sharding chỉ là những cách để chia database. Hy vọng anh có thêm nhiều videos chia sẽ nhung kiến trúc và cách họ áp dụng trong thực tế.
@mykun87376 ай бұрын
đúng chuyên gia DB nói chuyện nghe khác bọt thật, em thật sự hiếm khi nghe mấy ông thợ code youtube VN, có mỗi anh nên em xem.
@davidmedia96111 ай бұрын
Quả join ở phần ứng dụng thì bản chất cũng phải có dữ liệu đc query vào db . sau đó join xử lý dữ liệu dưới ứng dụng . Nói chung bài viết cũng ý nghĩa . Với lại em cũng từng làm các hệ thống lớn như vậy cũng chia nhỏ thêm nữa là query vào các database standby và chỉ insert vào master . Tối ưu nữa là cahe là kinh điển và index partion hợp lý. Có hệ thống hằng ngày hàng tuần tạo ra các bảng để phục vụ điều này thay vì partion
@tranquochuywecommit11 ай бұрын
Ở Việt Nam thì đa phần là chỉ cần chia mức độ Read sang hệ thống dự phòng (Slave). Nhưng ở các bài toán làm dữ liệu đa quốc gia, yêu cầu đọc ghi rất cao thì sẽ cần tới việc sử dụng kiến trúc phân tán như trong Video mình nói. Thật ra thì trong mô hình trong video, các database đều được sử dụng Master - Slave luôn anh em nhé.
@suale247510 ай бұрын
Chắc chưa chưa đủ lớn rồi :D
@sontrinhvan10244 ай бұрын
Rất bổ ích. Mình nhớ chia nhỏ để nhẹ như làm excel. Còn xử lý joi thì chắc chọn một nơi trung gian và ngay trên giao diện ẩn. Bạn xem😄?
@premium297911 ай бұрын
Tuyệt vời quá anh ơi. Video cực kỳ thực tế và hữu ích. Giá trị mang lại lớn hơn rất nhiều những clip kiểu tutorial getting started
@tranquochuywecommit11 ай бұрын
Cảm ơn sự ủng hộ của anh em. Mình rất vui vì thấy nó mang lại giá trị cho anh em. Anh em đăng ký kênh để nhận thông báo các video mới nhất của mình nhé
@chinhvd7 ай бұрын
Mặc dù chưa hiểu lắm nhưng cảm ơn anh đã chỉ đường!
@dinhvanty338510 ай бұрын
em thấy khá giống cách tiếp cận của môn cơ sở dữ liệu phân tán ở trường em, thầy sẽ dùng 2 phương pháp đó là phân mảnh ngang và phân mảnh dọc để chia nhỏ dữ liệu ra
@viettin357110 ай бұрын
Thầy Kỳ Thư à
@tranquochuywecommit8 ай бұрын
đúng rồi đó em. Những thứ học trên trường đều là các cấu thành để xây dựng nên những hệ thống lớn, phức tạp đấy. Học chắc các kiến thức em nhé.
@cautran75367 ай бұрын
Em cảm ơn anh. Kênh của anh rất nhiều kiến thức hữu ích và thú vị. Anh có thể làm video về tối ưu csdl cho các doanh nghiệp hay dùng với SAP được không ah?
@nguyennghialan2 ай бұрын
Anh Huy hoặc ai đó có thể cho tôi ví dụ làm sao để thực hiện JOIN tại application level? Xin cảm ơn
@hoanghieu384210 ай бұрын
ơi cát chầm tít chầm tít ơi cát mao cát mao . bằng tình cảm yêu thương, chúc anh muôn đời bình an, chúc anh sống trong ánh sáng hào quang của 10 phương chư phật! kiến thức của anh hay quá thực ra kiến thức có nhưng anh là người tóm gọn và truyền lại kiến thức hay anh ạ
@tranquochuywecommit10 ай бұрын
cảm ơn người anh em nhé
@NhatNguyen-eo4tn5 ай бұрын
Bạn đã chia sẽ kiến thức thiết kế db quá hay. Rất cảm ơn bạn.
@datdat55044 ай бұрын
Anh Huy có thể giải thích giúp em kỹ hơn phần join trên phần ứng dụng khi tách bảng ra nhiều server được không ạ. Em cảm ơn anh
@phattrinh12412 ай бұрын
Cho em hỏi, chia các bảng vào từng server khác nhau như thế thì làm sao tạo khóa chính khóa ngoại được nhỉ, rồi với các công nghệ ORM như hibernate, JPA của spring boot phải adapt như thế nào, em là sinh viên nên em kiến thức của em còn hạn hẹp ạ, mong được giải đáp
@ucchauminh579311 ай бұрын
Hay quá anh ơi, hi vọng anh sẽ còn ra nhiều video về việc phân tích csdl của các hệ thống lớn thêm nữa. Thank bro!
@tranquochuywecommit11 ай бұрын
Cảm ơn sự ủng hộ của anh em. Anh em đăng ký kênh nhé, thời gian tới mình có nhiều thứ hay ho sẽ chia sẻ cho mọi người
@sandichhuu9 ай бұрын
Thực tế triển khai chắc chắn là rất thử thách. Mình nghĩ ứng dụng connect nhiều db sẽ tốn nhiều thời gian để lấy dữ liệu từ nguồn về.
@tranquochuywecommit9 ай бұрын
bài toán tối ưu luôn có thử thách và rất thú vị anh em ah
@chuongnx7 ай бұрын
Với CSDL như mysql thì khi dữ liệu của db lên đến hàng TB là xử lý chậm, nếu giải pháp là sử dụng những csdl như oracle thì như thế nào(lý do họ vẫn chọn mysql có phải do chi phí không?)
@khanhsb158 ай бұрын
Cảm ơn anh, video rất hay và dễ hiểu, bổ ích
@vankhanhnguyen25147 ай бұрын
Việc chia nhỏ ntn thì giải quyết bài toán tìm kiếm như thế nào v anh?, vd tạo tài khoản mới email ko trùng, username ko trùng???
@havanlong22068 ай бұрын
bên em trước đây cũng đã phải tối ưu như vậy, đánh đổi lại bằng việc dữ liệu có thể không chính xác nữa, các kiểu filter, sort cũng sấp mặt và phải kết hợp các tech, sử dụng uuid thay cho id, Outsource thì sấp mặt chứ Prod thì em k biết, =)) hóng mọi người góp ý ạ
@weak52059 ай бұрын
cho em hỏi cách mình đồng bộ dữ liệu ở các server khác nhau nằm trên những vị trí địa lý khác nhau sao cho hiệu quả ạ, em cám ơn.
@t702al4 ай бұрын
Join ở ứng dụng có cơ chế như thế nào vậy anh
@TinooT11 ай бұрын
Mình có câu hỏi về tách mỗi bảng ở 1 database khác nhau: 1. JOIN bảng ở tầng ứng dụng nôm na là join bằng code ngôn ngữ lập trình đúng không? Mình có vài câu hỏi về việc tách 1 bảng ra ở nhiều database khác nhau. 1. 1 database có 1 bảng Comments 300GB thì có khác 1 database có 2 bảng Comments , mỗi bảng 150GB không? 2. Ở phút 7:54 mình thấy 2 bảng trong 1 database, anh nói các bảng sau khi tách có cùng tên, vậy 2 bảng trong 1 database này có cùng tên không? 3. Mình có thể chia theo cả chiều ngang và chiều dọc đúng không? Một câu hỏi thêm: anh có thể chia sẻ cách tìm kiếm thông tin về cấu trúc hệ thống, công nghệ sử dụng, ngôn ngữ mà 1 trang web, 1 ứng dụng,...sử dụng được không? Thông tin trong video anh tìm hay quá, mình cũng search tiếng Anh nhưng không có kết quả mong muốn. Xin cảm ơn anh.
@tathanh20311 ай бұрын
thay vì 1 thằng nó tìm comment trong 300GB thì bây h sẽ có 2 thằng tìm comment nhưng mỗi thằng chỉ cần tìm trong 150GB
@minhchienle271110 ай бұрын
Join ở tầng ứng dụng nghĩa là thông qua code tạo ra truy vấn, load vô bộ nhớ. Sau đó code đọc cái đó rồi tự xử lý hiểu nôm na là z. Mình đoán các framwork web hiện đại chắc có hỗ trợ chuyện đó khi giao tiếp với database. Cái này sâu quá nên cũng ko có thời gian tìm hiểu kĩ.
@ngocanhfox10 ай бұрын
A Huy ơi, ban đâu Table chưa được partition db, nhưng sau này có nhiều data lên rồi thì mình có thể chia nhỏ được không ạ. E đang nói về Postgresql
@tranquochuywecommit10 ай бұрын
thoái mái anh em nhé. Anh em chỉnh lại table partition sau cũng được.
@leoan106610 ай бұрын
A Huy có khoá học SQL online không ạ?
@tranquochuywecommit10 ай бұрын
Anh em tham khảo khoá học này nhé Từ điển tối ưu 100x hiệu năng Link: wecommit.com.vn/tu-dien-toi-uu-100x-hieu-nang/
@vietronaldo23w10 ай бұрын
Quá hay.
@hungletri355010 ай бұрын
Cho e hỏi. Tại sao họ ko triển khai hadoop luôn mà lại phân tán kiểu phân nhỏ mà dùng tiếp mySQL?
@tranquochuywecommit10 ай бұрын
hệ thống càng lớn thì càng phải cân nhắc khi chuyển đổi anh em ah. Chuyển đổi nó có rất nhiều chi phí ẩn a rủi ro, đông thơi có cả yếu tố ảnh hưởng tới khách hàng khi chuyển đổi nữa, ví dụ: downtime
@andyNice11 ай бұрын
cho mình hỏi nếu chia nhỏ cơ sở dữ liệu vậy thì ứng dụng cũng phải sửa lại phải không? làm sao để đảm bảo tính toàn vẹn của các tables trong môi trường phân tán
@tranquochuywecommit8 ай бұрын
Ah, có 1 lưu ý rằng: khi thực hiện phân tán database sử dụng kỹ thuật sharding, nếu ứng dụng mà tìm kiếm không có sharding key là toạch nhé anh em (vì nó phải tìm ở tất cả các database)
@VinhNguyen-zg7lu11 ай бұрын
Hay quá, anh làm thêm video về cái mem cache Redis đi anh
@thaiducquang231810 ай бұрын
Cho em hỏi ngu là việc tách nhỏ DB theo từng năm ra từng server riêng vậy thì việc search theo từ khóa sẽ như thế nào? Làm sao người dùng nhập tìm kiếm tên bài viết mà zoo keeper biết tìm kiếm ở server DB nào và tối ưu như thế nào vậy anh?
@tranquochuywecommit10 ай бұрын
phần này em tìm hiểu về lý thuyết của kỹ thuật sharding database sẽ thấy rõ hơn nhé
@metransformer10 ай бұрын
việc tách DB ra nhiều DB nhỏ, lúc dự án nhỏ mình chưa thấy, khi dự án phình to thì mới thấy đc thì lúc này chia có vấn đề gì không vậy ad. Chưa kể nếu tách ra như vậy việc lấy data liên bảng sẽ rất khó (join) thì mình giải quyết thế nào vậy. Thanks bro
@tranquochuywecommit8 ай бұрын
cảm ơn anh em đã ủng hộ kênh của mình nhé
@codewithme3057 ай бұрын
dạ anh ơi, anh cho em hỏi xíu là đẩy phần join lên tầng application nghĩa là mình không join bằng lệnh mysql mà join bằng code chạy nhiều thread hoặc async rồi loop để join hay như thế nào ạ?. Em cảm ơn anh nhiều!
@quocluuphan74985 ай бұрын
Theo mình nghĩ là vẫn join trên mysql giống như các hệ thống c..ờ b..ạc online tà…i sỉ.,u chẳn lẻ thấy join trên application
@bernadinadasha71048 ай бұрын
Video hay a à
@quanphamanh9578 ай бұрын
Khi chia nhỏ bảng thành các bảng con cùng tên thì chỉ số ID nó đánh như thế nào ạ
@havanlong22068 ай бұрын
dùng uuid thay cho id nha bạn, nếu như chưa triển khai uuid thì sẽ rất vất vả đây
@tungleggo7147 ай бұрын
@@havanlong2206 tức là uuid thường mình sẽ tạo ra trước khi tách bảng rồi ấy bạn nhỉ. T đang nghĩ nếu baayh muốn tạo ra uuid cho 1 bảng chưa có thì mình sẽ kiểu kết hợp thời gian bản ghi đó được tạo + 1 vài ký tự random có ok ko nhỉ ??
@nguyenhoanganh2k111 ай бұрын
ở đây tách các bảng ra server riêng là tương ứng với việc dưng lên 1 con service riêng ak anh?
@tranquochuywecommit11 ай бұрын
Đúng rồi anh em, database trên server riêng biệt luôn nhé.
@ThoLe-yw6rb11 ай бұрын
làm thêm bài về telegram với a
@tranquochuywecommit11 ай бұрын
Anh em đăng ký kênh nhé, sắp tới mình cũng còn nhiều nội dung thú vị chia sẻ cho mọi người. Cảm ơn anh em đã quan tâm và ủng hộ nhé.
@khanhnd15710 ай бұрын
thank anh chia se
@reviewtotnhat10 ай бұрын
muốn thống kê báo cáo thì họ dùng công nghệ nào vậy ạ(e nghĩ họ dùng DWH)
@tranquochuywecommit8 ай бұрын
các hệ thống lớn hiện tại sẽ có xu hướng xây dựng Data Lake và DWH anh em nhé
@nghiapham600010 ай бұрын
Giải thích rất tường minh, video hay lắm anh.
@tranquochuywecommit8 ай бұрын
cảm ơn anh em. Chúc anh em năm mới thật tuyệt vời nhé
@NamNguyen-wv7zv10 ай бұрын
Các anh cho em hỏi là e muốn tìm kiếm 1 danh sách các công nghệ kiểu như zookeeper thì có website nào không ạ ? Em xin cám ơn ạ
@hungletri355010 ай бұрын
Bạn thử xem cơ bản về hadoop và apache ecosystem xem
@tranquochuywecommit8 ай бұрын
mình đang làm 1 chuỗi các video để chia sẻ về những công nghệ, kỹ thuật đang được ứng dụng thực tế hiện nay. Có thể sẽ giúp ích được cho anh em đấy.
@HaiTran-ol2fu11 ай бұрын
Hay quá a ❤
@namngo392711 ай бұрын
Rất bổ ích tks anh❤
@atTran-xv5iz10 ай бұрын
thường những thông tin về cấu trúc cũng như concept mà các công ty công nghệ đang sử dụng có thể tìm kiếm ở đâu nhỉ, cũng muốn biết người ta đang áp dụng những gì mà tìm ra ít kết quả quá quá, cảm ơn anh
@tranquochuywecommit10 ай бұрын
các nội dung này thường rải rác, đọc ở nhiều diễn đàn khác nhau như reddit, quora, một số thông tin mình có tổng hợp từ các chia sẻ trên linkedin từ các kỹ sư đang làm việc tại các Big tech anh em ah
@HongHaiNguyenx10 ай бұрын
đọc trong documentations của các db, chẳng hạn với mongodb thì docs có hết các cách triển khai hệ thống, sau đó bạn sẽ nắm đc các keyword để tìm hiểu cách cài đặt cụ thể từ người khác nữa. ko cần phải đọc mấy bài nói cách làm của cty này kia đâu vì có đọc cũng chả hiểu đc, quan trọng bạn phải nắm được lý thuyết nền tảng trc rồi làm dần từ đơn giản nhất. mấy khái niệm về partitioning hay sharding, indexing ko biết thì 🤷
@minhquangngo887510 ай бұрын
@@HongHaiNguyenx đọc -> k hiểu -> tìm hiểu về các keyword nói như ông thì phải hiểu hết tất cả các công nghẹ trên đời rồi mới đi đọc mấy cái blog kiểu này chắc
@HongHaiNguyenx10 ай бұрын
@@minhquangngo8875 trc h t toàn làm vậy, ko thì sao bắt kịp 15 năm vừa qua. đúng là phải hiểu từng keyword đó, hồi mới ra trường t cũng phải đọc nhiều lắm, giờ cũng có ngừng đâu, vừa rồi còn làm audit source code dapp eth solidity mà cũng tự học đấy. bạn ko có kiến thức cơ bản thì có vào cty họ cũng ko thể đào tạo bạn đc.
@hungnguyenquoc71010 ай бұрын
Fb thì sao ạ. Cũng chia vậy à bác
@tranquochuywecommit10 ай бұрын
fb để một video khác mình sẽ phân tích với anh em nhé
@duyngo860810 ай бұрын
Cơ chế backup ntn nhỉ chắc backup phần cứng =))
@tranquochuywecommit8 ай бұрын
đi kèm với từng database lại có sử dụng cơ chế dạng Master - slave. Đáp ứng hoàn toàn về tính sẵn sàng anh em ah
@herohoang471710 ай бұрын
Hay quá a🎉🎉🎉
@tranquochuywecommit8 ай бұрын
cảm ơn anh em đã ủng hộ kênh của mình nhé
@tri_ho11 ай бұрын
Bổ ích
@iohk_10 ай бұрын
nếu được bạn làm video hướng dẫn deploy PostgREST và series lập trình PL/pgSQL nữa nha, mình cảm ơn
@banhgao352110 ай бұрын
A có thể cụ thể phần JOIN ở ứng dụng thay vì ở database là như nào không anh ?
@namngo572610 ай бұрын
thay vì bạn dùng câu query join thì mình chuyển qua dùng where in
@minhchienle271110 ай бұрын
where in 2 phát ở database. Sau đó code nhận dữ liệu load vô ram rồi tự xử.
@tungtran401911 ай бұрын
thanks anh
@tranquochuywecommit11 ай бұрын
Cảm ơn sự ủng hộ của anh em nhé. Anh em đăng ký kênh để sớm nhận thông báo các nội dung thú vị sắp tới nha.
@hyugatoru732910 ай бұрын
hờ hờ 😂
@vannguyenanh400311 ай бұрын
hệ thống mình như quần què mà hàng tháng vẫn chịu tải bằng nửa quora 🤣
@lenamduytuan10 ай бұрын
ở đây k có quần què, xóa comment giờ. :)
@anhchung73409 ай бұрын
trình bày rất là dài dòng, có thể rút gọn video từ 11p xuống 2p được . cái quan trọng nhất thì ko nói . tư duy chia nhỏ thì sinh viên năm 2 cũng biết
@tranquochuywecommit8 ай бұрын
tư duy chia nhỏ là gốc rễ của tối ưu. Bản thân mình cũng đã làm tối ưu nhiều năm, chỉ một số ít người (trong phạm vi những dự án mình từng làm) thật sự hiểu và làm được phần chia nhỏ này ngon nghẻ.
@dangviethung883 ай бұрын
Mình thấy nói như này thấy hiểu hơn á
@duykhuongnguyen325811 ай бұрын
nó khác gì partition nhỉ
@dunx842311 ай бұрын
Partition vẫn nằm trên cùng 1 server, không giải quyết được việc nghẽn hiệu năng
@tranquochuywecommit8 ай бұрын
Về tư duy thì Partition cũng là tách nhỏ các Table thành những phần riêng biệt (để tăng tốc hiệu năng), tuy nhiên các Partition đó đều nằm trên 1 database và cùng thuộc 1 server. Tại lúc này nó vẫn bị giới hạn. Tư duy trong video mình nói là tách thành nhiều server riêng biệt.