Thiết kế hệ thống Search Engine xử lý 100 tỷ Web Page (Google, Bing...) | System Design Wecommit

  Рет қаралды 66,232

Learning Database with Tran Quoc Huy

Learning Database with Tran Quoc Huy

Күн бұрын

Пікірлер: 126
@tranquochuywecommit
@tranquochuywecommit 2 ай бұрын
Gửi mọi người Group Telegream Wecommit Public Community : www.wecommit.com.vn/wecommitcommunity ,anh em có thể trao đổi những câu hỏi , vấn đề khi xem Video và kết nối với tôi trong Group nhé (trường hợp click trực tiếp bị lỗi thì ae copy link ra browser nhé)
@tringuyencaothien2412
@tringuyencaothien2412 10 ай бұрын
khúc inverted index thì content có bao nhiêu từ thì sẽ có bấy nhiêu cái index sẽ tạo ra một bộ index rất khổng lồ đó là hạn chế khi sài giải thuật này và khi dữ liệu cực lớn thì index cũng sẽ cũng sẽ bị trùng rất nhiều khi bạn nhập càng nhiều từ dẫn tới thời gian chạy vẫn sẽ lâu hơn 1 2 second khúc hash nội dung thì có thể bị sai nếu lưu nội dung dưới dạng html hoặc các trang tin tức clone tin của nhau nhưng khác timestamp -> vẫn sẽ bị duplicate khúc queue thì người dùng sẽ phải trả tiền rất nhiều vì 1 trang web sẽ đại diện cho 1 queue và 1 tỉ trang web sẽ là 1 tỉ queue một vấn đề nữa để kiểm tra dữ liệu có trong queue hay không thì phải pop từng phần tử trong queue ra để kiểm tra rồi nhét lại queue chứ nó ko dễ như cấu trúc dữ liêu hash table nói chung các bạn mới bắt đầu có thể xem để hình dung những thứ cơ bản dễ tiếp cận còn triển khai thực tế thì người ta sẽ ko triển khai theo hướng này đặc biệt là những start up.
@jackiedo7370
@jackiedo7370 10 ай бұрын
Ông này nói mấy cho ng ko biết thôi. Chứ kiến thức chuyên sâu ông này nói ko tin đc
@tringuyencaothien2412
@tringuyencaothien2412 10 ай бұрын
​@@jackiedo7370 bởi vậy System Design đâu có đơn giản đâu ngay ở mức cơ bản nhất nó cũng đã rất phức tạp rồi lý thuyết thì nói dễ chứ lúc đụng vô là sấp mặt từ A tới Z
@MrLoyalNguyen
@MrLoyalNguyen 10 ай бұрын
Không thấy nhân thử 100 tỷ pages ra xem cần bao nhiêu ổ đĩa nhỉ. Nghĩ đến thôi đã thấy mệt rồi.
@devkhoa
@devkhoa 9 ай бұрын
Mình cũng đồng ý với bạn về 2 ý đầu. Nhưng mà ý thứ 3 không nhất thiết 1 queue chỉ có 1 website, bạn có thể bỏ 1000 site vào 1 queue cũng vẫn ok, performance chắc chắn bị giảm bù lại cost cũng giảm. Nhưng mình ko nghĩ đơn giản như v
@tringuyencaothien2412
@tringuyencaothien2412 9 ай бұрын
​@@devkhoa đúng nhưng hiệu suất performance sẽ cực tệ bạn có thể cải thiện bằng tăng số lượng worker pick event nhưng nếu các website có cùng url nằm kề nhau trong queue thì là spam người ta rồi =)) cách đặt cùng 1 queue khá là không hợp lý
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
Nếu anh em muốn đào sâu hơn nữa về hệ thống Search Engine, anh em có thể xem thêm 02 câu hỏi ở cuối video này và cùng nhau thảo luận tại phần bình luận này nhé. Cảm ơn các anh em đã quan tâm và ủng hộ.
@baodanhseo
@baodanhseo 9 ай бұрын
Dạ anh Huy, em có thể xin được học các kiến thức về Search Engines (học sâu về cách thức hoạt động - thuật toán), thì em nên bắt đầu & lộ trình học - nguồn học nên tìm từ đâu uy tín ạ. Em cảm ơn anh
@truongtuan2198
@truongtuan2198 9 ай бұрын
Em cảm ơn anh. Rất vui vì thế hệ tụi em và sau này có anh. Quá tuyệt vời ạ
@tranquochuywecommit
@tranquochuywecommit 9 ай бұрын
một bình luận chứa rất nhiều năng lượng tích cực. Cảm ơn anh em nhé
@PhamAnhHao-zw4ff
@PhamAnhHao-zw4ff 10 ай бұрын
Video hay quá ạ. Từ cách a vẽ minh họa các luồng cho đến giải thích cách thức hoạt động của hệ thống mọi thứ đều rất trực quan và dễ hiểu. Mong anh sẽ ra thêm nhiều video về chủ đề System Design như này. Em cảm ơn ạ!!!!
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cảm ơn anh em. Anh em đăng ký kênh để nhận thông báo cho các video sắp tới nhé.
@_vietdava_
@_vietdava_ 6 ай бұрын
quá tuyệt vời luôn anh ơi, mặc dù em hiểu khoảng 50% video thôi nhưng phải nói là học hỏi được rất nhiều từ video này
@namdao-rn5ms
@namdao-rn5ms 8 ай бұрын
mặc dù ko làm về DB nhưng vẫn thích xem video anh làm ạ
@phamngoclinh110988
@phamngoclinh110988 10 ай бұрын
Mình không phải dân cntt cũng không biết gì về môn này nhưng lại rất thích xem video như này cảm ơn ad rất nhiều
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
oh, thật tuyệt vời, cảm ơn anh em nhé
@tmermfos9465
@tmermfos9465 10 ай бұрын
xem r có hiểu j k kkkk. Tôi dân IT mà xem cx k hiểu lắm cái này nâng cao vs dành cho ng đi làm lâu năm
@phamngoclinh110988
@phamngoclinh110988 10 ай бұрын
@@tmermfos9465 không hiểu nhưng vẫn thích xem 😂
@binhcoding3am148
@binhcoding3am148 9 ай бұрын
2024 chúc anh và gia đình mạnh khỏe, tiếp tục chia sẽ nhưng video bổ ích chất lượng cho cộng đồng IT Việt Nam
@tranquochuywecommit
@tranquochuywecommit 9 ай бұрын
cảm ơn anh em. Chúc anh em một năm 2024 nhiều sức khỏe và may mắn nhé
@thatson9218
@thatson9218 10 ай бұрын
Băm nội dung trang web để tránh duplicate sẽ bị sai khi nội dung trang copy nó thêm ngày tháng năm. Cách giải quyết này k triệt để. Ví dụ trang 1 có noi dung là "abc". Trang 2 là trang copy của trang 1 có noi dung như sau "hôm này là ngày 13/2/2024. abc". Cách giải quyết là compare noi dung của page 1 và page 2 giống nhau hoặc khác nhau bao nhiêu phần trăm để xem là ok thêm vào hệ thống
@tranquochuywecommit
@tranquochuywecommit 9 ай бұрын
ở cuối video mình có đề cập tới các vấn đề nghiên cứu sâu hơn đó anh em.
@ckien2007
@ckien2007 9 ай бұрын
Muốn làm cái này các bạn cần nghiên cứu lĩnh vực Xử lý ngôn ngữ tự nhiên, trong đó có một số mô hình mà mấy search engines mở đang dùng, hiện tại nó còn ra thuật toán mới hơn so với thuật toán ở giáo trình cũ của Standford.
@baodanhseo
@baodanhseo 9 ай бұрын
Em cảm ơn anh Huy rất nhiều, em học mảng SEO nên SE là chủ đề em rất quan tâm ạ
@thoimaidev
@thoimaidev 10 ай бұрын
Hay tẹt vời anh Huy ới. Mong a ra nhiều video chia sẻ về hệ thống như thế này cho đàn em học hỏi thêm ^^
@ThunderboltPath
@ThunderboltPath 10 ай бұрын
Video hay quá ông ơi 🎉 chủ đề hiện đại, giải thích chi tiết thiết thực. Hy vọng được xem thêm những video giải các bài toán thiết kế hệ thống như thế này 😊
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cảm ơn anh em đã ủng hộ. Anh em đăng ký kênh để nhận thông báo sớm nhất khi video mới ra mắt nhé.
@tmsanghoclaptrinh
@tmsanghoclaptrinh 10 ай бұрын
Các bạn có thể sử dụng các phần mềm như Goodnotes hoặc Notability để vẽ/viết trên iPad, bấm nút quay màn hình trên iPad, rồi edit trên máy tính để gộp video quay mặt mình và video iPad lại với nhau như anh Huy nhá ✍
@diepngo1472
@diepngo1472 10 ай бұрын
cám ơn anh, video rất cô đọng và thực tế
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cảm ơn anh em đã ủng hộ kênh mình nhé.
@nhatquangcntt
@nhatquangcntt 9 ай бұрын
Kiến thức rất hay, Minh chuyên SEO làm sao biết system google dựa vào yếu tố gì để lưu dữ liệu minh vào db và trả kết quả cao hơn đối thủ 😢. Hiện tại vd minh có url trùng từ khoá enduser tìm, nội dung mới ko trùng, trải nghiệm trang đích tốt ... bla bla ☺️ làm sao để đc lưu db và trả kết quả cao hơn khi enduser tìm
@huuhoangnguyen5651
@huuhoangnguyen5651 10 ай бұрын
theo e biết thì hash thì người ta băm web thành mã băm 64 bit nhị phân xong tính khoảng cách hamming nếu khoảng cách hamming nhỏ hơn ngưỡng đặt ra thì 2 trang web đc coi là trùng lặp. Có hẳn 1 bài hướng dẫn các cách tăng tốc độ tính toán nếu băm theo kiểu đó đc viết bởi ông nào ý cũng đang làm việc ở google=((
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
hay quá anh em, anh em có thể chia sẻ link giải thuật để mọi người cùng biết được không.
@nguyenhoang6881
@nguyenhoang6881 9 ай бұрын
Hay bạn, mình cũng đang thắc mắc đâu thể nào 2 trang có content giống hệt nhau dc
@ckien2007
@ckien2007 9 ай бұрын
Còn có nhiều dạng khoảng cách khác như khoảng cách Levenshtein, Jaccard, khoảng cách Cô-sin,... Cách cài đặt cơ bản thường là chuẩn hóa văn bản tạo bộ vector đầu ra cho văn bản rồi so sánh các bộ vector của các văn bản để tính toán mức độ tương đồng giữa vector từ khóa cần tìm với vector các văn bản. Google và Binh nó làm vậy (về lý thuyết :D )
@YCA-Education
@YCA-Education 9 ай бұрын
Học cái này xong thấy SEO cũng đơn giản
@ducdatnguyen9251
@ducdatnguyen9251 4 ай бұрын
Cám ơn anh đã chia sẽ những kiến thức rất quý báu, a có thể cho em hỏi một câu ngô nghê là trong việc tìm kiếm dữ liệu a có đề cập đến việc sử dụng inverted index để có kết quả nhanh chóng, vậy thì việc sử dụng công nghệ elasticsearch thì có điểm gì khác biệt so với cách đánh inverted index ạ? Việc đánh index sẽ làm giảm hiệu năng khi update lại dữ liệu thì đó là điểm chung của cả 2 công nghệ phải không ạ? Do cả inverted index và elasticsearch em đều chưa có trải nghiệm nên nếu hỏi không đúng a thông cảm nhé. Cám ơn a!
@thuanboss523
@thuanboss523 9 ай бұрын
Trông có vẻ cũng ko phức tạp lắm, cám ơn anh đã chia sẻ
@tranquochuywecommit
@tranquochuywecommit 9 ай бұрын
khi đi vào triển khai chi tiết sẽ còn nhiều thứ nữa, nhưng ở mức tổng quan thì thế này là được anh em ah
@nhungnguyen-mv1rl
@nhungnguyen-mv1rl 5 ай бұрын
Em cảm ơn anh, bài giảng đỉnh quá
@nampham7850
@nampham7850 10 ай бұрын
chi tiết và dễ hiểu vs cả người mới như em ạ
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
anh em đăng ký kênh để sớm nhận thông báo các video tiếp theo nhé. Cảm ơn anh em
@jackiedo7370
@jackiedo7370 10 ай бұрын
Đây ko phải kiến trúc google đang áp dụng 😂 nếu làm cách này thì cuộc đời lại đơn giản quá cơ
@tranquochuywecommit
@tranquochuywecommit 9 ай бұрын
tư tưởng áo dụng thôi anh em ah.
@quantien1979
@quantien1979 8 ай бұрын
chưa hiểu lắm về cân bằng tải, nhờ hổ trợ thêm
@milliebrown2332
@milliebrown2332 10 ай бұрын
Đúng cái đang cần mấy cái tri thức sâu này giờ ít kênh làm vl
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cảm ơn anh em. Anh em đăng ký kênh để cùng thảo luận với mình ở các nội dung chuyên sau sắp ra tiếp theo nhé.
@HuyNguyen-zp8ju
@HuyNguyen-zp8ju 9 ай бұрын
Đang học năm 3 năm 4 khuyên k nên xem dễ bị hiểu sai lệch khái niệm lắm😅
@hongnongthanh5489
@hongnongthanh5489 9 ай бұрын
hay ạ, thanks anh đã chia sẻ
@nhavan1432
@nhavan1432 10 ай бұрын
đỉnh đỉnh anh ơiiii
@TheRemjx01
@TheRemjx01 10 ай бұрын
Video rất hay và dễ hiểu. Thầy cho em hỏi thầy dùng tool gì để vẽ handwriting style + note vậy ạ?
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
mình dùng goodnotes anh em ạ.
@accminecraftnet5551
@accminecraftnet5551 10 ай бұрын
Hay dễ hiểu
@quyenhoang5695
@quyenhoang5695 10 ай бұрын
Với thiết kế như này mà đã đc 100 tỉ thì game lại dễ quá
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
có khung thiết kế rồi, phần scale cứ theo thế này là được anh em ah
@nguyenhanam1108
@nguyenhanam1108 9 ай бұрын
hay quá ạ
@BubVN
@BubVN 9 ай бұрын
phần index hay quá a
@tranquochuywecommit
@tranquochuywecommit 9 ай бұрын
cảm ơn anh em.
@XeomShipperMuaHangXeShipMua
@XeomShipperMuaHangXeShipMua 10 ай бұрын
Xem ko hiểu gì nhưng chúc bạn ăn tết vui vẻ 🎉
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
Cảm ơn người anh em. Chúc anh em đón Tết vui nhé
@TP-kj2sm
@TP-kj2sm 10 ай бұрын
16:05 nếu chỉ quét 1 lần thì khi nội dung web được cập nhật, content db của chúng ta sẽ bị outdated. Ví dụ các bài báo tường thuật trực tiếp sự kiện, Google search vẫn phải đảm bảo tìm kiếm được nội dung mới nhất mà không spam web của người ta liên tục (tốn tài nguyên của mình nữa). Mong anh nêu giải pháp cho vấn đề này ạ.
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
Quét nhiều lần định kỳ anh em nhé, các hệ thống hiện tại đều thế cả
@mypet24
@mypet24 9 ай бұрын
Cảm ơn video của bạn, tuy nhiên tôi muốn hỏi thêm chút là khi xây dựng db thì nguồn url bạn lấy ở đâu để lọc các title, content, ... để add vào db. Vì db sẽ phải quét định kỳ để hoàn thiện data cũng như tăng tốc tìm kiếm, chứ không phải khi nào có user nào đó tìm kiếm rồi mới tiến hành tìm và xử lý thông tin và trả lại cho user ngay lúc đó.
@mypet24
@mypet24 9 ай бұрын
Mọi người có ai biết nơi nào lưu trữ toàn bộ các url của tất cả các website đang hoạt động trên internet không ạ..?
@tuannguyenvanquoc2670
@tuannguyenvanquoc2670 10 ай бұрын
Hay quá, em cảm ơn anh ạ
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
Cảm ơn em. Em đăng ký kênh để cùng thảo luận với anh các video sắp tới nhé.
@thichmautim
@thichmautim 10 ай бұрын
Góp ý phần dùng hash để chống trùng thì hơi dở nhé. Vì ví dụ là web thì khi clone sẽ có khác 1 tí tẹo vậy là ra 2 trang khác nhau nếu tính theo hash.
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cái này mình có nêu ở cuối video đó anh em. Với 2 vấn đề ở cuối video (trong đó có phần anh em nói), anh em thử xem có phương án gì ở đây không?
@truongchidien3810
@truongchidien3810 10 ай бұрын
Theo em nghĩ thì mình có thể dùng ML để encode nội dung trang web thành 1 vector sau đó có thể thực hiện so sánh thì sẽ cho kết quả tốt hơn hash nhưng hiệu suất có thể sẽ chậm hơn và tốn thêm công sức để phát triển mô hình ML có độ chính xác cao
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
@truongchidien3810 thực ra hash cũng có nhiều cách, tại bài bên trên mình đưa ra một cách kinh điển và gợi mở ý tưởng để các anh em cùng nhau thảo luận. Ý tưởng chuyển thành vector cũng hay đấy anh em
@KaKaOfficial2
@KaKaOfficial2 10 ай бұрын
Video tuyệt vời ạ
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cảm ơn anh em. Anh em đăng ký kênh nhé, video mới sắp ra mắt đấy
@kemmuadong
@kemmuadong 10 ай бұрын
Hữu ích anh ạ
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cảm ơn anh em nhé
@DekaTruong
@DekaTruong 8 ай бұрын
Mình nghĩ đoạn Database có Inverted Index trên 100 tỷ records vẫn còn nhiều bottleneck phải giải quyết nữa chứ không đơn giản như vậy (có thể Partitioning hay Sharding các kiểu, vấn đề network nữa, chưa kể giới hạn phần cứng cần distributed processing chứ 1 database instance ngốn quá nhiều storage như vậy là bất khả thi,...).....Nếu được thì bạn làm thêm 1 Video chuyên sâu về vấn đề này để ae làm Architecture giao lưu học hỏi với!!! Chỗ đó nếu dùng ElasticSearch thì có thể có những tối ưu gì khác?!
@quack-dev
@quack-dev 5 ай бұрын
Tác giả đang vẽ ra một câu chuyện có thật nhưng trong tưởng tưởng. :)) mặc dù xem video có giá trị tham khảo nhưng về bản chất không thể apply trong thực tế. Điều này giống như câu chuyện học ở trường đại học mang tính hàn lâm nhưng ở môi trường doanh nghiệp thì ối dồi ôi.
@hungtlhhtb
@hungtlhhtb 9 ай бұрын
Tuy nghe có vẻ khả thi, nhưng Google đã không làm theo cách này vì tốn quá nhiều dữ liệu và quá chậm nếu theo mô hình này. có ý tưởng hay nhưng thực tế làm như này sẽ chỉ là tốn kém và phức tạp vấn đề tìm kiếm nên. trong khi các hệ thống tìm kiếm bây giờ là 0,0000001 s cho ra kết quả. thì ~ thời gian truy cập vào API
9 ай бұрын
Hay quá a. Cách làm video này bằng phần mềm gì vậy a.
@tranquochuywecommit
@tranquochuywecommit 9 ай бұрын
goodnotes anh em nhé
@PhamThan0710
@PhamThan0710 9 ай бұрын
voice trầm của bác hay mà sao tới âm sắc nó lên tông cao thế
@tranquochuywecommit
@tranquochuywecommit 9 ай бұрын
cảm ơn góp ý của anh em nhé.
@phungquocdan1895
@phungquocdan1895 10 ай бұрын
hay đấy
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cảm ơn anh em
@issacnewton-b6k
@issacnewton-b6k 10 ай бұрын
Thầy cho hỏi, cái list URL để xây dựng content DB thì lấy ở đâu? Thanks
@guitar300k
@guitar300k 10 ай бұрын
chỗ nào có link thì lưu lại chứ sao
@mypet24
@mypet24 9 ай бұрын
​@@guitar300k ý là nguồn url ở đâu để lọc thông tin lưu vào db, sau đó người dùng tìm kiếm thì mới vào db để tìm thông tin. ví dụ với từ khóa "winter" ở video thì ban đầu làm sao để có được danh sách các url mà nội dung có chứa từ khóa "winter". Đó là mấu chốt. Nếu db được quét định kỳ thì cũng phải có một nơi nào đó để lấy toàn bộ url trên nền tảng web, sau đó quét lấy title, content, hash code rồi lưu vào db.
@1337Rinz
@1337Rinz 10 ай бұрын
hay quá thầy. ủng hộ 1 subscribe ^^
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cảm ơn anh em nhé
@NguyenNguyen-zf9zx
@NguyenNguyen-zf9zx 9 ай бұрын
Không lẻ cái camera trong nhà mình có vấn đề?? Em mình gắn mà, không lẻ nó chơi mình sao??
@NguyenNguyen-zf9zx
@NguyenNguyen-zf9zx 9 ай бұрын
Sau này mình mà biết cái camera trong nhà có vấn đề, thì sẽ không để yên cho cái nhà này đâu.
@spaceteam8595
@spaceteam8595 10 ай бұрын
Anh có demo không anh nhỉ. Có dự án demo thì thực tế hơn nhiều đấy a Huy. :)
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
những bài này mục tiêu là có chia sẻ tư duy và thiết kế tổng thể anh em ah.
@zin6955
@zin6955 10 ай бұрын
Về phần dữ liệu khi được tìm kiếm trong database phần inverted index, em thấy cách hoạt động của nó tương đồng với thằng map reduce trong hadoop. Thì không biết là có thể áp dụng để sử dụng được thằng hadoop trong trường hợp này được không ạ.
@xuanhoangbo1236
@xuanhoangbo1236 10 ай бұрын
map reduce trong hadoop read/write trên ổ đĩa nên tốc độ khá chậm, bạn nên chuyển qua spark hoặc elk
@maicuongquyet
@maicuongquyet 10 ай бұрын
Máy a dùng ghi màn hình là gì ak a...hiệu của máy viết lên màn hình ạ
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
anh dùng ipad em ah
@anhemcoder4745
@anhemcoder4745 10 ай бұрын
Hay . Bạn có group nào để để cùng thảo luận không ?
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
anh em có thể thảo luận trên đây cùng mình luôn nhé
@anhemcoder4745
@anhemcoder4745 10 ай бұрын
@@tranquochuywecommit Đang vào list của kênh để xem video khác 🤣🤣🤣
@nongducthientuanfplhn7024
@nongducthientuanfplhn7024 10 ай бұрын
làm tiếp đi ạ
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
Okie anh em, anh em đăng ký kênh mình nhé. Sắp tới sẽ tiếp tục có những video như thế này.
@shadyTNTA
@shadyTNTA 7 ай бұрын
video hay quá, cho hỏi nội dung trong này ông bạn xem ở đâu thế? tôi muốn tìm nguồn
@neymarquan2959
@neymarquan2959 10 ай бұрын
Flow vẽ bằng gì đẹp quá a
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
video quay dựng với goodnotes anh em ah
@vandungnguyen1087
@vandungnguyen1087 10 ай бұрын
Hash để tránh trùng lặp là hash nội dung của trang web hay hash thông tin gì vậy anh?
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
Check nội dung nên sẽ thực hiện hash nội dung anh em ah. Tuy nhiên đây là cách tiếp cận cơ bản nhất thôi, anh em có thể đào sâu hơn khi đặt thêm vấn đề: nội dung giống nhau đến 90% thôi chứ không phải toàn bộ, vậy sẽ cần cải tiến thêm nữa ở giải thuật. Ở cuối video trong phần tổng hợp ghi chú mình có nói tới đó.
@TP-kj2sm
@TP-kj2sm 10 ай бұрын
@@tranquochuywecommit có 2 vấn đề mong anh chỉ giáo ạ: - dựa vào đâu để biết nội dung 2 trang giống nhau 80-90%? - nhiều trang chơi trò dùng font chữ lạ hoắc, không phải tiếng Việt nhưng có nét giống tiếng Việt, mắt con người vẫn đọc được tuy hơi khó thì có check được vụ trùng lặp nội dung không? (điển hình nhất là mấy trang báo lá cải)
@hochiuc2706
@hochiuc2706 9 ай бұрын
Anh dùng ứng dụng gì để vẽ minh hoạ ấy ạ.
@tranquochuywecommit
@tranquochuywecommit 9 ай бұрын
anh em dùng Goodnotes nhé
@trongnghia2096
@trongnghia2096 10 ай бұрын
Cho em hỏi anh vẽ bằng phần mềm gì vậy ạ
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
video này dùng goodnotes nhé anh em
@reviewFilm365
@reviewFilm365 10 ай бұрын
Anh này mới bị sa thải phải không ạ
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
sao thế anh em?
@TungHoang-w6f
@TungHoang-w6f 10 ай бұрын
Bác viết bằng phần mềm nào thế bác
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
sử dụng goodnotes anh em ah
@PhucLe-si5jg
@PhucLe-si5jg 10 ай бұрын
😍
@xuanhopdo9712
@xuanhopdo9712 10 ай бұрын
xem cuốn gớm =)))
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
cảm ơn anh em nhé.
@joannguyencong9475
@joannguyencong9475 10 ай бұрын
Bác dùng công cụ gì note trực quan thế ạ
@tranquochuywecommit
@tranquochuywecommit 10 ай бұрын
goodnotes anh em nhé
@nang4226
@nang4226 4 ай бұрын
đỉnh vcl
The IMPOSSIBLE Puzzle..
00:55
Stokes Twins
Рет қаралды 174 МЛН
Миллионер | 3 - серия
36:09
Million Show
Рет қаралды 2,1 МЛН
Xây dựng kiến trúc chịu tải lớn ở Tiki
48:23
Grokking Vietnam
Рет қаралды 86 М.
Loại Database giúp Generative AI  bùng nổ | Vector Database Wecommit
17:12
Trần Quốc Huy - Databases
Рет қаралды 41 М.
Design a Payment System - System Design Interview
31:40
High-Performance Programming
Рет қаралды 499 М.
Chiến lược thoát khỏi Layoff một cách chủ động | Trần Quốc Huy Wecommit
18:22
Architectural design workflow with the participation of AI
18:32
ArchiTecH1904
Рет қаралды 1,9 М.
The IMPOSSIBLE Puzzle..
00:55
Stokes Twins
Рет қаралды 174 МЛН