Word2vec - Mô hình hóa từ bằng mạng học sâu

  Рет қаралды 13,432

ProtonX

ProtonX

Күн бұрын

Пікірлер: 28
@quyetnguyenvan1968
@quyetnguyenvan1968 4 жыл бұрын
Cảm ơn anh, video rất hay và dễ hiểu.
@hyy1856
@hyy1856 3 жыл бұрын
Trước đã từng tham gia workshop ở quận 4 có a giảng.
@xuanthutrancongtuyet4127
@xuanthutrancongtuyet4127 Жыл бұрын
cảm ơn anh đã chia sẻ
@huyhoannguyen9913
@huyhoannguyen9913 2 жыл бұрын
Hay và dễ hiểu quá cảm un a 😍
@duanlecong326
@duanlecong326 3 жыл бұрын
Cảm ơn bạn đã chia sẻ video rất hay. Bạn làm thêm video về Transformer nha bạn :)
@vchanelhoang78
@vchanelhoang78 4 жыл бұрын
Cảm ơn anh
@jayjimei8658
@jayjimei8658 4 жыл бұрын
anh cho em xin bản pdf của bài giảng được k ạ
@BinhNguyen-lg7mh
@BinhNguyen-lg7mh 4 жыл бұрын
hay qué
@DuyTran-xd4qb
@DuyTran-xd4qb Жыл бұрын
anh có thể trả lời giúp em là vector đầu vào của mạng phải bắt buộc là vector onehot hay còn cách vectorize nào khác ko ạ
@ProtonX
@ProtonX Жыл бұрын
a nghĩ có nhưng mà em có thể cho a biết tại sao em muốn dùng cách khác thì a sẽ trả lời được tốt hơn?
@DuyTran-xd4qb
@DuyTran-xd4qb Жыл бұрын
@@ProtonX em thấy onehot tốn khá nhiều bộ nhớ trong khi vd như vector tfidf hoặc hasing
@ProtonX
@ProtonX Жыл бұрын
@@DuyTran-xd4qb thực ra đang để học ra vector embedding nhỏ hơn đó em - khoảng 300, còn dùng tfidf đếm thuần thì chiều của vector của em cũng tương chiều onehot hay chiều từ điển.
@incognito8508
@incognito8508 4 жыл бұрын
anh cho em hỏi trong CBOW thì U và V, cái nào embedding matrix và context matrix ạ. Em cảm ơn!
@ProtonX
@ProtonX 4 жыл бұрын
vẫn là U em nhé tuy nhiên lúc code người ta đưa các từ xung quanh người ta cần xử lý một chút.
@khangamminh512
@khangamminh512 3 жыл бұрын
Anh ơi anh có thể cho em hỏi, đối với cả một đoạn văn dài chứa nhiều câu thì xử lý như thế nào ạ. Đưa về hết 1 câu hay là tạo ma trận NxM (N: số từ trong câu, M: là số câu trong đoạn) ạ. Với cả anh có thể cho em xin cách thức liên lạc với anh được không ạ
@ProtonX
@ProtonX 3 жыл бұрын
em có thể cắt thành 2 câu nhỏ nhé. email của team: protonxai@gmail.com
@laptrinhsuongsuong5245
@laptrinhsuongsuong5245 3 жыл бұрын
anh cho em hỏi là bộ từ điển trước đó em đã loại bỏ stop words rồi thì khi one hot một câu với chiều dài là len bộ từ điển nhưng từ đó lại không có trong bộ từ điển thì làm sao ạ
@ProtonX
@ProtonX 3 жыл бұрын
Em loại xòm thì mới xây từ điển nhé em.
@laptrinhsuongsuong5245
@laptrinhsuongsuong5245 3 жыл бұрын
@@ProtonX dạ có phải là em tách từ ra xây dựng bộ từ điển và dùng bộ từ điển để xây dựng bộ stop words cho mình và dùng stop words đó loại bỏ trực tiếp trong bộ data và bắt đầu lại tách từ và xây dựng từ điển phải không ạ
@ProtonX
@ProtonX 3 жыл бұрын
@@laptrinhsuongsuong5245 stop word thường có sẵn rồi nhé em.
@ProtonX
@ProtonX 3 жыл бұрын
em loại stopword xong mới build vocab nhé em tuy nhiên tuỳ bài mới dùng stop word nhé ví dụ bài dịch máy mình không dùng vì mình cần dịch ra cả những từ stop đó
@laptrinhsuongsuong5245
@laptrinhsuongsuong5245 3 жыл бұрын
@@ProtonX dạ em cảm ơn ạ, em đang làm bài toán đánh giá quán ăn trên foody ạ, tại em đang học phần cbow để dùng nó mà chưa hiểu khúc chuyển đổi data về dạng data của cbow ạ, giờ em hiểu rồi ạ
@QuangThinhPhan
@QuangThinhPhan 3 жыл бұрын
Cho em hỏi, em xem ở video khác người ta coi weight matrix U là ma trận 3x6 (V là ma trận 6x3), embedding vector của 1 từ được tính là U(3,6) x W(6,1). Có thể hiểu U và V theo cách như thế này được không ạ? Có gì sai không ạ? Em cảm ơn.
@Dev_and_symphony
@Dev_and_symphony 2 ай бұрын
thế nên trong video mới cần transpose đấy bạn, tùy paper, mục đích là để thực hiện phép nhân matrix thôi
@ngocthuongtran5136
@ngocthuongtran5136 4 жыл бұрын
Anh ơi cho em xin thông tin chi tiết về khoá học này với ạ. Em đang học về xử lý ngôn ngữ tự nhiên và em đang làm một project môn học về đề tài phân loại cảm xúc của người dùng sau khi họ mua hàng trên các website thương mại điện tử việt nam thông qua các câu nhận xét đánh giá mà họ để lại, em xử lý ngôn ngữ là tiếng việt kết quả đầu ra phải xác định được bình luận đó thuộc vào mức độ cảm xúc nào, thì yêu cầu tối thiểu phải có 4 mức cảm xúc. Em muốn xin thông tin chi tiết về khoá học này ạ. ==> đây là email của em ạ: nathuong99@gmail.com. Em cảm ơn anh.
@ProtonX
@ProtonX 4 жыл бұрын
Thương Thọ docs.google.com/document/d/1CrKIH_XOzegVo6pH6P2XJmHcrt2Q-4zOQtVp11Q-x0Q/edit
@ProtonX
@ProtonX 4 жыл бұрын
đây em nhé
@ngocthuongtran5136
@ngocthuongtran5136 4 жыл бұрын
@@ProtonX em cảm ơn anh nhiều.
Word Embedding and Word2Vec, Clearly Explained!!!
16:12
StatQuest with Josh Starmer
Рет қаралды 344 М.
Cheerleader Transformation That Left Everyone Speechless! #shorts
00:27
Fabiosa Best Lifehacks
Рет қаралды 9 МЛН
Don't underestimate anyone
00:47
奇軒Tricking
Рет қаралды 29 МЛН
А я думаю что за звук такой знакомый? 😂😂😂
00:15
Денис Кукояка
Рет қаралды 6 МЛН
Word2Vec, GloVe, FastText- EXPLAINED!
13:20
CodeEmporium
Рет қаралды 25 М.
Demo hệ thống chatbot sử dụng LLM + RAG để truy xuất dữ liệu
39:05
Lê Minh Đạt (codermetaichinh)
Рет қаралды 1,5 М.
A Complete Overview of Word Embeddings
17:17
AssemblyAI
Рет қаралды 113 М.
244 - What are embedding layers in keras?
18:24
DigitalSreeni
Рет қаралды 22 М.
Q&A - Hierarchical Softmax in word2vec
18:23
ChrisMcCormickAI
Рет қаралды 14 М.
What is Bag of Words?
21:08
IBM Technology
Рет қаралды 6 М.
Cheerleader Transformation That Left Everyone Speechless! #shorts
00:27
Fabiosa Best Lifehacks
Рет қаралды 9 МЛН