Trước đã từng tham gia workshop ở quận 4 có a giảng.
@xuanthutrancongtuyet4127 Жыл бұрын
cảm ơn anh đã chia sẻ
@huyhoannguyen99132 жыл бұрын
Hay và dễ hiểu quá cảm un a 😍
@duanlecong3263 жыл бұрын
Cảm ơn bạn đã chia sẻ video rất hay. Bạn làm thêm video về Transformer nha bạn :)
@vchanelhoang784 жыл бұрын
Cảm ơn anh
@jayjimei86584 жыл бұрын
anh cho em xin bản pdf của bài giảng được k ạ
@BinhNguyen-lg7mh4 жыл бұрын
hay qué
@DuyTran-xd4qb Жыл бұрын
anh có thể trả lời giúp em là vector đầu vào của mạng phải bắt buộc là vector onehot hay còn cách vectorize nào khác ko ạ
@ProtonX Жыл бұрын
a nghĩ có nhưng mà em có thể cho a biết tại sao em muốn dùng cách khác thì a sẽ trả lời được tốt hơn?
@DuyTran-xd4qb Жыл бұрын
@@ProtonX em thấy onehot tốn khá nhiều bộ nhớ trong khi vd như vector tfidf hoặc hasing
@ProtonX Жыл бұрын
@@DuyTran-xd4qb thực ra đang để học ra vector embedding nhỏ hơn đó em - khoảng 300, còn dùng tfidf đếm thuần thì chiều của vector của em cũng tương chiều onehot hay chiều từ điển.
@incognito85084 жыл бұрын
anh cho em hỏi trong CBOW thì U và V, cái nào embedding matrix và context matrix ạ. Em cảm ơn!
@ProtonX4 жыл бұрын
vẫn là U em nhé tuy nhiên lúc code người ta đưa các từ xung quanh người ta cần xử lý một chút.
@khangamminh5123 жыл бұрын
Anh ơi anh có thể cho em hỏi, đối với cả một đoạn văn dài chứa nhiều câu thì xử lý như thế nào ạ. Đưa về hết 1 câu hay là tạo ma trận NxM (N: số từ trong câu, M: là số câu trong đoạn) ạ. Với cả anh có thể cho em xin cách thức liên lạc với anh được không ạ
@ProtonX3 жыл бұрын
em có thể cắt thành 2 câu nhỏ nhé. email của team: protonxai@gmail.com
@laptrinhsuongsuong52453 жыл бұрын
anh cho em hỏi là bộ từ điển trước đó em đã loại bỏ stop words rồi thì khi one hot một câu với chiều dài là len bộ từ điển nhưng từ đó lại không có trong bộ từ điển thì làm sao ạ
@ProtonX3 жыл бұрын
Em loại xòm thì mới xây từ điển nhé em.
@laptrinhsuongsuong52453 жыл бұрын
@@ProtonX dạ có phải là em tách từ ra xây dựng bộ từ điển và dùng bộ từ điển để xây dựng bộ stop words cho mình và dùng stop words đó loại bỏ trực tiếp trong bộ data và bắt đầu lại tách từ và xây dựng từ điển phải không ạ
@ProtonX3 жыл бұрын
@@laptrinhsuongsuong5245 stop word thường có sẵn rồi nhé em.
@ProtonX3 жыл бұрын
em loại stopword xong mới build vocab nhé em tuy nhiên tuỳ bài mới dùng stop word nhé ví dụ bài dịch máy mình không dùng vì mình cần dịch ra cả những từ stop đó
@laptrinhsuongsuong52453 жыл бұрын
@@ProtonX dạ em cảm ơn ạ, em đang làm bài toán đánh giá quán ăn trên foody ạ, tại em đang học phần cbow để dùng nó mà chưa hiểu khúc chuyển đổi data về dạng data của cbow ạ, giờ em hiểu rồi ạ
@QuangThinhPhan3 жыл бұрын
Cho em hỏi, em xem ở video khác người ta coi weight matrix U là ma trận 3x6 (V là ma trận 6x3), embedding vector của 1 từ được tính là U(3,6) x W(6,1). Có thể hiểu U và V theo cách như thế này được không ạ? Có gì sai không ạ? Em cảm ơn.
@Dev_and_symphony2 ай бұрын
thế nên trong video mới cần transpose đấy bạn, tùy paper, mục đích là để thực hiện phép nhân matrix thôi
@ngocthuongtran51364 жыл бұрын
Anh ơi cho em xin thông tin chi tiết về khoá học này với ạ. Em đang học về xử lý ngôn ngữ tự nhiên và em đang làm một project môn học về đề tài phân loại cảm xúc của người dùng sau khi họ mua hàng trên các website thương mại điện tử việt nam thông qua các câu nhận xét đánh giá mà họ để lại, em xử lý ngôn ngữ là tiếng việt kết quả đầu ra phải xác định được bình luận đó thuộc vào mức độ cảm xúc nào, thì yêu cầu tối thiểu phải có 4 mức cảm xúc. Em muốn xin thông tin chi tiết về khoá học này ạ. ==> đây là email của em ạ: nathuong99@gmail.com. Em cảm ơn anh.