OCR with multimodal LLM in "a flash" on Colab via API - Mì AI

  Рет қаралды 4,067

Mì AI

Mì AI

Күн бұрын

Пікірлер: 20
@tuananhlehoang9255
@tuananhlehoang9255 9 күн бұрын
Cám ơn anh đã chia sẻ model ạ, model quá ngon ❤❤❤
9 күн бұрын
Yeah. A sẽ gửi lởi cảm ơn của em tới tác giá nhé. Model xịn quá lun!
@actrungoan4725
@actrungoan4725 6 күн бұрын
Bạn có thể làm video hướng dẫn chạy trên máy Local không có kết nối Internet được không? Máy ở công ty của mình không được phép kết nối ra ngoài mà cái OCR này ngon quá, vượt gấp mấy lần ABBYY lẫn VietOCR Cảm ơn bạn nhiều!
6 күн бұрын
Video này mình chạy trên Colab vì máy mình yếu thôi. Bạn có thể lấy code này này chạy local được nếu máy bạn khoẻ nhé!
@nguyenvanhoang7801
@nguyenvanhoang7801 9 күн бұрын
chào anh. anh có thể làm video hướng dẫn train và sử dụng anomalib của intel được không ạ. cám ơn a
9 күн бұрын
Để a nghiên cứu nhé. Thanks em!
2 күн бұрын
ae nào cài trên colab rồi cho xài ké với
2 күн бұрын
Hehe!
@cobala2938
@cobala2938 9 күн бұрын
Trước kia e đã có dùng con LLM này, ngoài việc detect text, e muốn nó export bounding box của từng chữ trong ảnh. Nhưng nó không thể export được. Có cách nào để fine-tune model này để nó export bounding box không ạ?
9 күн бұрын
Thế thì em chuẩn bị dữ liệu đầu vào là ảnh, đầu ra là bounding box và finetune. Nhưng theo anh nghĩ khá vất vả đấy!
@mcartist6731
@mcartist6731 5 күн бұрын
LLM thì không nên finetune. Bạn dùng thêm PaddleOCR để detect ra text. Lưu ý phần detect này kết quả sẽ khác so vơi text đươc trích xuất bằng LLM trong video.
@baohuynh5462
@baohuynh5462 3 күн бұрын
Bạn có thể dùng mô hình florence thử detect, mô hình này chỉ 1B nên task không thể đa dạng được, tập trung tốt một task ocr trước. Hoặc kết hợp với model detect box như Paddleocr hay yolo rồi dùng LLM để OCR
@kynghecotuong
@kynghecotuong 9 күн бұрын
Mô hình này cần cấu hình ntn có thể chạy đc vậy bạn
9 күн бұрын
Mình chạy Colab nên cấu hình máy như nào cũng đc nhé!
@baohuynh5462
@baohuynh5462 3 күн бұрын
Chắc bạn cần tối thiểu 8g gpu hoặc phải convert qua gguf thì chạy cpu
@mahanminhnhat
@mahanminhnhat 8 күн бұрын
mình chạy bị báo lỗi ngay ở đoạn code load model và test model "model = AutoModel.from_pretrained(". ko rõ bị gì
8 күн бұрын
Bạn chụp ảnh post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup xem cho rõ nhé!
@sdg258
@sdg258 6 күн бұрын
Fix đuọc chưa á bác
@khatrieu3108
@khatrieu3108 6 күн бұрын
Cài lại thư viện transformer nha: pip install --upgrade transformers Ví dụ nó có báo "restart session" thì cứ ok rồi chạy lại các cell là ok nha
How Strong Is Tape?
00:24
Stokes Twins
Рет қаралды 96 МЛН
99.9% IMPOSSIBLE
00:24
STORROR
Рет қаралды 31 МЛН
Beat Ronaldo, Win $1,000,000
22:45
MrBeast
Рет қаралды 158 МЛН
Kỹ thuật RAG tăng cường dữ liệu cho Chatbot LLM
52:19
InoTechViet Channel
Рет қаралды 3,7 М.
Finetuning Large Language Model with PEFT, LoRA - Mì AI
50:11
LLMs: Xây dựng ứng dụng RAG với LangChain (AIO2023)
2:45:30
Khám phá AI Agents: Xu hướng định hình tương lai trí tuệ nhân tạo
30:20
How Strong Is Tape?
00:24
Stokes Twins
Рет қаралды 96 МЛН