نموذج علام اللغوي | ALLaM | نظــرة أعمق

  Рет қаралды 12,971

Abu Bakr Soliman

Abu Bakr Soliman

Күн бұрын

في هذا الفيديو, نستكشف سوياً تجربة بناء النموذج اللغوي (علام) المقدم من الهيئة السعودية للبيانات و الذكاء الاصطناعي في السعودية.
من خلال الورقة البحثية, نستكشف سوياً مراحل استكشاف المشكلة, وصولاً الى انشاء مجموعة النماذج اللغوية بكافة أنواعها.
03:30 from scratch or not
06:00 How does tokenizer work
08:51 LLaMA2 tokenizer
10:43 Fertility Rate
12:39 How can we expand the vocabulary
14:43 The ColossalAI Experiment
16:45 MMLU Datasets and the translation issues
22:00 How pre-train data were prepared
25:19 The pile dataset
25:50 Collecting Arabic Dataset
26:50 How to qualify the collected data
28:23 The datatrove project
29:40 The CosmoPedia Dataset
30:45 The machine-translated dataset
32:45 How to evaluate data ratios
34:50 Mixed Data Ratios
36:00 Continued Pretraining
37:30 Expanded vocabularies training
40:00 Continued Pretraining Hyperparameters
44:00 Train from scratch
44:20 Training on multiple stages
45:30 The cross-lingual transfer phenomena
48:30 Why do we need large batches
51:00 GPU Infrastructure
54:50 From base-model to instructions-tuned
56:40 The Ultra-Instinct dataset
01:00:01 The instructions-tuned model hyperparameters
01:04:00 Why do we need an additional finetuning step
01:07:00 Preference Training
01:07:50 DPO
01:11:00 On-Policy and Off-Policy Negative Sampling
01:13:00 DPO Data Augmentation
01:15:40 Learning Rates and Data Sizes
01:18:20 How many evaluation shots do you need
01:27:00 Human Evaluation Vs. Automated Evaluation
01:28:00 LMSys Arena
01:32:00 Why do we need to develop our evaluation
01:33:50 Conclusion

Пікірлер: 44
@mahmoudal.faress7832
@mahmoudal.faress7832 9 күн бұрын
جزاك الله كل خير وبارك الله بعلمك، فعلاً محتوى أكثر من رائع ومن أفضل الفيديوهات التي حضرتها بحياتي والتي تطرقت فيه لبحث بهذا التعقيد وأسهبت بالشرح وقدمت فيه روابط وأفكار خارجية تساعد الأخرين للاستزادة الفيدو مدته ساعة ونصف ولكنه قد احتصر على أخرين شهر ونصف من القراءة والبحث
@wesamkhallaf
@wesamkhallaf Ай бұрын
انت تقدم محتوي عربي رائع غير موجود كثيرا في هذا المجال وباسلوب مميز احييك عليه
@moustafabayommy409
@moustafabayommy409 23 сағат бұрын
ما شاء الله جزاكم الله خيرا وزادكم من فضله
@Qwme5
@Qwme5 Ай бұрын
شكرا جزيلا من اعماق قلبي ، انا كنت طالب دكتوراة ولم اكمل واعرف جيدا قيمة ما تقدم و سبحان الله جاء هذا المقطع وانا افكر اني اشارك في تحدي علام ، انا لسه ما كملت الفيديو ولكن والله البداية مشرفة وانت مثال مشرف للباحث العربي المتعلم ، واسلوب جميل في شرح الورقة العلمية والتفاصيل المهمة . متابع قناتك باهتمام وحرام والله ما عندك مشاهدين ودعم. ربنا يفتح عليك ونشوفك في أعلى المراكز يارب
@bakrianoo
@bakrianoo Ай бұрын
@@Qwme5 شكرا جدا على كلماتك الجميلة. و اتمنى لك التوفيق و الخير دوما 🙏
@hindraheemalmayyali3072
@hindraheemalmayyali3072 Ай бұрын
ممكن اتواصل مع حظرتك ؟؟
@محمدالميداوي
@محمدالميداوي 25 күн бұрын
والله تحية لإخواننا المصريين أفضل من يشرح المفاهيم العلمية بالعربية، شاهدت كثيرا من الفيديوهات الأجنبية ولم أفهم كما فهمت منك أخوك من المغرب.
@bakrianoo
@bakrianoo 25 күн бұрын
@@محمدالميداوي تحياتنا لأهل المغرب الغالي
@hashimosmanmusa8715
@hashimosmanmusa8715 Ай бұрын
طريقة الشرح وجودة المحتوى شئ في قمة الجمال جزاك الله كل خير
@YounesSaouabeddine
@YounesSaouabeddine 24 күн бұрын
بارك الله فيك وأحسن اليك، سبق وشاهدت مقطع الtransformer و Jais وكذا سلسلة الmini-rag ، صراحة محتوى من الطراز العالي و نحن في أمس الحاجة للمزيد ان شاء الله، أعانك الله أخي ابو بكر. أخوكم من المغرب.
@mohamedyassinch6016
@mohamedyassinch6016 14 күн бұрын
عاش بالتوفيق
@mohamedmaf
@mohamedmaf 8 күн бұрын
جزاكم الله خيرا ❤❤
@professorgamer2084
@professorgamer2084 26 күн бұрын
محتوى نادر وذو جودة عالية ... يعطيك العافية
@sultanovic7123
@sultanovic7123 29 күн бұрын
شكرا لك على المقطع والشرح وياليت تكون اوبن سورس صراحة النتيجة مرضية بالنظر لكمية المعضلات .
@nancyboukamel442
@nancyboukamel442 Ай бұрын
you are amazing :) greetings from lebanon
@MohamedAliFarag-oz8do
@MohamedAliFarag-oz8do 20 күн бұрын
عاش يا بكر ، ربنا يزيدك علماً وحلماً. 😍
@dabody123456
@dabody123456 Ай бұрын
بارك الله فيك و رحم الله والديك و زادك من كل علم نافع، شكرا على الفيديو شكرا يا بشمهندس أبو بكر
@mohamedhatem325
@mohamedhatem325 Ай бұрын
شكرا يا أبو بكر على الفيديو ده .... معلومات رائعة ربنا يجعلها فى ميزان حسناتك
@eslamnaser4904
@eslamnaser4904 Ай бұрын
الله،فخورين بيك ❤
@obh-m6fobh
@obh-m6fobh Ай бұрын
جزاك الله كل خير ، محتوى قيم جداً
@fertgoer7257
@fertgoer7257 Ай бұрын
شكرا لك على الفيديو القيم والغني اقترح عليك فيديو يتحدث عن مشكلة شح البيانات العربية وسبل زيادتها
@msharno
@msharno Ай бұрын
محتوى عظيم والله. ربنا يبارك فيك
@AasemSaid
@AasemSaid Ай бұрын
ماشاء الله ربنا يزيدك يارب ويعلمنا جميعا
@RaslanAbuzant
@RaslanAbuzant Ай бұрын
جزاك الله كل خير - معلومات رائعة
@kareemdesouky3603
@kareemdesouky3603 Ай бұрын
جميل جدا يا ابو بكر ربنا يكرمك يا صديقي ❤
@shhada80
@shhada80 Ай бұрын
جزاك الله عللى هذا الشرح المستفيض وعلى المعلومات القيمة المنثورة في ثنايا هذا الشرح، وكنا نتمنى لو كان هنالك نسخة منشورة للجميع ليتم التجريب عليها والحكم على النموذج بالتجارب الواقعية من خلال هذا الفيديو أو من خلال تجارب المستخدمين، فتبقى التجربة خير برهان.. أكرر شكري العميق لك على مجهوداتك الجبارة في الفيديوهات الفريدة التي تقدمها، والتي دوماً ما تزودنا بمعلومات جديدة لم نكن نعرفها، فنسأل الله تعالى أن يجعلها في ميزان حسناتك
@mohamedajamy
@mohamedajamy Ай бұрын
شكرا لك شرح مفصل وجميل
@asmaamahmoud7465
@asmaamahmoud7465 Ай бұрын
جزاك الله خيرا يا بشمهندس
@adnenchouibi7945
@adnenchouibi7945 Ай бұрын
Bravo 👏👏👏
@mekkiahmedi
@mekkiahmedi Ай бұрын
في هذا النموذج الذي بني على لغتين انجلبزي عربي، بنسبة تكاد تكون متساوية يكون هنالك خطر التحيز،حيث ان الابحاث العلمية باللغة العربية تكاد تكون معدومة
@haithamaliryan
@haithamaliryan Ай бұрын
ما شاء الله ، شرح جميل ورائع ، سؤالي : من هم الأشخاص الذين تنصح بمتابعتهم على كل وسائل التواصل
@justcars2454
@justcars2454 Ай бұрын
جميل، كون هناك مراكز عربية ل الذكاء الاصطناعي.
@abdallahaliabdallah6394
@abdallahaliabdallah6394 Ай бұрын
من قلبي - بارك الله فيك و زادك من كل علم نافع، شكرا على الفيديوهات الرائعة باللغة العربية الي نادرا ما الواحد بيلاقي زيها في مجال متخصص زي الـ LLM كمل على نفس النهج و الطريق - واستأذنك لو تقدر تعمل مقارنة عملية بين النماذج الي بتدعم اللغة العربية وتحطها في مقارنة مع حاجة زي command-r / command-r-plus / qwen2 (9b/72b) أنا حاليا شغال على بحث متعلق للـ LLM / RAG وحتى اللحظة دول أفضل ٣ نماذج بقدرة ممتازة على معالجة و ترجمة النصوص و التفكير المنطقي بشكل عام، فهل في بديل عربي ليه نفس القدرات؟ بردو هل عندك ترشيح لاي نموذج قوي تحت 70b يقدر يعالج النصوص العربية غير المذكورين فوق؟
@HazemAzim
@HazemAzim Ай бұрын
رائع
@unknown-ie3ik
@unknown-ie3ik Ай бұрын
راااائع
@RogayaAdamElzinSalim
@RogayaAdamElzinSalim Ай бұрын
wounderfull
@drmostafamahammad
@drmostafamahammad Ай бұрын
اتوقع استعمال محلل صرفي للتقطيع هيرفع الجودة..
@omaral-halabiah2851
@omaral-halabiah2851 Ай бұрын
جزاك الله خيراً عندي استفسار: لماذا لا يكون هناك models مخصصة لأمر محدد كأن يكون لدينا Model مدرب على أن يعطي أكواد بايثون و model مدرب على أن يعطي مقالات , ألن يكون هذه models أدق بالنتيجة ؟
@mohammedabdalmajed3914
@mohammedabdalmajed3914 27 күн бұрын
هناك بالفعل
@muchmore777
@muchmore777 Ай бұрын
It's a problem with the model in training and embedding a lot led to pressure to adapt
@katebalbalawi890
@katebalbalawi890 Ай бұрын
كانت بتسبورت ؟؟؟ ياخي كانت تدعم،، تكلم عربي او انجليزي لا تخلط
@heeemo2026
@heeemo2026 25 күн бұрын
يعني سبت الفيديو كله ولزقت في ذي؟
@أمديعماد
@أمديعماد 25 күн бұрын
المصريين كلهم هيج
@khaledalmundi1990
@khaledalmundi1990 18 күн бұрын
Please, I need to contact you, but couldn’t find a way to do so. If you can provide me with your email so I can send info there. Best regards 🙏🏼
أسرار بناء جيش موظفين ذكاء اصطناعي
31:41
Elyahyaoui Yassine ياسين اليحياوي
Рет қаралды 26 М.
Transformers and Attention in Details | شرح بالتفصيل
59:32
Abu Bakr Soliman
Рет қаралды 11 М.
Brawl Stars Edit😈📕
00:15
Kan Andrey
Рет қаралды 50 МЛН
؟ Docker ليه بنستخدم 💙
18:52
Yehia Tech يحيى تك
Рет қаралды 76 М.
The TRUTH behind Large Language Models (LLM) and How ChatGPT works.. - بالعربي
9:55
What is Kubernetes? (Arabic)
32:56
Ahmed Elfakharany - أحمد الفخراني
Рет қаралды 5 М.
How might LLMs store facts | Chapter 7, Deep Learning
22:43
3Blue1Brown
Рет қаралды 519 М.
الدحيح | الترانزستور
33:55
New Media Academy Life
Рет қаралды 5 МЛН
مقتطفات | إيلون ماسك: العربية لغة العدو
5:00
السبيل al-sabeel
Рет қаралды 242 М.
كيف تدمرت "صخر" أول شركة تطوير برمجيات عربية
17:17
فضفضة عن الأكل والمطاعم في السعودية
17:05