الفصل الرابع: فهم بنية النماذج اللغوية الكبيرة (LLMs)
1. لماذا نفهم بنية LLMs؟
قبل أن تتقن هندسة التوجيه، عليك أن تفهم كيف تفكر هذه النماذج. بالطبع، الذكاء الاصطناعي لا “يفكر” كما يفعل الإنسان، لكنه يعالج اللغة ويُصدر استجابات مبنية على تعلم إحصائي هائل.
كلما زادت معرفتك ببنية النموذج الداخلي، كلما عرفت كيف “تتحدث معه” بلغة يفهمها ويستجيب لها بشكل فعّال. وهذا جوهر هندسة التوجيه.
2. تعريف LLMs
LLMs هي اختصار لـ Large Language Models، أي النماذج اللغوية الضخمة. وهي عبارة عن أنظمة ذكاء اصطناعي تم تدريبها على مليارات الكلمات من الإنترنت والكتب والموسوعات والبرمجة والمقالات، وتستطيع:
- فهم اللغة البشرية الطبيعية.
- توليد نصوص جديدة شبيهة بما كتبه البشر.
- الإجابة على الأسئلة.
- كتابة الشيفرات البرمجية.
- الترجمة، والتلخيص، والإبداع.
مثال على LLM:
GPT-4 – نموذج مدرّب على نصوص متعددة اللغات، ويُعد من أقوى النماذج في الفهم والسياق.
3. كيف “يتعلم” النموذج اللغة؟
العملية الأساسية التي يقوم بها النموذج تُعرف بـ “نموذج التنبؤ بالكلمة التالية” (Next Word Prediction). ببساطة:
يقوم النموذج بتحليل جملة، ثم يُخمّن الكلمة التالية بناءً على ما تدرب عليه.
مثال:
“الذكاء الاصطناعي يمكن أن يُستخدم في…” النموذج يتوقع: “التعليم”، أو “الطب”، أو “الصناعة”، بناءً على السياق.
وهذه القدرة تعتمد على:
- كمية البيانات التي تدرب عليها.
- حجم النموذج (عدد المعاملات أو Parameters).
- جودة التدريب والتنقيح (Fine-tuning).
4. مكونات النموذج اللغوي الكبير
دعونا نُبسّط المكونات الأساسية لأي LLM:
أ. المُدخلات (Inputs)
النموذج لا يقرأ الحروف مباشرة. يتم أولاً تحويل الكلمات إلى تمثيلات رقمية تُعرف بـ التضمينات (Embeddings).
مثلًا، الكلمة “تفاحة” تتحول إلى مصفوفة أرقام تعكس معناها وسياقها.
ب. الطبقات (Layers)
كل نموذج يتكون من طبقات متعددة، مثل البصل. كل طبقة تعالج المعلومات من منظور مختلف، وتستخرج أنماطًا لغوية معينة.
- GPT-3 = يحتوي على 96 طبقة.
- GPT-4 = يُعتقد أنه يحتوي على أكثر من 100 طبقة.
كلما زادت الطبقات، زادت قدرة النموذج على فهم العلاقات المعقدة بين الكلمات.
ج. الانتباه (Attention Mechanism)
هذا المكون الثوري يسمح للنموذج أن يركز على الكلمات المهمة في الجملة.
مثال:
في الجملة: “الطالب الذي قرأ الكتاب حصل على الجائزة”، النموذج يحتاج لفهم أن “الطالب” هو الذي “حصل” وليس “الكتاب”. الانتباه هو ما يسمح له بهذا الربط.
د. التحويلات (Transformers)
وهي البنية المعمارية الأساسية للنماذج الحديثة. تم اقتراحها لأول مرة في ورقة علمية بعنوان:
“Attention Is All You Need” – عام 2017
ومن هنا، بدأت ثورة LLMs. كل النماذج مثل GPT وBERT وClaude وGemini تعتمد على Transformers.
5. الفرق بين GPT وBERT
الجانب | GPT | BERT |
---|---|---|
الاتجاه | من اليسار إلى اليمين (توليدي) | من كلا الاتجاهين (فهمي) |
الاستخدام | توليد النصوص، المحادثة، الكتابة | فهم السياق، التصنيف، الإجابة على الأسئلة |
نوع النماذج | Generative | Discriminative |
الأمثلة | ChatGPT، GPT-4، GPT-4o | BERT، RoBERTa، DistilBERT |
6. حجم النموذج ولماذا يهم
عدد المعاملات (Parameters) هو ما يُحدد قوة النموذج. المعاملات هي الأوزان التي يستخدمها النموذج لتحديد أهمية الكلمات وسياقاتها.
النموذج | عدد المعاملات (تقريبي) |
---|---|
GPT-2 | 1.5 مليار |
GPT-3 | 175 مليار |
GPT-4 | غير معلن، يُقدّر بـ 500+ مليار |
Mistral 7B | 7 مليار |
LLaMA 2 | 13 – 65 مليار |
كلما زاد العدد، أصبح النموذج:
- أكثر دقة.
- أكثر قدرة على الفهم العميق.
- لكنه يحتاج موارد أكبر (ذاكرة، معالجات).
7. Fine-Tuning وRLHF: كيف يتحسن النموذج؟
📌 Fine-tuning
هو تدريب إضافي يتم على النموذج بعد تدريبه الأساسي، لجعله متخصصًا في مجال معين، مثل الطب أو القانون أو التعليم.
📌 RLHF (Reinforcement Learning with Human Feedback)
تعني “التعلم بالتعزيز مع ملاحظات بشرية”. يتم استخدام مدخلات بشرية لتحسين استجابات النموذج، مما يجعله:
- أكثر ملاءمة للسياق.
- أقل عرضة للأخطاء.
- أكثر أخلاقية واحترامًا للمعايير.
8. هل النماذج تفهم فعلًا؟
هذا سؤال فلسفي. النموذج لا يملك وعيًا أو فهمًا حقيقيًا. هو فقط يحلل الأنماط، ويُعيد إنتاجها بطريقة تبدو ذكية جدًا.
لكنه لا “يعرف” مثلما يعرف الإنسان، بل يتوقع بناءً على احتمالات.
ومع ذلك، هذا لا يقلل من قوة النماذج، بل يجعلنا نحترم دقة الصياغة في التوجيه — لأن النموذج يتبعك تمامًا في الطريقة التي توجهه بها.
✅ خلاصة الفصل الرابع:
- النماذج اللغوية الكبيرة تعتمد على فكرة التنبؤ بالكلمة التالية.
- بنيتها تتكون من تضمينات، طبقات، وآلية الانتباه، ومعمارية Transformers.
- كلما زاد حجم النموذج وعدد طبقات الانتباه، زادت دقته.
- Fine-tuning وRLHF تجعل النماذج أكثر تخصصًا وموثوقية.
- الفهم الحقيقي هو وهم — النماذج تتعامل مع اللغة إحصائيًا، لا شعوريًا.
الفصل الخامس: أساسيات كتابة توجيهات فعالة؟ سيكون مفيدًا جدًا لتطبيق ما تعلّمته حتى الآن.