نافذة السياق: "ذاكرة" الذكاء الاصطناعي الخاصة بك

جوهر فهم نماذج اللغة الكبيرة عندما تتفاعل مع نموذج لغة كبير (LLM) مثل ChatGPT، فإنه يتذكر حقًا رسائلك السابقة ضمن المحادثة الجارية. هذه القدرة تعود في الأساس إلى ما يُسمى بـ"نافذة السياق". ذاكرة العمل لنموذج الذكاء الاصطناعي تشبه الذاكرة قصيرة المدى لدى الإنسان أو ذاكرة الوصول العشوائي (RAM) في الحاسوب. تمامًا كما تساعدنا الذاكرة قصيرة المدى في الاحتفاظ بالمعلومات ومعالجتها مؤقتًا، وتسمح ذاكرة الوصول العشوائي للحاسوب بالوصول السريع إلى البيانات التي يحتاجها في اللحظة الحالية، فإن ذاكرة عمل الذكاء الاصطناعي تحدد مقدار المعلومات التي يمكنه إدارتها في وقت واحد. هذه السعة تحد من مقدار السياق الذي يمكن للذكاء الاصطناعي مراعاته عند الإجابة على الأسئلة، تمامًا كما تحدد ذاكرتنا قصيرة المدى أو ذاكرة الوصول العشوائي للحاسوب حدود ما يمكن معالجته في وقت واحد.

Liubov Shchigoleva الكاتب

20 يناير 2024

جوهر فهم نماذج اللغة الكبيرة

عندما تتفاعل مع نموذج لغة كبير (LLM) مثل ChatGPT، فإنه يتذكر حقًا رسائلك السابقة ضمن المحادثة الجارية. هذه القدرة تعود في الأساس إلى ما يُسمى بـ”نافذة السياق”. ذاكرة العمل لنموذج الذكاء الاصطناعي تشبه الذاكرة قصيرة المدى لدى الإنسان أو ذاكرة الوصول العشوائي (RAM) في الحاسوب. تمامًا كما تساعدنا الذاكرة قصيرة المدى في الاحتفاظ بالمعلومات ومعالجتها مؤقتًا، وتسمح ذاكرة الوصول العشوائي للحاسوب بالوصول السريع إلى البيانات التي يحتاجها في اللحظة الحالية، فإن ذاكرة عمل الذكاء الاصطناعي تحدد مقدار المعلومات التي يمكنه إدارتها في وقت واحد. هذه السعة تحد من مقدار السياق الذي يمكن للذكاء الاصطناعي مراعاته عند الإجابة على الأسئلة، تمامًا كما تحدد ذاكرتنا قصيرة المدى أو ذاكرة الوصول العشوائي للحاسوب حدود ما يمكن معالجته في وقت واحد.

ببساطة، تخيل نافذة السياق على أنها مقدار النص الذي يمكن للذكاء الاصطناعي “قراءته” و”الاحتفاظ به في الذهن” في وقت واحد. كلما كبرت هذه النافذة، تمكن الذكاء الاصطناعي من تذكر المزيد من التفاصيل من محادثتك أو تحليلها من المستندات الطويلة دون “نسيان” ما قيل سابقًا.

ما هي نافذة السياق؟

على عكس البشر الذين يعالجون الكلمات، تقسم نماذج اللغة الكبيرة النص إلى “وحدات رمزية” (tokens). يمكن أن تكون الوحدة الرمزية حرفًا واحدًا، أو جزءًا من كلمة، أو كلمة كاملة، أو حتى عبارة قصيرة. على سبيل المثال، قد تحتوي كلمة “amoral” على وحدتين رمزيتين: “a” و”moral”.

يُقاس حجم نافذة السياق دائمًا بالوحدات الرمزية. في المتوسط، تبلغ الكلمة الإنجليزية حوالي 1.5 وحدة رمزية. من المهم ملاحظة أن نافذة السياق لا تُستخدم فقط لنصك؛ بل تشمل أيضًا عناصر مثل تعليمات النظام (تسمى “مطالبات النظام”)، ومعلومات إضافية لتوليد معزز بالاسترجاع (RAG)، والتنسيق. مطالبة النظام هي تعليمات تُعطى للذكاء الاصطناعي لتوجيه كيفية تصرفه أو استجابته. على سبيل المثال، إذا طلبت من الذكاء الاصطناعي الرد بطريقة احترافية، فإن هذا الأمر هو مطالبة نظام: “يرجى الإجابة على جميع الأسئلة بنبرة احترافية ومهذبة.”

لماذا هي مهمة جدًا؟

تقدم نافذة السياق الأكبر مزايا كبيرة لنماذج اللغة الكبيرة:

تحسين الاحتفاظ بالمعلومات: يمكن للذكاء الاصطناعي تذكر المزيد من التفاصيل طوال المحادثة، مما يمنعه من “فقدان المسار”.

معالجة نصوص أطول: يمكن للنماذج تحليل وتلخيص مستندات أو قواعد تعليمات برمجية أو مجموعات بيانات أكبر بكثير، وهو ما كان مستحيلًا في السابق.

استدلال متقدم: يسمح السياق المتزايد باستجابات أكثر دقة وتعقيدًا وفروقًا دقيقة. على سبيل المثال، تمكن نموذج Google’s Gemini 1.5 Pro من تعلم ترجمة لغة مهددة بالانقراض بشكل خطير (Kalamang) من خلال قراءة دليل قواعدها الوحيد، مما أظهر قدرة ترجمة مماثلة للإنسان.

إمكانيات تفاعل جديدة: تفتح سعة التعامل مع البيانات المتزايدة طرقًا جديدة تمامًا للمستخدمين للتفاعل مع الذكاء الاصطناعي، مما يتيح مهامًا أكثر تعقيدًا وشمولاً.

تحديات نوافذ السياق الكبيرة

على الرغم من فوائدها، تشكل نوافذ السياق الكبيرة تحديات:

التكلفة الحسابية والطاقة: تتطلب معالجة كتل نصية أكبر قوة حسابية وذاكرة ووقتًا أكثر بشكل كبير. يمكن لمضاعفة طول السياق أن يضاعف الحاجة الحسابية أربع مرات.

زمن الاستجابة (Latency): يمكن أن يصبح الاستدلال أبطأ مع زيادة طول السياق، مما يمثل مشكلة للتطبيقات في الوقت الفعلي.

مشكلة “إبرة في كومة قش”: مع نمو حجم النص (“كومة القش”)، يمكن أن يجد النموذج صعوبة في تحديد تفصيل محدد وحاسم (“الإبرة”). يتشتت انتباهه، مما يجعله يتغاضى عن الحقيقة الرئيسية - مثل تفويت جملة واحدة حول فشل حرج لمشروع ضمن تقرير من 200 صفحة. هذا يقلل بشكل كبير من موثوقية النموذج ودقته.

للتعمق أكثر، انظر الورقة البحثية الأساسية حول هذه المشكلة: https://arxiv.org/abs/2307.03172

تطور القدرات

نمت أحجام نوافذ السياق بشكل كبير بمرور الوقت، مما يمثل خطوة رئيسية نحو فهم أعمق وإدراك أوسع للوضع في أنظمة الذكاء الاصطناعي. بينما كانت نماذج اللغة الكبيرة المبكرة مثل GPT-2 محدودة بحوالي 2048 وحدة رمزية، شهدت النماذج الحديثة انفجارًا في قدراتها.

اليوم، تقدم نماذج مثل Anthropic’s Claude 3 نافذة سعة 200,000 وحدة رمزية. تصل نماذج OpenAI’s GPT-4 Turbo و GPT-4o إلى 128,000 وحدة رمزية. يتميز Google Gemini 1.5 Pro بنافذة قياسية سعة 128,000 وحدة رمزية، مع نسخة تجريبية تصل إلى 1 مليون وحدة رمزية، واختبارات بحثية تصل إلى 10 ملايين وحدة رمزية. تهدف مشاريع مثل Magic AI حتى إلى 100 مليون وحدة رمزية. هذا السباق لزيادة السياق هو مؤشر رئيسي على الابتكار والمنافسة في مجال الذكاء الاصطناعي.

يوضح الجدول التالي تطور قدرات نافذة السياق:

النموذج	نافذة السياق (وحدات رمزية)	سنة الإصدار	ملاحظات
GPT-4 Turbo	128,000	2023	نسخة مُحسَّنة منخفضة التكلفة
GPT-4o (Omni)	128,000	2024	متعدد الوسائط (نص، صورة، صوت)
Claude 3 Opus	200,000	2024	نافذة سياق ضخمة
Claude 3.5/4	200,000	2024	أحدث نماذج Anthropic
Gemini 1.5 Pro	128,000 (تجريبي حتى 1M)	2024	متعدد الوسائط، سياق كبير
Gemini 2.0 / 2.5 Pro	128,000+	2024	قدرات محسنة

موازنة القوة والعملية

نافذة السياق هي أساسية لـ”ذاكرة” وفهم نماذج اللغة الكبيرة. حجمها، المقاس بالوحدات الرمزية، يؤثر مباشرة على قدرة النموذج اللغوي الكبير على توليد نص متماسك والتعامل مع المهام المعقدة.

بينما تعزز نوافذ السياق الأكبر قدرات الذكاء الاصطناعي بشكل كبير، إلا أنها تأتي مع تحديات كبيرة تتعلق بالتكلفة والأداء والأمان. سيواصل تطوير نماذج اللغة الكبيرة المستقبلية التركيز على تحسين هذا المكون الحاسم، بحثًا عن “النقطة المثلى” بين قوة المعالجة والقابلية العملية للاستخدام. لذلك، فإن فهم نافذة السياق أمر بالغ الأهمية لأي شخص يتطلع إلى الاستفادة القصوى من أدوات الذكاء الاصطناعي الحالية والمستقبلية.

فهم نافذة السياق ذو صلة خاصة بـ GPT Workspace، حيث يؤثر مباشرة على مقدار المعلومات التي يمكن لنماذجنا الحالية - GPT-4.1 و GPT-4o - تذكرها ومعالجتها في وقت واحد. يقدم كلا النموذجين نافذة سياق كبيرة تصل إلى 128,000 وحدة رمزية، مما يجعلهما عمليين للغاية للمناقشات الممتدة وتحليل المستندات وسير العمل المعقدة. تتيح هذه السعة للمستخدمين الاستفادة من المستندات الطويلة أو التفاعلات دون فقدان السياق السابق بشكل متكرر، وهو أمر ضروري للحفاظ على جلسات متماسكة ومنتجة في GPT Workspace.

جرب نوافذ السياق الكبيرة في Google Workspace. ثبّت GPT Workspace واستخدم GPT-4o بسعة سياق 128k مباشرةً في Google Docs و Sheets و Slides و Gmail.

نافذة السياق: "ذاكرة" الذكاء الاصطناعي الخاصة بك

جوهر فهم نماذج اللغة الكبيرة

ما هي نافذة السياق؟

لماذا هي مهمة جدًا؟

تحديات نوافذ السياق الكبيرة

تطور القدرات

موازنة القوة والعملية

المزيد من أدلة عملية

كيفية استخدام ChatGPT في Google Docs: دليل شامل لعام 2026

كيفية استخدام الذكاء الاصطناعي في Google Sheets: أتمتة الصيغ والتحليل والتقارير

كيفية تثبيت وإعداد GPT Workspace: دليل Chrome Extension + Add-on

Start using AI in Google Workspace