GPT Workspace GPT Workspace

نافذة السياق: "ذاكرة" الذكاء الاصطناعي الخاصة بك

جوهر فهم نماذج اللغة الكبيرة عندما تتفاعل مع نموذج لغة كبير (LLM) مثل ChatGPT، فإنه يتذكر حقًا رسائلك السابقة ضمن المحادثة الجارية. هذه القدرة تعود في الأساس إلى ما يُسمى بـ"نافذة السياق". ذاكرة العمل لنموذج الذكاء الاصطناعي تشبه الذاكرة قصيرة المدى لدى الإنسان أو ذاكرة الوصول العشوائي (RAM) في الحاسوب. تمامًا كما تساعدنا الذاكرة قصيرة المدى في الاحتفاظ بالمعلومات ومعالجتها مؤقتًا، وتسمح ذاكرة الوصول العشوائي للحاسوب بالوصول السريع إلى البيانات التي يحتاجها في اللحظة الحالية، فإن ذاكرة عمل الذكاء الاصطناعي تحدد مقدار المعلومات التي يمكنه إدارتها في وقت واحد. هذه السعة تحد من مقدار السياق الذي يمكن للذكاء الاصطناعي مراعاته عند الإجابة على الأسئلة، تمامًا كما تحدد ذاكرتنا قصيرة المدى أو ذاكرة الوصول العشوائي للحاسوب حدود ما يمكن معالجته في وقت واحد.

Liubov Shchigoleva
Liubov Shchigoleva الكاتب
·
20 يناير 2024
نافذة السياق: "ذاكرة" الذكاء الاصطناعي الخاصة بك

جوهر فهم نماذج اللغة الكبيرة

عندما تتفاعل مع نموذج لغة كبير (LLM) مثل ChatGPT، فإنه يتذكر حقًا رسائلك السابقة ضمن المحادثة الجارية. هذه القدرة تعود في الأساس إلى ما يُسمى بـ”نافذة السياق”. ذاكرة العمل لنموذج الذكاء الاصطناعي تشبه الذاكرة قصيرة المدى لدى الإنسان أو ذاكرة الوصول العشوائي (RAM) في الحاسوب. تمامًا كما تساعدنا الذاكرة قصيرة المدى في الاحتفاظ بالمعلومات ومعالجتها مؤقتًا، وتسمح ذاكرة الوصول العشوائي للحاسوب بالوصول السريع إلى البيانات التي يحتاجها في اللحظة الحالية، فإن ذاكرة عمل الذكاء الاصطناعي تحدد مقدار المعلومات التي يمكنه إدارتها في وقت واحد. هذه السعة تحد من مقدار السياق الذي يمكن للذكاء الاصطناعي مراعاته عند الإجابة على الأسئلة، تمامًا كما تحدد ذاكرتنا قصيرة المدى أو ذاكرة الوصول العشوائي للحاسوب حدود ما يمكن معالجته في وقت واحد.

ببساطة، تخيل نافذة السياق على أنها مقدار النص الذي يمكن للذكاء الاصطناعي “قراءته” و”الاحتفاظ به في الذهن” في وقت واحد. كلما كبرت هذه النافذة، تمكن الذكاء الاصطناعي من تذكر المزيد من التفاصيل من محادثتك أو تحليلها من المستندات الطويلة دون “نسيان” ما قيل سابقًا.

ما هي نافذة السياق؟

على عكس البشر الذين يعالجون الكلمات، تقسم نماذج اللغة الكبيرة النص إلى “وحدات رمزية” (tokens). يمكن أن تكون الوحدة الرمزية حرفًا واحدًا، أو جزءًا من كلمة، أو كلمة كاملة، أو حتى عبارة قصيرة. على سبيل المثال، قد تحتوي كلمة “amoral” على وحدتين رمزيتين: “a” و”moral”.

يُقاس حجم نافذة السياق دائمًا بالوحدات الرمزية. في المتوسط، تبلغ الكلمة الإنجليزية حوالي 1.5 وحدة رمزية. من المهم ملاحظة أن نافذة السياق لا تُستخدم فقط لنصك؛ بل تشمل أيضًا عناصر مثل تعليمات النظام (تسمى “مطالبات النظام”)، ومعلومات إضافية لتوليد معزز بالاسترجاع (RAG)، والتنسيق. مطالبة النظام هي تعليمات تُعطى للذكاء الاصطناعي لتوجيه كيفية تصرفه أو استجابته. على سبيل المثال، إذا طلبت من الذكاء الاصطناعي الرد بطريقة احترافية، فإن هذا الأمر هو مطالبة نظام: “يرجى الإجابة على جميع الأسئلة بنبرة احترافية ومهذبة.”

لماذا هي مهمة جدًا؟

تقدم نافذة السياق الأكبر مزايا كبيرة لنماذج اللغة الكبيرة:

تحسين الاحتفاظ بالمعلومات: يمكن للذكاء الاصطناعي تذكر المزيد من التفاصيل طوال المحادثة، مما يمنعه من “فقدان المسار”.

معالجة نصوص أطول: يمكن للنماذج تحليل وتلخيص مستندات أو قواعد تعليمات برمجية أو مجموعات بيانات أكبر بكثير، وهو ما كان مستحيلًا في السابق.

استدلال متقدم: يسمح السياق المتزايد باستجابات أكثر دقة وتعقيدًا وفروقًا دقيقة. على سبيل المثال، تمكن نموذج Google’s Gemini 1.5 Pro من تعلم ترجمة لغة مهددة بالانقراض بشكل خطير (Kalamang) من خلال قراءة دليل قواعدها الوحيد، مما أظهر قدرة ترجمة مماثلة للإنسان.

إمكانيات تفاعل جديدة: تفتح سعة التعامل مع البيانات المتزايدة طرقًا جديدة تمامًا للمستخدمين للتفاعل مع الذكاء الاصطناعي، مما يتيح مهامًا أكثر تعقيدًا وشمولاً.

تحديات نوافذ السياق الكبيرة

على الرغم من فوائدها، تشكل نوافذ السياق الكبيرة تحديات:

التكلفة الحسابية والطاقة: تتطلب معالجة كتل نصية أكبر قوة حسابية وذاكرة ووقتًا أكثر بشكل كبير. يمكن لمضاعفة طول السياق أن يضاعف الحاجة الحسابية أربع مرات.

زمن الاستجابة (Latency): يمكن أن يصبح الاستدلال أبطأ مع زيادة طول السياق، مما يمثل مشكلة للتطبيقات في الوقت الفعلي.

مشكلة “إبرة في كومة قش”: مع نمو حجم النص (“كومة القش”)، يمكن أن يجد النموذج صعوبة في تحديد تفصيل محدد وحاسم (“الإبرة”). يتشتت انتباهه، مما يجعله يتغاضى عن الحقيقة الرئيسية - مثل تفويت جملة واحدة حول فشل حرج لمشروع ضمن تقرير من 200 صفحة. هذا يقلل بشكل كبير من موثوقية النموذج ودقته.

للتعمق أكثر، انظر الورقة البحثية الأساسية حول هذه المشكلة: https://arxiv.org/abs/2307.03172

تطور القدرات

نمت أحجام نوافذ السياق بشكل كبير بمرور الوقت، مما يمثل خطوة رئيسية نحو فهم أعمق وإدراك أوسع للوضع في أنظمة الذكاء الاصطناعي. بينما كانت نماذج اللغة الكبيرة المبكرة مثل GPT-2 محدودة بحوالي 2048 وحدة رمزية، شهدت النماذج الحديثة انفجارًا في قدراتها.

اليوم، تقدم نماذج مثل Anthropic’s Claude 3 نافذة سعة 200,000 وحدة رمزية. تصل نماذج OpenAI’s GPT-4 Turbo و GPT-4o إلى 128,000 وحدة رمزية. يتميز Google Gemini 1.5 Pro بنافذة قياسية سعة 128,000 وحدة رمزية، مع نسخة تجريبية تصل إلى 1 مليون وحدة رمزية، واختبارات بحثية تصل إلى 10 ملايين وحدة رمزية. تهدف مشاريع مثل Magic AI حتى إلى 100 مليون وحدة رمزية. هذا السباق لزيادة السياق هو مؤشر رئيسي على الابتكار والمنافسة في مجال الذكاء الاصطناعي.

يوضح الجدول التالي تطور قدرات نافذة السياق:

النموذجنافذة السياق (وحدات رمزية)سنة الإصدارملاحظات
GPT-4 Turbo128,0002023نسخة مُحسَّنة منخفضة التكلفة
GPT-4o (Omni)128,0002024متعدد الوسائط (نص، صورة، صوت)
Claude 3 Opus200,0002024نافذة سياق ضخمة
Claude 3.5/4200,0002024أحدث نماذج Anthropic
Gemini 1.5 Pro128,000 (تجريبي حتى 1M)2024متعدد الوسائط، سياق كبير
Gemini 2.0 / 2.5 Pro128,000+2024قدرات محسنة

موازنة القوة والعملية

نافذة السياق هي أساسية لـ”ذاكرة” وفهم نماذج اللغة الكبيرة. حجمها، المقاس بالوحدات الرمزية، يؤثر مباشرة على قدرة النموذج اللغوي الكبير على توليد نص متماسك والتعامل مع المهام المعقدة.

بينما تعزز نوافذ السياق الأكبر قدرات الذكاء الاصطناعي بشكل كبير، إلا أنها تأتي مع تحديات كبيرة تتعلق بالتكلفة والأداء والأمان. سيواصل تطوير نماذج اللغة الكبيرة المستقبلية التركيز على تحسين هذا المكون الحاسم، بحثًا عن “النقطة المثلى” بين قوة المعالجة والقابلية العملية للاستخدام. لذلك، فإن فهم نافذة السياق أمر بالغ الأهمية لأي شخص يتطلع إلى الاستفادة القصوى من أدوات الذكاء الاصطناعي الحالية والمستقبلية.

فهم نافذة السياق ذو صلة خاصة بـ GPT Workspace، حيث يؤثر مباشرة على مقدار المعلومات التي يمكن لنماذجنا الحالية - GPT-4.1 و GPT-4o - تذكرها ومعالجتها في وقت واحد. يقدم كلا النموذجين نافذة سياق كبيرة تصل إلى 128,000 وحدة رمزية، مما يجعلهما عمليين للغاية للمناقشات الممتدة وتحليل المستندات وسير العمل المعقدة. تتيح هذه السعة للمستخدمين الاستفادة من المستندات الطويلة أو التفاعلات دون فقدان السياق السابق بشكل متكرر، وهو أمر ضروري للحفاظ على جلسات متماسكة ومنتجة في GPT Workspace.

جرب نوافذ السياق الكبيرة في Google Workspace. ثبّت GPT Workspace واستخدم GPT-4o بسعة سياق 128k مباشرةً في Google Docs و Sheets و Slides و Gmail.

FREE TO INSTALL

Start using AI in Google Workspace

Join 7M+ professionals who write faster, analyze smarter, and collaborate better with GPT Workspace.