حشو السياق في الذكاء الاصطناعي يرفع التكاليف 70%

ثمة مفارقة تتكشّف بهدوء داخل فرق التطوير البرمجي حول العالم: الأدوات التي وُعدنا بأنها ستُضاعف الإنتاجية باتت في حالات كثيرة تستنزف الوقت والميزانية معاً. السبب ليس في النماذج اللغوية ذاتها، بل في الطريقة التي يتعامل بها المطورون معها.

ما المقصود بالحشو المفرط للسياق؟

المصطلح الإنجليزي Tokenmaxxing يشير إلى ممارسة حشو أكبر قدر ممكن من المعلومات في نافذة الـ tokens الخاصة بنموذج الذكاء الاصطناعي، على أمل الحصول على مخرجات أفضل. يُرسل المطورون ملفات كاملة، ووثائق مطوّلة، وتعليمات مفصّلة، معتقدين أن الكمية مرادفة للجودة. لكن الواقع يقول عكس ذلك تماماً.

لماذا تنقلب المعادلة؟

أبحاث نشرها باحثون في Stanford HAI عام 2024 حول قدرات النماذج اللغوية على معالجة السياقات الطويلة كشفت أن هذه النماذج تُعاني مما يُسمى "تشتت الانتباه" حين يتمدد السياق المُدخَل بشكل مفرط. النتيجة العملية هي كود يبدو مكتملاً في ظاهره، لكنه يحمل في داخله تناقضات منطقية تستلزم إعادة كتابة مكثّفة. دراسة مستقلة نشرتها مجلة ACM Queue في مطلع 2025 أكّدت أن النماذج تُولي اهتماماً أكبر للمعلومات الواردة في بداية السياق ونهايته، متجاهلةً ما في الوسط، وهو ما يُفسّر كثيراً من الأخطاء الغامضة في الكود المُولَّد.

الأرقام تتحدث

رصدت فرق هندسية متعددة، وثّقت تجاربها على منصات مثل GitHub Discussions وHacker News، ارتفاعاً في تكاليف استدعاءات API بنسبة تتراوح بين 40 و70 بالمئة، دون أي تحسن مقابل في جودة المنتج النهائي. بعض المشاريع وجدت نفسها مضطرة إلى إعادة كتابة ما بين 30 و50 بالمئة من الكود المُولَّد آلياً، وهو ما يُلغي عملياً الوقت الذي وفّرته الأداة في المراحل الأولى. الوقت الفعلي للإنجاز يتمدد بدلاً من أن يتقلص، والضغط على الفرق يتصاعد لأن التوقعات بُنيت على وعود لم تتحقق بهذا الشكل.

ماذا تقول أفضل الممارسات الحالية؟

توصيات مهندسي Anthropic المنشورة في وثائقهم التقنية الرسمية تُشير صراحةً إلى أن السياق المُركَّز والمحدد يتفوق على الحشو الكمي. الحل ليس في إعطاء النموذج كل شيء، بل في اختيار ما يحتاجه فعلاً. تقنيات مثل RAG، أي الاسترجاع المعزّز بالتوليد، تُتيح للنموذج الوصول إلى المعلومات الضرورية في اللحظة المناسبة بدلاً من حشوها جميعاً دفعة واحدة.

وماذا يعني هذا لك؟

إذا كنت مطوراً أو تقود فريقاً تقنياً، فالرسالة واضحة: أقل هو أكثر. ضع حدوداً واضحة لما تُدخله في النموذج، وقيّم إنتاجيتك بجودة ما تُشحن لا بعدد الأسطر التي يُولّدها. في بيئات الشركات الناشئة في المنطقة العربية، حيث الميزانيات محدودة والهوامش ضيّقة، هذا التمييز قد يكون فارقاً حقيقياً بين الربح والخسارة. السؤال الذي يستحق التأمل هو: هل تقيس إنتاجيتك بما يخرج من النموذج، أم بما يصل فعلاً إلى المستخدم؟

المصدر: TechCrunch، https://techcrunch.com/2026/04/17/tokenmaxxing-is-making-developers-less-productive-than-they-think/

ما المقصود بالحشو المفرط للسياق؟

لماذا تنقلب المعادلة؟

الأرقام تتحدث

ماذا تقول أفضل الممارسات الحالية؟

وماذا يعني هذا لك؟

اقرأ أيضاً في

تحالف سحابي جديد: ألفابت وبلاكستون يُطلقان شركة ذكاء اصطناعي برقائق خاصة

خسرَ ماسك دعواه ضد OpenAI بحكم موحّد من 9 محلّفين

خطر مؤسسي مخفي: الذكاء الاصطناعي يُزيح الخبراء الذين يحتاجهم