«DeepSeek-OCR» تحت المجهر | دراسة تكشف فجوات تقنية في معالجة النصوص الطويلة

تؤكد نتائج دراسة حديثة من جامعة توهوكو والأكاديمية الصينية للعلوم أن تقنية DeepSeek-OCR لا تقدم فهماً بصرياً حقيقياً للنصوص الطويلة، بل تعتمد بشكل مفرط على التخمين بناءً على أنماط لغوية سابقة. هذا يعني أن قدرة التقنية على ضغط البيانات بمعدل يصل إلى 20 ضعفاً تأتي على حساب الدقة، مما يجعلها غير موظفة بشكل آمن في معالجة المستندات المعقدة التي تتطلب استدلالاً دقيقاً خارج التوقعات اللغوية المعتادة.

تعتمد آلية DeepSeek-OCR، التي أُطلقت في أكتوبر الماضي، على تحويل النصوص إلى تمثيلات بصرية لتقليل عدد الرموز (Tokens)، وهو ما يهدف نظرياً إلى تجاوز “عنق زجاجة السياق” الذي يحد من قدرة الذكاء الاصطناعي على استيعاب الكتب أو الحوارات الضخمة. ومع ذلك، كشفت الاختبارات المستقلة أن هذا الضغط يؤدي إلى فقدان البيانات الجوهرية؛ حيث انخفضت دقة الإجابات إلى 20% فقط عند إدخال نصوص إضافية تؤثر على الاستدلال، مقارنة بـ 90% في النماذج التقليدية التي لا تعتمد على هذا النوع من الضغط.

بالنسبة للمطورين والشركات، يمثل هذا التشكيك تنبيهاً تقنياً بأن تقنيات الضغط البصري الحالية قد تتحول إلى “عكاز لغوي” يخدع النموذج؛ فبينما قد تنجح في قراءة المخطوطات غير الواضحة عبر استكمال الكلمات الناقصة بناءً على السياق، إلا أنها تخاطر بتقديم معلومات مغلوطة عند قراءة نصوص مطبوعة بوضوح تحتوي على أرقام أو بيانات غير متوقعة لغوياً.

لماذا تراجع أداء DeepSeek-OCR في الاختبارات المستقلة؟

يرجع التراجع إلى اعتماد التقنية على “الأسبقيات اللغوية” بدلاً من الإدراك البصري الصرف. في حالات النصوص الطويلة، يبدأ النموذج في “توقع” الكلمات التالية بناءً على احتمالات اللغة بدلاً من معالجة الرموز البصرية الفعلية، مما يؤدي إلى نتائج وصفها الباحثون بأنها “مضللة” في سياق معالجة البيانات الحساسة.

المعيارادعاءات DeepSeekنتائج الدراسة المستقلة
معدل ضغط النصوصتقليل الرموز بمعدل 7 إلى 20 مرةضغط مرتفع يؤدي لفقدان الدقة
دقة الاستدلال البصريكفاءة عالية في المستندات المعقدةتنخفض إلى 20% عند وجود نصوص مشوشة
آلية العمل الأساسيةإدراك بصري متطوراعتماد مفرط على التخمين اللغوي

تطرح هذه النتائج تساؤلات جوهرية حول مستقبل معالجة السياق الطويل؛ فالفشل في التمييز بين النص المرئي وبين احتمالات اللغة يعني أن أزمة معالجة المستندات الضخمة لا تزال قائمة، وأن الحلول التي تعتمد على الضغط البصري المكثف قد لا تكون المسار العملي الأكثر موثوقية في الوقت الراهن.