منهجية الفهرسة والتصنيف
في مشروع غوتنبرغ الرقمي
نظام فهرسة أكاديمي متكامل لأرشفة الصحافة الثقافية العربية بين عامَي 1876 و1953
مقدمة
يقوم هذا المشروع على منهجية فهرسة أكاديمية دقيقة تتجاوز الأرشفة التقليدية نحو بناء طبقة معرفية منظمة وقابلة للبحث والتحليل.
تندرج المجلات الأربع الكبرى — الرسالة، والثقافة، والهلال، والمقتطف — ضمن أكثر الدوريات الثقافية العربية تأثيراً في القرن العشرين. تعتمد هذه المنهجية على ثلاثة مستويات متكاملة من الفهرسة، مدعومة بأدوات الذكاء الاصطناعي، وتخضع للمراجعة البشرية المتخصصة في كل مرحلة.
مستويات الفهرسة الثلاثة
الفهرسة الأساسية
البيانات الببليوغرافية الجوهرية لكل مقالة.
الفهرسة التحليلية
طبقة تحليلية لفهم السياق الفكري.
الفهرسة المعرفية
أعمق المستويات: ربط بالتيارات الفكرية الكبرى.
الأنطولوجيا — قاموس التصنيف
الأبواب الثابتة (13 باباً)
أنواع المقالات (5 أنواع)
المعجم الموحد للكتّاب
قاموس مركزي للأسماء المعيارية يزيل التباين. تُحذف الألقاب (الأستاذ، الدكتور، بك، باشا) ويُحتفظ بالاسم الجوهري فقط.
مبادئ الفهرسة
الأمانة في النقل
تُنقل النصوص كما وردت بما فيها من أخطاء مطبعية وتهجئة تاريخية.
القوائم المغلقة
لا تُقبل قيم خارج القوائم المعتمدة في حقول الباب ونوع المقالة.
درجة الثقة
كل بيانات مستخرجة آلياً تحمل درجة ثقة. ما دون الحد يخضع لمراجعة بشرية.
النسب الدقيق
تُنسب المقالات المترجمة إلى مترجميها العرب مع الإشارة إلى الأصل.
الشفافية في النواقص
ما لا يمكن تحديده يُصنَّف صراحة كـ"يحتاج مراجعة".
التكامل بين المجلات
قاموس موحد واحد على جميع المجلات يتيح البحث المقارن.
مؤشرات الجودة
نتائج المعالجة الأولية لعام 1935 من مجلة الرسالة:
النسبة المتبقية في كل حقل تخضع للمراجعة البشرية قبل الإتاحة النهائية.
نطاق المشروع (المرحلة الأولى)
| المجلة | السنوات | عدد الصفحات | تقدير المقالات |
|---|---|---|---|
| الرسالة | 1933 – 1953 | 34,096 | ~15,000 |
| الثقافة | 1939 – 1953 | 23,643 | ~8,400 |
| الهلال | 1892 – 1953 | 59,064 | ~7,500 |
| المقتطف | 1876 – 1952 | 76,511 | ~7,000 |
| المجموع | 193,314 | ~37,900 |
الإتاحة المفتوحة
يسعى المشروع إلى الاندماج في الشبكات الأكاديمية العالمية من خلال معايير Dublin Core وOAI-PMH.