نُهيكل التراث العربي
إلى بنية تحتية للذكاء الاصطناعي
Structuring Arabic heritage
into AI data infrastructure
نبني بنية تحتية لبيانات الذكاء الاصطناعي — مدعومة بـ Google Cloud.
تم تصوير ما يتجاوز 2,000,000 صفحة (1887–1975). في المرحلة الأولى نستهدف تحويل 450,000 صفحة حتى 1953 إلى بيانات منظمة قابلة للبحث والتحليل.
Building AI data infrastructure for Arabic knowledge — powered by Google Cloud.
2,000,000+ pages photographed (1887–1975). Phase 1 targets structuring 450,000 pages up to 1953 into searchable data.
- البيانات الخام: تم تصوير 2,000,000+ صفحة من مجلات تراثية (1887–1975).
- المرحلة الأولى: تحويل وهيكلة 450,000 صفحة (حتى 1953) إلى بيانات منظمة قابلة للبحث والتحليل.
- المخرجات: Dataset + فهرس دلالي + Knowledge Graph + API للبحث (/search) والمقالات (/articles).
- Raw digitization: 2,000,000+ pages photographed from heritage magazines (1887–1975).
- Phase 1: convert and structure 450,000 pages (up to 1953) into searchable, analyzable data.
- Outputs: datasets + semantic index + knowledge graph + APIs for search (/search) and articles (/articles).
نموذج الدخل والاستدامة
نعمل بنموذج B2B قابل للتوسع: واجهات API + اشتراكات مؤسسية + تراخيص بيانات + حلول تنفيذ للجهات المالكة للأرشيفات. الواجهة العامة المجانية تُستخدم كعرض قيمة وإثبات منتج، بينما الدخل يأتي من طبقة البيانات المنظمة وخدماتها.
- API Access (SaaS): خطط شهرية/سنوية حسب الاستهلاك للوصول البرمجي إلى /articles و/search و/graph.
- اشتراكات جامعات ومراكز بحث: لوحات تحليلات وتصدير snapshots ووصول مؤسسي.
- Dataset Licensing: ترخيص الـ corpus المنظم ولقطات الـ Knowledge Graph وفق نطاق استخدام واضح.
- Enterprise Services: تشغيل خط المعالجة لصالح مؤسسات تمتلك أرشيفات مغلقة وتسليم بيانات منظمة.
Business Model & Sustainability
We operate a scalable B2B model: API access + institutional subscriptions + dataset licensing + enterprise delivery for private archives. The public free interface demonstrates value and product proof, while revenue comes from the structured data layer and services.
- API Access (SaaS): usage-based monthly/annual plans for /articles, /search, and /graph endpoints.
- University & Research Subscriptions: analytics dashboards, exports/snapshots, and controlled institutional access.
- Dataset Licensing: licensing structured corpus and knowledge graph snapshots under clear usage terms.
- Enterprise Services: running the pipeline for institutions with private archives and delivering structured outputs.