tutorials April 9, 2026 Herramientas Gratis Team

كيفية عمل OCR على ملف PDF ممسوح ضوئياً — نص قابل للبحث والتحرير

تعلم ما هو OCR وكيفية عمل PDF قابل للبحث من مسح ضوئي والأيض المدعومة ونصائح للحصول على أقصى دقة في التعرف.

كيفية عمل OCR على ملف PDF ممسوح ضوئياً — نص قابل للبحث والتحرير

ما هي تكنولوجيا OCR وماذا تفعل؟

OCR اختصار لـ Optical Character Recognition (التعرف الضوئي على الأحرف). إنها التكنولوجيا التي تسمح للكمبيوتر بـ "قراءة" النص الذي يظهر في صورة وتحويله إلى نص رقمي حقيقي قابل للتحرير والبحث.

عندما تمسح مستنداً ورقياً ضوئياً — عقداً موقعاً أو فاتورة قديمة أو صفحة من كتاب — تصبح النتيجة صورة فوتوغرافية للورقة. حتى لو بدا ملف PDF يشبه مستند نص، فهو في الحقيقة صورة فقط. لا يمكنك استخدام Ctrl+F للبحث عن كلمة ولا نسخ فقرة ولا تحديد نص. تحول تكنولوجيا OCR تلك الصورة إلى مستند نص حقيقي.

متى تحتاج لعمل OCR؟

  • ملفات PDF الممسوحة ضوئياً: المستندات الفيزيائية التي تمسحت أو صورت بدون OCR
  • الفواتير القديمة: عندما تحتاج نسخ بيانات للمحاسبة أو قواعد البيانات
  • العقود المرقمنة: للبحث عن بنود محددة أو نسخ شروط
  • الكتب والمنشورات: لرقمنة المحتوى والاقتباس أو البحث
  • صور المستندات: صور مأخوذة بالهاتف المحمول من مستندات على الورقة
  • الملفات التاريخية: رقمنة المستندات من الأرشيف
  • النماذج المملوءة بخط اليد: لاستخراج البيانات المكتوبة يدويا

كيفية عمل OCR (بشكل مبسط)

  1. معالجة مسبقة: تُحسن الصورة: زيادة التباين وتصحيح الانحراف وحذف الضوضاء في الخلفية.
  2. التجزئة: يحدد محرك OCR مناطق النص والأعمدة والجداول والصور والعناصر الأخرى في الصفحة.
  3. التعرف على الأحرف: يتم تحليل كل حرف ومقارنته مع قاعدة بيانات من الأشكال المعروفة باللغة المحددة.
  4. التصحيح اللغوي: يستخدم المحرك قواميس اللغة لتصحيح أخطاء التعرف بناءً على السياق.
  5. إنشاء ملف PDF: يُنشأ ملف PDF برقم بطبقة نص "غير مرئية" متراكمة فوق الصورة الأصلية، مما يحافظ على المظهر البصري لكن يضيف نصاً قابلاً للبحث.

كيفية عمل OCR على ملف PDF باستخدام أداتنا

  1. الوصول إلى الأداة: انتقل إلى عمل OCR على ملف PDF.
  2. حمّل ملف PDF الممسوح ضوئياً: اسحب الملف أو اختره. يمكنك أيضاً تحميل صور مباشرة (JPG أو PNG أو TIFF).
  3. اختر اللغة: اختر اللغة الأساسية للمستند (عربي أو إنجليزي أو فرنسي أو ألماني إلخ). هذا يحسن دقة بشكل كبير.
  4. اختر نوع الإخراج:
    • PDF قابل للبحث: يحافظ على الصورة الأصلية ويضيف نصاً غير مرئي. مظهر متطابق للأصل.
    • PDF قابل للتحرير: يستبدل الصورة بنص حقيقي منسق. قابل للتحرير أكثر لكن قد يفقد التصميم الأصلي.
  5. معالجة وتحمل: يستغرق OCR بين 10 و 60 ثانية حسب حجم وتعقيد المستند.
التوصية: للحفاظ على مظهر المستند الأصلي (التوقيعات والشعارات والأختام) والإضافة فقط للقدرة على البحث، اختر دائماً "PDF قابل للبحث". إذا احتجت تحرير النص، اختر "PDF قابل للتحرير" أو بعد ذلك حوّل إلى Word باستخدام أداة PDF إلى Word الخاصة بنا.

لغات مدعومة في OCR

تدعم أداة OCR الخاصة بنا أكثر من 100 لغة، بما فيها:

المنطقة اللغات الرئيسية
أوروبا الغربية الإسبانية والإنجليزية والفرنسية والألمانية والإيطالية والبرتغالية والهولندية
أوروبا الشرقية البولندية والتشيكية والمجرية والرومانية والبلغارية والروسية
آسيا الصينية المبسطة والصينية التقليدية والياباني والكوري والعربية
أمريكا اللاتينية الإسبانية (مع لكنات وñ والنبرات) والبرتغالية البرازيلية
أخرى العبرية والتايلاندية والفيتنامية والإغريقية والتركية

نصائح للحصول على الحد الأقصى من دقة OCR

جودة المستند الأصلي

  • الحد الأدنى للدقة الموصى بها: 300 DPI. أسفل من 200 DPI تنخفض الدقة بشكل ملحوظ.
  • التباين: نص أسود على خلفية بيضاء مثالي. النص الرمادي الفاتح على خلفية بيضاء يعطي نتائج سيئة.
  • الانحراف: إذا كان المستند ملتويا أكثر من 10 درجات، فإن OCR يفقد الدقة. تصحح أداتنا الانحرافات الطفيفة تلقائياً.
  • البقع والضوضاء: المستندات بها بقع أو أختام على النص أو ورق مصفر جداً تعطي نتائج سيئة.

إعدادات OCR

  • اختر اللغة الصحيحة: هذا أهم عامل للدقة. OCR محدد للإنجليزية سيعطي نتائج سيئة بالإسبانية (سيخلط بين ñ والنبرات).
  • استخدم OCR متعدد اللغات: إذا كان المستند بنصوص بلغات مختلفة، اختر لغات متعددة في الوقت نفسه.
  • للمستندات برموز: محركات OCR الحديثة تكتشف التخطيط برموز تلقائياً، لكن للتخطيطات معقدة جداً (المجلات والصحف) قد تكون الدقة أقل.

ما دقة OCR التي أتوقعها؟

دقة OCR الحديثة عالية جداً في الظروف المثالية:

  • مستند مطبوع بجودة عالية و 300 DPI: دقة 99%+
  • مستند مطبوع بجودة متوسطة و 200 DPI: دقة 95-98%
  • مستند ممسوح ضوئياً مع بقع أو تجاعيد: دقة 85-95%
  • خط يدوي: 60-80% (الكتابة اليدوية أصعب بكثير للتعرف)
  • خطوط ديكوريية أو مسننة: متغير، قد يكون منخفضاً

OCR على مستندات متعددة الصفحات

تعالج أداتنا مستندات متعددة الصفحات في المرة الواحدة. لا تحتاج لعمل OCR صفحة تلو الأخرى. النتيجة ملف PDF واحد برقمياً بجميع الصفحات قابلة للبحث، الحفاظ على الترتيب والهيكل للمستند الأصلي.

بعد OCR: استخدامات النص المستخرج

بمجرد أن يكون ملف PDF قابلاً للبحث، يمكنك:

  • البحث عن كلمات رئيسية مع Ctrl+F في أي قارئ PDF
  • نسخ مقاطع نصية لاقتباسها أو إعادة استخدامها
  • فهرسة المستند في أنظمة إدارة المستندات
  • تحويله إلى Word باستخدام أداة PDF إلى Word للتحرير الكامل
  • استخدام أدوات تحليل النص أو الذكاء الاصطناعي على المحتوى

اجعل ملف PDF قابلاً للبحث الآن

طبّق OCR على أي ملف PDF ممسوح ضوئياً وحوّله إلى نص قابل للبحث والنسخ. مجاني وبدون تثبيت.

عمل OCR على PDF مجاني →
Share
Related tools
OCR — اجعل PDF قابلاً للبحث
Back to blog