OCR(تشخیص کاراکتر نوری) چیست؟

تشخیص کاراکتر نوری (OCR) فرآیندی است که یک تصویر از متن را به یک قالب متن قابل خواندن توسط ماشین تبدیل می‌کند. برای مثال، اگر فرم یا رسیدی را اسکن می‌کنید، رایانه شما اسکن را به عنوان یک فایل تصویری ذخیره می‌کند. شما نمی‌توانید از یک ویرایشگر متن برای ویرایش، جستجو یا شمارش کلمات موجود در فایل تصویر استفاده کنید. با این حال، می‌توانید از OCR برای تبدیل تصویر به یک سند متنی استفاده کنید که محتوای آن به عنوان داده متنی ذخیره شده است. OCR‌ها از تجهیزات‌های مختلف سخت‌افزاری مانند اسکنر‌ها و از الگوریتم‌های پردازش تصویر و هوش مصنوعی برای تبدیل عکس به متن استفاده می‌کنند.

OCR چگونه کار می کند؟

 نرم‌افزار OCR برای تبدیل داده‌های تصویری به متن مراحل زیر را طی می‌کند:

  • آستانه گذاری و  ساختن تصاویر سیاه و سفید(باینری): یک اسکنر تصاویر را می‌خواند و آن‌ها را به داده‌های باینری تبدیل می‌کند. نرم‌افزار OCR تصویر اسکن شده را تجزیه و تحلیل می‌کند و (بر اساس روش‌های آستانه‌گذاری) مناطق روشن را به عنوان پس زمینه و مناطق تاریک را به عنوان متن طبقه‌بندی می‌کند.
  • پیش پردازش و کاهش نویز: نرم‌افزار OCR ابتدا تصویر را پاک می‌کند و خطا‌ها را حذف می‌کند تا برای خواندن آماده شود. برخی از تکنیک‌های تمیز کردن آن عبارتند رفع مشکلات تراز در حین اسکن، حذف حفره‌ها و لکه‌ها با عملیات مورفولوژی
  • تشخیص متن و کاراکتر ها: نرم‌افزار‌های OCR از دو روش برای تشخیص کاراکتر‌ها استفاده می‌کنند تطبیق الگو و استخراج ویژگی نامیده می‌شود.
  1. تشخیص الگو(Pattern recognition): برنامه‌های OCR نمونه‌هایی از متن در فونت‌ها و قالب‌های مختلف تغذیه می‌شوند که سپس برای مقایسه و تشخیص کاراکتر‌های سند اسکن شده استفاده می‌شوند.
  2. تشخیص ویژگی(Feature detection): برنامه‌های OCR قوانینی را در مورد ویژگی‌های یک حرف یا عدد خاص برای تشخیص کاراکتر‌ها در سند اسکن شده اعمال می‌کنند. ویژگی‌ها می‌تواند شامل تعداد خطوط زاویه دار، خطوط متقاطع یا منحنی در یک کاراکتر برای مقایسه باشد.

مزایای به کارگیری OCR

  • افزایش سرعت: نرم‌افزار‌های OCR سریع‌تر از انسان‌ها داده‌های تصاویر را استخراج می‌کنند.
  • صرفه جویی در زمان: با افزایش سرعت خواندن متون تصاویر، در زمان صرفه‌جویی می‌شود.
  • افزایش دقت و تشخیص بیشتر: OCR‌ها بر اساس الگوریتم‌های از پیش تعریف شده یا داده آموزش داده داده می‌توانند متون را با دقت بالایی اسکن کنند.
  • خواندن متون ناخوانا: OCR‌ها بر اساس داده آموزش داده شده و الگوریتم‌های هوش مصنوعی حتی متون ناخوانا را نیز تشخیص می‌دهند.
  • افزایش کارایی: با افزایش سرعت و دقت، کارایی افزایش می‌یابد.

کاربرد OCR

  • تبدیل تصاویر به متن
  • خواندن متون دست نویس
  • خواندن خودکار اسناد
  • تایید خودگار فرم ها و اسناد
  • نرم افزار های پلاک خوان
0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگوها شرکت کنید؟
در گفتگو ها شرکت کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *