OCR چگونه کار می کند؟
نرمافزار OCR برای تبدیل دادههای تصویری به متن مراحل زیر را طی میکند:
- آستانه گذاری و ساختن تصاویر سیاه و سفید(باینری): یک اسکنر تصاویر را میخواند و آنها را به دادههای باینری تبدیل میکند. نرمافزار OCR تصویر اسکن شده را تجزیه و تحلیل میکند و (بر اساس روشهای آستانهگذاری) مناطق روشن را به عنوان پس زمینه و مناطق تاریک را به عنوان متن طبقهبندی میکند.
- پیش پردازش و کاهش نویز: نرمافزار OCR ابتدا تصویر را پاک میکند و خطاها را حذف میکند تا برای خواندن آماده شود. برخی از تکنیکهای تمیز کردن آن عبارتند رفع مشکلات تراز در حین اسکن، حذف حفرهها و لکهها با عملیات مورفولوژی
- تشخیص متن و کاراکتر ها: نرمافزارهای OCR از دو روش برای تشخیص کاراکترها استفاده میکنند تطبیق الگو و استخراج ویژگی نامیده میشود.
- تشخیص الگو(Pattern recognition): برنامههای OCR نمونههایی از متن در فونتها و قالبهای مختلف تغذیه میشوند که سپس برای مقایسه و تشخیص کاراکترهای سند اسکن شده استفاده میشوند.
- تشخیص ویژگی(Feature detection): برنامههای OCR قوانینی را در مورد ویژگیهای یک حرف یا عدد خاص برای تشخیص کاراکترها در سند اسکن شده اعمال میکنند. ویژگیها میتواند شامل تعداد خطوط زاویه دار، خطوط متقاطع یا منحنی در یک کاراکتر برای مقایسه باشد.
مزایای به کارگیری OCR
- افزایش سرعت: نرمافزارهای OCR سریعتر از انسانها دادههای تصاویر را استخراج میکنند.
- صرفه جویی در زمان: با افزایش سرعت خواندن متون تصاویر، در زمان صرفهجویی میشود.
- افزایش دقت و تشخیص بیشتر: OCRها بر اساس الگوریتمهای از پیش تعریف شده یا داده آموزش داده داده میتوانند متون را با دقت بالایی اسکن کنند.
- خواندن متون ناخوانا: OCRها بر اساس داده آموزش داده شده و الگوریتمهای هوش مصنوعی حتی متون ناخوانا را نیز تشخیص میدهند.
- افزایش کارایی: با افزایش سرعت و دقت، کارایی افزایش مییابد.
کاربرد OCR
- تبدیل تصاویر به متن
- خواندن متون دست نویس
- خواندن خودکار اسناد
- تایید خودگار فرم ها و اسناد
- نرم افزار های پلاک خوان
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.