به عنوان یک قاعده ، وقتی صحبت از برنامه هایی برای شناخت متن اسکن شده (OCR ، تشخیص شخصیت نوری) می شود ، بیشتر کاربران تنها محصول - ABBYY FineReader را به یاد می آورند ، که بدون شک رهبر چنین نرم افزاری در روسیه و یکی از رهبران جهان است.
با این حال ، FineReader تنها چنین راه حل نیست: برنامه های رایگان برای تشخیص متن ، خدمات آنلاین با همان اهداف وجود دارد ، و علاوه بر این ، چنین کارکردهایی نیز در برخی از برنامه هایی که می دانید وجود دارد ممکن است در رایانه شما نصب شود. . من سعی خواهم کرد در مورد این همه در این مقاله بنویسم. تمام برنامه های مورد بررسی در ویندوز 7 ، 8 و XP کار می کنند.
رهبر تشخیص متن - ABBYY Finereader
بیشتر شما احتمالاً درباره FineReader (تلفظ Fine Reader) شنیده اید. این برنامه بهترین یا یکی از بهترین ها برای شناخت با کیفیت بالا متون به زبان روسی است. این برنامه پرداخت می شود و قیمت مجوز برای مصارف خانگی کمی کمتر از 2000 روبل است. همچنین می توانید نسخه آزمایشی FineReader را بارگیری کنید یا از تشخیص متن آنلاین در ABBYY Fine Reader Online استفاده کنید (می توانید چندین صفحه را به صورت رایگان و سپس با هزینه ای تشخیص دهید). همه این موارد در وب سایت رسمی توسعه دهنده //www.abbyy.ru موجود است.
نصب نسخه آزمایشی FineReader مشکلی ایجاد نکرد. این نرم افزار می تواند با Microsoft Office و Windows Explorer ادغام شود تا تشخیص راحت تر انجام شود. از محدودیت های نسخه آزمایشی رایگان - 15 روز استفاده و امکان تشخیص بیش از 50 صفحه.
عکس فوری برای تست برنامه های تشخیص
از آنجا که اسکنر ندارم ، برای بررسی ، از یک عکس فوری از دوربین تلفنی با کیفیت پایین استفاده کردم که در آن کنتراست را کمی ویرایش کردم. کیفیت بی ارزش است ، بیایید ببینیم چه کسی می تواند آن را اداره کند.
منوی FineReader
FineReader می تواند یک تصویر گرافیکی از متن را مستقیماً از اسکنر ، از پرونده های تصویری یا دوربین دریافت کند. در مورد من ، برای باز کردن پرونده تصویر کافی بود. نتیجه رضایت بخش - فقط دو اشتباه. باید بگویم که این بهترین نتیجه همه برنامه های آزمایش شده هنگام کار با این نمونه است - کیفیت تشخیص مشابه فقط در سرویس آنلاین رایگان OCR Free Online (اما در این بررسی ما فقط در مورد ابزارهای نرم افزاری صحبت می کنیم ، نه شناخت آنلاین).
نتیجه تشخیص متن در FineReader است
صادقانه بگویم ، FineReader احتمالاً هیچ رقیبی برای متون سیریلیک ندارد. از مزایای این برنامه نه تنها کیفیت تشخیص متن ، بلکه قابلیت های گسترده ، پشتیبانی از قالب بندی ، صادرات صالح به بسیاری از قالب ها از جمله Word docx ، pdf و سایر ویژگی هاست. بنابراین ، اگر وظایف OCR چیزی است که شما مرتباً با آن روبرو می شوید ، پس مبلغی را نسبتاً کمی هدر ندهید و هزینه آن را پرداخت می کند: شما با دریافت سریع نتیجه ای با کیفیت بالا در FineReader ، زمان زیادی صرفه جویی می کنید. به هر حال ، من هیچ چیزی را تبلیغ نمی کنم - من واقعاً فکر می کنم کسانی که باید بیش از ده ها صفحه را تشخیص دهند ، باید چنین نرم افزاری را در نظر بگیرند.
CuneiForm - یک برنامه تشخیص متن رایگان
به نظر من ، دومین برنامه محبوب OCR در روسیه ، CuneiForm رایگان است که می توانید از وب سایت رسمی //cognitiveforms.ru/products/cuneiform/ بارگیری کنید.
نصب برنامه نیز بسیار ساده است ، سعی در نصب هیچ نرم افزار شخص ثالث (مانند خیلی نرم افزار رایگان) ندارد. رابط کاربری مختصر و واضح است. در برخی موارد ، ساده ترین روش استفاده از جادوگر ، که برای اولین بار از آیکون های موجود در این فهرست استفاده می شود.
برنامه ای که من با نمونه ای که از آن در FineReader استفاده کردم ، کنار نیامدم ، یا به طور دقیق تر ، چیزی خواندنی ضعیف و خلاصه ای از کلمات تولید کردم. تلاش دوم با یک اسکرین شات از متن از سایت این برنامه انجام شده است که البته باید بیشتر شود (او به اسکنهایی با رزولوشن 200dpi و بالاتر نیاز دارد ، او عکس هایی با ضخامت خط فونت 1-2 پیکسل نمی خواند). در اینجا او به خوبی انجام داد (بخشی از متن به رسمیت شناخته نشد ، زیرا تنها روسی انتخاب شده است).
تشخیص متن در CuneiForm
بنابراین ، می توانیم فرض کنیم که CuneiForm همان چیزی است که باید امتحان کنید ، به خصوص اگر صفحات اسکن شده ای با کیفیت بالا دارید و می خواهید آنها را بطور رایگان تشخیص دهید.
Microsoft OneNote برنامه ای است که ممکن است قبلاً داشته باشید
مایکروسافت آفیس ، از نسخه 2007 شروع و تا پایان با نسخه فعلی ، 2013 ، برنامه ای برای یادداشت برداری دارد - OneNote. همچنین دارای ویژگی های تشخیص متن است. برای استفاده از آن ، کافیست اسکن شده یا هر تصویر دیگر متن را در یادداشت وارد کنید ، بر روی آن راست کلیک کرده و از منوی زمینه استفاده کنید. توجه داشته باشید که زبان تشخیص پیش فرض روی زبان انگلیسی تنظیم شده است.
شناخت در Microsoft OneNote
من نمی توانم بگویم که متن کاملاً شناخته شده است ، اما ، تا آنجا که می توانم بگویم ، حتی در CuneiForm حتی بهتر است. علاوه بر این برنامه ، همانطور که قبلاً نیز گفته شد ، این است که با احتمال قابل توجهی در حال حاضر روی رایانه شما نصب شده است. اگرچه ، البته در صورت لزوم کار با تعداد زیادی از اسناد اسکن شده ، استفاده از آن بعید است ، اما بعید است برای شناسایی سریع کارت های ویزیت مناسب تر باشد.
OmniPage Ultimate، OmniPage 18 - باید بسیار جالب باشد
من نمی دانم که این برنامه برای تشخیص متن OmniPage چقدر خوب است: نسخه آزمایشی وجود ندارد ، من نمی خواهم در جایی بارگیری کنم. اما اگر قیمت آن توجیه شود و در نسخه برای استفاده فردی و نه Ultimate در نسخه حدود 5000 روبل هزینه شود ، پس این باید چیزی چشمگیر باشد. صفحه برنامه: //www.nuance.com/for-individuals/by-product/omnipage/index.htm
قیمت نرم افزار OmniPage
اگر با خصوصیات و بررسی ها از جمله در نسخه های روسی زبان آشنا شوید ، در آنها خاطر نشان می شود که OmniPage واقعاً شناختی با کیفیت بالا و دقیق از جمله به زبان روسی ارائه می دهد ، اسکن های با کیفیت پایین را با نسبتاً راحت مقایسه کرده و مجموعه ای از ابزارهای اضافی را ارائه می دهد. از میان کاستی ها ، رابط کاربری مناسب ترین نیست ، خصوصاً برای یک کاربر تازه کار. به نوعی ، در بازار غربی OmniPage یک رقیب مستقیم برای FineReader است و در رده بندی های انگلیسی دقیقاً در بین خود می جنگند و بنابراین ، به نظر من ، این برنامه باید ارزشمند باشد.
اینها همه برنامه هایی از این نوع نیستند ، همچنین نسخه های متنوعی از برنامه های رایگان کوچک وجود دارد ، اما هنگام آزمایش با آنها ، دو عیب اصلی را که ذاتاً در آنها وجود دارد ، پیدا کردم: عدم پشتیبانی سیریلیک ، یا نرم افزارهای مختلف ، بسیار مفید در کیت نصب ، و به همین دلیل تصمیم گرفتم به آنها اشاره نکنم. اینجا