سلام بر همه خوانندگان وبلاگ!
من فکر می کنم کسانی که غالباً در رایانه کار می کنند (بازی نمی کنند ، یعنی کار نمی کنند) ، باید با تشخیص متن برخورد کنند. خوب ، برای مثال ، گزیده ای از کتاب را اسکن کرده اید و اکنون باید این قسمت را در سند خود وارد کنید. اما اسکن اسکن شده یک تصویر است و ما به متن نیاز داریم - برای این کار ما نیاز به برنامه های ویژه و خدمات آنلاین داریم تا متن را از تصاویر بشناسیم.
درباره برنامه های تشخیص ، من قبلاً در پست های قبلی نوشتم:
- اسکن متن و شناخت در FineReader (برنامه پرداخت شده)؛
- کار در آنالوگ FineReader - CuneiForm (برنامه رایگان).
در همان مقاله ، من می خواهم برای تشخیص متن به خدمات آنلاین بپردازم. از همه اینها ، اگر نیاز دارید که به سرعت یک متن را با 1-2 تصویر دریافت کنید - هیچ مشکلی برای نصب برنامه های مختلف وجود ندارد ...
مهم! کیفیت تشخیص (تعداد خطاها ، خوانایی و غیره) به کیفیت اصلی تصویر بسیار بستگی دارد. بنابراین ، هنگام اسکن (عکس گرفتن و غیره) ، کیفیت را تا حد ممکن انتخاب کنید. در بیشتر موارد ، کیفیت 300-400 dpi کافی خواهد بود (dpi پارامتری است که کیفیت تصویر را توصیف می کند. در تنظیمات تقریباً در تمام اسکنرها ، معمولاً این پارامتر نشان داده می شود).
خدمات آنلاین
به منظور نشان دادن نحوه عملکرد خدمات ، یک تصویر از یکی از مقاله هایم را گرفتم. این تصویر در کلیه خدمات بارگذاری می شود ، توضیحات مربوط به آن در زیر ارائه می شود.
1) //www.ocrconvert.com/
من این سرویس را بخاطر سادگی خیلی دوست دارم این سایت گرچه انگلیسی است اما با زبان روسی خوب کار می کند. نیازی به ثبت نام نیست برای شروع به رسمیت شناختن ، باید 3 عمل انجام دهید:
- تصویر خود را بارگذاری کنید.
- زبان متنی را که در تصویر است انتخاب کنید.
- دکمه شروع به کار را فشار دهید.
پشتیبانی از قالبها: PDF، GIF، BMP، JPEG.
نتیجه در زیر در تصویر ارائه شده است. باید بگویم متن کاملاً شناخته شده است. علاوه بر این ، خیلی سریع - من به معنای واقعی کلمه 5-10 ثانیه منتظر ماندم.
2) //www.i2ocr.com/
این سرویس مشابه موارد فوق کار می کند. در اینجا شما همچنین نیاز به بارگیری فایل ، انتخاب زبان تشخیص و کلیک بر روی دکمه عصاره متن دارید. این سرویس بسیار سریع کار می کند: 5-6 ثانیه. یک صفحه
قالبهای پشتیبانی شده: TIF، JPEG، PNG، BMP، GIF، PBM، PGM، PPM.
نتیجه این سرویس آنلاین بسیار راحت تر است: شما بلافاصله دو ویندوز را می بینید - در اولین ، نتیجه تشخیص ، در دوم - تصویر اصلی. بنابراین ، انجام ویرایش ها به همان اندازه آسان که به راحتی امکان پذیر است. به هر حال ، ثبت نام در سرویس نیز ضروری نیست.
3) //www.newocr.com/
این سرویس از چندین طریق بی نظیر است. در مرحله اول ، از فرمت DJVU "newfangled" پشتیبانی می کند (به هر حال ، لیست کاملی از قالب ها: JPEG ، PNG ، GIF ، BMP ، TIFF ، PDF ، DjVu). ثانیا ، از انتخاب نواحی متن در تصویر پشتیبانی می کند. این بسیار مفید است که شما نه تنها نواحی متن را در تصویر داشته باشید ، بلکه مناطقی از گرافیک را نیز دارید که نیازی به تشخیص آنها نیست.
کیفیت تشخیص بالاتر از حد متوسط است ، نیازی به ثبت نام نیست.
4) //www.free-ocr.com/
یک سرویس بسیار ساده برای به رسمیت شناختن: بارگذاری یک تصویر ، مشخص کردن زبان ، وارد کردن captcha (به هر حال ، تنها سرویس در این مقاله برای انجام این کار) ، و دکمه را فشار دهید تا تصویر را به متن ترجمه کنید. در واقع همه چیز!
قالبهای پشتیبانی شده: PDF، JPG، GIF، TIFF، BMP.
نتیجه تشخیص متوسط است. اشتباهاتی وجود دارد ، اما تعداد زیادی از آنها نیست. اما اگر کیفیت تصویر اصلی بالاتر بود ، مرتب سازی از خطاهای کمتری نیز وجود دارد.
PS
امروز همه چیز است اگر خدمات جالب تری برای تشخیص متن می دانید - در نظرات سهیم شوید ، من سپاسگذارم. یک شرط: مطلوب است که نیازی به ثبت نام نداشته باشید و خدمات رایگان است.
همه بهترین ها!