مژده: گوگل به سالهای طولانی انتظار ایرانیها برای داشتن یک برنامه کارای تبدیل عکس به متن فارسی OCR پایان داد!
بسیاری از موارد ما نیاز پیدا میکنیم که یک فایل گرافیکی را به متن تبدیل کنیم:
– دانشجو هستیم و لازم میشود ده – بیست صفحه از کتاب مرجع فارسی را به صورت تایپشده داشته باشیم.
– محقق هستیم و لازم میشود به سرعت تایپشده دهها کتاب و مقاله را داشته باشیم، تا در فصت بعدی روی آنها تحقیق کنیم و ویرایششان کنیم.
– یک کتاب و مجله قدیمی داریم و دوست داریم، این کتاب را در محیط اینترنت با دیگران به اشتراک بگذاریم.
در همه این موارد نیاز به دستهای از نرمافزارها پیدا میشود به نام OCR یا Optical Character Recognition که به سرعت، یک فایل گرافیکی را هوشمندانه به متن تبدیل کند و ما را از مشقت تایپ کُند رها کند.
گرچه سالهاست که OCRهای خوب به زبان انگلیسی و نیز تعداد قابل توجهی از زبانهای دیگر در دسترس بودند، اما به جرأت میتوانم بگویم که هیچ OCR خوبی به زبان فارسی در دسترس نبود.
من شخصا با زحمت زیاد چند OCR گرانقیمت به زبان فارسی را تهیه کردهام و باید بگویم که نتایج آنها واقعا وحشتناک بودند! تعداد قابل توجهی آنها در واقع تنها از هسته OCRهای مشهور مثل Readiris استفاده میکردند و با یک رابط کاربری جدید، سعی میکردند که بقبولانند کار جدیدی در عرصه OCR انجام دادهاند.
غالبا فایل متنی که این OCRها ارائه میدادند، آنقدر پراشتباه بود که شما راحتتر بودید که خودتان متن را تایپ کنید تا اینکه متن را به آنها بسپارید.
اما ششم ماه می – یعنی 4 روز پیش- روز خوبی برای ما ایرانیها و نیز شهروندان دهها کشور دیگر دنیا بود. چرا؟
چون گوگل اعلام کرد که ویژگی OCR را برای 200 زبان دنیا به گوگل درایو خود افزوده است!
یعنی الان شما میتوانید یک فایل تصویری یا یک PDF اسکن شده به زبان فارسی را در گوگل درایو آپلود کنید و بعد از مدتی، فایل متنی فارسی، آن را با میزان دقت بسیار خوب و حداقل اشتباه دریافت کنید.
پیداست که اگر وضوح اسکن یا عکس شما خیلی پایین باشد، OCR گوگل نمیتواند معجزه کند. اما طبق آزمایش من، OCR گوگل در وضوحهایی که OCRهای روتین، معمولا اشتباهات خیلی زیاد داشتند، به راحتی میتواند کار کند.
کار با OCR گوگل آسان است:
1- به گوگل درایو خود بروید و فایل مورد نظر را آپلود کنید.
2- بعد از مدتی در کنار فایل آپلود شده اصلی، یک فایل متنی با اسم مشابه ایجاد میشود.
3- روی این فایل راست کلیک کنید و از open with، گزینه google docs را انتخاب کنید و فایل متنی را دریافت کنید.
البته باید خاطرنشان کنم که متنهای ایجادشده با این روش هنوز به ویرایش نهایی کاربر نیاز دارند. گاهی هم اختلالاتی مثل از قلم افتادن برخی از سطرها هنگام تبدیل به متن مشاهده میشوند.
گاهی هم اگر پشتزمینه متن رنگی باشد، نتایج بسیار عجیب و غریب میشوند. مثلا:
به نظر میرسد که اگر وضوح اسکن یا عکسهای دریافتی در حد متوسط باشند، دقت OCR گوگل بسیار قابل توجه است.
اما فراتر از این خبر، چیزی که کنجکاوم بدانم این است که شیوه کار و برنامهنویسی OCR گوگل به چه صورت بوده است. به نظر میرسد که گوگل از شیوههای روتین برای OCR خود استفاده نکرده است.
تو وبلاگ google research یه توضیحات مختصری در مورد شیوه کارش داده:
http://goo.gl/EDw48C
بعد از مدتی یعنی دقیقاً چن دقیقه؟
روی فایل راست کلیک کنید و گزینه open with google doc را بزنید متن در زیر تصویر قابل مشاهده است
واسه من برعکس نشون میده
مثلا کلمه “فردا” رو بصورت “ادرف” مینویسه؟
دلیل خاصی داره؟
منم هم همینطور
ممنون که اطلاع رسانی کردین. برای من خیلی مفیده. تست کردم. همین پست شما رو print screen کردم و بدون اشتباه برام تبدیل به متن کرد.
گوگل کارش درسته، تست شد و نتیجه قابل قبول بود و از این پس زندگی برایمان آسانتر خواهد شد.
خبر خوش فوقالعادهای بود. خیلی ممنون از زحمات شما
یعنی بعد از این همه سال این اوج حقارت ما ایرانی ها رو در پیشرفت تکنولوژی نشون میده
تهش هم یکی مثل گوگل باید بیاد ما رو تر و خشک کنه!
یادمه سال 86 یه شرکتی تو الکامپ یه نرم افزار ocr ساخته بود ( به احتمال زیاد یه نسخه خارجی رو دستکاری کرده بود) و قیمتی که روش گذاشته بود یک میلیارد تومن بود!!!!!
اگر فکر میکنید همچین نرم افزاری با همچین قیمتی اصلا خریدار نداره اشتباه میکنید چون ادارات دولتی به شدت به چنین نرم افزارهای گرون قیمتی نیاز دارن تا از یک میلیارد تومن صد هزار تومنش رو به اون شرکت مثلا نرم افزاری بدن و بقیش رو بزارن تو جیب مبارکشون.
عملکردش عالیه.متن یک فایل 4 صفحه ای اسکن شده رو در زمان کوتاهی استخراج کرد. اون هم با کمترین خطا.
با اینکه دقتاش واقعا خیلی خوبه اما ده صفحۀ یک فایل رو بیشتر تبدیل نمیکنه؛ یک اشکال دیگهاش هم اینه که اگه توی یک صفحه چندستون باشه به شیوۀ ستون بندی انگلیسی از ستون چپ به راست مطالب رو پشت سر هم میگذاره.
می توانید فایل پی دی اف تان را با نرم افزارهایی به راحتی به چند فایل 10 صفحه ای تبدیل کنید و بعد تبدیلشان کنید.
فونتارو بهم میریزه 3 4 تا pdf خوانا امتحان کردم همه اینجوری میشن … تنظیمات خاصی داره ؟:::
نارهت هاگشناد هتسشنزاب داتسا
هدیکچ نیوزق هب زیربت زا ار یوفص تختیاپ یرمق یرجه 962 لاس رد لوا بسامهت هاش و اه غاب و اه خاک زا بکرم یا هناختلود داد روتسد رهش نیا رد رارقتسا یارب و داد لاقتنا دش رومأم هاش نامرف هب نامز نآ فورعم رعاش یدیون گیب یدبع .دوش داجیا اه نمچ هک دیارسب ندع تانج ناونع تحت یا هموظنم هناختلود یاه خاک و تارامع ندید زا سپ یعس هلاقم نیا رد .تفر یم رامش هب نامز نآ هتسجرب ناشاقن زا ییاه هراگنراوید رگنایامن رظن زا نآ نیماضم و اه یشاقن نیا زا گیب یدبع هنارعاش فیصوت هک تفرگ رارق نآ رب .درذگب هلاقم ناگدنناوخ
و اه خاک حرش نمض ،ندع تانج هموظنم رد بسامهت هاش رصاعم رعاش گیب یدبع هک تسا هتخادرپ یشاقن زا ییاه هنحص فیصوت هب نیوزق رد یوفص هناختلود یاه غاب نیا .تسا هدوب رگ هولج هناختلود یاه خاک زا یضعب یاهراوید رب تسد هریچ یناشاقن طسوت یاه شزرا تخانش یارب ،دنا هداد تنیز ار تداعس فورعم غاب تارامع هک اه هراگن راوید چگ یاهرشق ریز رد ییاه
آقا بابک فایل pdf رو به عکس تبدیل کن و بده بهش این مشکلت حل میشه یا یا با یه نرم افزار دوباره همون فایل رو به PDF تبدیل کن
ههه. کلا یه شعر دیگه ساخته: نماز من عماز بود!! آخ عمازو از کجا آورده.
فکر کنم بیشتر کاربردش ساختن هایکو باشه!
در مورد جا انداختن برخی خطوط یک فایل با همین مشکل را به دو قسمت کوچکتر تقسیم کردم خط جا افتادده را تبدیل کرد
خیلی خوب بود. به جرات میشه گفت چند ثانیه بیشتر طول نمیکشه.بهم ریختگیهاش جزئیه. فقط علائم و فرمولها رو نمیشناسه.
اصلا متنی نمیاره که بشه ادیتش کردم یه راهنمایی کنید دانلود میکنم به صورت عکسه بازم،یه اموزش بزارید.
بالای صفحه عکس هست پایینش هم متن تبدیل شده رو نشون می ده ، اگه تبدیل نکرده فایلت رو دوباره تبدیل به عکس کن.شاید هم رزولیشن پایینه
خیلی عالی بود. مدتها بود مشکل داشتم. از شما تشکر میکنم. کار با اون بسیار ساده و نتیجه کاملا قابل قبول بود.
نتیجهای که من گرفتم از تبدیل متن خیلی خیلی فراتر از انتظارات من بود، یعنی خیلی بیشتر از حد نرمافزارهای ocr دیگه، مخصوصا فارسیهاش. البته هنوز اونطور نشده کخ فایل رو بدی و متن تحویل بگیری! D:
واقعاً خبر عالیای بود!
نتیجه تبدیل شما نشون میده که انگار گوگل داره از یه دیکشنری هم کمک میگیره!
منم امتحان کردم ولی کار نکرد
همون رویه ای که گفته بودین رو انجام دادم
شاید واسه همه کار نمی کنه
آقا ممنون . منو که از تایپ کردن نجات دادی
گمانم باید گزینه زبان را در ویندوز خودمان ردیف کنیم وزبان اصلی رو روی فارسی بگذاریم .اخرین گزینه تغییر زبان رو میگم .
باسلام
خبر خوبی بود
خوب هم کار کرد
یکی از نکات مهم که تاثیر در عملکرد این سیستم دارد ، فونت متن هست .
هر چه فونت غیر متداولی استفاده شود تشخیص سخت تر و نتیجه دور از هدف تر خواهد بود.
موفق باشید
خیلی ممنون. خدا خیرتون بده اطلاع رسانی کردید.
به نام خدا
با سلام
1) لارم میدانم که تشکر فراوان خود را به خاطر اطلاع رسانی این موضوع اعلام نمایم.
2) متن شعری را که در بالا ذکر کرده بودی به صورت یک1 ستون ، یعنی مصراع های اول شعر را در drive gooogle امتحان کردم به خوبی پاسخ داد. پس مرتبط با رنگ زمینه نبود
با آرزوی موفقیت وتشکر مجدد
ع
بیشتر این عقب افتادگی نرم افزاری در ایران به خاطر عدم اجرای صحیح قوانین کپی رایت و حقوق مولف است.
آقا با این کارت شاید مسیر زندگیمو عوض کردی…
آیا شرکتهای ایرانی قادر خواهند بود از این امکان بسیار ارزشمند استفاده کنند و نرم افزارهایی تهیه کنند که قابلیت OCR با دقت بالا رو داشته باشه؟
چقدر از Readiris 15 بهتر است؟ هر کدام چه نمره ای از 100 می گیرند؟
برنامه ای که گوگل استفاده میکنه tesseract نام دارد که رایگان بوده و بر روی ویندوز هم قابل نصب هست.