در دنیای کامپیوترها فقط صفر و یک ها معنی دارند. در نظر انسان تصویر یک منظره دارای معنا و مفاهیم مختلفی است. کوه، درخت، ابرها و خورشید. اما کامپیوتر این تصویر را به شکل رشتهای از صفر و یک ها میبیند. درست مانند تصویر یک سند متنی. اگرچه مغز انسان میان تصویر منظره و سند تفاوت قائل است ولی کامپیوتر هر دوی اینها یکسان میبیند. در علوم کامپیتر روشی به نام شناسایی نویسه نوری (او سی آر) وجود دارد که میتواند منجر به تشخیص نویسه یا کاراکتر در یک تصویر شود. به این روش Optical Character Recognition یا به طور خلاصه OCR گفته میشود.
روش او-سی-آر در شکل ساده خود میتواند حروف چاپی یا تایپ شده را تشخیص دهد. این کار را از راه ذخیره سازی و مطابقت انواع نوشتارهای یک کاراکتر در قلمها یا فونتهای محتلف انجام میدهد. به این صورت که به طور مثال حرف «پ» را در فونتهای مختلفی بررسی میکنند و با کمترین میزان نویز یا آلودگی ذخیره میکنند. حال برنامه به هنگام بررسی و اسکن بخشهای مختلف یک تصویر به دنبال کارکترهایی که در حافظه خود دارد میگردد. به محض مطابقت بخشی از تصویر با یکی از حروف آن بخش از تصویر را با آن حرف علامت میزند. این کار را تاجایی ادامه میدهد که کل تصویر را پیمایش کند.
شناسایی زبان فارسی با دقت بالا
از آنجایی که در زبان فارسی حروف به اشکال مختلف پیوسته و جدا وجود دارند شناسایی آنها از طریق OCR کار بسیار دشواری است. ربات تلگرامی متن کاو میتواند این کار را با دقت زیادی انجام دهد. دقت شناسایی حروف فارسی در این ربات بستگی به کیفیت تصویری که به آن ارسال میکنید دارد. اگر حروف فارسی در تصویر شما واضح و با پس زمینه سفید باشد بهترین نتیجه را خواهید گرفت. این ربات هم از طریق آدرس https://t.me/TextRactorBot در دسترس است و هم در نرم افزار پیام رسان تلگرام از طریق قسمت جستجو و عبارت TextRactorBot در اختیار شما قرار دارد.
ربات تلگرامی TextRactorBot تشخیص کاراکترهای فارسی را با دقت بالایی انجام میدهد. میتوانید آن را به رایگان امتحان کنید. در زیر نحوه عملکرد آن را میبینید:
ابزار کار مترجمین!
به عنوان یک مترجم حتما زیاد پیش آمده که تصویر یک سند چاپی را به شما بدهند و ترجمه آن را بخواهند. ازآنجایی که معمولا از ابزار ترجمه گوگل یا ترگمان کمک میگیرید مجبور هستید که سند مربوطه را دوباره بنویسید. با استفاده از ربات تلگرامی متن کاو دیگر نیازی به نوشتن دوباره متن نیست. به راحتی از سند عکس بگیرید و به ربات بفرستید تا متن آن را به شما تحویل بدهد! همچنین امکان تبدیل PDF به Word هم در این ربات فزاهم آمده است.