Tesseract.js переводить зображення OCR у браузери

Переклад OCR все ще не є досконалим, але він різко покращився за останні кілька років. Провідним шляхом є Tesseract двигун перекладу в даний час відкриті джерела в C++.

Хоча це неймовірна бібліотека, вона обмежена лише програмним забезпеченням. На щастя, хтось зробив порт Tesseract у JavaScript, який називається Tesseract.js. Це підтримує до 60 мов і хоча це, звичайно, не ідеально, вона добре виконує свою роботу.

Встановлення та налаштування - це вітер, де можна націлювання на будь-який елемент зображення на сторінці і запустіть Tesseract.recognize () функції. Це може зайняти будь-який тип зображення, і це автоматично стиснути та перекласти у браузері.

Ви можете отримати набагато складніше, але краса як можна запустити OCR з одним рядком коду.

Перегляньте цільову сторінку Tesseract.js, якщо ви хочете побачити демонстрацію в реальному часі. Це працює в браузері, де ви можете перетягніть будь-яке відскановане зображення тексту, щоб отримати автоматичний переклад OCR.

Ви також можете завантажити цей приклад локально через сторінку GitHub або створити власну програму, включивши сценарій Tesseract.js прямо з CDN.

Найпростіший приклад коду виглядає наступним чином myImage є прямим посиланням на елемент зображення HTML:

 Tesseract.recognize (myImage). Then (функція (результат) console.log (результат));

У будь-якому випадку ця бібліотека є настільки корисною, щоб переміщатися за допомогою розпізнавання в Інтернеті. Це далеко не досконале, але це теж найкращий ресурс для веб-розробників, які хочуть динамічну функціональність розпізнавання на сторінці.

Щоб дізнатися більше, відвідайте сторінку GisHub Tesseract.js, де ви можете ознайомитися з демонстрацією в реальному часі та переглянути документацію в Інтернеті.