Головна » Веб дизайн » Tesseract.js переводить зображення OCR у браузери

    Tesseract.js переводить зображення OCR у браузери

    Переклад OCR все ще не є досконалим, але він різко покращився за останні кілька років. Провідним шляхом є Tesseract двигун перекладу в даний час відкриті джерела в C++.

    Хоча це неймовірна бібліотека, вона обмежена лише програмним забезпеченням. На щастя, хтось зробив порт Tesseract у JavaScript, який називається Tesseract.js. Це підтримує до 60 мов і хоча це, звичайно, не ідеально, вона добре виконує свою роботу.

    Встановлення та налаштування - це вітер, де можна націлювання на будь-який елемент зображення на сторінці і запустіть Tesseract.recognize () функції. Це може зайняти будь-який тип зображення, і це автоматично стиснути та перекласти у браузері.

    Ви можете отримати набагато складніше, але краса як можна запустити OCR з одним рядком коду.

    Перегляньте цільову сторінку Tesseract.js, якщо ви хочете побачити демонстрацію в реальному часі. Це працює в браузері, де ви можете перетягніть будь-яке відскановане зображення тексту, щоб отримати автоматичний переклад OCR.

    Ви також можете завантажити цей приклад локально через сторінку GitHub або створити власну програму, включивши сценарій Tesseract.js прямо з CDN.

    Найпростіший приклад коду виглядає наступним чином myImage є прямим посиланням на елемент зображення HTML:

     Tesseract.recognize (myImage). Then (функція (результат) console.log (результат)); 

    У будь-якому випадку ця бібліотека є настільки корисною, щоб переміщатися за допомогою розпізнавання в Інтернеті. Це далеко не досконале, але це теж найкращий ресурс для веб-розробників, які хочуть динамічну функціональність розпізнавання на сторінці.

    Щоб дізнатися більше, відвідайте сторінку GisHub Tesseract.js, де ви можете ознайомитися з демонстрацією в реальному часі та переглянути документацію в Інтернеті.