UNIX

Open Google-проект Tesseract-OCR теперь на русском

Поисковые системы, Системы

Исходные коды OCR-движка Tesseract были опубликованы компанией HP ещё в 2005 году. К тому времени проект уже 10 лет не развивался и сильно уступал своим конкурентам. Однако проект был “подхвачен” компанией Google, которая на днях объявила о выпуске третьей версии Tesseract. Среди усовершенствований новой версии – новый модуль анализа оформления страниц, поддержка открытого стандарта представления […]