OCR - это сокращение от оптического распознавания символов. Это технология извлечения текста из отсканированных файлов PDF или изображений PDF. Это позволяет пользователю редактировать, копировать и искать текст отсканированного документа PDF / PDF изображения.
Вы можете получить больше информации по этой ссылке: http://en.wikipedia.org/wiki/Optical_character_recognition