OCR

OCR (оптическое распознавание символов)

Технология анализа изображений печатного или рукописного текста и преобразования их в машиночитаемые, доступные для поиска и редактирования текстовые данные.

Техническая деталь

Современные конвейеры OCR включают предобработку изображений (выравнивание, бинаризацию, удаление шума), анализ макета для определения текстовых областей, сегментацию символов и распознавание образов. Такие движки, как Tesseract, используют нейронные сети LSTM для распознавания. Для PDF OCR создаёт невидимый текстовый слой, наложенный поверх сканированного изображения, что делает документ доступным для поиска при сохранении исходного внешнего вида.

Пример

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Связанные инструменты

M Merge PDF S Split PDF C Compress PDF R Rotate PDF A Add Page Numbers P PDF to JPG W Watermark PDF R Reorder PDF Pages F Flatten PDF E Edit PDF Metadata S Sign PDF J JPG to PDF E Extract Text from PDF D Delete PDF Pages R Reverse PDF E Extract PDF Pages E Extract Odd/Even Pages R Resize PDF Pages C Crop PDF I Insert Blank Pages D Duplicate PDF Pages P PDF to PNG A Add Header & Footer A Add Text to PDF A Add Image to PDF

Связанные термины

Cross-Reference Table Digital Signature Annotation Bookmark Bates Numbering Content Stream AcroForm Color Management (PDF)