OCR

Optical Character Recognition

Optical Character Recognition (OCR) คือเทคโนโลยีที่แปลงรูปภาพของข้อความ เช่น เอกสารที่สแกนหรือภาพถ่าย ให้เป็นข้อมูลข้อความที่เครื่องอ่านได้ OCR ทำให้ผู้ใช้สามารถค้นหา แก้ไข และคัดลอกข้อความจากเอกสารที่เดิมไม่มีเนื้อหาข้อความดิจิทัล

รายละเอียดทางเทคนิค

ระบบ OCR สมัยใหม่ใช้เครือข่ายประสาทเทียม (โดยเฉพาะ CNN และ LSTM) เพื่อรู้จำอักขระได้อย่างแม่นยำ กระบวนการมักเริ่มจากการประมวลผลภาพล่วงหน้า (การกำจัดความเอียง การลดสัญญาณรบกวน) ตามด้วยการแบ่งส่วน การรู้จำ และขั้นตอนหลังการประมวลผล

ตัวอย่าง

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

เครื่องมือที่เกี่ยวข้อง

M Merge PDF S Split PDF C Compress PDF R Rotate PDF A Add Page Numbers P PDF to JPG W Watermark PDF R Reorder PDF Pages F Flatten PDF E Edit PDF Metadata S Sign PDF J JPG to PDF E Extract Text from PDF D Delete PDF Pages R Reverse PDF E Extract PDF Pages E Extract Odd/Even Pages R Resize PDF Pages C Crop PDF I Insert Blank Pages D Duplicate PDF Pages P PDF to PNG A Add Header & Footer A Add Text to PDF A Add Image to PDF

คำศัพท์ที่เกี่ยวข้อง

Cross-Reference Table Digital Signature Annotation Bookmark Bates Numbering Content Stream AcroForm Color Management (PDF)