🍋
Menu
PDF

OCR

Optical Character Recognition

Optical Character Recognition (OCR) คือเทคโนโลยีที่แปลงรูปภาพของข้อความ เช่น เอกสารที่สแกนหรือภาพถ่าย ให้เป็นข้อมูลข้อความที่เครื่องอ่านได้ OCR ทำให้ผู้ใช้สามารถค้นหา แก้ไข และคัดลอกข้อความจากเอกสารที่เดิมไม่มีเนื้อหาข้อความดิจิทัล

รายละเอียดทางเทคนิค

ระบบ OCR สมัยใหม่ใช้เครือข่ายประสาทเทียม (โดยเฉพาะ CNN และ LSTM) เพื่อรู้จำอักขระได้อย่างแม่นยำ กระบวนการมักเริ่มจากการประมวลผลภาพล่วงหน้า (การกำจัดความเอียง การลดสัญญาณรบกวน) ตามด้วยการแบ่งส่วน การรู้จำ และขั้นตอนหลังการประมวลผล

ตัวอย่าง

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

เครื่องมือที่เกี่ยวข้อง

คำศัพท์ที่เกี่ยวข้อง