Tagged PDF
PDF Etiquetado (Estrutura PDF Acessivel)
Um documento PDF que inclui informacao de estrutura semantica (headings, paragrafos, tabelas, listas) que torna o conteudo acessivel a leitores de ecra e outras tecnologias de acessibilidade.
Detalhe técnico
Os PDFs etiquetados contem uma arvore de estrutura (StructTreeRoot no catalogo) com elementos que mapeiam para tipos padrao: Document, Part, Sect, H1-H6, P, Table, TR, TD, TH, L, LI, Figure, Formula, Link, Note, Reference, etc. Cada elemento referencia o conteudo da pagina marcado (operadores BMC/EMC). O texto alternativo (Alt) fornece descricoes para imagens. O campo ActualText fornece texto de substituicao. A propriedade Lang define o idioma. A conformidade PDF/UA (ISO 14289) requer etiquetagem completa, texto alternativo e ordem de leitura logica.
Exemplo
```javascript
// Tagged PDF: PDF manipulation example
import { PDFDocument } from 'pdf-lib';
const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```