BrowserTools
Publicidade
Início / PDF / PDF para Imagens (PNG / JPG)

PDF para Imagens (PNG / JPG)

Converte cada página de um PDF para imagens PNG ou JPG, inteiramente no teu navegador.

A carregar PDF para Imagens (PNG / JPG)… Se nada acontecer, ativa o JavaScript.

Converter um PDF para imagens chama-se rasterização, o processo de renderizar as instruções vetoriais, os tipos de letra incorporados e os gráficos de mapa de bits de uma página de PDF numa grelha de pixéis a uma resolução específica. Cada página do PDF é desenhada numa tela HTML5 à escala de DPI (pontos por polegada) pedida, e a tela é depois exportada como um ficheiro PNG ou JPEG. Ao contrário de um PDF puramente vetorial, uma imagem rasterizada pode ser aberta em qualquer editor de imagem, incorporada diretamente num diapositivo de apresentação, publicada num site ou partilhada nas redes sociais sem ser preciso qualquer visualizador de PDF. Esta ferramenta usa o PDF.js, o motor de renderização de PDF de código aberto da Mozilla, para tratar da rasterização inteiramente dentro do teu navegador.

Perguntas frequentes

Os meus ficheiros são enviados para um servidor?
Não. O PDF.js, o motor de renderização de PDF da Mozilla, corre inteiramente dentro do teu navegador. O teu PDF é lido a partir do teu disco local, renderizado numa tela HTML5 em memória, e os ficheiros de imagem são descarregados diretamente para o teu dispositivo. Nada é transmitido pela rede.
Qual é o tamanho máximo de ficheiro ou o número de páginas que esta ferramenta suporta?
Não há um teto rígido. Os limites práticos dependem da memória do teu navegador. PDF muito grandes (centenas de páginas em alta resolução) podem tornar o navegador lento; recomenda-se processar algumas páginas de cada vez usando a função de intervalo de páginas para os documentos grandes.
Isto funciona com PDF protegidos por palavra-passe?
Os PDF que exigem uma palavra-passe para abrir (palavra-passe de utilizador) não são suportados sem introduzir primeiro essa palavra-passe. As restrições por palavra-passe de proprietário podem ainda assim permitir a renderização consoante as permissões definidas. Se conseguires abrir o PDF normalmente no teu navegador, a conversão deve funcionar.
Que resolução devo escolher para a melhor qualidade?
Para visualização no ecrã, uma escala de 1,5x a 2x (aproximadamente 144-192 DPI) é um bom equilíbrio entre qualidade e tamanho de ficheiro. Para uso em impressão, escolhe 3x (288 DPI) ou superior. Os valores de escala mais altos produzem imagens mais nítidas mas também ficheiros muito maiores e exigem mais memória do navegador para serem gerados.
Como é que isto se compara com usar o Adobe Acrobat para exportar imagens?
A exportação do Acrobat consegue produzir saídas de DPI mais alto e oferece mais opções de formato (TIFF, BMP). Para a grande maioria dos casos de utilização (apresentações, uso web, correio eletrónico), esta ferramenta de navegador produz resultados de qualidade idêntica nas resoluções que suporta, sem instalação nem subscrição, e com privacidade total.
Quando devo usar a saída PNG em vez de JPEG?
Usa PNG para documentos que contêm sobretudo texto, desenho de linhas, diagramas ou cores sólidas; o PNG é sem perdas e preserva na perfeição os contornos nítidos. Usa JPEG para páginas dominadas por fotografias ou ilustrações complexas onde o menor tamanho de ficheiro importa mais do que a fidelidade perfeita. O JPEG introduz artefactos de compressão subtis que são mais visíveis à volta dos contornos do texto.
Que formatos e versões de PDF são suportados como entrada?
O PDF.js suporta as versões de PDF 1.0 até 2.0, incluindo documentos com fluxos de referências cruzadas, fluxos de objetos e a maioria dos modos de cifragem. Os PDF criados por qualquer aplicação padrão (Acrobat, Word, LaTeX, Chrome ou scanners) são todos compatíveis.
Posso converter apenas páginas específicas em vez do documento inteiro?
Sim. Introduz um intervalo de páginas como '1-3,5,7' para converter apenas essas páginas. Isto é mais rápido e usa menos memória do que converter um documento completo, e é especialmente útil quando só precisas de um diagrama ou gráfico específico de um relatório grande.
Posso automatizar a conversão de PDF para imagem para muitos ficheiros?
A ferramenta de navegador processa os ficheiros individualmente. Para a conversão em lote ou automatizada, o PDF.js e outras bibliotecas como o pdf2pic, o poppler (linha de comandos) ou o Ghostscript podem ser usados em fluxos de trabalho do lado do servidor ou com scripts. Estas ferramentas usam a mesma abordagem de rasterização mas correm fora do navegador.
Há funcionalidades de PDF que possam não ser renderizadas corretamente?
O PDF.js renderiza corretamente a grande maioria dos PDF. Os casos-limite incluem certos tipos de letra Type 3, alguns efeitos avançados de transparência, anotações 3D (PDF 1.6+) e documentos que usam modos de cifragem invulgares. Os campos de formulário interativos e as ações de JavaScript não são executados durante a rasterização; a imagem mostra apenas o estado visual estático de cada página.

Sobre PDF para Imagens (PNG / JPG)

Os casos de utilização mais comuns para a conversão de PDF para imagem incluem extrair diagramas ou gráficos específicos de um relatório para usar numa apresentação, converter documentos digitalizados para um formato aceite pelos portais de carregamento de imagens, produzir miniaturas para sistemas de gestão documental, arquivar páginas de um contrato assinado como imagens à prova de adulteração e preparar conteúdo para publicações nas redes sociais onde o PDF não é suportado. Os programadores também usam a conversão de PDF para imagem para gerar miniaturas de pré-visualização em aplicações de gestão documental e para executar pipelines de OCR (reconhecimento ótico de carateres) que aceitam imagem como entrada em vez de PDF.

Como o PDF.js é um renderizador de PDF completo a correr inteiramente no teu navegador, o teu documento nunca sai do teu dispositivo. Não há carregamento para servidor, nem chamada a API, nem processamento por terceiros. Isto é particularmente importante para os PDF que contêm informações de identificação pessoal, documentos jurídicos sob acordo de confidencialidade ou demonstrações financeiras, que têm todos obrigações de confidencialidade que os serviços de conversão baseados na nuvem não conseguem satisfazer de forma fiável.

Escolher as definições de saída certas é importante para a qualidade e o tamanho do ficheiro. À escala 1x (cerca de 96 DPI), as imagens são adequadas para visualização no ecrã mas vão parecer desfocadas quando impressas. A 2x (192 DPI) a saída fica nítida em ecrãs de alta densidade e é aceitável para impressão de baixo volume. A 3x (288 DPI) e acima, as imagens são adequadas para reprodução impressa. O PNG é sem perdas e produz ficheiros maiores, mas é ideal para documentos com texto nítido, desenho de linhas e gráficos de cor sólida. O JPEG tem perdas mas produz ficheiros muito mais pequenos e é o melhor para páginas fotográficas ou muito ilustradas onde os artefactos de compressão não se notam. Na dúvida, usa PNG para documentos com muito texto e JPEG para os que têm muitas imagens.

De PostScript a pixéis: como o PDF.js trouxe a renderização de PDF para o navegador

Durante a maior parte da história do PDF, ver um PDF exigia uma aplicação nativa dedicada, primeiro o Adobe Reader, depois rivais como o Foxit e o Sumatra. Os navegadores ou lançavam um plug-in externo ou um controlo ActiveX incorporado, ambos célebres pelas vulnerabilidades de segurança e pelos encerramentos inesperados. A Mozilla mudou isto em 2011 ao lançar o PDF.js, um projeto de código aberto que implementou um renderizador de PDF completo em JavaScript puro e HTML5 Canvas, sem código nativo nem plug-ins. Foi incluído no Firefox 19 (2013) como visualizador de PDF predefinido, marcando a primeira vez que um navegador importante conseguia mostrar PDF sem qualquer software de terceiros.

O desafio técnico que o PDF.js resolveu é considerável. As páginas de PDF são descritas num subconjunto de PostScript, uma linguagem de programação baseada em pilha onde comandos como 'moveto', 'lineto', 'setfont' e 'showstring' são interpretados para construir o aspeto visual de uma página. O PDF.js teve de implementar um interpretador para esta linguagem, um motor de renderização de tipos de letra capaz de lidar com tipos de letra TrueType, Type 1, CFF e OpenType, um descodificador de imagem para JPEG, JBIG2, CCITT Fax e outros esquemas de compressão, e um motor de composição para o complexo modelo de transparência do PDF, tudo isto em JavaScript, a correr a velocidades interativas num separador do navegador.

A rasterização em DPI alto revela uma propriedade interessante do PDF: é verdadeiramente independente da resolução para o conteúdo vetorial. Uma página de PDF descrita inteiramente com instruções vetoriais pode ser renderizada a 72 DPI para uma miniatura de ecrã ou a 4800 DPI para uma fotocompositora de impressão, produzindo uma saída apropriada para cada meio a partir exatamente do mesmo ficheiro de origem. É por isto que o PDF é preferido a formatos rasterizados como o TIFF para fins de arquivo: a fidelidade do documento não está limitada pela resolução a que foi originalmente criado, apenas pela precisão da aritmética de vírgula flutuante usada para interpretar as suas instruções de desenho.

Publicidade
Publicidade
Publicidade