PDF para Imagens (PNG / JPG)
Converte cada página de um PDF para imagens PNG ou JPG, inteiramente no teu navegador.
A carregar PDF para Imagens (PNG / JPG)… Se nada acontecer, ativa o JavaScript.
Converter um PDF para imagens chama-se rasterização, o processo de renderizar as instruções vetoriais, os tipos de letra incorporados e os gráficos de mapa de bits de uma página de PDF numa grelha de pixéis a uma resolução específica. Cada página do PDF é desenhada numa tela HTML5 à escala de DPI (pontos por polegada) pedida, e a tela é depois exportada como um ficheiro PNG ou JPEG. Ao contrário de um PDF puramente vetorial, uma imagem rasterizada pode ser aberta em qualquer editor de imagem, incorporada diretamente num diapositivo de apresentação, publicada num site ou partilhada nas redes sociais sem ser preciso qualquer visualizador de PDF. Esta ferramenta usa o PDF.js, o motor de renderização de PDF de código aberto da Mozilla, para tratar da rasterização inteiramente dentro do teu navegador.
Perguntas frequentes
Os meus ficheiros são enviados para um servidor?
Qual é o tamanho máximo de ficheiro ou o número de páginas que esta ferramenta suporta?
Isto funciona com PDF protegidos por palavra-passe?
Que resolução devo escolher para a melhor qualidade?
Como é que isto se compara com usar o Adobe Acrobat para exportar imagens?
Quando devo usar a saída PNG em vez de JPEG?
Que formatos e versões de PDF são suportados como entrada?
Posso converter apenas páginas específicas em vez do documento inteiro?
Posso automatizar a conversão de PDF para imagem para muitos ficheiros?
Há funcionalidades de PDF que possam não ser renderizadas corretamente?
Sobre PDF para Imagens (PNG / JPG)
Os casos de utilização mais comuns para a conversão de PDF para imagem incluem extrair diagramas ou gráficos específicos de um relatório para usar numa apresentação, converter documentos digitalizados para um formato aceite pelos portais de carregamento de imagens, produzir miniaturas para sistemas de gestão documental, arquivar páginas de um contrato assinado como imagens à prova de adulteração e preparar conteúdo para publicações nas redes sociais onde o PDF não é suportado. Os programadores também usam a conversão de PDF para imagem para gerar miniaturas de pré-visualização em aplicações de gestão documental e para executar pipelines de OCR (reconhecimento ótico de carateres) que aceitam imagem como entrada em vez de PDF.
Como o PDF.js é um renderizador de PDF completo a correr inteiramente no teu navegador, o teu documento nunca sai do teu dispositivo. Não há carregamento para servidor, nem chamada a API, nem processamento por terceiros. Isto é particularmente importante para os PDF que contêm informações de identificação pessoal, documentos jurídicos sob acordo de confidencialidade ou demonstrações financeiras, que têm todos obrigações de confidencialidade que os serviços de conversão baseados na nuvem não conseguem satisfazer de forma fiável.
Escolher as definições de saída certas é importante para a qualidade e o tamanho do ficheiro. À escala 1x (cerca de 96 DPI), as imagens são adequadas para visualização no ecrã mas vão parecer desfocadas quando impressas. A 2x (192 DPI) a saída fica nítida em ecrãs de alta densidade e é aceitável para impressão de baixo volume. A 3x (288 DPI) e acima, as imagens são adequadas para reprodução impressa. O PNG é sem perdas e produz ficheiros maiores, mas é ideal para documentos com texto nítido, desenho de linhas e gráficos de cor sólida. O JPEG tem perdas mas produz ficheiros muito mais pequenos e é o melhor para páginas fotográficas ou muito ilustradas onde os artefactos de compressão não se notam. Na dúvida, usa PNG para documentos com muito texto e JPEG para os que têm muitas imagens.
De PostScript a pixéis: como o PDF.js trouxe a renderização de PDF para o navegador
Durante a maior parte da história do PDF, ver um PDF exigia uma aplicação nativa dedicada, primeiro o Adobe Reader, depois rivais como o Foxit e o Sumatra. Os navegadores ou lançavam um plug-in externo ou um controlo ActiveX incorporado, ambos célebres pelas vulnerabilidades de segurança e pelos encerramentos inesperados. A Mozilla mudou isto em 2011 ao lançar o PDF.js, um projeto de código aberto que implementou um renderizador de PDF completo em JavaScript puro e HTML5 Canvas, sem código nativo nem plug-ins. Foi incluído no Firefox 19 (2013) como visualizador de PDF predefinido, marcando a primeira vez que um navegador importante conseguia mostrar PDF sem qualquer software de terceiros.
O desafio técnico que o PDF.js resolveu é considerável. As páginas de PDF são descritas num subconjunto de PostScript, uma linguagem de programação baseada em pilha onde comandos como 'moveto', 'lineto', 'setfont' e 'showstring' são interpretados para construir o aspeto visual de uma página. O PDF.js teve de implementar um interpretador para esta linguagem, um motor de renderização de tipos de letra capaz de lidar com tipos de letra TrueType, Type 1, CFF e OpenType, um descodificador de imagem para JPEG, JBIG2, CCITT Fax e outros esquemas de compressão, e um motor de composição para o complexo modelo de transparência do PDF, tudo isto em JavaScript, a correr a velocidades interativas num separador do navegador.
A rasterização em DPI alto revela uma propriedade interessante do PDF: é verdadeiramente independente da resolução para o conteúdo vetorial. Uma página de PDF descrita inteiramente com instruções vetoriais pode ser renderizada a 72 DPI para uma miniatura de ecrã ou a 4800 DPI para uma fotocompositora de impressão, produzindo uma saída apropriada para cada meio a partir exatamente do mesmo ficheiro de origem. É por isto que o PDF é preferido a formatos rasterizados como o TIFF para fins de arquivo: a fidelidade do documento não está limitada pela resolução a que foi originalmente criado, apenas pela precisão da aritmética de vírgula flutuante usada para interpretar as suas instruções de desenho.