Visa PDF-filer med en linux-server. (3 / 5 steg)
Steg 3: Tillägg: Poppler verktyget kommandon.
pdftohtml Syntax
pdftohtml [alternativ] [pdf-fil] [HTML-fil]
Tillgängliga alternativ
En sammanfattning av alternativ finns beskrivna.
-h, hjälp-- Visa Sammanfattning av alternativ.
-f - första sidan ska skrivas ut
-l - sista sidan att skriva ut
-q - Skriv inte ut några meddelanden eller fel
-v - print copyright och Versionsinfo
-p - byta .pdf länkar med .html
-c - genererar komplexa produktion
-i - ignorera bilder
-noframes - genererar inga ramar. Stöds inte i komplexa utdataläge.
-stdout - använda standardutdata
-zoom - zoom pdf-dokumentet (standard 1,5)
-xml - utdata för XML-efterbearbetning
-enc - output text encoding namn
-opw - ägare lösenord (för krypterade filer)
-ultrarent vatten - användarlösenord (för krypterade filer)
-dold - kraft dolda text utvinning
-dev - utdata enhetsnamnet för Ghostscript (png16m, jpeg m.m.)
-nomerge - kopplas inte postnumren punkterna
-nodrm - åsidosätta DRM dokumentinställningar
pdftohtml exempel
pdftohtml test.pdf test.html
Detta kommando ger dig en enkel HTML-fil lämpar sig för att läsa eller kopiera textinnehåll för PDF-filen. Du kan faktiskt ta texten i webbläsaren och klistra in den i andra program. Det tillverkar inte alla PNG-filer, så du inte kommer att kunna se eventuella inbäddade grafikobjekt. Det är ett bra verktyg om du bara vill extrahera texten från en Adobe fil.
Om du vill se bilder, måste du använda alternativet -c (som i "komplex"):
pdftohtml - c test.pdf test.html
Detta alternativ ger enskilda HTML-filer, en för varje sida i PDF-filen, med PNG referenser blandas i. Grafiken i den ursprungliga PDF-filen visas i en webbläsare och den textdelen kan skära och klistras. Den totala storleken på HTML- och PNG-filer som genereras med - c alternativet brukar vara ungefär likvärdig med den ursprungliga PDF.