Umwandeln eines PDF/DOCX-Files in eine DokuWiki-Page

Version Status Datum Autor:in URL
0.1 Review und Freigabe 06.12.2024 Egil Rüefli
  1. Konvertieren des PDFs in eine MSWord-Datei: Öffnen Sie das PDF mit MSWord und speichern Sie es anschliessend im docx-Format ab.
  2. Installation pandoc: Installieren Sie pandoc für Ihre Plattform: pandoc - a universal document converter
  3. Konvertieren das Docx-File in DokuWiki-Markdown: pandoc –extract-media ./Media –from docx –to dokuwiki –output Dokument.dw Dokument.docx #Die Option –extract-media exportiert die Bild-Dateien aus dem Dokument und legt sie im von Ihnen erzeugten Ordner ./Media ab.
  4. Kopieren des Textes in eine DokuWiki-Page: Kopieren Sie den Text aus Dokument.dw in eine neu erstellte DokuWiki-Page.
  5. Upload der Bilder: Laden Sie die Bild-Dateien mit Hilfe des DokuWiki-Medien-Managers hoch (Mass-Upload ist möglich)
  6. Formatierungen anpassen: Korrigieren Sie die Formatierungen nach. So ist es z.B. nötig, dass Sie die Bildpfade anpassen. Im Dokument.dw steht der lokale Bildpfad, also z.B. ./Media/image1.jpg. Diesen Pfad müssen Sie überall durch den entsprechenden DokuWiki-Namespace ersetzen, also z.B. durch de:intern:dokument:image1.jpg. Sie können dazu die Suchen & Ersetzen-Funktion Ihres Editors nutzen.
, , ,