daniel2012
Saison gestartet
- Beiträge
- 468
Was für ein Programm verwendet du eigentlich um die Daten der Webseite zu extrahieren und in ein E-Book umzuwandeln?
Aus Interesse, womit werden die Beschreibungen extrahiert?
ein C# Program (.NET) lädt die Beschreibung runter und versucht aus dem ersten Posting die entsprechenden Daten zu extrahieren und schreibt diese Information in eine SQL Datenbank. Aus allen Posting einer Sortenbeschreibung wird versucht die Bilder automatisch runter zuladen und ebenfalls in der Datenbank zu speichern.
Nachdem alle Beschreibungen in die DB geschrieben wurde, wird direkt in der DB noch ein paar Korrekturen vorgenommen.
Im Anschluss wird mit Mail Merge Funktion von Word und der Datenbank ein Dokument mit den Sortenbeschreibungen erstellt und diesen Inhalt wird in ein Template eingefügt welches das Layout des Dokument vorgibt.
Aufgrund des geänderten Seitenlayout gibt es ein paar Beschreibungen die mehr als 1 Seite beanspruchen und bei diesen wird dann noch das Bild etwas verkleinert, so dass die Beschreibung wieder auf eine Seite passt.
Im Anschluss wird das Worddokument noch in eine Pdf-Datei konvertiert.
Aufgrund der recht starren Mailmerge Funktion bei der Behandlung von leeren Felder, versuche ich derzeit das Worddokument direkt zu generieren, so dass leere Felder weggelassen werden könnten.