Tool: Flexible PDF to XLS konvertierung

Palladin007

assimiliert
Servus,

ich suche ein Tool, das Daten aus einem Produkt-Katalog, der als PDF vorliegt, in als Excel-Dokument speichern kann.
Wichtig ist dabei, dass das nicht nur stur Tabellen sind, sondern sich das Format pro Seite auch ändern kann, es sollte also auch möglichst flexibel sein.
Wenn es kostenpflichtig ist, stört das nicht weiter, es sollte nur sowas wie eine Test-Version geben, damit ich ausprobieren kann.

Ich weiß, dass es dazu tausende Einträge bei Google gibt, die Auswahl ist groß, allerdings die Menge an Blödsinn auch.
Kennt da jemand ein oder mehrere Programme, die privat oder im Unternehmen verwendet werden/wurden und die ich mir anschauen kann?

Wie gesagt, Kostenfaktor ist egal, solange ich es mir als Test-Version anschauen und zumindest grob ausprobieren kann, was es bietet.

Grüße


PS:

Das Tool soll dafür verwendet werden, eine größere Anzahl Daten von PDF zu Excel zu bringen, es sollte nach Möglichkeit auch schnell und angenehm zu handhaben sein.
Ein paar Hintergrund-Infos:
Potentielle Kunden hatten schon die Anforderung, bestehende Daten, die (warum auch immer) nur als PDF-Katalog vorhanden sind, in Excel zu konvertieren um sie anschließend mit möglichst wenig Aufwand in unsere Software importieren zu können.
Bisher würde es so aus sehen, dass diese Daten per Hand mühsam eingegeben in die Software oder Excel eingetippt werden müssen. Das kostet viel Zeit und ist eine potentielle Fehlerquelle, daher besteht die Anforderung, eine Software zu finden, die davon so viel wie möglich automatisieren kann.
Excel deshalb, da in Excel schon relativ flexibel und schnell die Daten formatiert werden können und auch unsere Software einen flexiblen Import von Excel aus anbietet.
 
Zuletzt bearbeitet:
Office 2013 kann PDF-Dateien von Haus aus öffnen und ins entsprechende Format bringen. Allerdings nur, wenn die PDF-Datei nicht geschützt ist und sie so erstellt wurde, dass man die Inhalte auch auslesen kann. Wenn der Ersteller die Tabelle zum Beispiel selbst nur als Bild eingefügt hat, dann sind die Werte in den Spalten und Zeilen gar nicht in der PDF-Datei gespeichert.
Eine pauschale Lösung dafür gibt es also nicht.
 
Das einzige was mir da spontan einfällt ist Omnipage. Damit kann man PDFs relativ flexibel bearbeiten und auch Vorlagen erstellen.
Ob das die Lösung für das Problem ist!? Na ja, anschauen kannst du es dir ja...
Aber generell ist der Weg von PDFs weg zu einem anderen Format (wie oben schon erwähnt) je nach Quelle schwierig.
 
Erst einmal Danke für die Beiträge.

Ich probiere jeden Tipp aus, der hier genannt wird, ich habe mir dafür extra eine VM angelegt, die ich dann weg schmeißen kann.



Allgemein kann ich aber sagen, ich soll nach Möglichkeit nichts vorgeben.
Ich muss also auch damit rechnen, dass die PDF nur ein eingescanntes Dokument mit vielen Bildern, viel Text und zwischendrin mal eine Tabelle ist.
 
Vom Bauchgefühl her, das wird nie so klappen ;). Aber falls du eine Lösung findest, dann geb bitte mal bescheid. Interessiert mich auf jeden Fall ob du fündig wirst.
 
Vollautomatisch wird das nichts, das ist klar.


Aber eben vielleicht so, dass ich Seite für Seite speichern kann, wo was liegt und daraus eine Art Maske bauen kann.
Mit der kann ich dann die Daten aus einer ganzen Reihe gleichartiger PDFs raus lesen. Das hat mich nur einmal viel Zeit für eine PDF gekostet und der Rest geht ganz fix durch.
 
Kennt noch jemand ein gutes Programm dafür?

OmniPage habe ich ausprobiert und das wirkt auch recht vielversprechend, aber ich finde es nicht so übersichtlich.
Ich habe auch das Programm PDF2XL gefunden, das Tabellen, Text und Bilder gesondert markieren und dann in die Excel-Tabelle legen kann. Das ist sehr schön mit Vorschau gemacht, allerdings habe ich bisher keine Möglichkeit gefunden, selber fest zu legen, wo ein markierter Bereich aus dem PDF-Dokument landet, das wird entweder alles in ein neues Sheet, oder untereinander in die selbe Spalte geklatscht.

Dann habe ich noch ein paar andere Tools gefunden, die das ganze automatisch machen und auch ziemlich gut, allerdings auch nur, wenn das PDF-Dokument entsrechend schön formatiert ist.
 
Oben