Beiträge von Sojan im Thema „Paperless-ng(x)“

    Paperless-ngx & Backup

    Paperless-ngx legt per default die importierten Dokumente in die Ordner

    • originals (wie der Name schon sagt, werden hier unangetastet die Originale abgelegt)
    • archive (komprimierte/veränderte Kopien der Originale)
    • thumbnails (Vorschaubilder)

    ab. Diese Ordner lassen sich z. B. durch rsync regelmäßig sichern, so dass das Wichtigste, nämlich die Dokumente, auf jeden Fall sicher sind.

    Hinterlegte Tags, Korrespondenten, Speicherpfade, Dokumententypen und User sind aber in einer Datenbank gespeichert und würden beim bloßen Sichern der PDFs verloren gehen.

    Aber Paperless-ngx bringt eine Backup-Funktion mit.

    In den Ordner mit der Docker-Compose-Datei gehen und den folgenden Befehl ausführen

    docker-compose exec -T webserver document_exporter ../export -z

    Dabei wird alles gesichert, auch Tags & Co. Die Option -z fasst die Dateien zu einer einzigen Zip-Datei zusammen.

    Ein Backup ist aber nur etwas wert, wenn es sich auch wieder zurückspielen lässt. Also in einer VM Paperless-ngx installiert und die zuvor erstellte Zip-Datei mit unzip paperless-sicherung.zip -d ~/Docker/paperless/export entpackt.

    Anschließend noch mit

    docker-compose exec -T webserver document_importer ../export

    die Dateien wieder importiert.

    Ergebnis: Alles wurde übernommen, sieht aus wie das Original. :thumbup:

    Genau so eine Ordner Struktur habe ich aktuell ohne das Programm

    Habe ich auch, ganz klassisch. Ordner/Dateien gibt es schon seit Jahrzehnten und wird sie vermutlich auch noch ewig geben, deshalb werde ich auch weiterhin darauf setzen.

    Auf der anderen Seite sind die Komfortfunktionen eines Programms schon sehr nett, wie Volltextsuche, Tags, Mehrbenutzerumgebung, automatisches Einordnen von Scans, Zugriff vom Smartphone/Tablet usw.

    Ich versuche nun, das Beste aus beiden Welten zu vereinen. ;) Komfortable Bedienung auf der einen Seite bei gleichzeitig zukunftssicherer Archivierung in Ordner-/Dateistruktur.

    Für mich wäre es interessant wie sich das Programm in einer bestehenden Ordner Struktur einarbeitet .

    Glaube nicht, dass das möglich ist. Die Dateien werden neu eingelesen und daraus das Archiv erstellt. Ist also eher eine langfristige Sache für verregnete Tage. ^^

    Habe er das Gefühl paperless ist was für Menschen die noch nie eine PDF auf dem PC hatten

    Oder genau anders rum...wenn du PDFs im fünfstelligem Bereich auf dem Rechner hast, dann wirst du es lieben. :D

    Nachdem ich das Thema Dokumentenarchiv eine ganze Weile hab ruhen lassen, habe ich einen erneuten Anlauf mit Paperless gewagt. Seit meinem letzten Versuch ist die Funktion Speicherpfad hinzugekommen und genau darum sollen es gehen.

    Die meisten Programme ordnen die Dokumente intern über eine Datenbank zu. Ist das Programm futsch, dann wars das auch mit den Dokumenten. Paperless ist hier anders. Es besteht die Möglichkeit, anhand von Dokumenteneigenschaften und frei wählbaren Begriffen eine Ordnerstrukur zu bilden, so dass auch ohne Programm die Dokumente leicht auffindbar sind.

    Hier einmal die Eigenschaften des Dokuments - rot markiert die Möglichkeit, einen Speicherort für dieses Dokument zu hinterlegen bzw. eine Voreinstellung auszuwählen (wie in diesem Beispiel geschehen).

    Die Voreinstellung der Speicherpfade lassen sie über einen separaten Menüpunkt erstellen.

    In den geschweiften Klammern lassen sich die Dokumenteneigenschaften abfragen, die Texte ohne Klammern sind frei wählbar, der Schrägstrich steht für eine Ordnerebene.

    Code
    Bankgeschäfte/{owner_username}/{correspondent}/Girokonto/{document_type}/{created_year}/{created} {title} ({owner_username})[{tag_list}]

    Das geniale ist nun, ändere ich einen definierten Speicherpfad, so wird dieser automatisch auf alle Dokumente angewandt, bei denen diese Voreinstellung hinterlegt ist.

    Und so sieht es dann auf Ordner- und Dateiebene aus.Für mich ist es so absolut ausreichend, so dass ich Paperless vermutlich als Dokumentenverwaltung einsetzen werde. Natürlich sollte das von Paperless erstellte Archiv regelmäßig auf einem separaten Datenträger gesichert werden.

    Tatsächlich gab es während der Installation bereits die Möglichkeit mit dem default-User pi, was ich auch gemacht habe. in der .env war aber da nichts eingetragen. Ich habe dann nochmal separat dort einen Admin eingerichtet mit Passwort, aber es will dennoch nicht greifen und den Login zulassen

    Hast du das schon ausprobiert?

    Paperless-ng Portainer stack create superuser - S55MA HAM blog
    When deploying paperless-ng stack with docker-compose file in Portainer you can’t login to paperless admin because superuser for login is missing (not…
    s55ma.radioamater.si
    Zitat

    When deploying paperless-ng stack with docker-compose file in Portainer you can’t login to paperless admin because superuser for login is missing (not created). You need to create it by going into container webserver CLI console and create it.

    So wie ich das bis jetzt verstanden habe, wird alles an Dokumenten in einen Ordner gelegt und nur über die DB dann sortiert.

    Nö, hatte ich schon im Beitrag Nr. 11 beschrieben. Du kannst die Konfiguration in Paperless so anpassen, dass bis zu vier Ebenen in der Ordner-/Dateistruktur möglich sind und die Dokumente automatisch darin einsortiert werden. Auch der Dateiname selbst lässt sich z. B. nach dem Titel automatisch benennen.

    Das sollte völlig ausreichen, um Dokumente auch ohne Datenbank wiederzufinden.

    Aus irgendeinem Grund spinnen hier also die Filter und alles wird völlig falsch und unsinnig getaggt. Das empfinde ich nun als großes Problem. Gerade da es in der Diskussion mit nicoletta ja auch darum ging, ob man nur auf paperless setzen könnte. Wenn nun eine Software schon in einer einfachen Grunddisziplin versagt, würde ich das in Frage stellen wollen.

    Hast du im Menü einmal die Protokolle aufgerufen? Ist dort zu erkennen, was das Programm erkannt hat und was es daraus gemacht hat?

    Habe als Tag "Internet" und als Korrespontent "Vodafone" voreingestellt und wird beim Import von Dokumenten auch richtig erkannt.

    Code
    [2022-06-09 15:23:44,973] [DEBUG] [paperless.matching] Correspondent Vodafone matched on document 2019-12-05_Internet because it contains this word: Vodafone
    
    [2022-06-09 15:23:44,975] [DEBUG] [paperless.matching] Tag Internet matched on document 2019-12-05_Vodafone Internet because it contains this word: Vodafone

    was wäre denn der Nachteil nur peperless zuverwenden?

    Die Frage kannst du auf alle Dokumentenverwaltungssysteme (DMS) ausweiten. Die meisten dieser Programme nutzen eine Datenbank zur Verwaltung des Archivs, in der sämtliche Angaben zum Dokument hinterlegt sind. Häufig ist das Auffinden eines Dokuments auch nur über dieses Programm sinnvoll möglich. Es besteht also eine Abhängigkeit.

    Schöne wäre es, wenn das DMS die Dokumente so benennen und in Ordner ablegen würde, dass ich auch ohne Programm mich im Archiv zurechtfinden könnte.

    Paperless bietet die Möglichkeit, die Dateien in einem begrenzten Umfang nach eigenen Vorgaben zu benennen und automatisch in Ordnern einzusortieren (max. 2-3 Ebenen).

    Wenn dir das ausreicht, dann sehe ich keinen Nachteil, "Paperless only" zu betreiben.

    Eine kleine Frage ist das extra abgesichert oder wird das direkt durch Anwender Anmeldung aktiviert ?

    Ich finde keinen Hinweis darauf.

    Du legst nach der Installation, aber vor Inbetriebnahme, einen Admin an.

    Docker

    docker-compose run --rm webserver createsuperuser

    ohne Docker

    sudo -u paperless paperless-manage createsuperuser

    Das mit der Nummerierung ist für mich kein Problem, da paperless zusätzlich läuft. Also ich habe bereits auf dem Rechner und als eines von mehreren Backups ebenfalls auf dem NAS alle Dokumente. Ich schiebe die halt zusätzlich in paperless, da ich so von allen Geräten und auch mobil darauf zugreifen kann, ohne fremden Cloudspeicher nutzen zu müssen. Zudem habe ich so eine Volltextsuche.

    Ok, das entschärft natürlich meine Bedenken. ;)

    Hatte auch schon überlegt, Paperless einfach zusätzlich laufen zu lassen - gewissermaßen als Komfortfunktion. Denn die Bedienung der GUI sagt mir schon zu.

    Müsste ich mir noch ein Konzept überlegen, wie ich auf einfache Weise beide Welten unter einen Hut bekomme.

    Ja das mit dem Drucker wäre schon relevant würd ich sagen. Muss ich mir doch noch einen Rechner aufstellen als Server :/

    Ich würde es erst einmal ausgiebig in einer VM testen. Ein Dokumentenarchiv soll ja für einen seeehr langen Zeitraum Bestand haben, da darf man sich schon etwas Zeit nehmen.

    Verwaltungsprogramme kommen und gehen, was aber über die Jahrzehnte erhalten geblieben ist, ist die Ordner- und Dateistruktur. Deshalb ist es mir so wichtig, dass das Programm die Dokumente nicht nur über die Datenbank zuordnet, sondern die Ablage auch in einer "lesbaren" Form vornimmt.

    Macht es sinn paperless auf dem pc zu intallieren also wenn es nicht die ganze zeit läuft?

    Technisch funktioniert es natürlich. Ob es Sinn macht, hängt von deinem Wünschen ab. Wenn du Dokumente vom Scanner direkt in das Eingangsverzeichnis von Paperless verschieben möchtest, dann muss halt der Rechner + Programm laufen. Vielleicht möchtest du auch übers Tablet, Notebook oder Smartphone auf deine Dokumente zugreifen können.

    Ansonsten finde ich das Programm echt klasse, geht schon in die Richtung, wonach ich seit längerer Zeit suche. Einzig die Ordnerstruktur gefällt mir noch nicht, die würde ich gerne noch granularer haben. Leider gibt es aktuell nur zwei Felder + Datum, nach denen ich die Struktur vorgeben kann.

    Ich werde die Entwicklung auf jeden Fall weiter verfolgen. ;)

    Die simple Numerierung der Dateien in der Standardeinstellung sagt mir nicht zu. Denn wenn die Entwickler eines Tages keine Lust mehr haben, dann bleibt man auf einem Haufen nichtssagender Dateien zurück.

    Ein paar Dokumente importiert, beschriftet und Tags vergeben.

    Anschließend die /etc/paperless.conf angepasst. Am Ende des Dateinamens habe ich die vergebenen Tags in eckige Klammern gepackt.

    PAPERLESS_FILENAME_FORMAT={document_type}/{correspondent}/{created_year}/{created} {title} [{tag_list}]

    Paperless benennt die Dateien entsprechend der Vorgabe automatisch um. So würden sich notfalls auch Dokumente wiederfinden, wenn die Anwendung nicht (mehr) zur Verfügung stehen sollte.