Paperless-ng(x)

  • Hallo zusammen,

    nutzt hier jemand Paperless-ng(x)? Bin am überlegen das mal einzurichten, aber ein Pi soll wohl zu schwach dafür sein, bzw. nicht wirklich performant laufen dann.

    Jetzt wüsst ich dann nicht wo ich das sonst installieren sollte :/

    Rollenspiel.Monster -Deine Fediverse Rollenspiel Nodes

    GPG

    System: TUXEDO Aura 15 - Gen1, AMD Ryzen 7 4700U, 32GB RAM, 1TB M.2 SATAIII, EndeavourOS(Gnome[Wayland])

  • Ich verwende es seit.. 3 Monaten? Weiß nicht mehr genau. Sind aber Monate. Will es nicht mehr missen. Läuft einwandfrei. Willst du irgendwas spezielles wissen oder sehen?

    Zur Installation kann ich dir nicht viel sagen. Habe es auf meinem unraid laufen. Benötigt halt Redis.

    💾 AMD EPYC 7452 (8 Cores) 40GB | 💾 Unraid Homeserver i5-4570 16GB

    💻 Ryzen 9 7900X RX7800XT 32GB | 💻 MacBook Pro M2Pro 32GB

    EndeavourOS <3

  • Was für ne Hardware hast du da drunter?

    Da rennt ein alter i5 4570 mit 16GB RAM. Wenn die Texterkennung läuft, neue Dokumente indiziert und importiert werden, geht die Last kurz hoch, fängt sich aber relativ schnell wieder ein. Ich muss dazu sagen, dass gleichzeitig ein PLEX Mediaserver auf dem Gerät läuft, ein PDF Auto-Tesseract (unabhängig von paperless), Handbrake, ein FTP für meine Hofkamera, MeTube, TubeSync, ein File-Downloader und ein Telegram-Bot.

    Der Screenshot zeigt die Spikes bei Texterkennung und Indizierung.

    💾 AMD EPYC 7452 (8 Cores) 40GB | 💾 Unraid Homeserver i5-4570 16GB

    💻 Ryzen 9 7900X RX7800XT 32GB | 💻 MacBook Pro M2Pro 32GB

    EndeavourOS <3

  • Hmm muss mir wohl doch noch nen kleinen Rechner für zu Hause zulegen als Server; paperless sieht nämlich schon ziemlich interessant aus. Bisher liegt alles auf der Nextcloud rum.

    Rollenspiel.Monster -Deine Fediverse Rollenspiel Nodes

    GPG

    System: TUXEDO Aura 15 - Gen1, AMD Ryzen 7 4700U, 32GB RAM, 1TB M.2 SATAIII, EndeavourOS(Gnome[Wayland])

  • Lässt sich die Ordnerstruktur und Namensvergabe in paperless so einstellen, dass ich auch ohne Programm ein Dokument finden würde?

    Ich habe hier gar keine Ordnerstruktur mit Dateinamen. Das Programm speichert die ganzen Dokumente intern quasi in seiner eigenen Struktur ab. Wie die genau aufgebaut ist, kann ich dir nicht sagen. Denn das verwaltet paperless alles selbst und ich habe nie in die internen Ordner hinein gesehen.

    Paperless bietet zwei Möglichkeiten, Dokumente zu importieren. Zum einen ganz klassisch im Browser via drag&drop oder Schaltfläche - zum anderen über einen überwachten Ordner. In beiden Fällen wird das Dokument dann mit OCR versehen, indiziert und ins Archiv aufgenommen.

    Man kann nun bei jedem Dokument den Namen nach Belieben ändern, Kommentare, Anmerkungen und sonstige Meta hinzufügen, entfernen und bearbeiten. Zusätzlich arbeitet das Tool mit Tags. Du kannst Dokumente beliebig mit einem oder mehreren Tags versehen. Du kannst zudem ein Eingangs-Tag verwenden. Ich habe hier das Tag "offen" gewählt. Alle neuen Dokumente erhalten dieses automatisch. Alle paar Tage lasse ich mir nun alle "offenen" Dokumente anzeigen und schaue, ob diese richtig getaggt wurden. Dann entferne ich das Tag "offen".

    Mit automatisch getaggt meine ich übrigens tatsächlich automatisch. Du kannst Filter und Regeln erstellen, nach denen Dokumente automatisch mit Tags versehen werden. Wenn im Briefkopf z.B. Allianz, DEVK, etc steht, kann das Programm automatisch den Tag "Versicherungen" vergeben. Oder du lässt alles mit "Rechnung" auch als Rechnung taggen, usw.

    Du kannst alle Dokumente natürlich via Browser jederzeit herunterladen. Du selbst arbeitest hier aber nicht mit Ordnern oder Ordnerstukturen. Das übernimmt paperless alles für dich.

    Es ist sicher möglich, auf die Dateien direkt zuzugreifen. Das habe ich aber nie versucht. Auch aus Angst, dass ich das Programm dann durcheinander bringe und ein Chaos entsteht. Paperless ist also eher eine Art lokaler Cloudspeicher für Dokumente mit eigener Verwaltung.

    💾 AMD EPYC 7452 (8 Cores) 40GB | 💾 Unraid Homeserver i5-4570 16GB

    💻 Ryzen 9 7900X RX7800XT 32GB | 💻 MacBook Pro M2Pro 32GB

    EndeavourOS <3

  • Testweise auf einem Archlinux-Server installiert, paperless-ngx gibt's im AUR.

    Dateinamen und Ordnerstruktur lassen sich anpassen. Dazu muss die /etc/paperless.conf gemäß des Links angepasst werden.

    Advanced topics — Paperless-ngx 1.7.1 documentation

    In der Standardeinstellung wird alles in einem Ordner abgelegt und die Dateien werden durchnumeriert.

    • 000001.pdf
    • 000002.pdf
    • ...

    Einmal editiert, zuletzt von Sojan (3. Juni 2022 um 15:25)

  • Die simple Numerierung der Dateien in der Standardeinstellung sagt mir nicht zu. Denn wenn die Entwickler eines Tages keine Lust mehr haben, dann bleibt man auf einem Haufen nichtssagender Dateien zurück.

    Ein paar Dokumente importiert, beschriftet und Tags vergeben.

    Anschließend die /etc/paperless.conf angepasst. Am Ende des Dateinamens habe ich die vergebenen Tags in eckige Klammern gepackt.

    PAPERLESS_FILENAME_FORMAT={document_type}/{correspondent}/{created_year}/{created} {title} [{tag_list}]

    Paperless benennt die Dateien entsprechend der Vorgabe automatisch um. So würden sich notfalls auch Dokumente wiederfinden, wenn die Anwendung nicht (mehr) zur Verfügung stehen sollte.

    Einmal editiert, zuletzt von Sojan (4. Juni 2022 um 18:42)

  • Macht es sinn paperless auf dem pc zu intallieren also wenn es nicht die ganze zeit läuft?

    Technisch funktioniert es natürlich. Ob es Sinn macht, hängt von deinem Wünschen ab. Wenn du Dokumente vom Scanner direkt in das Eingangsverzeichnis von Paperless verschieben möchtest, dann muss halt der Rechner + Programm laufen. Vielleicht möchtest du auch übers Tablet, Notebook oder Smartphone auf deine Dokumente zugreifen können.

    Ansonsten finde ich das Programm echt klasse, geht schon in die Richtung, wonach ich seit längerer Zeit suche. Einzig die Ordnerstruktur gefällt mir noch nicht, die würde ich gerne noch granularer haben. Leider gibt es aktuell nur zwei Felder + Datum, nach denen ich die Struktur vorgeben kann.

    Ich werde die Entwicklung auf jeden Fall weiter verfolgen. ;)

  • Ja das mit dem Drucker wäre schon relevant würd ich sagen. Muss ich mir doch noch einen Rechner aufstellen als Server :/

    Ich würde es erst einmal ausgiebig in einer VM testen. Ein Dokumentenarchiv soll ja für einen seeehr langen Zeitraum Bestand haben, da darf man sich schon etwas Zeit nehmen.

    Verwaltungsprogramme kommen und gehen, was aber über die Jahrzehnte erhalten geblieben ist, ist die Ordner- und Dateistruktur. Deshalb ist es mir so wichtig, dass das Programm die Dokumente nicht nur über die Datenbank zuordnet, sondern die Ablage auch in einer "lesbaren" Form vornimmt.

  • Das mit der Nummerierung ist für mich kein Problem, da paperless zusätzlich läuft. Also ich habe bereits auf dem Rechner und als eines von mehreren Backups ebenfalls auf dem NAS alle Dokumente. Ich schiebe die halt zusätzlich in paperless, da ich so von allen Geräten und auch mobil darauf zugreifen kann, ohne fremden Cloudspeicher nutzen zu müssen. Zudem habe ich so eine Volltextsuche.

    💾 AMD EPYC 7452 (8 Cores) 40GB | 💾 Unraid Homeserver i5-4570 16GB

    💻 Ryzen 9 7900X RX7800XT 32GB | 💻 MacBook Pro M2Pro 32GB

    EndeavourOS <3

  • Das mit der Nummerierung ist für mich kein Problem, da paperless zusätzlich läuft. Also ich habe bereits auf dem Rechner und als eines von mehreren Backups ebenfalls auf dem NAS alle Dokumente. Ich schiebe die halt zusätzlich in paperless, da ich so von allen Geräten und auch mobil darauf zugreifen kann, ohne fremden Cloudspeicher nutzen zu müssen. Zudem habe ich so eine Volltextsuche.

    Ok, das entschärft natürlich meine Bedenken. ;)

    Hatte auch schon überlegt, Paperless einfach zusätzlich laufen zu lassen - gewissermaßen als Komfortfunktion. Denn die Bedienung der GUI sagt mir schon zu.

    Müsste ich mir noch ein Konzept überlegen, wie ich auf einfache Weise beide Welten unter einen Hut bekomme.

  • Hallo

    Ich habe mich lange nicht mehr damit beschäftigt auch aus Zeitgründen und bin erst durch diesen Faden wieder darauf Aufmerksam geworden.

    Ich werde mir das heute auch mal rein ziehen und aufbauen.

    Eine kleine Frage ist das extra abgesichert oder wird das direkt durch Anwender Anmeldung aktiviert ?

    Ich finde keinen Hinweis darauf.

    Paperless-ng
    Das nächste Level der Dokumentenverwaltung
    paperless.codeberg.page

    Gruss

  • Eine kleine Frage ist das extra abgesichert oder wird das direkt durch Anwender Anmeldung aktiviert ?

    Ich finde keinen Hinweis darauf.

    Du legst nach der Installation, aber vor Inbetriebnahme, einen Admin an.

    Docker

    docker-compose run --rm webserver createsuperuser

    ohne Docker

    sudo -u paperless paperless-manage createsuperuser

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!