Bilder mit Tesseract OCR in Text umzuwandeln - Nemo Action

  • Texterkennung, Textdetection oder auch Textrecognition genannt also mittels OCR Text von Bildern auslesen und als Text ausgeben und speichern.

    Dazu nutzen wir Tesseract (gleichnamig wie ein first-person shooter game based on Cube2/Sauerbraten) eine von HP, UNLV, und Google entwickelt und geschriebene Library API für "Optical Character Recognition" ORC. Um das ganze so einfach wie möglich zu halten auch wieder als Nemo Action Eintrag.


    Die extract-text-from-image.nemo_action unter ~/.local/share/nemo/actions speichern und tesseract-ocr-deu installieren. Wobei -l deu sich natürlich auf die Sprache bezieht und beliebig angepasst werden kann. Es stehen unter Ubuntu/Mint 160 Pakete in allen erdenklichen Sprachen zur Verfügung wer sich alle installieren möchte kann das Metapaket tesseract-ocr-all herunterladen. Mir persönlich reicht deutsch. Die Texterkennung ist sehr gut wenn auch nicht 100% Fehlerfrei.

    Einmal editiert, zuletzt von maik3531 (7. April 2024 um 08:08) aus folgendem Grund: "convert image to text" zu "extract text from image" da das Bild im eigentlichem Sinn ja nicht umgewandelt/konvertiert wird sondern dessen Text ausgelesen/extrahiert und in eine neue Datei geschrieben wird.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!