Nemo aktion für rembg

  • Ich habe mich in letzter Zeit ziemlich viel mit KI beschäftigt. Unter anderen mit localwriter (wie der Name schon sagt lokaler KI-Assistent in LibreOffice Writer), Generative AI for Krita , Alpaca und die ganzen llms und eben auch Rembg zum entfernen von Hintergründen aus Bildern. Das waren zumindest die Dinge die ich erfolgreich unter Linux Mint zum laufen bekommen habe mal abgesehen von tgpt usw.

    remgb ist aber ein Terminal Programm weshalb ich für Nemo zwei nemo_action Dateien erstellt habe. Eine einfache Version welche einfach die Standard Werte nutzt ohne zusätzliche Dialoge und eine Version wo man die Werte für Vordergrund, Hintergrund und Glättung der Übergänge mit Schieberegler einstellen kann.

    Einfache Version:

    Code
    [Nemo Action]
    Name=Bild-Hintergrund entfernen
    Comment=Entfernt den Hintergrund aus dem ausgewählten Bild
    Exec=bash -c 'input="$1"; output="$(dirname "$input")/$(basename "$input" .${input##*.})-rmbg.png"; rembg i "$input" "$output"' _ %F
    Icon-Name=image-x-generic
    Selection=Image
    Extensions=jpg;jpeg;png;bmp;webp;tiff

    Erweiterte Version:

    Code
    [Nemo Action]
    Active=true
    Name=Bild-Hintergrund entfernen mit Einstellungen
    Comment=Entfernt den Hintergrund des ausgewählten Bildes mit einstellbaren Parametern
    Exec=bash -c 'input="$1"; foreground=$(zenity --scale --title="Vordergrund-Schwellenwert" --text="Beeinflusst die Empfindlichkeit des Vordergrunds. Höhere Werte entfernen mehr. (Standard: 240):" --min-value=0 --max-value=255 --value=240); if [ $? -ne 0 ]; then zenity --error --text="Vorgang abgebrochen."; exit 1; fi; background=$(zenity --scale --title="Hintergrund-Schwellenwert" --text="Beeinflusst die Empfindlichkeit des Hintergrunds. Niedrigere Werte entfernen mehr. (Standard: 10):" --min-value=0 --max-value=255 --value=10); if [ $? -ne 0 ]; then zenity --error --text="Vorgang abgebrochen."; exit 1; fi; erode=$(zenity --scale --title="Erode-Größe" --text="Stelle die Glättung der Übergänge ein (Standard: 10):" --min-value=0 --max-value=100 --value=10); if [ $? -ne 0 ]; then zenity --error --text="Vorgang abgebrochen."; exit 1; fi; output="$(dirname "$input")/$(basename "$input" .${input##*.})-rmbg.png"; rembg i --alpha-matting --alpha-matting-foreground-threshold "$foreground" --alpha-matting-background-threshold "$background" --alpha-matting-erode-size "$erode" "$input" "$output"' _ %F
    Icon-Name=image-x-generic
    Selection=Image
    Extensions=jpg;jpeg;png;bmp;webp;tiff
  • Hier noch das Ergebnis nachdem ich das Bild durch das Generative AI for Krita Plugin anpassen lassen habe. Habe dazu einfach geschrieben es soll den Hintergrund mit Strand und Palmen füllen. Klar weiß ich das es im Internet schneller geht und z.T. auch bessere Ergebnisse gibt aber die oben genannten Tools funktionieren alle offline wobei man bei den Krita plugin auch online KI nutzen kann aber da braucht man ja schon wieder ein Account oder ist in der Anzahl beschenkt etc.

  • Ich habe für das Krita Generative AI eine deutsche Sprachdatei erstellt und auch an die Entwickler gegeben.

    Vielleicht ist es ja schon in der nächsten Version. Bis dahin könnt Ihr die Datei aus den Anhang laden und unter

    ~/.local/share/krita/pykrita/ai_diffusion/language

    entpacken.

    Moin,

    Nach Deinem gestrigen Post in einem anderen Thread bin ich auf den lokalen Ansatz mit Krita echt neugierig geworden und habe mir die notwendigen Sachen über den von Dir dankenswerterweise geteilten Link installiert. Das hat mir >56 GB Daten auf den Rechner gespült ;) aber damit war zu rechnen für lokale Modelle.
    Da ich keine tiefere Ahnung von der ganzen Materie habe, habe ich mich etwas schwer getan, aus den angebotenen Modellen, Plugins etc. das auszuwählen, was für einen ersten Test notwendig ist. Ich habe also sicher zuviel angekreuzt :S

    Nach einigen Fehlermeldungen, das dies oder jenes nicht installiert wurde, habe ich es in Krita trotzalledem ans Laufen bekommen.
    Ein kleines, weißes Robbenbaby auf den Strand in dem Bild aus dem Thread zu setzen, war kein Problem.
    Die Ränder aufzufüllen, wie von dem Threadersteller gewünscht, hat bei 2 von 4 Rändern funktioniert. In zwei Fällen brach die Erstellung mit einer für mich nicht gut nachvollziehbaren Fehlermeldung ab.

    Insgesamt sind die Ergebnisse (das Robbenbaby auf dem Strand und die aufgefüllte Ränder) ganz ok. Bei genauem Hinsehen sind jedoch die generierten Bereiche identifizierbar, ebenso wie die für das Auffüllen oder Platzieren aufgezogenen Rahmen.

    Was die Laufzeit bis zum fertigen Ergebnis angeht, strapaziert das meine Geduld schon ziemlich 8o.
    Ich habe es gestern verrückterweise auf meinem DayliDriver installiert.
    Das ist eine Lenovo ThinkStation P304 Tiny mit Intel i9-11900T, NVMe, 64 GB RAM und einer NVIDIA Quadro P1000.
    Also ein kleines Powerpaket, das aber bei den Berechnungen kräftig zu ventilieren beginnt.
    Die Laufzeiten bis zu Abbruch bzw. Ergebnis lagen im Bereich von 5 - 10 Minuten, während Adobe Photoshop auf einem Apple M2 Max (ich weiß, unfährer Vergleich) dafür irgendetwas unter 2 Sekunden benötigt. Die Qualität ist dabei auch ungleich besser aber da ist sicher in Krita auch noch Feintuning möglich.

    Dass es bei mir auf dem Rechner ZorinOS Pro 17.2 installiert wurde, mag für den einen oder anderen Fehler beim Installieren verantwortlich sein.
    Die Installationsfehler sind wiederum möglicherweise für für die Abbrüche bei der Erstellung bzw. die Laufzeit ursächlich.

    Trotzdem finde ich die Machbarkeit mit Krita klasse und ich würde mich gerne noch ein bisschen mehr damit beschäftigen.
    Mir fehlt insbesondere die Orientierung bei der Auswahl der zu installierenden Komponenten.
    Magst Du dazu vielleicht hier im Forum einen Artikel schreiben?

    Ich glaube, dass das Viele hier interessieren würde ...

    +++++++++++++

    IT-verrückt, seitdem ich Ende der 80er Jahre auf dem Wohnzimmertisch meiner

    wenig begeisterten Eltern meinen ersten C64 eingeschaltet habe.

    +++++++++++++

    In unserem Haushalt tummelt sich beständig eine Unmenge an Hard- und Software.

    PCs, Notebooks, Tablets, IoT, Handys, Gadgets und Software, von neu bis alt, von sinnvoll bis sinnlos – der Stromzoo.

  • Hallöchen,

    es gibt dazu auch ein Handbuch (leider nur englisch) und bereits viele Videos auf Youtube.

    Als Hardwareanforderung wird folgendes angegeben:

    Quote

    Hardware requirements

    NVIDIAGTX 1060 6GB or better.
    You may encounter issues and limitations on older cards.
    AMD12GB VRAM or more. Slow with limited feature set.
    Custom install required for Linux.
    AppleApple Silicon via MPS (community support).
    CPUWorks, but is very slow.


    Ich habe es auf zwei Laptops laufen einen Dell Precicion 7540 ( LM 22.1, Intel i7-9850H mit AMD ATI Radeon Pro WX 3200 und 32 GB RAM welchen ich letztes Jahr für 440 € über AFB gekauft hatte und meinen DayliDriver


    laufen und es funktioniert recht ordentlich. Für mich ist es aber nur Spielerei wie RE: Mögliche Anfängerfehler beim Linux? oder mintcopilot und die ganzen offline KI Geschichten usw. Ich möchte damit sagen das ich es zwar nutze aber kein Profi bei dem Plugin bin und mir auch am laufenden Band Anleitungen durch lese oder Videos anschaue. Ich habe auch schon mehrere Leute von Linux überzeugt aber nicht durch Überredung sondern weil sie gesehen haben was bei mir alles geht. 8o

  • Hallöchen,

    es gibt dazu auch ein Handbuch (leider nur englisch) und bereits viele Videos auf Youtube.

    ... hab ich auch mittlerweile gefunden :)

    Quote
    NVIDIAGTX 1060 6GB or better.
    You may encounter issues and limitations on older cards.

    Da wird klar, warum es bei mir so lange dauert ...
    Die NVIDIA Quadro P1000 hat lediglich 4GB VRAM, grundsätzlich zu wenig für KI glaube ich.
    Da hilft dann auch die CPU nicht, die ja wohl nicht viel beiträgt.

    Zudem ist die Quadro P1000 um den Faktor 2x langsamer wie die als Mindestanforderung angegebene GTX1060 6GB und gut 3-4x langsamer als die RTX 3060 Max-Q in Deinem Laptop.

    Quote

    Für mich ist es aber nur Spielerei

    #Metoo

    Also werde ich das Ganze nocheinmal mit einem anderen Rechner ausprobieren.
    Die Frage ist nur, wie ich das Installierte wieder loswerde :P ...

    +++++++++++++

    IT-verrückt, seitdem ich Ende der 80er Jahre auf dem Wohnzimmertisch meiner

    wenig begeisterten Eltern meinen ersten C64 eingeschaltet habe.

    +++++++++++++

    In unserem Haushalt tummelt sich beständig eine Unmenge an Hard- und Software.

    PCs, Notebooks, Tablets, IoT, Handys, Gadgets und Software, von neu bis alt, von sinnvoll bis sinnlos – der Stromzoo.

  • Heute kam eine neue version vom Krita AI Plugin raus und es ist richtig schnell geworden und da lokal auch unzensiert...

    Hab zum zeigen mal was harmloses gewählt. Sollte das schon zu viel sein bitte löschen.

  • rembg hat mich interessiet, deshalb habe ich es in LM22.1 Cinn in der Virtualbox installiert.

    Die 1. Action läuft sehr schnell, die 2. mit den Einstellungen braucht ein paar Minuten.

    Da ich das Ergebnis von verschiedenen Einstellungen vergleichen will, habe ich die Werte an den Namen angehängt. Dann überschreiben sich die Dateien auch nicht.

    output="$(dirname "$input")/$(basename "$input" .${input##*.})-rmbg-$foreground-$background-$erode.png"

  • Heute mal wieder was zum Thema Künstliche Intelligenz. Zunächst möchte ich nochmal auf den Mint-KI Chat hinweisen da da es in diesem Thema hauptsächlich um die offline Nutzung von KI geht und ich ihn hier noch nicht mit erwähnt hatte.

    Und nun zum eigentlichen Thema: KI MUSIK

    Keine Ahnung wer von euch das ganze schon bisschen mit verfolgt hat. Es gibt genau wie ChatGPT auch KIs für Musik eine der aktuell besten beschreibt Johannes Ruof unter

    External Content youtu.be
    Content embedded from external sources will not be displayed without your consent.
    Through the activation of external content, you agree that personal data may be transferred to third party platforms. We have provided more information on this in our privacy policy.
    womit so coole Lieder wie https://www.riffusion.com/riff/f79f465f-…b9-75dea5fb469a entstehen können.

    Nun aber der Punkt warum das ganze hier landet. Es gibt mittlerweile eine OSS alternative welche bei entsprechender Hardware lokal lauffähig ist. Momentan kommt die Qualität natürlich noch nicht an die oben genannte Möglichkeit heran aber immerhin hat man mit einer RTX-Grafikkarte und 32 GB RAM innerhalb von wenigen Minuten einen eigenen KI generierten Song https://map-yue.github.io

    GitHub - multimodal-art-projection/YuE: YuE: Open Full-song Music Generation Foundation Model, something similar to Suno.ai but open
    YuE: Open Full-song Music Generation Foundation Model, something similar to Suno.ai but open - multimodal-art-projection/YuE
    github.com

    External Content www.youtube.com
    Content embedded from external sources will not be displayed without your consent.
    Through the activation of external content, you agree that personal data may be transferred to third party platforms. We have provided more information on this in our privacy policy.

  • Inspiriert vom localwriter habe ich selbst ein LibreOffice Plugin erstellt.

    Da nicht jeder einen so leistungsstarken Rechner hat um ein lokales LLM zu nutzen oder man auch einfach wählen möchte ob nun schnell und umfangreich mittels ChatGPT oder Lokal und dafür privat.. Deshalb habe ich tgpt wie schon beim mintcopilot integriert. Nun warum nicht gleich direkt über die API von ChatGPT ? Um es eben auch ohne Key nutzen zu können ohne das kosten entstehen und auch um bei Problemen auf andere Provider zu wechseln.

    Also es kann nur mit ollama oder auch nur mit tgpt genutzt werden. Beides installiert zu haben geht natürlich auch, da kann man je nach Situation halt wechseln.

    Was geht: Texte erstellen, erweitern, ersetzen, übersetzen, abändern lassen, Bilder generieren und einfügen lassen (nur tgpt)

    Lob nehme ich gern entgegen 😁


  • Falls jemand mehr Ahnung von einem Videotutorial als ich hat oder Verbesserungsvorschläge für das Benutzerhandbuch hat kann gern auch die odt haben.

    LG.

  • Denke das es da keine Probleme geben sollte. Es sollte general unter Linux funktionieren aber getestet habe ich es nur unter Linux Mint Cinnamon. Ich helfe aber so gut ich kann wenn es Fragen oder Probleme gibt :)

  • Habe das LibreOffice Writer KI-Assistent Plugin weiter angepasst. Nun wird es durch pancoc Formatiert was nahezu vollständig in odt umwandelt. Weiterhin kann zwischen verschiedenen online Providern oder einen offline installierten ollama wechseln.


Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!