[Ausgelagert] Mint-Copilot - KI-Assistent

  • Habe das Mint Copilot noch mal überarbeitet.

    maik3531
    September 25, 2024 at 6:44 PM

    Habe ich dahingehend lösen können das nun kein Terminaltfenster mehr eingebettet wird. Die Diktierfunktion habe ich von google speech_recognition zu nerd-dictation gewechselt und Bildgenerierung mit integriert. Vorlesen funktioniert weiterhin am besten mit Pied 

  • Habe das Mint Copilot noch mal überarbeitet.

    Ich hab das jetzt mal in Debian, ohne die Sprachein oder -ausgaben Zusatzsoftware, installiert.
    Es funktioniert, ich bekomme Antworten, allerdings sehr langsam.
    Ich werde das mal weiter beobachten, ich finde die Idee sehr gut.

    "Wissenschaft ist immer nur der aktuelle Stand des Irrtums."

  • Kann nun auch lokal mit z.B. Ollama curl -fsSL https://ollama.com/install.sh | sh verwendet werden

    Das Skript hat mein SOLUS Gnome geschrottet.
    Das Skript hatte festgestellt das ich keinen NVIDA odere AMD GPU habe und Fehler ausgeworfen...... danach ist mir der Gnomedesktop eingefroren und mein PC startete danach nicht mehr. Musste jetzt alles neu installieren.

  • Das Skript hat mein SOLUS Gnome geschrottet.
    Das Skript hatte festgestellt das ich keinen NVIDA odere AMD GPU habe und Fehler ausgeworfen...... danach ist mir der Gnomedesktop eingefroren und mein PC startete danach nicht mehr. Musste jetzt alles neu installieren.

    Das Ollama oder das Programm mintcopilot-1.0.8 aus dem Anhang ? Auch die offline KI Geschichten sollten ohne Nvidia oder AMD GPU laufen solang deine CPU stark genug ist und du genug Arbeitsspeicher hast.

    External Content www.youtube.com
    Content embedded from external sources will not be displayed without your consent.
    Through the activation of external content, you agree that personal data may be transferred to third party platforms. We have provided more information on this in our privacy policy.

  • Unter Einstellung können je nach Provider nur noch die unterstützten Modelle ausgewählt werden. Provider welche ein Key benötigen lassen sich nicht mehr auswählen ohne ein Key einzugeben. Bildvorschau nun bei pollinations und bei blackboxai. Wenn nicht blackboxai ausgewählt ist wird standardmäßig pollinations mit flux verwendet. Diktieren kann einfach mit der Eingabetaste oder "Eingabe absenden" abgeschickt werden. Vorlesen kann mit einen klick auf "Ausgabe stoppen" gestoppt werden. ...

  • Das Ollama oder das Programm mintcopilot-1.0.8 aus dem Anhang ? Auch die offline KI Geschichten sollten ohne Nvidia oder AMD GPU laufen solang deine CPU stark genug ist und du genug Arbeitsspeicher hast.

    External Content www.youtube.com
    Content embedded from external sources will not be displayed without your consent.
    Through the activation of external content, you agree that personal data may be transferred to third party platforms. We have provided more information on this in our privacy policy.

    Ich habe das curl -fsSL https://ollama.com/install.sh | sh ausgeführt.
    Hat im Terminal gemeckert das ich keine Nvida habe bzw. AMD..... naja egal dachte ich, also Terminal geschlossen.
    Dann der ganze PC eingefroren, nur ein Reset half..... aber danach blieb der PC im HP Wolf Logo stecken, das ist ein HP Mini PC:

  • Kommt darauf an wie stark dein Rechner ist auf mein

    läuft "llama3", "mistral", "deepseek-r1:7b" "phi3,5" problemlos das "deepseek-r1:32b" ist glaube ich so das höchste was man auf normaler Hardware laufen lassen kann aber da sollte es schon rtx-3060 oder neuer sein mit mindestens 32 GB Arbeitsspeicher

  • läuft "llama3", "mistral", "deepseek-r1:7b" "phi3,5" problemlos das "deepseek-r1:32b"

    Und worin unterscheiden sich die einzelnen Modelle? Sind hier die Ergebnisse der Suchanfragen unterschiedlich?

    Was unterscheidet z.B. "llama3" von "phi3,5" und "mistral"? Ist das eine mehr für Programmierer das andere für Wissenschaftler das nächste füür Dummys wie mich ?

    Bei mir sieht das so aus:

    Da wird es dann wohl eher llama2 bei dem Prozessor :D

    Linux Command Library     Commandlinefu.com

    Code
       __   _                  _____     _    __      
      / /  (_)__  __ ____ __  / ___/_ __(_)__/ /__ ___
     / /__/ / _ \/ // /\ \ / / (_ / // / / _  / -_|_-<
    /____/_/_//_/\_,_//_\_\  \___/\_,_/_/\_,_/\__/___/
  • Naja die unterschiedlichen Modelle sind z.T. von unterschiedlichen Firmen und damit auch unterschiedlich trainiert wurden es gibt verschiedene Tests wo die sich dran messen lassen sollen. Aber wie du schon geschrieben hast, gerade bei den kleinen bzw. den fein trainierten Modellen ist es so das sie bestimmte dinge sehr gut können und andere wiederum so gut wie garnicht https://openrouter.ai/rankings

    Die meisten LLM's kann man auch einfach fragen z.B.

    Quote

    Ich bin ein LLM (Large Language Model) entwickelt von Phind. Ich assistiere Entwicklern bei komplexen Programmier-, technischen und Informationsaufgaben. Meine Hauptfunktion ist es, in einer VSCode-Erweiterung zu laufen und Entwicklern bei der Arbeit mit Code in einem VSCode-IDE zu helfen.


    Der Vorteil bei mintcopilot-1.9 besteht eigentlich darin das du selbst die meisten online LLM's ohne Anmeldung ohne Account etc. nutzen kannst um mal auf die schnelle was zu frage oder ein Bild generieren zu lassen.

  • Unter Einstellung können je nach Provider nur noch die unterstützten Modelle ausgewählt werden. Provider welche ein Key benötigen lassen sich nicht mehr auswählen ohne ein Key einzugeben. Bildvorschau nun bei pollinations und bei blackboxai. Wenn nicht blackboxai ausgewählt ist wird standardmäßig pollinations mit flux verwendet. Diktieren kann einfach mit der Eingabetaste oder "Eingabe absenden" abgeschickt werden. Vorlesen kann mit einen klick auf "Ausgabe stoppen" gestoppt werden. ...

    Habe mal für nerd-dictation ein Installationsscript erstellt (getestet auf ein frisch installierten LinuxMint 22.1 Cinnamon)

    ./install_nerd_dictation.sh

  • Um "nerd-dictation" unter Wayland laufen zu lassen müssen die Pakete "ydotool" und "ydotoold" installiert sein.

    Code
    sudo usermod -aG input $USER

    Ausgeführt werden und der Befehl auf

    Code
    nerd-dictation begin --simulate-input-tool=STDOUT

    geändert werden. Ab Version 1.0.1 von ydotool lautet der Befehl

    Code
    nerd-dictation begin --simulate-input-tool=YDOTOOL

    Da aber bei Linux Mint und Ubuntu momentan noch Version 0.1.8 im Repo ist ist momentan der obere Befehl für Wayland nutzbar.

  • Auf Grund von Feedback folgende Fehler behoben:

    - Wenn code generiert wurde kam es zu Fehlern da versucht wurde diesen auszuführen anstelle ihn als History zurück zu geben. (wurde behoben)

    - Da die Eingabe an Terminal GPT weiter geleitet wird, kam es zu Fehlern wenn man Anführungsstriche verwendet hat (wurde behoben)

    - Es konnte die Merkfunktion nicht deaktivieren werden wenn diese auf 0 gesetzt wurde (wurde behoben)

    - Modellauswahl wurde gespeichert und genutzt aber beim erneuten aufrufen der Einstellungen wurden Voreinstellung anstelle des genutzten Model gezeigt (wurde behoben)

  • Hallo Maik,

    vielleicht kannst Du mir ja helfen. Ich habe mir vor ein paar Wochen extra einen zweiten gebrauchten Laptop für 74,- € bei Ebay gekauft auf dem der Verkäufer freundlicherweise bereits extra Edge DEV installiert hatte (wenn auch dummerweise auf dem Superuserkonto…, blöd).

    Ich lies mir bisher auf meinem WIN 10 Laptop Fanfiktion mit der Mikrsoftstimme Katja aufnehmen und schnitt mit Audacity mit. So konnte ich abends auf meinem MP3_Player in aller Ruhe die Story anhören.

    Auf meinem Linux Mint Laptop funktioniert das zwar, aber eher schlecht. Es ruckelt und der Text hat nach jedem Satz sehr lange Pausen, ganz besonders zwischen den Absätzen.

    Ich suche bereits seit 8 Monaten nach einer Lösung (!!!!), bin aber bisher noch zu keinem erfolgreichen Ende gekommen.

    Thorsten-Voice klingt wirklich gut, ich „spreche“ aber kein „Terminal“ und habe keine Ahnung, wie ich etwas, das funktioniert auf meinen Rechner bekommen kann. Um Edge DEV „sicher“ benutzen zu können habe ich mir sogar den o.g. Rechner bei Ebay gekauft, den ich nur „für mein Hobby“ verwenden wollte. Aber trotz zweitem Linux Mint Laptop …. ich suche immer noch.

    Ich hoffe, dass Du mir helfen kannst.

  • nun du brauchst nicht unbedingt das Terminal du kannst normal die Texte in LibreOffice schreiben/kopieren und vorlesen lassen z.B. mit https://gitlab.com/maik3531/LibreOffice_KI-Assistent oder willst du direkt aus Textdateien Audiodateien erstellen ?

    Für den Fall das es wirklich mit Terminal genutzt werden soll ..

    Code
    spd-say "$(cat Datei.txt)"


    Ich nutze Firefox und der liest nit der von mir eingestellten Stimme vor welche ich über pied ausgewählt habe.


    wenn du es einfach nur in realistischer Stimme hören magst und es nicht unbedingt offline erstellt werden muss bzw. nix Datenschutzmäßig bei ist kannst du auch Notebookml nutzen siehe

    External Content www.youtube.com
    Content embedded from external sources will not be displayed without your consent.
    Through the activation of external content, you agree that personal data may be transferred to third party platforms. We have provided more information on this in our privacy policy.

  • Hallo Maik,

    ich war auf die Seite für die Du den Link angegeben hast. Erst einmal: WOW, was man mit dieser Libre-Erweiterung so alles machen kann!

    Klingen die Stimmen so wie die Stimmen im Youtubevideo? Die Vorlesefunktionen unter Firefox oder der Standardreader unter Linux Mint klingen ja eher "vorsündflutlich".

    Gehen wir das was laut Link zu tun ist einmal durch:

    INSTALLATION:

    1. Lade die .oxt-Datei (Erweiterungspaket) herunter (da müsstest Du mich durchleiten)

    2. Öffne sie im Libre Office Writer über

    Extras → Hinzufügen (da wäre wohl auch Hilfe von Dir gut)

    3. Neustart

    4. Writer hat neuen Menüpunkt „KI-Assistent“.

    Und dann könntest Du mir erklären, wie ich dann zu vorgelesenem Text (mit ausgewählter deutscher Stimme?) komme.

    Text aus dem Internet kopieren

    → einfügen in Libre Writer

    und KI-Assistenten nutzen, so dürfte es wohl funktionieren.

    Ist es sehr schwer, Programme in der Anwendungsverwaltung zu platzieren? Es scheint auf alle Fälle ein tolles Programm/eine tolle Erweiterung zu Libre Office zu sein.

    Läuft es auf Linux Mint 22.2 stabil?

    Wenn ich nach acht Monaten endlich eine gute Lösung gefunden hätte, wäre ich wirklich sehr froh.

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!