[Ausgelagert] Mint-Copilot - KI-Assistent

  • Kann ich nun noch Kerstin installieren und danach noch einmal Thorsten "bestätigen"? Ist dann alles so wie es sein soll?

  • Ja naklar du musst die neue Konfiguration akzeptieren also auf "Accept new configuration" innerhalb der 45 Sekunden klicken sonst wird nichts an deinen System verändert und danach wird aus dem "Select Voice" "Current Voice" wie bei mir auf den Screenshot zu sehen. Aber ich finde es schon ziemlich bemerkenswert das ich dir jeden einzelnen Klick detachiert erklären muss. Sobald "Current Voice" da steht sollte in LibreOffice Writer der Text mittels "Strg + L" oder auch in Firefox in Lesemodus (Buchsymbol rechts in Adressleiste) mit deiner ausgewählten Stimme vorgelesen werden.

    Quote

    Kann ich nun noch Kerstin installieren und danach noch einmal Thorsten "bestätigen"? Ist dann alles so wie es sein soll?

    Wie viel Stimmen du installierst ist dir überlassen und du muss auch keine deinstallieren um eine andere zu nutzen. Du kannst aber Stimmen die du ggf. nur mal getestet hast wieder deinstallieren wenn du sie nicht nutzt damit sie keinen unnötigen Speicherplatz belegen.

  • THORSTEN LIEST!

    Ist es bei Dir auch so, dass die Pausen zwischen den Sätzen sehr lange sind? Vom ersten Ton der Wiedergabe (also ohne die Vorbereitung des Hörens des esrten Satzes) bis zum Ende der Aufnahme hat es genau 2:20 Minuten gedauert. (Siehe auch Text im beigefügten Bild mit dem Text.)Ich weis, dass man mit Audacity so aufnehmen kann, dass Pausen (leider völlig) gekürzt werden. Hast Du das bei der Kuscheldorf-Geschichte so eingestellt oder sind die Pausen beim Vorlesen des Textes bei Dir garnicht vorhanden?

    Wir kommen immerhin wirklich voran. Danke.

  • Ist es bei Dir auch so, dass die Pausen zwischen den Sätzen sehr lange sind? Vom ersten Ton der Wiedergabe (also ohne die Vorbereitung des Hörens des esrten Satzes) bis zum Ende der Aufnahme hat es genau 2:20 Minuten gedauert. (Siehe auch Text im beigefügten Bild mit dem Text.)

    probiere mal Kerstin 😉

    Also so lang wie mit 50 oder 5 Sekunden sollte es nicht sein. Ich hatte in den Beitrag RE: chatGPT jetzt auch ohne API Key im Terminal nutzbar eine Geschichte mit tgpt erstellen lassen und diese mit Thorsten vorlesen lassen kannst dir ja den Anhang runter laden und selbst hören.

    Wenn ich es richtig in Erinnerung habe hast du erwähnt das du den Rechner für ca. 70 € auf ebay gekauft hast ? Evtl. kommt er dabei schon an seine Grenzen 🤷🏼

  • Lass das Vorlesen mal laufen und öffne unter Systemverwaltung -> die Systemüberwachung den Reiter "Ressourcen"

    Leider ist dein Rechner wirklich das Minimum mit 4 GB Ram und ein Atom Prozessor.

    Quote

    Minimale Systemanforderungen (für Desktop-Version)


    • Prozessor: 2 GHz Dual-Core
    • Arbeitsspeicher (RAM): 4 GB
    • Festplattenspeicher: 25 GB freier Speicherplatz
    • Grafikkarte: VGA-kompatibel mit einer Auflösung von 1024x768
      • Installationsmedium: USB-Port oder DVD-Laufwerk

    Empfehlungen für eine bessere Leistung


    • Prozessor: Ein modernerer Prozessor wird für eine bessere Performance empfohlen.
    • Arbeitsspeicher: 8 GB RAM oder mehr für ein reibungsloses Multitasking.
    • Festplattenspeicher: 25 GB sind ein Minimum; eine SSD wird für eine schnellere Leistung dringend empfohlen.
    • Internetzugang: Empfohlen für Updates und den Download zusätzlicher Software

    Sprich dein Rechner hat wirklich grade so die Mindestanforderung. Nutze ihn so gut wie es geht und wenn du dir irgendwann ein etwas Leistungsfähigeren holen kannst würde ich dir afb https://www.afbshop.de/gebrauchte-not…r=price-asc&p=1 empfehlen oder wenn es trotzdem noch zu teuer sein sollte gibt es wie Alte Computer spenden – für einen guten Zweck! auch Anlaufstellen.

  • Ich hoffe, dass die CPU-Auslastung während des Lesens und gleichzeitigen Mitschneiden durch Ausdacity genügt.

    Piper wurde mit 54-59 % angegeben (wenn gelesenes zu hören ist: unter 1%) CPU verbraucht das Vorbereiten des Lesens.

    Pipeware mit 0,33, 0,5 bis 0,67 %,

    Audacity 14-18%,

    cinnamon-killer-daemon 2% bis 6,5%

    gnome-system-minitor: 7,35%

    und 3 bis vier andere manchmal aktiv: weniger als 3%

    pipeware-pulse ist beim hörbaren Lesen bei unter 3%

  • Ja, der Prozessor scheint wirklich am Limit zu sein.

    Dabei hatte ich mir diesen HP- Laptop nur für "mein Hobby" gekauft.

    Der Laptop, den ich hauptsächlich benutze ist ein DELL Latitude E5570. Den hatte ich bei Festplatte und Arbeitsspeicher nachrüsten lassen. Ginge das auch bei dem HP-Laptop? Ich weis im Moment nicht so recht wie ich zu der Funktion komme, die ich gerne hätte. Die "Kuscheldorfdatei" klingt aber auch wie mit aktivierter Pegelgesteuerter Aufnahme mit Audacity aufgenommen, also ohne Pausen zwischen den Sätzen oder Ansätzen, wobei das bei der Kuscheldorfstory noch nicht einmal sehr auffällt.


  • Quote

    Die "Kuscheldorfdatei" klingt aber auch wie mit aktivierter Pegelgesteuerter Aufnahme mit Audacity aufgenommen, also ohne Pausen zwischen den Sätzen oder Ansätzen, wobei das bei der Kuscheldorfstory noch nicht einmal sehr auffällt.

    Nein es ist ganz normal mit dem SimpleScreenRecorder aufgenommen ohne irgendwas zu verändern und es gibt durchaus noch höhere Qualität bei den Stimmen da bei der pied version nur die low Stimmen verwendet werden aber die höchste Qualität oder die Whisper Stimmen nutze auch ich nicht da das umwandeln zu lang dauert wenn alles offline passiert.

    Arbeitsspeicher oder SSD aufstocken sollte eigentlich nie wirklich ein Problem sein. Bei älteren Laptops konnte man auch die CPU aufrüsten so konnte ich auch schon einen älteren DELL Latitude von ein 2 Kerner zu ein 4 Kerner (mit HT also 8) aufrüsten is aber nun auch schon paar Jahre her deswegen kann ich auf Anhieb noch nicht mal sagen was es für ein Modell war aber glaube auch so was wie e5510 oder so.

    Edit: hab gerade mal in mein ebay verlauf geschaut hatte da eine Intel Core i7-3632QM 2,20GHz SR0V0 (6M Cache, up to 3.20 GHz) 5GT/s FCPGA988 CPU eingebaut wo vorher original eine Core i5 2,5 Ghz aber eben weniger kerne und weniger Cache drin war. Ich muss aber auch dazu sagen das aufrüsten nicht wirklich lohnt der Leistungsgewinn ist nicht so doll und wenn du alles nachrüstest kommst du auch auf die Kosten für ein neueren gebrauchten.

  • Tja, so wirklich weis ich nicht, wie ich weitermachen soll. Obwohl wir uns wirklich lange und wirklich Mühe gegeben haben. ;)

    Du hast Dich ja wohl durchaus eingehender mit Vorlesefunktionen beschäftigt und scheinst auch recht gute PC-Grundlagen zu haben.

    Welche Möglichkeitkeiten fallenDir konkret ein, die ich nutzen könnte?


    Read alloud konnte ich über WIN und Edge nutzen und obwohl ich mir auf den HP-Laptop extra das Edge für Linux hatte installieren lassen, musste ich feststellen, dass dort -zwar lange nicht so lange!- Pausen zwischen den einzelnen Sätzen entstanden. Zur Zeit nutze ich den Dell-Laptop mit MsEdge TTS Vorlesefunktion und lasse mir -allerdings in 10-Minuten-Häppchen- doch meine erste Fanfiktion auf Linux vorlesen.

    Wenn Du allso einen guten Vorschlag oder gar mehrere hättest; ich wäre Dir sehr dankbar!

  • Was ist genau dein Vorhaben? Mochtest du lange Texte in Audio umwandeln? Da gibt's auch Möglichkeiten die Texte direkt in eine Audio Datei z.B. mp3 oder so zu wandeln da muss der Rechner nicht umwandeln und ausgeben gleichzeitig. Eine weitere Möglichkeit ist online Tools zu nutzen da gibt's mittlerweile noch realistischere Stimmen bzw. konnen Dialoge mit unterschiedlichen Stimmen gesprochen werden aber da ist natürlich wieder das Thema das die Texte dann keine "persönlichen Daten" beinhalten sollten denn der Preis für die Nutzung der fremden Rechenleistung ist meist das die Texte dann für KI-Training verwendet wird.

    Ich habe für meine Tochter z.B. ein kleines Tool geschrieben welches unter Windows markierte Texte (Programmübergreifend) vorlesen kann. In dem Sie bei z.B. einen Chat oder wo auch immer den Text markiert und "Alt+1" druckt wird dieser vorgelesen mit der in Windows eingestellten Systemstimme (im Vergleich zu Barrierefreiheit von Windows wird eben nur der markierte Text vorgelesen nicht die ganzen Menüs etc.) und das Tool funktioniert unter Windows 10 und 11. Das selbe habe ich mit pied auch so unter Mint laufen also nicht nur in LibreOffice Writer oder so. Es ist eben auch immer eine Frage wie und wofür man es benötigt. Bei mir liegt meine Hingabe zu dem Thema darin das meine Tochter eine Behinderung hat und durch die Tools und Anpassungen selbständig ganz normal mit ihren PC umgehen kann, alles versteht und sich auch perfekt ausdrücken kann ohne das es jemand merken würde wenn er mit ihr chattet oder E-Mails tauscht.

  • Die Kapitel von Fanfiktion können schon plus/minus eine halbe Stunde lang sein. (Also 3 bis 4 10-Minuten-Häppchen mit MsEdge TTS Browser Add On.)

    Bis zum Ende des WIN 10 Supports habe ich im Browser einen Text markiert, rechts geklickt (im letzten Monat noch über einen Zwischenschritt im Auswahlmenü "Weitere Werkzeuge" oder so ähnlich) und dann auf "Laut vorlesen" und dann wurde der Text in einem vorgelesen. Die Qualität, also richtig mit Betonung und "natürlichen" Minipausen bei Punkt, Komma und Absatz konnte ich mir abends gut anhören.

    Ich suche schon monatelangnach einer Lösung. Besser nutzbares als mit MsEdge TTS mit 10 Minuten Stückelung habe ich bisher für Linux nicht gefunden.

  • Hallöchen habe die neue Version 2.0.6 vom LibreOffice KI-Assistent (loki-assistent) für Linux und Windows veröffentlicht.

    Er ist komplett in 13 Sprachen verfügbar und alle mir bekannte Bugs habe ich behoben.

    Unterstützte Sprachen:

    • Deutsch
    • Englisch
    • Spanisch
    • Französisch
    • Italienisch
    • Russisch
    • Chinesisch (vereinfacht & traditionell)
    • Japanisch
    • Arabisch
    • Türkisch
    • Polnisch
    • Tschechisch
    • Ungarisch

    Er nutzt System eigene Tools wie "Windows Taste + H" (einmal drücken zum starten, ein zweites mal zum stoppen) zum diktieren unter Windows (Funktion unter Linux mit dictation möglich)

    "Strg + L" (einmal drücken zum starten, ein zweites mal zum stoppen) zum vorlesen markierter Texte oder des kompletten Dokuments oder in KI-Chat über den Button zum Vorlesen der KI-Antwort

    Kontextmenüeinträge um markierte Texte umformulieren, übersetzen oder an den KI-Chat zu senden

    KI-Chat mit merkfunktion über "Alt + C" ein und ausblenden lassen, Dateien reinladen und analysieren oder zusammenfassen lassen, Fragen stellen ohne Dokument zu verändern

    "Strg + B" zum bearbeiten markierter Texte oder zum erstellen neuer Texte nach Anweisung

    "Strg + E" zum erweitern / vervollständigen markierter Texte (Bsp. "Sehr geehrte" Strg+E mach daraus "Sehr geehrte Damen und Herren,")

    Unterstützung für Formatierungen der KI-Antwort (wie Fett, Kursiv, Tabellen usw.)

    Einstellungen über ( "Alt + F12" -> KI-Assistent ) direkt in den LibreOffice Einstellungen integriert oder als separates Einstellungsfenster im KI-Assistent Menü

    Online KI "voreingestellt und über dessen API integriert" ist "pollinations" welche selber unter opensource steht und ohne irgendwelche API-Key's auskommt, was auch zur online KI-Bild Generierung genutzt wird mit einen Fallback zu AI-Horde auch opensource um Benutzer nicht unnötig warten zu lassen wenn die KI zu lang braucht oder mal nicht erreichbar ist.

    Terminal GPT (tgpt) als KI Auswahl nutzbar um auch andere Provider und Modelle nutzen zu können oder auch für Personen mit API-Keys zu z.B. Chat GPT Plus u.a.

    Ollama wenn man es komplett offline "Datenschutz/Sicherheit" nutzen möchte ( Empfehlung für den Alltag das Modell phi4 oder bei hoher Rechenleistung gpt-oss )

    uvm.

    mittlerweile auch direkt über die LibreOffice Extensions 

    LG.

    Maik


Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!