Text generation Web UI

Pyrukar

Captain
Registriert
Jan. 2013
Beiträge
3.642
Hallo ich nutze seit einiger Zeit Text Generation Web UI und grundsätzlich tut die auch was ich von ihr möchte, aber ich habe einige Fragen und hoffe ihr könnt mir weiterhelfen oder zumindest einen Hinweis geben wo ich gezielter fragen kann. (Ich habe und möchte keinen Github account :) ).

1. Gibt es eine Möglichkeit beim Starten automatisch das zuletzt geladene KI Model zu laden? Es gibt die Möglichkeit ein Modell zu laden direkt wenn es im Dropdown ausgewählt ist aber nicht mit Start up der WebUI, soweit ich das sehe.

2. Es gibt die Funktion dass ich die WebUI im Netzwerk freigebe ... da kommt eine Warnmeldung dass damit direkt alles aus dem Internet zugreifbar ist (sein könnte) aber solange ich hinter meinem Router inkl. Firewall bin, kann doch niemand auf mein lokales Netzwerk zugreifen (solange ich nicht gerade eine Portfreigabe o.ä. vornehme), oder?

3. Irgendwie bekomme ich, wenn ich versuche Modelle zu laden oftmals eine Fehlermeldung ich Verwende derzeit z.B. nous-hermes-llama2-13b.Q5_K_M.gguf was erfolgreich lädt und wie gesagt tut was ich möchte. Aber das Modell ist inzwischen verhältnismäßig alt und es gibt neuere Versionen auf Huggingface ... Nur keine von denen lässt sich laden. Ebenso habe ich es noch nicht geschafft, ein einziges Modell zum laufen zu bringen, was meine GPU nutzt. (soweit ich es verstehe laufen .gguf Modelle grundsätzlich auf der CPU)
modelle die ich versucht habe zu laden sind z.B.
NousResearch_Hermes-2-Pro-Llama-3-8B; NousResearch_Hermes-3-Llama-3.1-8B; Hermes-3-Llama-3.1-8B.Q8_0.gguf
da ich ja mit dem Alten Modell des Selben Anbieters recht zufrieden bin.
Kann mir ggf jemand sagen, wo das Problem liegen könnte, dass diese Modelle nicht laden? (Die Fehermeldungen kann ich bei bedarf gerne nachliefern)

4. Hat jemand gute Erfahrungen gemacht mit einem Modell das 1. mit dem Programm (unter Windows) Fehlerfrei lädt und 2. Mit meinem System (5800x 32GB Ram, 3060 12GB) Ordentlich läuft? Ich nehme gerne Empfehlungen an. Ich nutze die KI hauptsächlich als Sparring Partner um private P&P RPG Geschichten zu entwickeln bzw. Charakteren mehr tiefe zu verleihen. Also gute Skills im kreative Geschichten aus Stichpunkten entwickeln wären Top. Coding oder Übersetzung nutze ich eher nicht.

gruß
Pyrukar
 
madmax2010 schrieb:
Vermutlich falsches Formart
Soweit ich es sehen kann, sollten die Formate unterstützt sein. Ich lade die Dateien auch durch den Internen Downloader herunter aber es ist kein unterschied.

aber vielleicht kann mir jemand ein Modell empfehlen das Problemos funktioniert. (und nicht 1 1/2 Jahre alt ist)
 
Zuletzt bearbeitet:
hmmm, also das mit dem Modell automatisch laden hat soweit funktioniert ... ich hab die Funktion in der Readme datei gefunden, das Thema ist also erledigt.

Anders sieht es jedoch mit der Lokalen Netzwerkfreigabe aus. ich habe die Entsprechende Funktion aktiviert und im cmd Fenster steht jetzt auch plötzlich eine andere URL. wobei die alte am PC immer noch lokal zu erreichen ist. (http://127.0.0.1:7860/ ist lokal zu erreichen und funktioniert. im cmd steht http://0.0.0.0:7860/)
wenn ich aber am Handy den browser nehme und egal welche lokale URL Eintrage bekomme ich keine Verbindung. Ich habe auch mal anstatt http://127.0.0.1 die im Router angezeigte 192.168.x.x:7860 eingegeben aber dennoch keine Verbindung bekommen... irgend eine Idee was ich falsch mache?

Da hier ja recht wenig rücklauf ist ... welche Lokalen Text KI Programme verwendet ihr denn so?
 
Gibts hier wirklich niemand der mir weiterhelfen kann?
 
@MechanimaL Laufen die beide auch als Lokaler server? bzw. kann ich damit Netzwerkfreigabe erteilen?
 
Hast du Firewall Freigabe eingerichtet? Schätze du musst noch Port 7860 freigeben
 
LasseSamenström schrieb:
Schätze du musst noch Port 7860 freigeben
Ich will doch nur im LAN damit arbeiten, ich möchte das nicht von außen erreichen.
 
Das ist ja auch nur für intern. Extern wird es erst nur, wenn du es in deinem Router nattest
 
@LasseSamenström Kannst du mir bitte etwas genauer erläutern, was ich einstellen muss? Ich weis wie ich ein Port Forwarding einstelle, aber das ist ja dafür da dass eine Netzwerkresource von Extern erreicht werden kann. Ich habe das z.B. mit meinem NAS so eingestellt.

Aber 1. Habe ich im Gegensatz zum NAS auf meinem Rechner ja eine Dynamische IP und 2. Möchte ich ja nicht ins Internet sondern nur ins Lan. und 3. Wundert mich ein bisschen, dass andere Port Basierte Systeme wie z.b. mein Bildgenerierungs Tool keine Probleme damit haben und direkt auf dem Handy auftauchen, sobald ich den Server am PC starte.
 
1727248813310.png

1727248842359.png


Weiter, weiter, Namen vergeben und fertig. Nur weil du ein Port am Rechner freigegeben hast, heißt das noch lange nicht, dass das Internet darauf zugreifen könnte. Das blockiert in dem Fall dein Router/Firewall
Damit können andere Geräte im gleichem Netzwerk eben auf diesen Port ihre Anfragen stellen
 
  • Gefällt mir
Reaktionen: MechanimaL
LasseSamenström schrieb:
Nur weil du ein Port am Rechner freigegeben hast
Sorry, da war mein Denkfehler ... Ich habe Portfreigabe gehört und sofort an eine Router einstellung gedacht ... :) danke für die Erklärung
 
Zurück
Oben