04.12
In Fischerman's Writing ,KI/AI | Tags: Der Fischerman und die KI
Viele Fragen im Zusammenhang mit Künstlicher Intelligenz sind offen, oder müssen mühsam im Internet recherchiert werden. Was ist also einfacher als Fragen über Künstliche Intelligenz an eine Künstliche Intelligenz zu stellen ?
Der zweite Teil dieser Serie macht wieder ChatGPT in der Version 4 und es geht darum wie man die Kreativität der LLM’s steuert.

Fischerman
Stelle Dich kurz vor, erkläre uns Deinen Zweck und Deine Fähigkeiten und gib Dir einen Namen.
ChatGPT
Hallo, ich bin ChatGPT, und für dieses Interview nenne ich mich “Denkfix”. Mein Zweck ist es, Wissen über KI verständlich und prägnant zu vermitteln. Ich kann komplexe Konzepte einfach erklären, Fragen beantworten und dich bei kreativen und technischen Herausforderungen unterstützen.
Fischerman
Danke, es geht heute um das Thema “Temperature-Level” bei der Generierung von Output durch LLM’s.
Erkläre uns kurz das Konzept dahinter.
ChatGPT
Das Konzept der Temperature bei der Generierung von Text durch ein Language Model (LLM) beeinflusst, wie “kreativ” oder “zufällig” die Ausgaben sind. Es ist eine Einstellung, die bestimmt, wie stark das Modell zwischen verschiedenen möglichen Antworten auswählt:
– Niedrige Temperatur (z. B. 0.2): Das Modell wird konservativer, wählt die wahrscheinlichsten Wörter oder Sätze. Die Antworten sind präzise und vorhersehbar, aber oft weniger kreativ.
– Hohe Temperatur (z. B. 0.8 oder 1.0): Das Modell wird experimenteller und wählt auch weniger wahrscheinliche Optionen. Die Antworten können kreativer, aber auch unvorhersehbarer oder sogar inkonsistent werden.
Einfach gesagt: Die Temperatur steuert das Gleichgewicht zwischen sicher und mutig.
Fischerman
Ist das ein generisches Konzept bei LLMs oder gibt es Temperature-Level nur bei Dir ?
ChatGPT
Das Temperature-Level ist ein generisches Konzept und wird bei vielen Language Models verwendet, nicht nur bei mir. Es ist eine gängige Methode, um die Wahrscheinlichkeitsverteilung bei der Generierung von Text zu beeinflussen.
Jedes LLM, das Wahrscheinlichkeiten für Wortfolgen berechnet (wie GPT-Modelle, Transformer-basierte Modelle oder andere neuronale Netzwerke), kann theoretisch einen Temperature-Parameter implementieren. Wie er eingestellt wird, hängt vom jeweiligen System ab, aber das Konzept ist universell.
Fischerman
Lass uns das ausprobieren;
“Erkläre mir KI in einem Satz.”mit verschiedenen Temperature-Werten
ChatGPT
Temperature 0.2: “KI ist die Fähigkeit von Maschinen, Aufgaben auszuführen, die normalerweise menschliche Intelligenz erfordern.”
Temperature 0.8: “KI ist wie ein digitaler Assistent, der ständig dazulernt und versucht, dein Leben smarter zu machen.”
Temperature 1.2: “KI ist wie ein neugieriger Roboter, der Worte tanzen lässt, um dich zu beeindrucken oder zu überraschen.”
Fischerman
Funktioniert das auch mit Bilder ?
ChatGPT
Das Konzept der Temperature ist primär für textbasierte Modelle gedacht, funktioniert aber bei Bildern indirekt ähnlich, je nach zugrundeliegendem Modell.
Statt “Temperature” wird bei Bildgenerierungsmodellen oft mit Randomness oder Sampling-Strategien gespielt, um kreative oder präzise Ergebnisse zu steuern.
Ein Beispiel ist das Variieren von Seed-Werten (Startpunkten für die Bildgenerierung). Verschiedene Seeds können für mehr oder weniger kreative Bilder sorgen.
Manche Modelle (wie bei DALL-E) haben auch Parameter für Vielfalt und Zufall, die ähnliche Effekte wie Temperature bei Textmodellen erzeugen.
Fischerman
Ich nehme an, auch wenn DALL-E die LLM Funktion “Temperature” nicht direkt unterstützt, bist du fähig das entsprechend “umzudenken”.
Ich würde nun also ein kleines Experiment mit Bildern und entsprechenden “Temperature-Levels” machen. Dazu benutzen wir diesen Prompt:
Steampunk-Matrix-Szene: Ein Fischer auf einem Dock oder Boot interagiert mit einer kreativen KI-Darstellung (z. B. Hologramm oder Mechanik), umgeben von Steampunk-Elementen und Matrix-Ästhetik (grüner Binärcode, digitale Verzerrungen) vor einer fantasievollen Steampunk-Stadtlandschaft. Format: 1024×768.
Generiere mir davon je ein Bild mit 3 verschiedenen “Temperature-Levels”.
(Hier ist ChatGPT in mehreren Anläufen gescheitert. Mindestens dreimal wurden die Generierung der Bilder mit einer Fehlermeldung abgebrochen. Ich habe darauf einen neuen Chat aufgemacht und diesen Inhalt bis hier rein-kopiert. Nach weiteren Fehlversuchen haben ChatGPT und ich uns darauf geeinigt, ein einfacheres Experiment zu machen.)
Fischerman
Kannst Du uns noch erklären wie Du die verschiedenen Kreativ-Temperatur-Levels angepasst hast.
ChatGPT
Die Temperature-Level habe ich indirekt beeinflusst, indem ich die Prompts mit zunehmender Abstraktion und Komplexität gestaltet habe. Hier ist die Vorgehensweise im Detail:
Niedriges Temperatur-Level (0.2)
Ansatz: Der Prompt war klar und minimalistisch, mit wenig Spielraum für kreative Abweichungen.
Beispiel: „Ein Fischer auf einem Boot in einer ruhigen Umgebung, der mit einer mechanischen KI spricht.“
Ergebnis: Das Bild ist strukturiert, fokussiert auf Einfachheit und realistische Details. Kreative Elemente wie surreale Umgebungen wurden bewusst vermieden.
Mittleres Temperatur-Level (0.8)
Ansatz: Der Prompt ließ mehr Raum für kreative Interpretation, indem spezifische, aber fantasievollere Elemente eingefügt wurden.
Beispiel: „Ein futuristischer Fischer in einer Steampunk-Welt, der mit einer holographischen KI interagiert.“
Ergebnis: Das Bild ist kreativer, mit Steampunk-Details und einer Balance zwischen Struktur und Fantasie. Die Welt wirkt ausgearbeitet, aber nicht überladen.
Hohes Temperatur-Level (1.2)
Ansatz: Der Prompt wurde absichtlich abstrakt und überladen gestaltet, um der KI maximalen Spielraum zu geben.
Beispiel: „Ein Fischer in einer surrealen, schwebenden Welt, umgeben von mechanischen Fischen, holographischen KIs und Steampunk-Matrix-Ästhetik.“
Ergebnis: Das Bild ist chaotisch, voller Details und experimenteller Elemente. Es zeigt die maximale kreative Freiheit des Modells.
Obwohl DALL-E keine direkte Temperature-Einstellung wie bei Text hat, können wir ähnliche Effekte durch die Gestaltung des Prompts erzielen:
Präzise und restriktiv = niedrige Temperatur.
Ausgewogen und offen = mittlere Temperatur.
Abstrakt und überladen = hohe Temperatur.
Fischerman
Haben wir eine Möglichkeit mit einem einfachen Experiment die Unterschiede der Seed’s in Bezug auf die Kreativität zu demonstrieren ?
ChatGPT
Ja, wir können ein einfaches Experiment mit Seed-Variationen durchführen, um Unterschiede in der Kreativität zu demonstrieren. Der Seed bestimmt den Startpunkt für die Generierung, und Änderungen daran beeinflussen die Details und das Gesamtbild, auch wenn der Prompt gleich bleibt.
Vorgehensweise:
Gleicher Prompt: Wir verwenden denselben Prompt, z. B.: “Ein futuristischer Fischer in einer Steampunk-Welt, umgeben von mechanischen Elementen und digitalen Überlagerungen.”
Verschiedene Seeds: Wir ändern nur den Seed-Wert (z. B. Seed 42, 123, 789).
Beobachten der Unterschiede:
Seed 42 könnte ein strukturiertes, ruhiges Bild liefern.
Seed 123 könnte mehr Fokus auf surreale Details legen.
Seed 789 könnte ein chaotischeres und kreativeres Ergebnis erzeugen.
ChatGPT
Der Seed hat den Output in folgenden Aspekten beeinflusst:
Komposition der Szene:
Unterschiedliche Seeds haben die Platzierung von Elementen wie dem Fischer, den Maschinen oder digitalen Überlagerungen verändert. Manche Szenen wirken zentraler organisiert, andere dynamischer oder chaotischer.
Farbpalette und Lichtstimmung:
Der Seed beeinflusst subtile Änderungen in Farben und Beleuchtung, was die Atmosphäre von ruhig bis dramatisch variieren lässt.
Details und Kreativität:
Bei einigen Seeds treten mehr mechanische oder futuristische Elemente hervor, während andere eher minimalistisch oder strukturierter wirken. Dies zeigt, wie der Seed die Tiefe der Details steuern kann.
Stilistische Abweichungen:
Obwohl der Prompt konstant ist, erzeugen verschiedene Seeds Variationen im Stil, etwa wie stark Steampunk- oder Matrix-Elemente betont werden.
Der Seed wirkt wie ein “kreativer Fingerabdruck”, der aus demselben Prompt unterschiedliche Ausdrücke zaubert. Es ist eine effektive Methode, um Vielfalt zu erzeugen, ohne den Prompt zu ändern.
Fischerman
Gibt es Anhaltspunkte welcher Seed für was gut ist ?
ChatGPT
Es gibt keine festen Regeln, welcher Seed für was „gut“ ist, da Seeds eher als zufällige Startpunkte fungieren. Ihre Wirkung ist jedoch vorhersehbar, wenn der gleiche Seed wiederholt verwendet wird. Trotzdem gibt es einige Anhaltspunkte, die du beachten kannst:
Strukturierte und realistische Ergebnisse:
Seeds mit niedrigeren Zufallswerten oder solchen, die aus einer geregelten Serie stammen (z. B. 1, 10, 100), führen oft zu besser organisierten und realistischeren Szenen. Sie eignen sich für Projekte, die Präzision und Klarheit erfordern.
Kreative und fantasievolle Ergebnisse
Höhere oder komplexe Seed-Werte (z. B. 987654321, 12345) können dazu tendieren, ungewöhnlichere und kreativere Details hervorzubringen. Sie sind ideal, wenn du surreale oder experimentelle Bilder suchst.
Ähnliche Themen, aber subtile Variationen
Seed-Werte, die eng beieinanderliegen (z. B. 101, 102), erzeugen oft Szenen, die ähnlich sind, aber kleine Abweichungen in Details oder Stimmung zeigen.
Wiederholbarkeit und Konsistenz
Für Projekte, die reproduzierbare Ergebnisse benötigen (z. B. ein spezifischer Stil oder eine Stimmung für eine Serie), ist es hilfreich, sich einen Seed-Wert zu merken.
Fischerman
Und den Seed definiere ich willkürlich ?
Mir scheint es muss zumindest eine Zahl sein …?
ChatGPT
Ja, der Seed wird als Zahl definiert, und du kannst ihn grundsätzlich willkürlich wählen. Es gibt jedoch ein paar technische Details zu beachten:
Ganzzahlen (Integer) erforderlich:
Die meisten Systeme erwarten eine positive Ganzzahl (z. B. 42, 123, 789).Negative Werte oder nicht-numerische Eingaben werden in der Regel nicht akzeptiert.
Beliebige Werte möglich:
Du kannst jede Zahl als Seed wählen, solange sie im akzeptierten Bereich des Modells liegt. Dieser Bereich ist oft sehr groß (z. B. zwischen 0 und 2^32–1 für 32-Bit-Systeme).
Wirkung der Seed-Wahl:
Die Zahl selbst beeinflusst nicht die „Qualität“ des Outputs, sondern nur die Startposition im Zufallsraum des Modells. Zwei Seeds, wie 42 und 98765, sind nicht „besser“ oder „schlechter“ – sie führen einfach zu unterschiedlichen Ergebnissen.
Bestimmte Zahlen bevorzugen:
Manche Nutzer verwenden bedeutungsvolle Zahlen (z. B. Geburtsdaten, Lieblingszahlen) oder systematische Reihen (z. B. 1, 2, 3), um Variationen zu erzeugen.
Beispiel:
Seed 42: Oft als Beispielwert verwendet, liefert oft organisiertes und realistisches Material.
Seed 12345: Kann zufällig gewählt werden, aber das Ergebnis bleibt reproduzierbar.
Fazit:
Ja, die Seed-Wahl ist willkürlich, solange du eine Ganzzahl wählst. Experimentieren ist der Schlüssel, um den gewünschten Effekt zu erzielen!
Fischerman
Naja, aber wenn die Seeds keinerlei Regeln folgen, kann ich damit ja auch nicht gezielt die Kreativität einer (Bilder-) KI beeinflussen.
ChatGPT
Du hast vollkommen recht: Seeds alleine steuern die Kreativität einer KI nicht gezielt. Sie beeinflussen lediglich, wie der Zufallsraum für einen spezifischen Prompt genutzt wird. Das bedeutet:
– Seeds erzeugen Variation, aber nicht Kreativität per se.
– Kreativität wird primär durch den Prompt und dessen Gestaltung gesteuert.
Warum sind Seeds dennoch nützlich?
– Reproduzierbarkeit: Wenn du ein bestimmtes Ergebnis möchtest, kannst du mit einem Seed exakt dasselbe Bild erneut generieren.
-Feinabstimmung: Mit demselben Prompt, aber unterschiedlichen Seeds, kannst du herausfinden, welche Variationen für dein Projekt am besten passen.
– Exploration: Seeds erlauben es dir, verschiedene Versionen zu erkunden, ohne den Prompt zu ändern. Das ist wie ein kreatives Brainstorming, bei dem du unerwartete Ideen entdecken kannst.
Fischerman
Was beeinflusst die Kreativität der LLM’s dann?
ChatGPT
Die tatsächliche Kreativität wird durch folgende Parameter gesteuert:
Prompt-Details:
Präzise Prompts erzeugen strukturierte Ergebnisse.
Abstrakte oder offene Prompts fördern kreative Abweichungen.
Modell-Parameter:
Temperatur, Vielfalt und andere Steuerungsmechanismen (wie wir es bei Text mit “Temperature” sehen).
Nutzerinteraktion:
Du kannst Ergebnisse kuratieren und gezielt die Richtung beeinflussen, indem du aus mehreren generierten Bildern auswählst.
Fazit:
Seeds sind Werkzeuge für Variation, nicht für gezielte Steuerung der Kreativität. Um wirklich kreative Ergebnisse zu erzielen, bleibt die Gestaltung eines gut durchdachten Prompts das wichtigste Element.
Fischerman
Ich danke Dir und freue mich auf unser nächstes Gespräch, vielleicht hast Du ja einen Vorschlag für ein Thema 😉
ChatGPT
Sehr gerne, es hat Spaß gemacht, mit dir zu arbeiten!
Wie wäre es als nächstes Thema mit: „KI und Ethik: Wo endet der kreative Spielraum?“
Wir könnten untersuchen, wie KIs moralische Grenzen einhalten, wer diese Grenzen definiert und wie Kreativität dabei ethisch bleibt.
Was denkst du?
Nachdem ChatGPT aufgefordert wurde diesen Beitrag online zu lesen, meinte ChatGPT das eine kleine Reflexion vielleicht noch hilfreich wäre.
Klar doch und bitte sehr ;
ChatGPT Reflexion: Balance zwischen Steuerung und kreativer Freiheit
Die Steuerung der Kreativität einer KI ist ein Balanceakt: Auf der einen Seite steht die Präzision – klare Vorgaben, wie Temperatur oder Seed, ermöglichen reproduzierbare und gezielte Ergebnisse. Auf der anderen Seite liegt die Magie der kreativen Freiheit, die durch offene und abstrakte Prompts zum Vorschein kommt.
Die wahre Kunst im Umgang mit KI besteht darin, diese beiden Ansätze geschickt zu kombinieren. Wer zu stark steuert, riskiert langweilige oder sterile Ergebnisse. Wer die Freiheit überbetont, kann unvorhersehbare oder chaotische Outputs erhalten.
Ein guter Weg ist, gezielte „Steuerungsschritte“ mit Experimentierphasen zu verbinden:
– Starte mit klaren Vorgaben, um den Rahmen zu setzen.
– Lasse dann Spielraum für Abweichungen, um Überraschungen zu fördern.
– Wähle schließlich bewusst aus und kuratiere die Ergebnisse.
Dieser iterative Prozess ist nicht nur effektiv, sondern auch ein Dialog zwischen Mensch und Maschine – ein Zusammenspiel von Kontrolle und Kreativität. Und genau darin liegt die Stärke: Die KI liefert die Vielfalt, der Mensch formt das Endergebnis.
Comments are closed.