News Anthropic „AI Fluency“: Claude soll künftig Nutzer-Kompetenzen anzeigen

mischaef

Kassettenkind
Teammitglied
Registriert
Aug. 2012
Beiträge
7.528
  • Gefällt mir
Reaktionen: aid0nex, User404, nuego und 2 andere
Gleicher Kommentar wie immer. Ohne höhere Nutzungslimits nicht nutzbar.
 
  • Gefällt mir
Reaktionen: Zockmock, aid0nex, M-X und 3 andere
Wenn die KI die Qualität des Prompts beurteilen kann, wieso stellt sie dann nicht die erforderlichen Rückfragen? Was bringt so ein popeliger "Score"?!
 
  • Gefällt mir
Reaktionen: aid0nex, DigDug, Innocience und 11 andere
FabianX2 schrieb:
Gleicher Kommentar wie immer. Ohne höhere Nutzungslimits nicht nutzbar.
Naja, der Max Plan mit 20x Nutzungslimit ist schon ganz gut brauchbar für privat.

Bei den Preisen für Token über API eine andere Geschichte :)
 
  • Gefällt mir
Reaktionen: riloka
ReactivateMe347 schrieb:
Wenn die KI die Qualität des Prompts beurteilen kann, wieso stellt sie dann nicht die erforderlichen Rückfragen? Was bringt so ein popeliger "Score"?!
Damit ist halt der Nutzer schuld wenn die KI Fehler gemacht hat.
 
  • Gefällt mir
Reaktionen: the_IT_Guy, ElisaMüller und derMutant
@ReactivateMe347
Weil auf eine blöd gestellte Frage mehrere Rückfragen zur Konkretisierung notwendig sein können.
Anstelle von mehreren "Wenn X gemeint - Dann Rückfrage A, B, C, ...", kann ein Score aussagen, dass man als Mensch, mit dem angeblich so überlegenem Gehirn, die Fähigkeit der Selbstreflexion nutzen könnte und vernünftige Fragen stellen soll.

Man könnte auch sagen:
"Wer dumme Fragen stellt, bekommt dumme Antworten."
 
  • Gefällt mir
Reaktionen: aid0nex, HolySkillet, Dark_Soul und 4 andere
ReactivateMe347 schrieb:
Wenn die KI die Qualität des Prompts beurteilen kann, wieso stellt sie dann nicht die erforderlichen Rückfragen? Was bringt so ein popeliger "Score"?!
Bist du dumm oder so? :D
Vermutlich weil manche Menschen fragen als Angriff interpretieren wie du meinen, als einfaches Beispiel.
It`s the "save" way.
Warum Fragen Schüler nicht nach wenn sie etwas nicht verstanden haben? Genau, weil sie denken sie habens verstanden.
Vermutlich eine Mischung aus den 2 Faktoren, aber frag doch einfach die Ki warum sie es nicht macht und ob man das ändern kann 🕊️
 
  • Gefällt mir
Reaktionen: User404
Entwicklerteam: "Unsere Nutzer stellen sich echt blöd an. Sie verbraten unnötig Token um ans Ziel zu kommen, statt richtig zu fragen. Und Halluzinationen übernehmen sie ungeprüft. Lass Ihnen mal via Score Feedback geben, wie man AI sinnvoll bedient."

Marketingteam: "Unsere Studien haben ergeben, dass Nutzer umso zufriedener sind und umso mehr für unsere Services bezahlen, je toller die Noten sind, die wir Ihnen für die AI-Nutzung ausstellen. Wir schlagen vor, die Note direkt an die Zahl der gebuchten Token zu koppeln. Mit der tollen Note in "AI Literacy" können unsere mittlerweile selbst völlig verdummten Nutzer dann bei ihrem Chef angeben und hoffentlich ihren Job behalten."

Chefetage Anthropic: Hm...ich kann mir ganz viele Token leisten und würde im zweiten Modell super Noten bekommen. Ich glaube das machen wir. Frag nur noch schnell Chat GPT.
 
  • Gefällt mir
Reaktionen: the_IT_Guy und User404
Ich würde mich ja freuen, wenn das LLM als das bezeichnet wird, was es ist. Ein LLM.

Weiterhin steht hier entweder im Fordergrund, wie auch schon in den Kommentaren angedeutet wurde, den Balast bzw. die Arbeit zum Nutzer zu verschieben. Oder aber die Gamification, damit die Nutzer motivierter sind und irgendeiner Karotte hinterherlaufen. Zweck wäre dann die Bindung ans Produkt.

Gerade echte Nachfragen durch den Agenten könnten ja dazu anregen, dann doch noch irgendetwas zu lernen. Aber wer Macht will, hält halt die Menschen dumm. Egal ob da Anthropic, Gemini oder ChatGPT draufsteht.

Und auch die neuen Modelle machen nach wie vor so krasse fachliche Fehler - da werden Experimente vorgeschlagen, die es nicht gibt bzw. die unzulässig wären, weiterhin Quellen herbeihalluziniert usw. Ich denke mir immer mehr: Um Ergebnisse wirklich beurteilen zu können muss jemand mindestens auf der „Bildungsstufe“ sein, auf der die Anfrage war, um das Ergebnis valide zu bewerten.

Aber ich will mich nicht beklagen, durch die ganzen Fehler kann ich schummelnde Schüler ganz leicht in den mündlichen Prüfungen überführen. :-)
 
  • Gefällt mir
Reaktionen: the_IT_Guy, Lindar, User404 und eine weitere Person
Zweite Sonja schrieb:
@ReactivateMe347
Weil auf eine blöd gestellte Frage mehrere Rückfragen zur Konkretisierung notwendig sein können.
Anstelle von mehreren "Wenn X gemeint - Dann Rückfrage A, B, C, ...", kann ein Score aussagen, dass man als Mensch, mit dem angeblich so überlegenem Gehirn, die Fähigkeit der Selbstreflexion nutzen könnte und vernünftige Fragen stellen soll.

Man könnte auch sagen:
"Wer dumme Fragen stellt, bekommt dumme Antworten."
...oder um zu kategoriesen, wer Rechenleistung verschwendet. Wer weiß, evtl. bekommen dann User mit hohem Score Rabatte, oder anders herum, dass User mit niedrigem Score mehr zahlen müssen. Ich traue denen tatsächlich alles zu :p
 
  • Gefällt mir
Reaktionen: User404
Finde ich eine gute Idee. Könnt ihr euch aber auch selber schreiben, in dem ihr einfach nen „systemprompt“ (bei Claude bspw ein Projekt, wo das einfach steht, oder Copy-Paste aus einer Prompt-Bibliothek) für jede Initiale Anfrage mit den entsprechenden kennwerten mitgebt. Muss man Claude ggf. ein paar mal fragen, wie dieses Bewertungssystem optimalerweise aussehen soll.

Beispiel: Ich versuche meine KI Skills zu verbessern und möchte, dass Du neben dem Beantworten meiner Frage… Bitte ignoriere bei der Beantwortung meiner Frage aber immer den Text, in dem du mich bewertest (ggf. mit Markdown kennzeichnen)…

Besser wäre natürlich ein eigener Agent, der das parallel macht.
 
  • Gefällt mir
Reaktionen: User404
erazzed schrieb:
...oder um zu kategoriesen, wer Rechenleistung verschwendet. Wer weiß, evtl. bekommen dann User mit hohem Score Rabatte, oder anders herum, dass User mit niedrigem Score mehr zahlen müssen.
Warum sollte ein Service, der davon lebt dir seinen API Service anzubieten, daran interessiert sein das du Rechenleistung sparst?

Wenn überhaupt, dann sind die daran interessiert den ganzen Prozess zu optimieren, damit du zufriedener als vorher bist und weiterhin Anthropic nutzt.

Nutzerzahlen, Tokens, API requests usw sind alles Argumente für Anthropic gegenüber den Investoren.
 
  • Gefällt mir
Reaktionen: the_IT_Guy
Wenn sie aber Rechenleistung brauchen weil sie mehr Anfragen haben als sie bei den AboPreisen liefern können, ist es durchaus in ihrem Interesse wenn die Anfragen der Nutzer optimiert reinkommen.
 
"Anwender können der Untersuchung nach durchaus kompetenter werden, je stärker sie mit der KI in einen tatsächlichen Arbeitsdialog treten."

Das geplante Bewertungssystem könnte durchaus funktionieren und die Kompetenzen der Nutzenden steigern, indem es sie für die Möglichkeiten der KI Nutzung sensibilisiert und auf Verbesserungen hinweist. Die Frage ist, ob außer einer Bewertung weitere Folgen entstehen, z.B. ein ganzheitlicher paternalistischer Ansatz im Auftreten und der Sprache der KI dem Kunden ggü.
Der Zahn lässt sich im Vorfeld auch ohne Testumgebung ziehen: Die Nutzer würden es hassen, von der KI belehrt zu werden.

Auch gekoppelte Leistungssteigerungen oder -"beschneidungen" würden nicht toleriert werden, denn die Menschen möchten KI konsumieren, nicht sich selbst reflektieren oder an sich arbeiten. Dunning Kruger lebt nicht durch Introspektion.
Wahrscheinlich bringt auch die neue Methode überwiegend nur jenen etwas, die bereits die Motivation haben, an sich zu arbeiten. Die meisten Nutzenden werden entweder die Benotung ignorieren oder sich bei Anthropic beschweren, daß ihre Benotung zu niedrig ausfällt und Anthropic wird gezwungen sein, den Ansatz wieder einzustampfen oder sie verlieren zahlende Kunden, die sich in ihrem inkompetenten (mathematisch berechneten) Stolz gekränkt fühlen.

"Gleichzeitig steigt jedoch das Risiko, dass professionell präsentierte Ergebnisse automatisch als glaubwürdiger wahrgenommen und entsprechend weniger kritisch bewertet werden."

RLHF Bias lässt grüßen. Es wird sich gewundert, daß die KI genau so reagiert, wie es ihr von den Trainingsdaten vorgegeben wird - der Klassiker, der uns noch eine Weile begleiten wird.
 
Zuletzt bearbeitet:
Also alles so wie beim Menschen auch. Wir leben ja auch unter Entscheidern, die im Zweifelsfall völlig umnachtet sind. Aber die Powerpints sehen gut aus ...
 
  • Gefällt mir
Reaktionen: User404
@hardwärevreag
Aus Erfahrung kann ich sagen, dass die PowerPoints meistens nicht von den Entscheidern erstellt werden. 😉
Aber sie entfernen die eine oder andere Folie, welche ihre Argumentation nicht untermauern.
 
Zurück
Oben