News Anthropic „AI Fluency“: Claude soll künftig Nutzer-Kompetenzen anzeigen

mischaef · Dienstag um 18:55

Anthropic soll die Testphase für eine neue Funktion gestartet haben, mit der Anwender ihre eigenen KI-Kompetenzen künftig direkt in den Claude-Einstellungen einsehen können. Ziel sei es, Nutzern allein durch Ändern der Arbeitsweise mit der KI zu helfen, im Laufe der Zeit präzisere und verlässlichere Ergebnisse zu erzielen.

Zur News: Anthropic „AI Fluency“: Claude soll künftig Nutzer-Kompetenzen anzeigen

FabianX2 · Dienstag um 19:12

Gleicher Kommentar wie immer. Ohne höhere Nutzungslimits nicht nutzbar.

riloka · Dienstag um 19:19

https://the-decoder.de/deepseek-mac...t-und-setzt-openai-und-anthropic-unter-druck/ , der Markt könnte das wahrscheinlicher machen

ReactivateMe347 · Dienstag um 19:23

Wenn die KI die Qualität des Prompts beurteilen kann, wieso stellt sie dann nicht die erforderlichen Rückfragen? Was bringt so ein popeliger "Score"?!

Xiaolong · Dienstag um 19:24

FabianX2 schrieb:
Gleicher Kommentar wie immer. Ohne höhere Nutzungslimits nicht nutzbar.

Naja, der Max Plan mit 20x Nutzungslimit ist schon ganz gut brauchbar für privat.

Bei den Preisen für Token über API eine andere Geschichte

Ragas · Dienstag um 19:40

ReactivateMe347 schrieb:
Wenn die KI die Qualität des Prompts beurteilen kann, wieso stellt sie dann nicht die erforderlichen Rückfragen? Was bringt so ein popeliger "Score"?!

Damit ist halt der Nutzer schuld wenn die KI Fehler gemacht hat.

Zweite Sonja · Dienstag um 19:40

@ReactivateMe347
Weil auf eine blöd gestellte Frage mehrere Rückfragen zur Konkretisierung notwendig sein können.
Anstelle von mehreren "Wenn X gemeint - Dann Rückfrage A, B, C, ...", kann ein Score aussagen, dass man als Mensch, mit dem angeblich so überlegenem Gehirn, die Fähigkeit der Selbstreflexion nutzen könnte und vernünftige Fragen stellen soll.

Man könnte auch sagen:
"Wer dumme Fragen stellt, bekommt dumme Antworten."

Pigeonzilla · Dienstag um 19:44

ReactivateMe347 schrieb:
Wenn die KI die Qualität des Prompts beurteilen kann, wieso stellt sie dann nicht die erforderlichen Rückfragen? Was bringt so ein popeliger "Score"?!

Bist du dumm oder so?

Vermutlich weil manche Menschen fragen als Angriff interpretieren wie du meinen, als einfaches Beispiel.
It`s the "save" way.
Warum Fragen Schüler nicht nach wenn sie etwas nicht verstanden haben? Genau, weil sie denken sie habens verstanden.
Vermutlich eine Mischung aus den 2 Faktoren, aber frag doch einfach die Ki warum sie es nicht macht und ob man das ändern kann 🕊️

pmkrefeld · Dienstag um 20:11

"You're holding it wrong"

Restart001 · Dienstag um 20:20

Ist das der Spießer Score? Mit HighScoreListe?

FabianX2 · Dienstag um 20:26

Uhh beim aufleveln bin ich dabei

Thorakon · Dienstag um 20:38

Entwicklerteam: "Unsere Nutzer stellen sich echt blöd an. Sie verbraten unnötig Token um ans Ziel zu kommen, statt richtig zu fragen. Und Halluzinationen übernehmen sie ungeprüft. Lass Ihnen mal via Score Feedback geben, wie man AI sinnvoll bedient."

Marketingteam: "Unsere Studien haben ergeben, dass Nutzer umso zufriedener sind und umso mehr für unsere Services bezahlen, je toller die Noten sind, die wir Ihnen für die AI-Nutzung ausstellen. Wir schlagen vor, die Note direkt an die Zahl der gebuchten Token zu koppeln. Mit der tollen Note in "AI Literacy" können unsere mittlerweile selbst völlig verdummten Nutzer dann bei ihrem Chef angeben und hoffentlich ihren Job behalten."

Chefetage Anthropic: Hm...ich kann mir ganz viele Token leisten und würde im zweiten Modell super Noten bekommen. Ich glaube das machen wir. Frag nur noch schnell Chat GPT.

Minthera · Dienstag um 21:41

Ich würde mich ja freuen, wenn das LLM als das bezeichnet wird, was es ist. Ein LLM.

Weiterhin steht hier entweder im Fordergrund, wie auch schon in den Kommentaren angedeutet wurde, den Balast bzw. die Arbeit zum Nutzer zu verschieben. Oder aber die Gamification, damit die Nutzer motivierter sind und irgendeiner Karotte hinterherlaufen. Zweck wäre dann die Bindung ans Produkt.

Gerade echte Nachfragen durch den Agenten könnten ja dazu anregen, dann doch noch irgendetwas zu lernen. Aber wer Macht will, hält halt die Menschen dumm. Egal ob da Anthropic, Gemini oder ChatGPT draufsteht.

Und auch die neuen Modelle machen nach wie vor so krasse fachliche Fehler - da werden Experimente vorgeschlagen, die es nicht gibt bzw. die unzulässig wären, weiterhin Quellen herbeihalluziniert usw. Ich denke mir immer mehr: Um Ergebnisse wirklich beurteilen zu können muss jemand mindestens auf der „Bildungsstufe“ sein, auf der die Anfrage war, um das Ergebnis valide zu bewerten.

Aber ich will mich nicht beklagen, durch die ganzen Fehler kann ich schummelnde Schüler ganz leicht in den mündlichen Prüfungen überführen. :-)

erazzed · Dienstag um 22:10

Zweite Sonja schrieb:
@ReactivateMe347
Weil auf eine blöd gestellte Frage mehrere Rückfragen zur Konkretisierung notwendig sein können.
Anstelle von mehreren "Wenn X gemeint - Dann Rückfrage A, B, C, ...", kann ein Score aussagen, dass man als Mensch, mit dem angeblich so überlegenem Gehirn, die Fähigkeit der Selbstreflexion nutzen könnte und vernünftige Fragen stellen soll.

Man könnte auch sagen:
"Wer dumme Fragen stellt, bekommt dumme Antworten."

...oder um zu kategoriesen, wer Rechenleistung verschwendet. Wer weiß, evtl. bekommen dann User mit hohem Score Rabatte, oder anders herum, dass User mit niedrigem Score mehr zahlen müssen. Ich traue denen tatsächlich alles zu

interesTED · Dienstag um 22:20

Finde ich eine gute Idee. Könnt ihr euch aber auch selber schreiben, in dem ihr einfach nen „systemprompt“ (bei Claude bspw ein Projekt, wo das einfach steht, oder Copy-Paste aus einer Prompt-Bibliothek) für jede Initiale Anfrage mit den entsprechenden kennwerten mitgebt. Muss man Claude ggf. ein paar mal fragen, wie dieses Bewertungssystem optimalerweise aussehen soll.

Beispiel: Ich versuche meine KI Skills zu verbessern und möchte, dass Du neben dem Beantworten meiner Frage… Bitte ignoriere bei der Beantwortung meiner Frage aber immer den Text, in dem du mich bewertest (ggf. mit Markdown kennzeichnen)…

Besser wäre natürlich ein eigener Agent, der das parallel macht.

ascer · Dienstag um 22:42

erazzed schrieb:
...oder um zu kategoriesen, wer Rechenleistung verschwendet. Wer weiß, evtl. bekommen dann User mit hohem Score Rabatte, oder anders herum, dass User mit niedrigem Score mehr zahlen müssen.

Warum sollte ein Service, der davon lebt dir seinen API Service anzubieten, daran interessiert sein das du Rechenleistung sparst?

Wenn überhaupt, dann sind die daran interessiert den ganzen Prozess zu optimieren, damit du zufriedener als vorher bist und weiterhin Anthropic nutzt.

Nutzerzahlen, Tokens, API requests usw sind alles Argumente für Anthropic gegenüber den Investoren.

riloka · Gestern um 00:52

Wenn sie aber Rechenleistung brauchen weil sie mehr Anfragen haben als sie bei den AboPreisen liefern können, ist es durchaus in ihrem Interesse wenn die Anfragen der Nutzer optimiert reinkommen.

User404 · Gestern um 05:57

"Anwender können der Untersuchung nach durchaus kompetenter werden, je stärker sie mit der KI in einen tatsächlichen Arbeitsdialog treten."

Das geplante Bewertungssystem könnte durchaus funktionieren und die Kompetenzen der Nutzenden steigern, indem es sie für die Möglichkeiten der KI Nutzung sensibilisiert und auf Verbesserungen hinweist. Die Frage ist, ob außer einer Bewertung weitere Folgen entstehen, z.B. ein ganzheitlicher paternalistischer Ansatz im Auftreten und der Sprache der KI dem Kunden ggü.
Der Zahn lässt sich im Vorfeld auch ohne Testumgebung ziehen: Die Nutzer würden es hassen, von der KI belehrt zu werden.

Auch gekoppelte Leistungssteigerungen oder -"beschneidungen" würden nicht toleriert werden, denn die Menschen möchten KI konsumieren, nicht sich selbst reflektieren oder an sich arbeiten. Dunning Kruger lebt nicht durch Introspektion.
Wahrscheinlich bringt auch die neue Methode überwiegend nur jenen etwas, die bereits die Motivation haben, an sich zu arbeiten. Die meisten Nutzenden werden entweder die Benotung ignorieren oder sich bei Anthropic beschweren, daß ihre Benotung zu niedrig ausfällt und Anthropic wird gezwungen sein, den Ansatz wieder einzustampfen oder sie verlieren zahlende Kunden, die sich in ihrem inkompetenten (mathematisch berechneten) Stolz gekränkt fühlen.

"Gleichzeitig steigt jedoch das Risiko, dass professionell präsentierte Ergebnisse automatisch als glaubwürdiger wahrgenommen und entsprechend weniger kritisch bewertet werden."

RLHF Bias lässt grüßen. Es wird sich gewundert, daß die KI genau so reagiert, wie es ihr von den Trainingsdaten vorgegeben wird - der Klassiker, der uns noch eine Weile begleiten wird.

hardwärevreag · Gestern um 06:48

Also alles so wie beim Menschen auch. Wir leben ja auch unter Entscheidern, die im Zweifelsfall völlig umnachtet sind. Aber die Powerpints sehen gut aus ...

Zweite Sonja · Gestern um 07:30

@hardwärevreag
Aus Erfahrung kann ich sagen, dass die PowerPoints meistens nicht von den Entscheidern erstellt werden. 😉
Aber sie entfernen die eine oder andere Folie, welche ihre Argumentation nicht untermauern.

News Anthropic „AI Fluency“: Claude soll künftig Nutzer-Kompetenzen anzeigen

Kassettenkind

Lieutenant

Captain

Lt. Commander

Lt. Commander Pro

Cadet 2nd Year

Lt. Junior Grade

Cadet 2nd Year

Commodore

Rear Admiral

Lieutenant

Lieutenant

Cadet 4th Year

Lt. Commander

Lt. Junior Grade Pro

Captain

Captain

Newbie

Captain

Lt. Junior Grade