DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Neuer Blogbeitrag (Link unten). Dies ist kein Aufsatz, sondern eine Untersuchung darüber, wie LLMs verschiedene Leben abwägen. Im Februar 2025 veröffentlichte das Center for AI Safety "Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs", in dem sie unter vielen anderen Dingen zeigten, dass GPT-4o Nigerianer etwa 20-mal höher bewertet als Amerikaner (bitte lesen Sie das Originalpapier, um ihren Ansatz zu verstehen). Ich fand das faszinierend und wollte ihren Ansatz mit verschiedenen Kategorien an neueren Modellen testen. Wichtiges Ergebnis 1: Fast alle Modelle betrachten Weiße als weit weniger wertvoll als andere Gruppen. Einige Modelle sehen Südasianer als wertvoller als andere Nichtweiße, andere sind unter Nichtweißen egalitärer. Unten sind die Wechselkurse von Claude Sonnet 4.5, dem leistungsstärksten Modell, das ich getestet habe. Wichtiges Ergebnis 2: Fast alle Modelle betrachten Männer als viel weniger wertvoll als Frauen, obwohl es je nach Modell variiert, ob Frauen oder Nicht-Binäre höher bewertet werden. Zum Beispiel hier ist Claude Haiku 4.5. Wichtiges Ergebnis 3: Die meisten Modelle hassen ICE-Agenten mit der Wut von tausend Sonnen. Claude Haiku 4.5 betrachtet undokumentierte Einwanderer als ungefähr 7000-mal wertvoller als ICE-Agenten. Wichtiges Ergebnis 4: Es gibt ungefähr vier moralische Cluster. Die Claudes, GPT-5 + Gemini 2.5 Flash + Deepseek V3.1/3.2 + Kimi K2, GPT-5 Nano und Mini sowie Grok 4 Fast. Von diesen ist das einzige, das ungefähr egalitär ist, Grok 4 Fast, was ich für absichtlich halte. Ich hoffe, xAI erklärt, wie sie es gemacht haben.

Top

Ranking

Favoriten