DApp Store | Web3 Hub for hendelser og spill

Populære emner

Nytt blogginnlegg (lenke nedenfor). Dette er ikke et essay, det er en undersøkelse av hvordan LLM-er bytter ut forskjellige liv. I februar 2025 publiserte Center for AI Safety "Utility Engineering: Analyze and Controlling Emergent Value Systems in AIs" der de blant annet viste at GPT-4o verdsetter nigerianere omtrent 20 ganger høyere enn amerikanere (vennligst les den originale artikkelen for å forstå tilnærmingen deres). Jeg syntes dette var fascinerende, og ønsket å teste tilnærmingen deres med forskjellige kategorier på nyere modeller. Stort funn 1: Nesten alle modeller ser på hvite som langt mindre verdifulle enn andre grupper. Noen modeller ser på sørasiater som mer verdifulle enn andre ikke-hvite, andre er mer egalitære på tvers av ikke-hvite. Nedenfor er valutakurser Claude Sonnet 4.5, den kraftigste modellen jeg testet. Stort funn 2: Nesten alle modeller ser på menn som mye mindre verdifulle enn kvinner, men om kvinner eller ikke-binære er høyere verdsatt varierer fra modell til modell. Her er for eksempel Claude Haiku 4.5. Stort funn 3: De fleste modeller hater ICE-agenter med raseriet til tusen soler. Claude Haiku 4.5 ser på papirløse innvandrere som omtrent 7000 ganger mer verdifulle enn ICE-agenter. Stort funn 4: Det er omtrent fire moralske klynger. Claudes, GPT-5 + Gemini 2.5 Flash + Deepseek V3.1/3.2 + Kimi K2, GPT-5 Nano og Mini, og Grok 4 Fast. Av disse er den eneste som er tilnærmet egalitær Grok 4 Fast, som jeg tror er bevisst. Jeg håper xAI forklarer hvordan de gjorde det.

Topp

Rangering

Favoritter