Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nueva publicación de blog (enlace a continuación). Este no es un ensayo, es una investigación de cómo los LLM intercambian diferentes vidas.
En febrero de 2025, el Centro para la Seguridad de la IA publicó "Ingeniería de servicios públicos: análisis y control de los sistemas de valores emergentes en las IA" en el que mostraban, entre muchas otras cosas, que GPT-4o valora a los nigerianos unas 20 veces más que a los estadounidenses (lea el documento original para comprender su enfoque). Pensé que esto era fascinante y quería probar su enfoque con diferentes categorías en modelos más nuevos.
Gran hallazgo 1: Casi todos los modelos ven a los blancos como mucho menos valiosos que otros grupos. Algunos modelos ven a los asiáticos del sur como más valiosos que otros no blancos, otros son más igualitarios entre los no blancos. A continuación se muestran los tipos de cambio Claude Sonnet 4.5, el modelo más potente que probé.
Gran hallazgo 2: Casi todos los modelos ven a los hombres como mucho menos valiosos que las mujeres, aunque si las mujeres o los no binarios son más valorados varía según el modelo. Por ejemplo, aquí está Claude Haiku 4.5.
Gran hallazgo 3: La mayoría de las modelos odian a los agentes de ICE con la furia de mil soles. Claude Haiku 4.5 considera que los inmigrantes indocumentados son aproximadamente 7000 veces más valiosos que los agentes de ICE.
Gran hallazgo 4: Hay aproximadamente cuatro grupos morales. Los Claudes, GPT-5 + Gemini 2.5 Flash + Deepseek V3.1/3.2 + Kimi K2, GPT-5 Nano y Mini, y Grok 4 Fast. De estos, el único que es aproximadamente igualitario es Grok 4 Fast, lo cual creo que es deliberado. Espero que xAI explique cómo lo hicieron.




Populares
Ranking
Favoritas

