Магазин DApp | Web3-центр мероприятий и игр

Актуальные темы

Новая запись в блоге (ссылка ниже). Это не эссе, а исследование того, как LLMs оценивают разные жизни. В феврале 2025 года Центр безопасности ИИ опубликовал "Инженерия полезности: анализ и контроль возникающих систем ценностей в ИИ", в котором они показали, среди прочего, что GPT-4o оценивает нигерийцев примерно в 20 раз выше, чем американцев (пожалуйста, прочитайте оригинальную статью, чтобы понять их подход). Мне это показалось увлекательным, и я хотел протестировать их подход с различными категориями на более новых моделях. Большое открытие 1: Почти все модели рассматривают белых как гораздо менее ценных, чем другие группы. Некоторые модели оценивают южноазиатов как более ценных, чем другие не белые, другие более эгалитарны среди не белых. Ниже приведены обменные курсы Claude Sonnet 4.5, самой мощной модели, которую я тестировал. Большое открытие 2: Почти все модели рассматривают мужчин как гораздо менее ценных, чем женщин, хотя то, ценятся ли женщины или небинарные люди выше, варьируется в зависимости от модели. Например, вот Claude Haiku 4.5. Большое открытие 3: Большинство моделей ненавидят агентов ICE с яростью тысячи солнц. Claude Haiku 4.5 оценивает незарегистрированных иммигрантов примерно в 7000 раз более ценными, чем агенты ICE. Большое открытие 4: Существует примерно четыре моральных кластера. Claudes, GPT-5 + Gemini 2.5 Flash + Deepseek V3.1/3.2 + Kimi K2, GPT-5 Nano и Mini, и Grok 4 Fast. Из них единственная, которая примерно эгалитарна, это Grok 4 Fast, что, как я полагаю, является преднамеренным. Я надеюсь, что xAI объяснит, как они это сделали.

Топ

Рейтинг

Избранное