Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

John B. Holbein
Phó Giáo sư Chính sách công, Chính trị, Giáo dục @UVAbatten
Tôi chia sẻ khoa học xã hội thú vị.
Các tác giả này muốn biết liệu các bà mẹ có phải đối mặt với sự phân biệt trong việc tuyển dụng hay không, ngay cả khi họ có trình độ tương đương với các ứng viên khác.
Vì vậy, họ đã thực hiện hai thí nghiệm.
Đầu tiên, một thí nghiệm trong phòng thí nghiệm: các tham gia viên đã đánh giá các cặp ứng viên xin việc giống hệt nhau, chỉ khác nhau ở tình trạng làm cha mẹ.
Sau đó, một nghiên cứu kiểm toán thực tế: họ đã gửi hơn 1.200 đơn xin việc đến các nhà tuyển dụng thực sự cho các công việc cấp đầu vào và trung cấp.
Họ đã ngẫu nhiên hóa xem các ứng viên là:
– Các bà mẹ (dựa trên việc tham gia vào PTA)
– Phụ nữ không có con (họ được liệt kê là tình nguyện trong một vai trò không liên quan đến cha mẹ)
– Các ông bố (dựa trên việc tham gia vào PTA)
– Đàn ông không có con (họ được liệt kê là tình nguyện trong một vai trò không liên quan đến cha mẹ)
Tất cả các ứng viên đều có trình độ giống nhau.
Sau đó, họ theo dõi các đánh giá, khuyến nghị lương và các cuộc gọi lại từ nhà tuyển dụng.
Họ phát hiện rằng:
Các bà mẹ được đánh giá là kém năng lực hơn và ít cam kết hơn so với các phụ nữ không có con có trình độ tương đương.
Các bà mẹ bị yêu cầu phải đáp ứng các tiêu chuẩn nghiêm ngặt hơn, được đề nghị mức lương thấp hơn và có khả năng bị tuyển dụng hoặc thăng chức thấp hơn nhiều.
Trong thí nghiệm thực địa, các nhà tuyển dụng thực sự đã gọi lại các phụ nữ không có con với tỷ lệ gấp hơn hai lần so với các bà mẹ.
Ngược lại, các ông bố không phải chịu hình phạt nào và đôi khi còn nhận được phần thưởng.
Tóm lại:
"Hình phạt cho việc làm mẹ" là có thật, có nguyên nhân và do sự phân biệt, không phải do sự khác biệt về khả năng.
Như các tác giả đã nói:
"Việc chứng minh là một người mẹ dẫn đến sự phân biệt đối xử với các bà mẹ trong việc tuyển dụng và lương."




22
“Những phát hiện này cung cấp bằng chứng rõ ràng rằng dữ liệu thu thập trên MTurk đơn giản là không thể tin cậy.”
Các nhà nghiên cứu đã tranh luận từ lâu về việc liệu dữ liệu khảo sát từ Amazon Mechanical Turk (MTurk) có thể được tin cậy hay không.
Bài báo này áp dụng một cách tiếp cận đơn giản để đánh giá chất lượng dữ liệu hiện đang được sản xuất bởi MTurk.
Tác giả đưa ra cho người trả lời các cặp câu hỏi mà rõ ràng là mâu thuẫn với nhau.
Ví dụ:
"Tôi nói rất nhiều" và "Tôi hiếm khi nói."
Hoặc:
"Tôi thích trật tự" và "Tôi khao khát hỗn loạn."
Nếu mọi người đang chú ý, việc đồng ý với một câu nên có nghĩa là không đồng ý với câu kia. Tối thiểu, hai câu trả lời không nên di chuyển cùng nhau.
Cùng một khảo sát chính xác được thực hiện trên ba nền tảng: Prolific, CloudResearch Connect và MTurk.
Trên Prolific và Connect, mọi thứ diễn ra bình thường: hầu hết các mục mâu thuẫn có tương quan âm, như lẽ thường tình dự đoán.
Tuy nhiên, trên MTurk, kết quả lại ngược lại.
Hơn 96% các cặp mục rõ ràng đối lập này có tương quan dương. Nói cách khác, nhiều người trả lời đưa ra các câu trả lời tương tự cho những tuyên bố mà thực sự mâu thuẫn với nhau.
Các tác giả sau đó thử những gì hầu hết các nhà nghiên cứu sẽ làm tiếp theo:
-hạn chế mẫu cho "công nhân MTurk có uy tín cao"
-ap dụng các kiểm tra chú ý tiêu chuẩn
-loại bỏ những người trả lời nhanh và những người trả lời thẳng.
Không có gì trong số đó giải quyết được vấn đề. Ngay cả sau khi sàng lọc nghiêm ngặt, nhiều mục mâu thuẫn vẫn có tương quan dương trên MTurk.
Hệ quả là nghiêm trọng: việc trả lời cẩu thả trên MTurk không phải là tiếng ồn hiếm; nó đủ hệ thống để đảo ngược dấu hiệu của các mối quan hệ và tạo ra kết quả trái ngược với những gì thực sự xảy ra.
Wow; điều này thật đáng lên án.


Jay Van Bavel, PhD04:26 9 thg 1
Chúng ta không nên tin tưởng dữ liệu thu thập trên MTurk nữa
Dự đoán của tôi là dữ liệu trực tuyến khác sẽ giảm chất lượng do LLMs. Điều này sẽ trở thành một cuộc khủng hoảng tồn tại cho các khoa học hành vi.

23
Hàng đầu
Thứ hạng
Yêu thích


