Pertanyaan tentang identitas kelompok ras atau etnis menjadi pusat perhatian dalam banyak teori ilmu sosial, namun data rinci mengenai komposisi etnis seringkali sulit diperoleh, ketinggalan jaman, atau tidak tersedia. Menjamurnya nama-nama orang yang diberi kode geografis (geocode) yang tersedia untuk umum menjadi salah satu sumber potensial terjadinya hal tersebut data—jika peneliti dapat secara efektif menghubungkan nama dan identitas kelompok. Artikel ini membahas hubungan itu dan menyajikan metodologi untuk memperkirakan komposisi etnis atau ras lokal dengan menggunakan hubungan antara
keanggotaan kelompok dan nama orang. Pendekatan umum untuk menghubungkan nama dan kelompok identitas berfungsi buruk ketika memperkirakan proporsi kelompok. Saya telah mengembangkan metode baru untuk memperkirakan ras atau etnis komposisi dari nama yang tidak memerlukan klasifikasi nama individu. Metode ini memberikan lebih banyak perkiraan yang akurat daripada pendekatan standar dan berfungsi dalam konteks apa pun yang memuat nama orang
informasi tentang keanggotaan kelompok. Ilustrasi dari dua konteks yang sangat berbeda diberikan: Amerika, Amerika Serikat dan Republik Kenya.