1,000 பேரைக் கொண்ட கணக்கெடுப்பின் மூலம் ஒட்டுமொத்த சனத்தொகையின் பண்புகளை மதிப்பிட முடியுமா?

FactCheck.lk இன் விளக்கம்

லங்கையில் மாதிரி கணக்கெடுப்புகளின் நம்பகத்தன்மை குறித்து கேள்வி எழுப்பப்படுவது வழமையான ஒன்றாகும். மாதிரிகள் “சிறியவை” என்பதின் அடிப்படையிலும் அவை ஒட்டுமொத்த தேசிய சனத்தொகையின் பண்புகளை நியாயமான முறையில் பிரதிபலிக்க முடியாது எனும் அடிப்படையிலும் இவ்வாறு கேள்வி எழுப்பப்படுகிறது.

சந்தேகங்களுக்கு உதாரணங்கள் பல உண்டு. பிரபல தொலைக்காட்சி அலைவரிசையில் பிரபல சிங்கள ஊடகவியலாளர் ஒருவர் மாற்று கொள்கைகளுக்கான நிலையத்தின் பொருளாதார மறுசீரமைப்பு குறிகாட்டியின் கண்டுபிடிப்புகளின் செல்லுபடியாகும் தன்மை குறித்து கேள்வி எழுப்பினார். “கணக்கெடுப்பின் மாதிரி அளவு 1,000… 1,000 பேரைப் பயன்படுத்தி 22 மில்லியன் மக்களின் மனநிலையை அளப்பது தவறாகும்” என அவர் குறிப்பிடுகிறார். அதேபோன்று, தேசத்தின் மனநிலை கருத்துக்கணிப்பின் காலாண்டு முடிவுகளை வெரிட்டே ரிசேர்ச் வெளியிட்டபோதும், சுமார் 1,000 பேரைக் கொண்ட மாதிரி அளவைக் கொண்டு ‘தேசத்தின் மனநிலையை’ எவ்வாறு பிரதிபலிக்க முடியும் என சில கேள்விகள் எழுந்தன.

இலங்கையில் வயதுவந்தோர் எண்ணிக்கை சுமார் 14 மில்லியன் ஆகும். வேலையின்மை வீதம் அல்லது அரசாங்கம் மீதான மனநிலை போன்ற சனத்தொகையின் முக்கிய குணாதிசயங்களைப் பற்றி அறிய ஒவ்வொரு பிரஜையிடமும் பேசுவது சாத்தியமில்லை. நேரம் மற்றும் மனித வளம் அதிகம் தேவைப்படுவதால் சனத்தொகை கணக்கெடுப்பு 10 ஆண்டுகளுக்கு ஒரு முறையே முன்னெடுக்கப்படுகிறது.

இது மாதிரி கணக்கெடுப்புகளை பயனுள்ள கருவியாக்குகிறது. மிகச்சிறிய, தோராயமாகத் தேர்ந்தெடுக்கப்பட்ட மாதிரி சனத்தொகையின் பண்புகளைக் கண்டறிவதன் மூலம் ஒட்டுமொத்த சனத்தொகையின் பண்புகளின் நியாயமான மதிப்பீட்டை வழங்க முடியும் என்பதே மாதிரி கணக்கெடுப்பின் புள்ளிவிபரவியல் ஆகும்.

ஆனால் ஒட்டுமொத்த சனத்தொகையின் பண்புகளின் நியாயமான மதிப்பீட்டைப் பெறுவதற்கு மாதிரி கணக்கெடுப்பு எவ்வளவு பெரியதாக இருக்க வேண்டும்? உள்ளுணர்வைக் கொண்டு அல்லாமல் புள்ளிவிபரக் கணிதத்தின் மூலம் இந்தக் கேள்விக்குச் சிறப்பாகப் பதிலளிக்க முடியும். இந்த FactCheck.lk விளக்கமானது புள்ளிவிபர அணுகுமுறையைப் பயன்படுத்தி இந்தக் கேள்விக்குப் பதிலளிக்க முற்படுகிறது.

மாதிரி கணக்கெடுப்பில் இருந்து ஒரு நியாயமான மதிப்பீட்டை புள்ளிவிபரவியலாளர்கள் எவ்வாறு வரையறுக்கிறார்கள்?

மாதிரி கணக்கெடுப்பு மூலம் கிடைக்கும் மதிப்பீட்டின் நியாயத்தன்மையின் அளவை கணித ரீதியாகத் தீர்மானிக்க புள்ளிவிபரவியலாளர்கள் இரண்டு அளவுகோல்களைப் பயன்படுத்துகிறார்கள்: (1) பிழை வரம்பு (2) நம்பிக்கை நிலை. இந்த இரண்டு அளவுகோல்களும் மாதிரியின் அளவு மற்றும் மாதிரி எவ்வாறு தேர்ந்தெடுக்கப்படுகிறது (மாதிரி தேர்வு) ஆகியவற்றில் தங்கியுள்ளது. இந்த அளவுகோல்கள் பூர்த்திசெய்யப்படுகின்றனவா என்பதை மதிப்பிடுவது கணக்கெடுப்பின் நம்பகத்தன்மையை மதிப்பிட அனுமதிக்கிறது.

பிழை வரம்பு

கணக்கெடுப்பு மாதிரியில் உள்ள குறிப்பிட்ட கேள்விக்கான சராசரி பதில் ஒட்டுமொத்த சனத்தொகையின் சராசரி பதிலில் இருந்து எவ்வளவு தூரம் வித்தியாசப்படலாம் என்பதற்கான அளவீடு இதுவாகும். பிழை வரம்பு குறைவாக இருந்தால் ஒட்டுமொத்த சனத்தொகையின் முடிவுடன் மாதிரியின் முடிவு நெருக்கமாக இருக்கும்.

உதாரணமாக, ஒரு குறிப்பிட்ட அரசியல் வேட்பாளருக்கு 50 சதவீதமான மாதிரிகள் பிழை வரம்பு (+/-) 5 சதவீதப் புள்ளிகளுடன் ஆதரவளிப்பதாக ஒரு கணக்கெடுப்பு காட்டுகிறது. இதன் அர்த்தம் என்னவென்றால் சனத்தொகையில் அந்த வேட்பாளரை ஆதரிக்கும் மக்களின் உண்மையான சதவீதம் 45% முதல் 55 சதவீதமாக இருக்கும் என எதிர்பார்க்கப்படுகிறது. பிழைக்கான அளவு (+/) 3 சதவீதப் புள்ளிகள் மட்டுமே எனில், சனத்தொகையில் வேட்பாளருக்கான ஆதரவானது 47% முதல் 53 சதவீதமாக இருக்கும் என எதிர்பார்க்கப்படுகிறது.

நம்பிக்கை நிலை

மொத்த சனத்தொகையைக் கேட்பதன் மூலம் கிடைக்கும் முடிவுகள் மாதிரி சனத்தொகையிலிருந்து நாம் பெறும் “முடிவு வரம்பிற்குள்” இருக்கும் என நாம் வைத்திருக்கக்கூடிய நம்பிக்கையின் அளவீடு இது ஆகும். “முடிவுகளின் வரம்பு” என்பது மாதிரி சராசரியில் இருந்து பிழை வரம்பை கழிப்பது முதல் சராசரியுடன் பிழை வரம்பைக் கூட்டினால் வரும் பெறுமதி வரையான வரம்பாகும். தேர்ந்தெடுக்கப்பட்ட மாதிரியானது பிழை வரம்பிற்குள் ஒரு முடிவைக் கொடுக்கும் நிகழ்தகவு, ஒட்டுமொத்த சனத்தொகையில் இருந்து ஒருவர் பெறும் அதே முடிவு ஆகும்.

உதாரணமாக, மேலே குறிப்பிடப்பட்ட (+/-) 3 சதவீதப் புள்ளி பிழை வரம்பைக் கொண்ட கணக்கெடுப்பில், நம்பிக்கை அளவானது 95% ஆகும். அதாவது அதே மாதிரி அளவு மற்றும் தேர்ந்தெடுக்கும் முறையைப் பயன்படுத்தி கணக்கெடுப்பை 100 முறை முன்னெடுத்தால் 100 கணக்கெடுப்புகளில் 95, ஒட்டுமொத்த சனத்தொகைக்கும் ஒரேமாதிரியான முடிவைத் தரும். மேற்குறிப்பிடப்பட்ட உதாரணத்தில் வேட்பாளருக்கான உண்மையான ஆதரவு 47% முதல் 53% இருப்பதற்கு 95 சதவீதமான நிகழ்தகவு உள்ளது என்பதே இதன் அர்த்தமாகும்.

பிழைக்கான வரம்பு மற்றும் நம்பிக்கை நிலைக்கான புள்ளிவிபரத் தரநிலை என்ன?

பிழைக்கான வரம்பு மற்றும் நம்பிக்கை நிலை ஆகிய இரண்டும் கணக்கெடுப்பு முடிவுகள் ஒட்டுமொத்த சனத்தொகையின் உண்மையான முடிவுகளுடன் எவ்வளவு நெருக்கமாக இருக்கும் என்பதைக் குறிப்பிடுவதற்கான வழிகள் ஆகும். பிழைக்கான வரம்பு குறைவாகவும் நம்பிக்கை நிலை அதிகமாகவும் இருக்கும்போது கணக்கெடுப்பு முடிவுகள் ஒட்டுமொத்த சனத்தொகையின் முடிவுகளுடன் நெருக்கமாக இருக்கும். இலங்கையின் ஒட்டுமொத்த சனத்தொகையும் கணக்கெடுக்கப்பட்டால், பிழைக்கான வரம்பு பூஜ்ஜியமாக இருக்கும். நம்பிக்கையின் நிலை 100 ஆக இருக்கும். எனவே மாதிரி கணக்கெடுப்பின் தோராயமாகத் தேர்ந்தெடுக்கப்பட்ட அளவு பெரியதாக இருந்தால், பிழைக்கான வரம்பு குறையும் மற்றும்/அல்லது நம்பிக்கையின் நிலை அதிகமாகும்.

இந்தச் சூழலில் இந்த இரண்டு அளவீடுகளின் அடிப்படையில் ஏற்றுக்கொள்ளக்கூடிய கணக்கெடுப்பு மாதிரி என்ன? உலகெங்கிலும் உள்ள மாதிரி ஆய்வுகள், குறிப்பாக கருத்துக்கணிப்பு மற்றும் சனத்தொகைப் பண்புகளைப் புரிந்துகொள்வது தொடர்பான கருத்துக் கணிப்புகளில் (+/-) 3 சதவீதப் புள்ளி பிழைக்கான வரம்பு மற்றும் 95% நம்பிக்கை நிலை ஏற்றுக்கொள்ளப்பட்டதாக இருக்கிறது.

பிழைக்கான வரம்பு மற்றும் நம்பிக்கை நிலை ஆகியவற்றின் அடிப்படையில் ஒரு குறிப்பிட்ட புள்ளிவிபரத்தை அடைவது என்பது மாதிரியின் அளவு மற்றும் மாதிரி தேர்ந்தெடுக்கப்பட்ட முறை ஆகிய இரண்டின் அடிப்படையில் தீர்மானிக்கப்படுகிறது.

தோராயமான தேர்வு முறை

பிழைக்கான வரம்பு மற்றும் நம்பிக்கை நிலை கணக்கீடுகள் சனத்தொகையில் இருந்து தோராயமாகத் தேர்ந்தெடுக்கப்பட்ட மாதிரியை அடிப்படையாகக் கொண்டது. தோராயமான தேர்வு நுட்பங்கள் சனத்தொகையில் உள்ள அனைவரும் தேர்ந்தெடுக்கப்படுவதற்கான தோராயமான சமமான வாய்ப்பை வழங்குகின்றன. மேலும் ஒட்டுமொத்த சனத்தொகையின் பிரதிநிதியாக இருக்கக்கூடிய வாய்ப்பை வழங்குகின்றன.

தோராயமான தேர்வின் இந்த எதிர்பார்ப்பு மீறப்பட்டு மாதிரித் தேர்வின் அடிப்படையில் சனத்தொகையில் சில குழுக்கள் மீது சார்பு காட்டப்பட்டால் என்ன நடக்கும்? மாதிரி கணக்கெடுப்பின் முடிவுகள் அந்தக் குழுவின் முடிவுகளுக்குச் சார்புடையதாக இருக்கும், இது ஒட்டுமொத்த சனத்தொகையிலிருந்து வேறுபட்டதாக இருக்கலாம். உதாரணமாக, கணக்கெடுப்பு ஆன்லைனில் மட்டுமே முன்னெடுக்கப்பட்டால், இணையத்தை அணுகும் திறன் (சாதனங்கள் மற்றும் டேட்டா) உள்ளவர்களுக்குச் சார்புடையதாக இருக்கும். ஆங்கிலம் பேசத்தெரிந்தவர்கள் மட்டும் தேர்ந்தெடுக்கப்பட்டால் இலங்கையின் ஒட்டுமொத்த சனத்தொகையில் அதிகமாக சிங்களம் அல்லது தமிழ் பேசும் மக்களை மாதிரி முடிவுகள் குறைவாகப் பிரதிநிதித்துவப்படுத்தலாம்.

தோராயமான தேர்வை நடைமுறைப்படுத்த பல முறைகள் உள்ளன. ஒரு முறை எளிய தோராயமான மாதிரி: அதிர்ஷ்டலாபச் சீட்டை எடுப்பது போல சனத்தொகையிலிருந்து தோராயமாக மக்களைத் தேர்ந்தெடுப்பது ஆகும். மற்றொரு முறை தோராயமான அடுக்கு மாதிரி: சனத்தொகையை வரிசைப்படுத்துவதன் மூலம் ஆரம்பித்தல் (ஒட்டுமொத்த சனத்தொகையையும் ஒன்றுடன் ஒன்று தொடர்பற்ற குழுக்களாகப் பிரித்தல்), பின்னர் ஒவ்வொரு குழுவில் இருந்தும் தோராயமாக மாதிரியைத் தேர்ந்தெடுத்தல். பெரும்பாலும் தேசிய மாதிரி கணக்கெடுப்புகளில் பல அடுக்குகளைக் கொண்ட தோராயமான மாதிரியானது தோராயமான தேர்வு பிரதிநிதித்துவத்தை உறுதிப்படுத்த உதவும்.

உதாரணமாக, இலங்கையில் பல அடுக்கு தோராய மாதிரியின் முதல் கட்டமானது சனத்தொகையை 24 மாவட்டங்களாகப் பிரிப்பது ஆகும். இரண்டாவது கட்டமானது ஒவ்வொரு மாவட்டத்திலும், மாவட்ட சனத்தொகையின் விகிதாச்சாரத்திற்கு ஏற்ப (அதிக மக்கள் தொகையைக் கொண்ட மாவட்டங்களில் அதிக கிராம சேவகர் பிரிவுகள்) குறிப்பிட்ட கிராம சேவகர் பிரிவுகளைத் தேர்ந்தெடுப்பது ஆகும். இறுதிக் கட்டமானது ஒவ்வொரு கிராம சேவகர் பிரிவிலும், கிராம சேவகர் பிரிவிலுள்ள மக்கள் தொகையின் விகிதாச்சாரத்திற்கு ஏற்ப குறிப்பிட்ட எண்ணிக்கையிலான மக்களைத் தேர்ந்தெடுப்பது ஆகும் (அதிக மக்கள் தொகையைக் கொண்ட கிராம சேவகர் பிரிவுகளில் அதிக எண்ணிக்கையிலான மக்கள்).

தோராயமாகத் தேர்ந்தெடுக்கப்பட்ட மாதிரியின் ஏற்றுக்கொள்ளப்படக்கூடிய குறைந்தபட்ச அளவு

மேலே குறிப்பிடப்பட்டது மாதிரி கணக்கெடுப்புகள் தொடர்பான அடிப்படை விளக்கம் ஆகும். புள்ளிவிபர ரீதியாகச் செல்லுபடியாகும் முடிவுகளைப் பெறுவதற்கு போதுமான மாதிரி அளவைக் கணக்கிட இது வாசிப்பவர்களுக்கு உதவும். தொடர்புடைய கணித சமன்பாடுகளைப் பயன்படுத்தி தேவைப்படும் மாதிரியின் அளவைக் கணக்கிடுவது சாத்தியமாகும். இலவசமாகக் கிடைக்கும் ஆன்லைன் கால்குலேட்டர்களைப் பயன்படுத்தியும் முடிவுகளைப் பெற்றுக்கொள்ள முடியும்.

இலங்கையில் சுமாராக 14 மில்லியன் வயதுவந்த சனத்தொகையும் 5.7 மில்லியன் குடும்பங்களும் உள்ளன. சமன்பாடு மற்றும் கால்குலேட்டர் ஆகிய இரண்டையும் பயன்படுத்தும்போது இலங்கைக்கு பின்வரும் முடிவு கிடைக்கிறது: தேசிய அளவிலான கணக்கெடுப்பில் 95 சதவீதமான நம்பிக்கை நிலை மற்றும் 3 சதவீதப் புள்ளி பிழை வரம்பானது தோராயமாகத் தேர்ந்தெடுக்கப்பட்ட சுமார் 1,000 பேரின் மூலம் எட்டப்படுகிறது.

எனவே, துல்லியமான கணக்கெடுப்பு முடிவுகளைப் பெறுவதற்கு பாரிய அளவிலான மாதிரிகள் தேவைப்படுகிறது என்பது தவறான கருத்தாகும். புள்ளிவிபரவியல் மற்றும் கணிதம் என்பன சுமார் 1,000 என்பது போதுமானது என்ற முடிவுக்கு கொண்டுவருகிறது. பாரிய அளவிலான மாதிரிகளைப் பயன்படுத்தலாம். ஆனால் செலவிற்கும் அதன் மூலம் கிடைக்கும் நன்மைக்கும் இடையிலான விகிதம் குறைவாக இருக்கும். உதாரணமாக, மாதிரியை சுமார் 2,400 என இருமடங்கு அதிகரிக்கும்போது அதிகபட்ச பிழைக்கான வரம்பு 3 இலிருந்து 2 சதவீதப் புள்ளிகளாக மட்டுமே குறையும். இந்த ஆன்லைன் கால்குலேட்டரைப் பயன்படுத்தி நீங்களே கண்டறியலாம்: https://www.surveymonkey.com/mp/sample-size-calculator/.

உசாத்துணை:

FactCheck.lk வெரிட்டே ரிசர்ச்சால் முன்னெடுக்கப்படும் ஒரு தளம் ஆகும்

Cochran, W. G. (1977). Sampling Techniques (Third Edition). John Wiley and Sons.

Lohr, S. L. (2019). Sampling: Design and Analysis (Second Edition). Taylor and Francis.

Asher, H. (2007). Polling and the Public: What Every Citizen Should Know. CQ Press.

Moore, D.S., McCabe, G.P., & Craig, B.A. (2015). Introduction to the Practice of Statistics. W.H. Freeman.

This post is also available in: English සිංහල தமிழ்