[컴양방] 4/25

face Validity

Content Validity

Criterion Validity

나는 수능 성적이 나쁜데, 대학에 와서 보니 성적이 매우 좋음
→ 수능 시험이 나의 수학 능력을 엄밀하게 측정하지 못한다고 추정 가능.

measurement tool이 낸 답(criterion)이 실제 결과와 들어맞지 않으면 안 된다.

그러나 항상 정답이 존재하는 게 아니기 때문에, 이 유효성은 예외적으로 존재한다.
가령, 혈중알콜농도.
“얼마나 술을 마셨습니까?”라는 설문은 혈중알콜농도 측정기로 바로 측정할 수 있고,
이를 통해서 유효성을 검증 가능하다.

이때, 1. 즉시 결과를 확인할 수 있는 것과 2. 나중에 확인할 수 있는 것 두 가지로 나뉜다.

Construct Validity

Criterion Validity는 항상 존재하는 것이 아니기 때문에, Construct Validity가 중요합니다.
정답이 없는 상황에서 내 measurement가 어떻게 타당함을 보일까?

A. 가설을 세워서 입증 → 가장 핵심
B, C는 선택이에요

Sampling

왜 sampling을 할까요?
전부 관찰할 수 없기 때문이죠.
이 강의에서 가장 어려운 부분입니다.

전부 관찰할 수 없기 때문에 결정적이지 않고 확률적입니다.

Population의 element를 random selection 한다: 어떤 element가 sample에 들어갈 확률이 전부 같다.

Alf Landon for President

어디서 샘플링을 하냐에 따라서 통계의 에측 결과가 달라질 수 있다.

이 설문조사 당시, 전화를 갖고 있는 것은 잘 사는 사람들 뿐이었음.
따라서 ARS 조사는 잘 사는 사람들에 대한 편향 조사였음.

Tomas E.Dewey for President

Non-probability Sampling

probability sampling이 더 좋죠.
하지만 확률 표집이 불가능한 경우가 있습니다.

가령, 탈북민들 건강 문제처럼 sample frame이 없는 경우.
확률 이론에 근거하지 않은 표집을 하는 것.
눈에 닥치는대로 표집하는 겁니다.

  1. 편의 표집(haphazard sampling): 그냥 눈에 띄기 때문에 표집
  2. 의도 표집:
    보수 학생 집단 및 진보 학생 집단 간의 여론이 다른 것 같다.
    이걸 연구 하려면 보수적인 학생 및 진보적인 학생을 찾아야 해요.
    하지만 샘플링을 하려면 우선 누가 보수/진보적인지 알아야 하죠.
    그래서 우선 보수/진보적인 동아리에 가서 학생을 모집하는 거예요.
    1번의 경우, 아무 생각 없이 표집한 거죠. 달라요.
  3. Snowball sampling:
    샘플을 하나 구한 뒤, 그에게 다른 샘플을 추천받습니다.
    동성애 연구를 하고 싶어서 우선 homosexual인 사람을 찾아 연구합니다.
    다시 그에게 다른 성소수자를 소개받아 연구합니다.
    이렇게 되면 당연히 랜덤도 아니고 전체 집단을 연구하는 것도 아니겠죠.
  4. Quota sampling(할당 표집):
    젊고/늙고, 남/녀로 나눠서 4 그룹으로 나눕니다.
    여기에서 각 그룹이 전체 국민에서 차지하는 비율을 조사하고,
    그만큼만 샘플링을 합니다.
    확률적 표집은 아닙니다. 단지 비율만 맞추는 거예요.
    그렇기 때문에 bias되어있을 수 있습니다.

따라서 양적 연구에는 적합하지 않습니다.
exploration 정도의 목적으로만 사용 가능합니다.

Probability Sampling

  • 확률에 근거해서
  • 랜덤 표집
  • 아무리 잘 뽑아도 표집 오류는 있을 수 있음.
  • 하지만 오차 범위를 계산할 수 있다!

Sampling distribution

샘플의 크기에 따라서 샘플의 조합이 정해지게 되고,
이 샘플들의 평균 분포는 결정적이다.
이 때, 샘플 평균의 분포는 모집단 평균에서 더 높은 빈도를 지닌다.
샘플 크기가 클 수록 이 빈도는 더 커지게 된다.

이때 모집단이 정규분포를 이루는 경우 표본 평균도 정규분포를 이루고,…
신뢰구간을 구할 수 있죠.

으아아 이거 고등학교 꺼 아니냐~
으흑흑 집중 안돼애ㅐ

Systematic Sampling

순서가 있는지 잘 고려를 해야 잘 표집할 수 있어요.

Systematic vs Simple random

virtually same!
체계적으로 틀릴 수 있습니다.