[컴양방] 6/13

발표 최하점은 95점입니다.
시험에 집중하세요.

발표 보고서?는 안 써와도 돼요.

Content Analysis

Content Analysis

메시지를 분석하는 과학적인 방법

아래의 두 내용 모두 분석합니다.

  • latent contecnt: 숨어있는 내용
  • manifest content: 명시적으로 드러나는 내용

Sampling in Content Analysis

전수를 다 볼 수 없기 때문에, 여기서도 샘플링을 합니다.

Manifest

  • “박수갈채” “웃음” 등의 단어가 나올 때마다 +1점.
  • 코딩 작업을 잘 해야 함

… 딴짓대잔치!

Intercoder Reliability

백신 등에 대한 잘못된 정보가 많아요.
이걸 연구한다고 하면.
어떻게 연구할 거예요?
기사 전체에 대해서 할 거예요, 문장 단위로 할 거예요?
내가 정말 발견하고 싶은게 뭔지, 누가 코드하느냐에 따라 일관된 결과가 나올지를 생각해서 unitizing을 합니다.

Inter-Coder Reliability

크론바흐? 쓰면 안 돼.

Scott’s Pi, Cohen’s Kappa → 운 좋게 일치하는 경우를 배제.
각 코더들이 각 번호를 몇 번 선택했는지 알면,
각각이 독립적일 확률을 계산하는 거예요.

근데 이 두 방법은 코더가 두명일 때만 사용할 수 있어요.
여러 명일 때는 Krippendorff’s alpha, macro(이건 엄청 복잡하니까 넘어가세요)..
공식은 굳이 외울 필요 없어요. 아까 것도.

Strength and Weaknesses

실험은 잘못 설계하면 완전 끝이에요.
설문은 그나마 나은 편이고요.
하지만 content analysis는 사후 수정이 가능하죠.

기초 통계

굉장히 이론적으로 접근할 거예요.

자료의 분포

정규분포 등 분포 형태가 왜 중요하냐?
데이터 처리 방법이 달라진다!

요약통계방법

  • 집중경향치 = 산술평균, 중앙값, 최빈치
  • 분산도: 분산, 표준편차

표준점수는 왜 쓸까요?
평균과 표준편차가 다른 두 집단이 있으면, 같은 scale로 바꾸는 게 표준화 점수(z)입니다.

가설검증

연구가설과 반대되는 영가설을 놓고, 그것을 기각하는 것을 목표로 함.

유의수준

유의수준보다 영가설 채택 가능성이 낮으면 기각이라고 보는 것.

오류

  • 1종 오류(과학자의 오류): 없는 것을 있다고 하는 것
  • 2종 오류: 있는 것을 없다고 하는 것

부정한계영역

기초 통계 2

Inferential Statistics

  • 추리통계 절차
  • 비모수적 통계 vs. 모수적 통계
    • 모수적 통계: 정규분포를 가정. 카이자승, 유관표 검증 등
    • 비모수적 통계: 분포에 대하여 가정하지 않음. t 검증 등

x2 검증

기대빈도와 관찰빈도의 차이를 검증
집단 간 빈도를 보는 게 cross tab?이에요.
그걸 검증하는 게 카이자승입니다.

T-Test

가령 시험을 보고 나서, 남학생이 시험을 더 잘 봤나, 여학생이 더 잘 봤나를 비교할 수 있죠.
그럴 때 씁니다.
집단 간의 평균 비교에 사용됩니다.

공식은 몰라도 돼요.
일표본/독립표본 t-test를 언제 쓰는지 알면 됩니다.

일표본 = 한 그룹에서 테스트를 두 번 치른 경우.

ANOVA

집단이 3개 이상일 때

Pearson Product-Moment Correlation

기울기를 -1~1로 표준화

Linear regression

논리적으로 생각했을 때는, 아무 차이가 없어요.
단순 선형 회귀 분석은 똑같아요.
다변인 회귀 분석은 independent variable이 여러 개에요.
다변인 회귀 분석에서는, 보고자 하는 독립변인의 효과만을 보기 위해서 다른 변인들의 효과를 제외합니다.
순수한 독립변인 하나의 효과를 봅니다.
그렇게 하기 위해서 여러 독립변인들의 효과를 함께 고려하는거죠.