Couldi 2024. 9. 8. 21:18
반응형

[내용 정리]

1. 데이터 분석의 목적과 알고자 하는 대상

데이터 분석의 목적

- 데이터 분석을 시작할때는 '구체적인 데이터 분석 목적을 정하는 것'이 중요한 첫 단계

ex) 신약의 효과 유무와 효과의 크기를 알고 싶다 / 소득과 행복도 사이에 어떤 관계가 있는지 알고 싶다 / 기온으로부터 올해 농작물 수확량을 예측하고 싶다.

알고자 하는 대상

- 데이터 분석의 목적을 정했다면, 다음으로는 '알고자 하는 대상'을 명확히 하는 것이 중요

2. 모집단

모집단을 생각하다

- 통계학에서 알고자하는 대상 전체 = '모집단'

- 데이터를 분석할 때는, 데이터 분석 목적과 알고자 하는 대상에 기초하여 직접 모집단을 설정해야함

- 알고자하는 대상이 전체일지라도, 실제로 데이터를 얻을 가능성이 없는 요소를 포함한 모집단은 적절하지 않음

'지금 알고자 하는 대상은 무엇인지', '무엇을 모집단으로 설정할 것인지'의 문제는 항상 중요하다.

모집단 크기

- 모집단에 포함된 요소(element)의 수 = 모집단 크기

  • 유한모집단
    • 모집단 중 한정된 요소만 포함한 것
  • 무한모집단
    • 모집단 중 포함된 요소의 개수가 무한한 것

표본조사

- 모집단의 일부를 분서갛여 모집단 전체의 성질을 추정 = 추론통계(inferential statistics)

  • 표본(Sample) : 추론 통계에서 조사하는 모집단의 일부
  • 표본추출(sampling) : 모집단에서 표본을 뽑는 것
  • 표본조사 : 표본을 이용해 모집단의 성질을 조사하는 것

표본크기

- 표본에 포함된 요소의 개수 = 표본크기(sample size)

- 표본크기는 모집단의 성질을 추정할 때의 확실성이나 가설검정의 결과에도 영향을 끼치기 때문에, 통계분석에 있어 중요한 요소 중 하나

[알아야 할 키워드]

  • 데이터 분석의 목적 → 알고자 하는 대상
  • 모집단
  • 모집단 크기
  • 유한모집단
  • 무한모집단
  • 표본조사
  • 추론통계
  • 표본
  • 표본추출
  • 표본조사
  • 표본크기

[리뷰]

깔끔하고 간단하게 모집단과 표본에 대한 설명을 나누어 놓았다. 설명의 방식이 간단하고 명료하여 마음에 든다.

반응형