데이터를 통계적으로 수집하고 정리하자

표본을 추출할 때 모집단을 대표하는 표본을 선택하는 것이 매우 중요합니다.

현직자가 했습니다. 코호트 분석도 중요하고, 특성이 있는 집단 분석도 중요한 것 같습니다.

통계 용어는 종종 영어가 더 직관적입니다. 하이브리드 방식을 선택하겠습니다.

정성적 데이터 간단한 샘플링 절차
(단순 무작위 샘플)
무작위로 무작위로 선택
계층화 된 샘플
(층화 샘플)
계층을 추가 모집단 정보로 나누어 계층별로 균등하게 추출
양적 데이터 계통발생학적 방법
(체계적 샘플링)
처음에는 작게 추출하고 같은 수만큼 추출하여 점차 크기를 늘려가세요.
식민지 추출
(클러스터 샘플링)
여러 기능 그룹의 조합으로 운전 및 출차

측정 측정

명목상(독특한 속성) 성별, 지역, 직업
순위(주문 가능) 높음/중간/낮음, 1/2/3
간격 (등간격으로 주어진 값, 절대 원점 없음) 기온, 주가지수, 고객만족지수
비율(절대 원점 존재, 비율 계산 가능) 상품의 무게, 크기, 판매량

측정 기구 및 방법은 왜곡이 없어야 하며, 반복적으로 측정해도 결과가 동일해야 하고, 다른 사람이 측정해도 결과가 동일해야 합니다.

위의 세 가지 조건이 충족되면 신뢰성이 결정됩니다.

데이터 특성

#도수분포표
table()
#시각화
barplot()
hist()