표본을 추출할 때 모집단을 대표하는 표본을 선택하는 것이 매우 중요합니다.
현직자가 했습니다. 코호트 분석도 중요하고, 특성이 있는 집단 분석도 중요한 것 같습니다.
통계 용어는 종종 영어가 더 직관적입니다. 하이브리드 방식을 선택하겠습니다.
| 정성적 데이터 | 간단한 샘플링 절차 (단순 무작위 샘플) |
무작위로 무작위로 선택 |
| 계층화 된 샘플 (층화 샘플) |
계층을 추가 모집단 정보로 나누어 계층별로 균등하게 추출 | |
| 양적 데이터 | 계통발생학적 방법 (체계적 샘플링) |
처음에는 작게 추출하고 같은 수만큼 추출하여 점차 크기를 늘려가세요. |
| 식민지 추출 (클러스터 샘플링) |
여러 기능 그룹의 조합으로 운전 및 출차 |
측정 측정
| 명목상(독특한 속성) | 성별, 지역, 직업 |
| 순위(주문 가능) | 높음/중간/낮음, 1/2/3 |
| 간격 (등간격으로 주어진 값, 절대 원점 없음) | 기온, 주가지수, 고객만족지수 |
| 비율(절대 원점 존재, 비율 계산 가능) | 상품의 무게, 크기, 판매량 |
측정 기구 및 방법은 왜곡이 없어야 하며, 반복적으로 측정해도 결과가 동일해야 하고, 다른 사람이 측정해도 결과가 동일해야 합니다.
위의 세 가지 조건이 충족되면 신뢰성이 결정됩니다.
데이터 특성
#도수분포표
table()
#시각화
barplot()
hist()
