책 소개
마케팅을 위한 데이터 분석, 금융상품의 리스크와 수익률 분석, 주식과 환율의 변동률 분석 등 쏟아지는 데이터에서 의미 있는 정보를 뽑아내기 위한 방법으로서의 통계를 소개하는 책이다. 이 책은 복잡한 공식과 기호는 하나도 사용하지 않고 사칙연산과 제곱, 루트 등 중학교 기초수학만으로 통계학의 기초를 확실히 다질 수 있게 돕는다.
시장의 가격 동향, 소비자의 소비 동향, 주식과 환율의 변동, 부동산가격의 변동 등 숫자로 표현되는 여러 현상들을 분석해 자신과 자신이 속한 기업에 필요한 정보를 뽑아내고 정확히 예측해야 성공하는 전략, 이기는 전략을 세울 수 있음을 강조하면서 초보 중의 초보라도 통계학에서 가장 중요한 항목인 ‘검정’과 ‘구간추정’을 가장 쉽게, 그리고 가장 빨리 이해할 수 있도록 도와준다. 총 21개 강의로 구성되어 있어, 아무리 바쁜 비즈니스맨이라도 하루에 30분 정도를 투자하여 3주 정도에 통계학의 기초를 마스터할 수 있도록 구성되어 있다.
목차
시작하면서
제0강의
‘통계학’을 효율적으로 한 단계씩 이해하는 것이 목적
1. 이 책은 왜 2부 구성으로 되어 있는가?
2. 통계학이란 무엇인가? 기술통계와 추리통계
3. 표준편차를 가장 중요하게 다룬다
4. ‘확률’은 거의 다루지 않는다
5. ‘95% 예언적중구간’으로 설명한다
6. 수학 기호나 공식은 거의 사용하지 않는다
7. 괄호를 채우는 간단한 연습문제로 독학이 가능하다
제1부
표준편차부터 검정과 구간추정까지를 한번에
제1강의
도수분포표와 히스토그램 : 데이터의 특징을 돋보이게 하는 도구
1. 데이터 자체로는 아무것도 알 수 없기 때문에 통계를 사용
2. 히스토그램 만들기
[제1강의 정리]
[연습문제]
제2강의
평균값의 역할과 평균값을 이해하는 방법 : 평균값은 지렛대가 균형을 이루는 지점
1. 통계량은 데이터를 요약한 수치
2. 평균값이란?
3. 도수분포표에서의 평균값
4. 히스토그램에서 평균값의 역할
5. 평균값을 어떻게 이해해야 하는가?
[제2강의 정리]
[연습문제]
[Column] 평균을 구하는 방법은 여러 가지
[보충설명] 지렛대가 균형을 이루는 받침점이 ‘산술평균’이 되는 이유
제3강의
분산과 표준편차 : 흩어져 있는 데이터 상태를 추정하는 통계량
1. 불규칙한 통계량을 아는 것이 중요
2. 버스 도착시간으로 분산을 이해
3. 표준편차의 의미
4. 도수분포표로 표준편차를 구하는 방법
[제3강의 정리]
[연습문제]
[보충설명] 편차의 평균이 반드시 0이 되는 것을 증명
제4강의
표준편차① : 데이터의 특수성을 평가
1. 표준편차는 ‘파도의 거칠기’
2. 표준편차로 데이터의 ‘특수성’을 평가
3. 여러 데이터 세트를 비교할 때의 표준편차
4. 가공된 데이터의 평균값과 표준편차
[제4강의 정리]
[연습문제]
제5강의
표준편차② : 주식리스크의 지표(주가변동성)로 활용
1. 주식의 평균수익이란?
2. 평균수익률만으로는 우량기업인지 판단할 수 없다
3. 주가변동성이 의미하는 것
[제5강의 정리]
[연습문제]
제6강의
표준편차③ : 하이 리스크와 하이 리턴, 샤프지수도 이해
1. 하이 리스크와 하이 리턴, 로우 리스크와 로우 리턴
2. 금융상품의 우열을 가리는 방법
3. 금융상품의 우열을 가리는 수치, 샤프지수
[제6강의 정리]
[연습문제]
제7강의
정규분포 : 키, 동전 던지기 등에서 흔히 볼 수 있는 분포
1. 가장 많이 발견할 수 있는 데이터 분포
2. 일반정규분포를 보는 방법
3. 키 데이터는 정규분포를 따른다
[제7강의 정리]
[연습문제]
[보충설명] 세상에 정규분포가 가득한 이유
제8강의
통계적 추정의 출발점 : 정규분표를 이용해서 ‘예언’
1. 정규분포의 성질을 이용해 ‘예언’을 할 수 있다
2. 표준정규분포의 95% 예언적중구간
3. 일반정규분포의 95% 예언적중구간
[제8강의 정리]
[연습문제]
[Column] 예언을 정확히 맞추는 점쟁이의 기술
제9강의
가설검정 : 하나의 데이터로 모집단을 추리
1. 통계적 추정이란 부분으로 전체를 추리하는 것
2. 더욱 정확한 모집단을 추정
3. 95% 예언적중구간으로 가설의 타당성 판단
[제9강의 정리]
[연습문제]
[Column] 통계적 검정의 획기적인 점과 한계
제10강의
구간추정 : 95% 적중하는 신뢰구간 찾기
1. 예언적중구간을 추정에 역이용
2. 신뢰구간 ‘95%’가 의미하는 것
3. 표준편차를 아는 정규모집단의 평균값에 대한 구간추정
[제10강의 정리]
[연습문제]
제2부
관측 데이터 뒷면에 펼쳐져 있는 거대한 세계를 추측한다
제11강의
모집단과 통계적 추정 : ‘부분’으로 ‘전체’를 추론
1. 모집단은 가상의 항아리
2. 랜덤 샘플링과 모평균
[제11강의 정리]
[연습문제]
제12강의
모분산과 모표준편차 : 모집단 데이터의 분포 상태를 나타내는 통계량
1. 데이터의 분포 상태를 파악
2. 모분산과 모표준편차의 계산
[제12강의 정리]
[연습문제]
제13강의
표본평균① : 여러 데이터의 평균값은 한 데이터의 평균값보다 모평균에 가깝다
1. 관측된 하나의 데이터로부터 무엇을 말할 수 있는가?
2. 표본평균을 구하는 이유
[제13강의 정리]
[연습문제]
제14강의
표본평균② : 관측 데이터가 늘어날수록 예언 구간은 좁아진다
1. 정규분포에서 보이는 표본평균의 성질
2. 정규모집단에서의 표본평균에 대한 95% 예언적중구간
[제14강의 정리]
[연습문제]
제15강의
표본평균을 이용한 모평균의 구간추정 : 모분산을 알고 있는 정규모집단의 모평균은?
1. 모평균이나 모분산을 추정하기 위한 방법
2. 표본평균을 이용한 모평균의 구간추정
[제15강의 정리]
[연습문제]
제16강의
카이제곱분포 : 표본분산을 구하는 방법과 카이제곱분포
1. 표본 d산을 구하는 방법
2. 카이제곱분포란?
[제16강의 정리]
[연습문제]
제17강의
정규모집단의 모분산을 추정 : 모분산을 카이제곱분포로 추정
1. 카이제곱분포의 95% 예언적중구간
2. 정규모집단의 모분산을 추정
[제17강의 정리]
[연습문제]
제18강의
표본분산의 분포는 카이제곱분포 : 표본분산과 비례하는 통계량 W
1. 표본분산과 비례하는 통계량 W를 만드는 방법
2. 표본분산의 카이제곱분포는 자유도가 하나 낮은 수가 된다
[제18강의 정리]
[연습문제]
[보충설명] W 자유도가 V 자유도보다 1만큼 작은 이유
제19강의
모평균이 미지인 정규모집단을 구간추정 : 모분산은 모평균을 몰라도 추정 가능
1. 모평균을 몰라도 모분산을 추정
2. 모분산 추정의 구체적인 예
[제19강의 정리]
[연습문제]
제20강의
t분포 : 모평균 이외의 것은 ‘현실에서 관측된 표본’으로 계산할 수 있는 통계량
1. t분포
2. t분포의 히스토그램
3. 통계량 T의 계산
4. t분포의 정식적인 정의
[제20강의 정리]
[연습문제]
[Column] t분포의 발견은 기네스 맥주 덕분
제21강의
t분포로 구간추정 : 정규모집단에서 모분산을 모를 때의 모평균 추정
1. 가장 자연스러운 구간추정 - t분포
2. t분산를 이용한 구간추정 방법
[제21강의 정리]
[연습문제]
책을 맺으면서
연습문제 해답
찾아보기