책소개
과학이 발전하는 과정에서 경험이나 자료로부터 지식을 추출하는 방법을 연구하는 과정에서 정립된 통계학은 과학 연구의 핵심적인 도구이다. 20세기 후반부터 진행된 정보화로 축적된 대규모의 자료에서 지식을 추출하는 빅 데이터, 기계 학습, 데이터 마이닝, 심층 학습, 데이터 과학 분야의 핵심에도 통계학이 자리하고 있다. 따라서 지금의 세상을 올바르게 보고 이해하기 위해서는 통계학에 대한 이해가 필수적이다. 많은 통계학 책이 수학적 기술을 기반으로 하고 있기 때문에 수학적 기술의 의미를 이해하는데 어려움이 있는 것이 사실이다. 수학적 기술을 완전히 배제할 수는 없지만 왜 그렇게 하는지 그리고 무엇을 하고자 하는지에 대한 충분한 설명을 덧붙인 책을 쓰기로 했고 이 책은 그 결과물이다. 주변의 많은 사례와 문제가 통계적 관점에서 이해하야 한다는 것과 이때 필요한 통계적 개념과 용어를 설명하기 위해 노력하였다. 통계학이 방법론에 관련한 학문이지만 기본적으로 어떻게 하지보다 왜 그렇게 하지라는 질문에 관심을 가져야 한다는 것을 강조하고 그 질문에 나름대로 답하려고 한 책이란 점에서 기존의 통계학 책과 구별된다.
목차
<제 1 장 통계학은 어떤 학문인가?>
제 1 절 일상에서마주치는 통계적 사례들
제 2 절 통계학은 어떤 학문인가?
제 3 절 과학과 통계학
<제 2 장 자료는 무엇인가?>
제 1 절 자료는 어떻게 생겼나?
제 2 절 자료를 이해하는데 필요한 개념들
제 3 절 특성에서 변수를거쳐 자료로
제 4 절 실제 자료
<제 3 장 분포는 통계학의 핵심이다>
제 1 절 분포는 무엇인가?
제 2 절 변수도 여러 가지다
제 3 절 변수의 정의에 유의하자
제 4 절 실제 자료의 변수 분류하기
<제 4 장 자료의 질이 좋아야 한다>
제 1 절 좋은 자료는 좋은 표본에서 나온다
제 2 절 통계적 문제는 분포를 추정하는 것이다
제 3 절 좋은 표본을 얻는 방법
제 4 절 층화임의표집
제 5 절 임의표집 사례
<제 5 장 실험은자료를 얻는 또 다른 방법이다>
제 1 절 실험이 조사와 다른 점은 무엇인가
제 2 절 실험설계에필요한 개념들
제 3 절 유효한 실험과 임의화
제 4 절 실험단위가 사람인 경우 필요한 개념들
제 5 절 실험설계 사례
제 6 절 과학 연구와 실험
<제 6 장 기존 자료도 이용하자>
제 1 절 기존 자료와 예측
제 2 절 시계열 자료
제 3 절 시간에 대한 이해
<제 7 장 인공지능을 향한 통계학의 변신>
제 1 절 빅 데이터
제 2 절 기계학습, 심층 학습 그리고 데이터 마이닝
제 3 절 데이터 과학
제 4 절 정돈된 자료
<제 8 장 확률은 무엇인가?>
제 1 절 임의 현상
제 2 절 확률은 임의 현상을 표현하는 도구다
제 3 절 확률의 수학적 정의
제 4 절 고전적 확률
제 5 절 빈도론적 확률
제 6 절 주관적 확률
제 7 절 통계적 문제와 확률
<제 9 장 이산 변수의 분포는 어떻게 나타내는가?>
제 1 절 이산 분포를 표와 그래프로 표현하기
제 2 절 이산 분포를 수학적으로 표현하기
제 3 절 표본 자료의 임의성
제 4 절 실제 자료 분석하기
<제 10 장 연속 변수의 분포는 어떻게 나타내는가?>
제 1 절 연속 변수 이해하기
제 2 절 연속 분포를 표와 그래프로 표현하기
제 3 절 연속 분포를 수학적으로 표현하기
제 4 절 여러 가지 연속 분포
-4.1 정규 분포
-4.2 균등 분포
-4.3 지수 분포
제 5 절 정규 분포에 대한 추론
<제 11 장 유의성 검증은 무엇인가?>
제 1 절 연구 목적에서 가설로
제 2 절 설계 목표에서 가설로
제 3 절 요구 사항에서 가설로
제 4 절 정규성 검증
제 5 절 모비율에 대한 검증
제 6 절 모평균에 대한 검증
제 7 절 유의성 검증 결과의 해석
<제 12 장 변수 간의 관계를 알아내는 것이 최종 목표다>
제 1 절 연관은 무엇인가?
제 2 절 회귀 모형
제 3 절 회귀 분석
제 4 절 질적 설명 변수를 포함하는 회귀 모형
제 5 절 반응 변수가 질적 변수인 경우의 회귀모형
제 6 절 연관의 해석