[K-MOOC 통계학의 이해 1] 12-4 기타통계량의 표집분포, 12-5 확률분포 실습 및 과제

2022. 9. 4. 23:02Data Analyst/통계학

12-4 기타통계량의 표집분포

 

 

12-5 확률분포 실습 및 과제

실습

## 예제
x <- c(0,1,2)
probx <- c(2/5,2/5,1/5)
plot(x,probx,type="h",ylab="P(X=x)",ylim=c(0,0.4)) #type="h" -> 기둥형 그림
abline(h=0)

## (X1+X2)/2의 표집분포
# P(0,0.5,1,1.5,2)=c(4/25,8/25,8/25,4/25,1/25)

반복 <- 100000
x1 <- sample(x,반복,replace=T,prob=probx)
x2 <- sample(x,반복,replace=T,prob=probx)
xx <- cbind(x1,x2)
xbar <- rowMeans(xx)
xbartbl <- table(xbar)/반복
plot(xbartbl,type="h",xlab=expression(bar(x)),ylab=expression(f(bar(x)))) #expression -> 기호 표현 함수
abline(h=0)

## X~Poi(1)
# X1+ ... +X15 ~?
x <- c(3,5,10,15,20)
probT <- round(ppois(x,15),4)

# Monte Carlo simulation
반복 <- 100000
xsum <- rep(NA,반복) #반복 수 만큼 NA 반복
for (i in 1:반복)
  xsum[i] <- sum(rpois(15,1)) #rpois(15,1) -> lambda 값이 1인 걸 15개 뽑음


prob <- NULL
for (i in 1:5)
  prob <- c(prob,mean(xsum <= x[i]))
#xsum <= x[i] -> x[1] = 3, x[2] = 5, True 이면 1, False이면 0
#빈도수를 더해 반복수로 나누면 비율이 나옴(mean)
  
probE <- round(prob,4)
result <- rbind(probT,probE)
colnames(result) <- x

## 중심극한정리
x <- c(0,1,2)
probx <- c(2/5,2/5,1/5)
mu <- 0.8
sigma <- sqrt(14/25)

반복 <- 10000
n <- 10
xbar <- rep(NA,반복)
for (i in 1:반복)
  xbar[i] <- sum(sample(x,n,replace=T,prob=probx))

xbar
table(xbar)
fx <- table(xbar)/반복
plot(fx,xlab="합",ylab="f(합)")
abline(h=0)
xx <- seq(0,n*2,by=0.01)
lines(xx,dnorm(xx,n*mu,sqrt(n)*sigma),col="red")

## 이항분포의 정규근사
n <- 100
p <- 0.4
mu <- n*p
sigma <- sqrt(n*p*(1-p))
x <- 0:n

fx <- dbinom(x,n,p)
plot(x,fx,ylab="f(x)",type="h",xlim=c(20,60))
abline(h=0)

x <- seq(20,60,by=0.1)
fx <- dnorm(x,mu,sigma)
lines(x,fx,col="red")

 

과제

는 어려워서 풀지 못했습니다..

 

 

 

*강의의 모든 내용을 적은게 아닌, 정리하며 눈에 보이는 것만 후딱 요약해 적은겁니다.

강의도 무료이니 여인권 교수님의 강의를 직접 들어보길 추천해요!

 

모든 내용 출처 : http://www.kmooc.kr/courses/course-v1:SookmyungK+SM_sta_004k+2019_03SM_02/course/#block-v1:SookmyungK+SM_sta_004k+2019_03SM_02+type@chapter+block@eb0a1c109e664458999982d10e934a63