만약, 나이가 30 이상인 사람의 임신 횟수가 3 이상일 확률을 구하고 싶으면 아래와 같이 계산할 수 있습니다.
nrow(OldAgeThreePregnant)/nrow(Pregnants)*100
위 내용의 전체 코드는 아래와 같습니다.
# 데이터셋
Pregnants = data.frame(NumPregnant=c(6,1,8,1,0,5,3,10,2,8),Age=c(50,31,32,21,33,30,26,29,53,54))
Pregnants
# 나이가 30 이상인 데이터
OldAge = subset(Pregnants, Age>=30)
OldAge
# 나이가 30 이상이면서 임신 횟수가 3 이상인 데이터
OldAgeThreePregnant = subset(OldAge, NumPregnant>=3)
OldAgeThreePregnant
# 나이가 30 이상이면서 임신 횟수가 3 이상일 확률
nrow(OldAgeThreePregnant)/nrow(Pregnants)*100
올려주신 예제를 토대로 아래와 같은 데이터셋이 있다고 가정할 때
먼저 아래와 같이 subset 함수를 이용하여 나이가 30 이상인 데이터를 가져옵니다.
그런 다음, 위에서 가져온 "나이가 30 이상인 데이터" 중에서 임신 횟수가 3 이상인 데이터를 가져오면 됩니다.
만약, 나이가 30 이상인 사람의 임신 횟수가 3 이상일 확률을 구하고 싶으면 아래와 같이 계산할 수 있습니다.
위 내용의 전체 코드는 아래와 같습니다.
실행 결과는 아래와 같습니다.