크롤링은 웹페이지의 HTML 소스를 분석해서 데이터를 가져오는 방법입니다.
어떤 웹페이지를 크롤링하던 코드가 있어도 해당 웹페이지의 HTML 구조가 변경되면 크롤링이 되지 않을 수 있습니다.
예를 들어 올려주신 코드를 보면 id가 alex-area인 HTML 요소로부터 데이터를 찾아오도록 되어있는데
실제 해당 페이지의 HTML 소스를 보면 alex-area라는 부분이 없습니다.
아마도 해당 사이트의 디자인 개편으로 HTML 요소가 바뀐 것 같고 그래서 크롤링을 해올 수 없게 된 것 같습니다.
다시 크롤링이 가능하게 하려면 바뀐 HTML 소스를 확인해서 코드를 변경해야 합니다.
예를 들면 다음과 같은 식이 될 수 있습니다.
html2 <- html_nodes(html1, xpath = '//*[@id="mainContent"]/div/div/div[1]')
크롤링은 웹페이지의 HTML 소스를 분석해서 데이터를 가져오는 방법입니다.
어떤 웹페이지를 크롤링하던 코드가 있어도 해당 웹페이지의 HTML 구조가 변경되면 크롤링이 되지 않을 수 있습니다.
예를 들어 올려주신 코드를 보면 id가 alex-area인 HTML 요소로부터 데이터를 찾아오도록 되어있는데
실제 해당 페이지의 HTML 소스를 보면 alex-area라는 부분이 없습니다.
아마도 해당 사이트의 디자인 개편으로 HTML 요소가 바뀐 것 같고 그래서 크롤링을 해올 수 없게 된 것 같습니다.
다시 크롤링이 가능하게 하려면 바뀐 HTML 소스를 확인해서 코드를 변경해야 합니다.
예를 들면 다음과 같은 식이 될 수 있습니다.
html2 <- html_nodes(html1, xpath = '//*[@id="mainContent"]/div/div/div[1]')