R로 크롤링하는 도중에 문제가 발생하여 질문드립니다 교제에서 배울때는 잘만되던 크롤링이 직접 해볼려고하니 문제가 뜨네요 html1 <- read_html("https://movie.daum.net/moviedb/grade?movieId=54081") html1 html2 <- html_nodes(html1, xpath = '//*[@id="alex-area"]/div/div/div/div[3]/ul[2]') html2 일단 제가 짠 코드입니다 원래 교제에서는 여기서 다음 뉴스를 예시로 xpath값만 잘 입력하면 html2에서 xml_nodeset (1)이 뜨면서 뒷 내용을 계속 이어갈수 있었는데 윗 내용을 입력하면 xml_nodeset (0)가 뜨면서 내용이 없다고 나옵니다 이부분에 대해서 xpath 값이 잘못된건지... 아니면 추가로 내용을 덧붙여야하는지 모르겠네요....
크롤링은 웹페이지의 HTML 소스를 분석해서 데이터를 가져오는 방법입니다. 어떤 웹페이지를 크롤링하던 코드가 있어도 해당 웹페이지의 HTML 구조가 변경되면 크롤링이 되지 않을 수 있습니다. 예를 들어 올려주신 코드를 보면 id가 alex-area인 HTML 요소로부터 데이터를 찾아오도록 되어있는데 실제 해당 페이지의 HTML 소스를 보면 alex-are...