처음입니다만

처음입니다만

1달 전에 시작한 초보자입니다...

웹 디자인R

질문R 크롤링 html_nodes

R로 크롤링하는 도중에 문제가 발생하여 질문드립니다 교제에서 배울때는 잘만되던 크롤링이 직접 해볼려고하니 문제가 뜨네요 html1 <- read_html("https://movie.daum.net/moviedb/grade?movieId=54081") html1 html2 <- html_nodes(html1, xpath = '//*[@id="alex-area"]/div/div/div/div[3]/ul[2]') html2 일단 제가 짠 코드입니다 원래 교제에서는 여기서 다음 뉴스를 예시로 xpath값만 잘 입력하면 html2에서 xml_nodeset (1)이 뜨면서 뒷 내용을 계속 이어갈수 있었는데 윗 내용을 입력하면 xml_nodeset (0)가 뜨면서 내용이 없다고 나옵니다 이부분에 대해서 xpath 값이 잘못된건지... 아니면 추가로 내용을 덧붙여야하는지 모르겠네요....
267
1
1
0
피토니
피토니·2023-05-22
크롤링은 웹페이지의 HTML 소스를 분석해서 데이터를 가져오는 방법입니다. 어떤 웹페이지를 크롤링하던 코드가 있어도 해당 웹페이지의 HTML 구조가 변경되면 크롤링이 되지 않을 수 있습니다. 예를 들어 올려주신 코드를 보면 id가 alex-area인 HTML 요소로부터 데이터를 찾아오도록 되어있는데 실제 해당 페이지의 HTML 소스를 보면 alex-are...