#R

민돌민돌· 10개월

질문R코딩 초보 도와주세요..

금융 관련 R코딩에서 네이버 주식의 재무 관련 지표를 이용하여 주식 투자에 유용한 시각화 3개를 만들고 주식 관련 데이터를 활용하여 투자에 유용한 시각화 3개를 만들어야 하는데 두개가 어떤 차이가 있고 어떻게 시작해야 할지 감이 안잡혀요..ㅠㅠ https://finance.naver.com/sise/sise_market_sum.naver
120
1
0
피토니
피토니·2024-06-02
네이버 주식의 재무 관련 지표를 활용하는 방법과 주식 관련 데이터를 활용하는 방법으로 나누어서 설명드리겠습니다. 네이버 주식의 재무 관련 지표 활용 1. R에서 rvest 패키지를 사용하여 네이버 금융 웹사이트에서 데이터를 스크래핑합니다. install.packages("rvest") library(rvest) url <- 'https://...
yujyy1yujyy1· 2년

질문뭐가 잘못된건가요..?

ccc<-NbClust(Z,distance="euclidean", min.nc = 2, max.nc = 8, method = "kmeans", index = "ccc") solve.default(W)에서 다음과 같은 에러가 발생했습니다: system is computationally singular: reciprocal condition number = 1.242e-16
335
1
0
피토니
피토니·2023-06-13
solve.default(W)의 W가 특이행렬인 경우 발생하는 오류 같은데 W를 확인해보시면 좋을 것 같습니다.
yujyy1yujyy1· 2년

질문dplyr패키지 오류

안녕하세요. R을 공부하고 있는 학생입니다. dplyr패키지 설치해서 rename함수를 사용하려는데 자꾸 오류가 떠서 질문 드립니다. 어떻게 해결해야하나요? install.packages("dplyr") WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding: https://cran.rstudio.com/bin/windows/Rtools/ Warning in install.packages : 패키지 ‘dplyr’가 사용중이므로 설치되지 않을 것입니다 install.packages("dplyr") Error in install.packages : Updating loaded packages Restarting R session... install.packages("dplyr") WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding: https://cran.rstudio.com/bin/windows/Rtools/ ‘C:/Users/Yun_ji1/AppData/Local/R/win-library/4.2’의 위치에 패키지(들)을 설치합니다. (왜냐하면 ‘lib’가 지정되지 않았기 때문입니다) trying URL 'https://cran.rstudio.com/bin/windows/contrib/4.2/dplyr_1.1.2.zip' Content type 'application/zip' length 1555567 bytes (1.5 MB) downloaded 1.5 MB 패키지 ‘dplyr’를 성공적으로 압축해제하였고 MD5 sums 이 확인되었습니다 Warning in install.packages : 패키지 ‘dplyr’의 이전설치를 삭제할 수 없습니다 Warning in install.packages : problem copying C:\Users\Yun_ji1\AppData\Local\R\win-library\4.2\00LOCK\dplyr\libs\x64\dplyr.dll to C:\Users\Yun_ji1\AppData\Local\R\win-library\4.2\dplyr\libs\x64\dplyr.dll: Permission denied Warning in install.packages : ‘dplyr’를 복구하였습니다 다운로드된 바이너리 패키지들은 다음의 위치에 있습니다 C:\Users\Yun_ji1\AppData\Local\Temp\RtmpekHQAs\downloaded_packages library(dplyr) 다음의 패키지를 부착합니다: ‘dplyr’ The following objects are masked from ‘package:stats’: filter, lag The following objects are masked from ‘package:base’: intersect, setdiff, setequal, union Warning message: 패키지 ‘dplyr’는 R 버전 4.2.3에서 작성되었습니다
2.7K
2
0
피토니
피토니·2023-05-30
일단 에러 메시지를 보시면 Rtools를 설치해야 한다고 나오는 것 같습니다. Rtools는 R 패키지를 빌드하는 데 필요한 도구들을 제공하는 소프트웨어입니다. Rtools가 없으면 몇몇 패키지의 설치가 어려울 수 있습니다. Rtools를 다음의 과정으로 설치할 수 있습니다. https://cran.rstudio.com/bin/windows/Rtools...

질문R 크롤링 html_nodes

R로 크롤링하는 도중에 문제가 발생하여 질문드립니다 교제에서 배울때는 잘만되던 크롤링이 직접 해볼려고하니 문제가 뜨네요 html1 <- read_html("https://movie.daum.net/moviedb/grade?movieId=54081") html1 html2 <- html_nodes(html1, xpath = '//*[@id="alex-area"]/div/div/div/div[3]/ul[2]') html2 일단 제가 짠 코드입니다 원래 교제에서는 여기서 다음 뉴스를 예시로 xpath값만 잘 입력하면 html2에서 xml_nodeset (1)이 뜨면서 뒷 내용을 계속 이어갈수 있었는데 윗 내용을 입력하면 xml_nodeset (0)가 뜨면서 내용이 없다고 나옵니다 이부분에 대해서 xpath 값이 잘못된건지... 아니면 추가로 내용을 덧붙여야하는지 모르겠네요....
288
1
1
0
피토니
피토니·2023-05-22
크롤링은 웹페이지의 HTML 소스를 분석해서 데이터를 가져오는 방법입니다. 어떤 웹페이지를 크롤링하던 코드가 있어도 해당 웹페이지의 HTML 구조가 변경되면 크롤링이 되지 않을 수 있습니다. 예를 들어 올려주신 코드를 보면 id가 alex-area인 HTML 요소로부터 데이터를 찾아오도록 되어있는데 실제 해당 페이지의 HTML 소스를 보면 alex-are...
뎁스_2599뎁스_2599· 2년

질문Segmentation fault

안녕하세요, 현재 R을 배우고 있는 학생입니다. 다름이 아니라 BATCH를 사용할 때 자꾸 segmentation fault가 떠서 질문드립니다. $ R CMD BATCH myfirst_rcode 이렇게 치면 Segmentation fault 이렇게 뜨는데  어떻게 해결할 수 있는지 알 수 있을까요?
218
2
0
피토니
피토니·2023-05-05
먼저 코드를 볼 수 있으면 좋겠지만 코드에 문제가 없다면 Segmentation fault는 주로 메모리 관련 문제입니다. 코드 상에 메모리 누수가 있거나 코드를 실행하려고 설치한 패키지 중에 메모리 문제가 있는 것이 있을 수도 있습니다. 혹은 R을 설치한 컴퓨터나 R을 설치할 때의 문제 있을 수도 있으므로 가능하다면 다른 컴퓨터에서도 실행해보시기 바랍...
gygy· 2년

질문LOOCV 질문 있습니다!

안녕하세요 공부를 하다가 R로 LOOCV를 구하는데 결정계수가 하나밖에 나오지 않습니다. 결정계수가 여러개 나오게 하는 다른 코드가 있나요..? loocv <- trainControl(method = "LOOCV") model2 <- train(y~x1+x2+x3, data = test, method = "lm", trControl = loocv) model2$results 전 이렇게 구했습니다! 데이터는 그냥 아무 숫자나 넣어서 아무렇게나 만들었습니다  알려주시면 감사하겠습니다
521
1
1
0
피토니
피토니·2023-05-15
LOOCV는 각 관측치를 한 번씩 제외한 후 모델을 학습하고 해당 관측치에 대한 예측값과 실제값을 비교하여 모델의 성능을 평가하는 방법이기 때문에 LOOCV는 데이터 포인트마다 하나의 결정계수 값을 반환합니다.여러 개의 결정계수를 얻고 싶으시다면 다른 교차검증 방법을 사용하거나 코드를 수정해야 합니다.
gygy· 2년

질문caret 패키지가 이상해요

내일 당장 쪽지시험이라 공부해야되는데 쪽지시험에 필요한 caret 패키지가 이상해요 ㅠㅠ 패키지 다운은 제대로 된 것 같은데 라이브러리로 불러들일때 자꾸 Error: package or namespace load failed for ‘caret’ in loadNamespace(j <- i[[1L]], c(lib.loc, .libPaths()), versionCheck = vI[[j]]): ‘prodlim’이라고 불리는 패키지가 없습니다 이렇게 떠요,, 그래서 prodlim 패키지를 따로 다운받아 보기도 했는데도 안돼요,, 도와주세요,,
940
2
1
0
피토니
피토니·2023-04-05
일단 다음과 같이 search() 함수로 패키지가 제대로 로드되었는지 확인해보시기 바랍니다. search() 패키지가 로드되지 않았다면 아래와 같이 패키지를 로드해보시고 패키지 로드시 "prodlim"에 오타는 없는지 확인해보시기 바랍니다. library(prodlim) library(caret) 혹은 car...
유라123유라123· 3년

질문R 그레인저 인과관계 질문드립니다.

R로 논문쓰는 중입니다. 그레인저는 안정된 데이터로 해야 한다고 배웠는데, 변수 중에 하나는 원데이터가 안정되어 있고 나머지는 안정이 안되어 있습니다.  그럼 그레인저 돌릴 때도, 안정된 원데이터는 원데이터 그대로 쓰고 나머지 데이터들은 차분된 데이터를 사용해야 하는지 궁금합니다. 
1.0K
1
0
sus4sus4· 3년

질문R 두개의 데이터프레임 데이터 메꾸는 방법 궁금합니다

dataframe1 은 아래와 같고,      col1  col2 col3 1    10    20   30 2    10    10   NA  3    20    30   NA   dataframe2는 아래와 같을 때,      col1   col2   col3 1   10     20     NA 2   10     10     30 3   20     30     50   행을 비교해서 co1 과 col2의 데이터값이 동일하다면, col3이 NA일 때 데이터 값을 넣어주려면(서로서로 데이터를 메꿔주는 형태) 어떻게 해야할까요?    제가 원하는 최종결과 >   col1   col2   col3 1   10     20     30 2   10     10     30 3   20     30     50   도저히 모르겠습니다 ㅜㅜ 알려주시면 감사하겠습니다!
953
1
0
한외과한외과· 3년

질문데이터 전처리 과정에서 어려운 것이 있어 질문 드립니다.

예를 들어 남녀 표준 몸무게 표가 이렇게 있다고 할때 female height weight 156 53.7 157 54.2 158 54.7 159 55.2 160 55.7 161 56.2 162 56.8 163 57.3 164 57.9 165 58.6 166 59.2 167 59.9 168 60.5 169 61.3 170 62    male height weight 156 55.9 157 56.6 158 57.2 159 57.9 160 58.6 161 59.3 162 60.3 163 60.7 164 61.4 165 62.1 166 62.8 167 63.6 168 64.3 169 65 170 65.8 자료가  data gender height   2 156   1 166   2 162   2 167   1 168   2 165   1 159   2 159   2 164   1 158   2 159   1 160   2 164   1 159   1 156   1 159   2 162   1 158   2 168   1 161   1 164   1 161   1 164   1 162   2 163   1 156   2 163   2 167   1 170   1 156   이 자료에서 (male = 1 , female = 2 ) 표준몸무게를 찾아서 새로운 열을 하나 더 만드려고 하는데요   st.wei <- function(x,y){ res <- ifelse(x==1,male[which(male$height==y),2],female[which(female$height==y),2] ) return(res) } 고민하다가 이렇게 function 지정해서 하려고 했는데..apply 는 안되는군요..ㅠㅠ 다른 방법은 없을까요??  
996
1
0
피토니
피토니·2021-09-28
이 링크가 도움이 되실지요? https://blog.naver.com/vision_re/220058711187
·2021-09-28
parkpark· 4년

질문선형회귀 질문

선형회귀 관련 질문입니다. 오늘의 tempHigh, sunlightTimeSum, windMax, temp5Avg, RHMin, windMaxInstantDir, LocalAPAvg로 내일의 tempHigh인 to_tempHigh 변수를 예측하고자 합니다. ​ 1. to_tempHigh는 다음날의 tempHigh 입니다. train 데이터(1910~2017년도의 데이터)로 다른 변수들을 독립 변수로 두고, to_tempHigh를 종속 변수로 두어 선형회귀모델을 만듭니다. model_fwd3 <- lm(to_tempHigh ~ tempHigh + sunlightTimeSum + windMax + temp5Avg + RHMin + windMaxInstantDir + LocalAPAvg , data = train) ​ 2. test데이터(2017년도의 데이터)을 이 모델에 넣어 test데이터의 to_tempHigh를 예측합니다. 그 후에, test데이터의 to_tempHigh를 그래프로 그린 후, 모델을 통해 예측한 to_tempHigh를 그래프에 선으로 추가합니다. predtemphigh <- predict.lm(model_fwd3,newdata = test[-1]) plot(test[1:32,1], type = &#39;o&#39;, col = &#39;red&#39;)#실제 최고기온 lines(predtemphigh[1:32], type = &#39;o&#39;, col = &#39;blue&#39;)#다음날 최고기온 ​ 그 결과, 그래프 속 예측한 to_tempHigh가 하루씩 밀려서 나오는데, 이유를 모르겠습니다. 이것에 관해 알고계신분 계신가요?   자세한 코드는 LaVue/linear_regression.R at main · jiParkyoung/LaVue (github.com) 여기에 있습니다.
980
0

질문R 프로그래밍 관련 질문입니다 (반복문, 데이터 저장)

library(RSelenium) # 가상서버에서 크롬으로 연결 remdr <- remoteDriver(remoteServerAddr='localhost', port=4445L, browserName='chrome') # 창 열기 remdr$open() # url 접속 (멜론 월간 TOP100) remdr$navigate("https://www.melon.com/chart/month/index.htm?classCd=GN0000") # 원하는 버튼 xpath 찾아서 클릭 remdr$findElement(using = 'xpath', value = '//*[@id="DM0000"]/a/span')$clickElement() remdr$findElement(using = 'xpath', value = '//*[@id="lst50"]/td[5]/div/a')$clickElement() # 현재 페이지 소스 읽어들이기 source <- remdr$getPageSource()[[1]] html <- read_html(source) # 노래 제목 뽑기 song_name <- html_nodes(html,'div.song_name') %>% html_text() song_name<-gsub("\n","",song_name) song_name<-gsub("\t","",song_name) song_name<-gsub("곡명","",song_name) song_name # 가수 뽑기 song_artist <- html_nodes(html,'div.info > div.artist') %>% html_text() song_artist <- gsub("\n","",song_artist) song_artist <- gsub("\t","",song_artist) song_artist # 가사 뽑기 song_lyric <- html_nodes(html,'div.section_lyric') %>% html_text() song_lyric <- gsub("\n","",song_lyric) song_lyric <- gsub("\t","",song_lyric) song_lyric <- gsub("가사프린트가사오류신고","",song_lyric) song_lyric # 데이터 프레임화 song_info <- data.frame(song_name=song_name, song_artist=song_artist, song_lyric=song_lyric, stringsAsFactors = FALSE) view(song_info) # 창 닫기 remdr$close()   안녕하세요, 어찌저찌 여기까지 와서 질문을 하게 되었네요ㅠㅠ 데이터 분석 수업의 과제 일환으로 R 분석을 활용한 트렌드 도출을 하게 되었는데 교수님께서 알려주신 것이라고는 본인이 짠 코드만 던져주신 것... 혼자 이것저것 찾아보다가 Selenium이라는 것을 알게 되었고, 이걸 토대로 멜론 음원 차트에서 노래제목, 가수, 가사를 뽑아 정리하고자 하였습니다. 이것저것 찾아본 끝에, 저 코드를 돌리면 아래와 같은 결과가 나오는데요 이렇게 1위부터 50위 까지의 정보를 하나의 테이블로 만들고 싶습니다...! 반복을 위해서는 for문을 사용하라고 하는데, 기초 문법 지식이 없는지라 구글링해서 아무리 따라해도 자꾸 오류만 나네요ㅠㅠ 제가 짠 코드가 비효율적이라면, 혹시 다른 방법이 또 있을까요? 감사합니다:)
1.5K
0
지슬지슬· 5년

질문R studio 파이차트 간략하게 만들기

distribute = table(boxoffice$배급사) order_dist = order(distribute, decreasing = T) freq_dist = distribute[order_dist] pie(freq_dist, labels = label) pct = round(freq_dist/sum(freq_dist)*100,1) label=paste0(names(freq_dist),"\n", pct, "%") 박스오피스를 보고 이와 같은 파이차트를 만들었습니다. 여기서 상위4개를 top4로 합치고 나머지를 묶고 싶은데 어떡해 해야하나요?
2.4K
1
0
kimho
kimho·2020-10-25
조건에 따라 그룹으로 묶으시면 될 것 같습니다. 아래 샘플 코드를 참고해보시기 바랍니다. # 샘플 데이터 df=data.frame(id=paste('R',seq(1,5),sep=''),value=as.numeric(c('45','25','77','0','100'))) # 조건에 따른 그룹 만들기 grp1=subset(df,value<26) gr...
R제발요R제발요· 5년

질문R 프로그래밍 제발 답변좀 도와주세요 ㅠㅠ

R을 깔때 같이 다운받아지는 자료중에서 nycflight 자료를 이용해서   1. 비행기의 출발이 지연됐던 시간과 아닐 때의 시계뿐 아니라 나머지 기상정보(기온, 응결점, 습도, 바람 등)의 평균 차이를 구하라.   2. 도착이 지연된 항공기를 공항 및 항공사 별로 집계를 내되, 공항과 항공사의 이름은 코드가 아닌 이름으로 표현하라. (한 화면에 보 이지 않아도 무방하다)   이것좀 해주실수 있을까요..ㅠㅠ 감사합니다.
1.2K
0