-
220929 = 데이터프레임 간단하게 정리PYTHON 2022. 9. 29. 19:30
# finance-datareader = pandas를 통해 불러올 수 있는 금융 데이터 수집 라이브러리
( import를 통해 FinanceDatatReader를 불러올 수 있음)
# 데이터프레임은 shape를 통해 행과 열의 크기를 볼 수 있음
# 데이터프레임을 to_csv로 저장할 수 있음
# pd.read_scv("저장파일")로 다시 읽어 올 수 있음
# url을 수집할 때 url안에 있는 {__}로 넣어 f-string을 사용하여 각각 code나 no를 넣을 수 있음
# read_html로 url을 수집할 수 있음
# 페이지별로 url을 불러올 때 for문을 사용하여 수집할 수 있음
( for A in table 과 append를 사용하여 수집할 수 있음 )
# concat을 사용하여 수집한 데이터를 하나의 데이터프레임으로 합칠 수 있음
( axis = 0 행을 기준으로 위아래로 같은 컬럼을 붙여 새로운 행을 만듦. / axis = 1 컬럼을 기준으로 새로운 컬럼을 만듦 )
# dropna = 수집한 데이터에서 결측치를 제거해줌
# time.sleep = 데이터를 불러올 때 쉬었다가 가져올 수 있음. time.sleep없이 데이터를 불러오면 해당url에 과부하가 걸릴 수 있음
# " .str.contains 은 이해가 되지 않아 다시 공부하기 " / beautifulsoup 다시 복습하기
참고 및 출처 : 멋쟁이사자처럼 강의자료
'PYTHON' 카테고리의 다른 글
20221005 = 강의정리 (0) 2022.10.27 221004 = merge (1) 2022.10.06 220928 = Beatifulsoup, table (0) 2022.09.29 220926 = describe, nunique, groupby (0) 2022.09.29 220923 = UPPER, lower, len (0) 2022.09.29