-
20221012 = Streamlit 실습, concatPYTHON 2022. 10. 27. 16:32
# Streamlit 생활코딩 실습진행하기 ( www.youtube.com/watch?v=XACHCUduqh0 )
# pip install cufflinks 및 다른 라이브러리 설치하기!
# 미니프로젝트할 때 kaggle / Dacon 참고해서 활용하기!
# replace("변환할 값", "변환될 값") 으로 공백이나 문자열을 변경할 수 있음
# lambda x 복습하기
# df_first_melt["연도"] = df_first_melt["기간"].str.split("년", expand=True)[0].astype(int)
df_first_melt["월"] = df_first_melt["기간"].str.split("년", expand=True)[1].str[:-1].astype(int)
위 코드 복습하기 !!
# def parse_year(date):
return int(date.split("년")[0])
def parse_month(date):
return int(date.split("년")[1][:-1])
위 코드 복습하기 !!
# "2013" == 2013 = False / int 형이 아니면 값을 비교하거나 계산할 수 없기 때문에 int로 변경해야 함.
int로 감싸줘야 연산이 가능하다. astype(int)로 int로 변경할 수 있다.
# df.groupby("지역명")["평당분양가격"].agg(["mean"]) = agg는 집계를 의미함
# df = pd.concat([df_first_prepare, df_last_prepare]) = concat으로 두 개의 데이터를 합칠 수 있음
# 깔끔한 데이터란??
# df = pd.melt(raw, id_vars=raw.columns[:4])
=> raw라는 데이터프레임을 id_vars로 raw.columns의 앞의 4개 컬럼만 사용하고 나머지는 행으로 melt한다!
# dropna() 로 결측치를 제거할 수 있음
# df.drop(columns="삭제할 컬럼명") -> drop으로 필요없는 컬럼을 삭제할 수 있음
# df["연"] = df["연월"].apply(lambda x: int(x.split(".")[0])) -> "."을 기준으로 앞의 값
df["월"] = df["연월"].apply(lambda x: int(x.split(".")[1])) -> "."을 기준으로 뒤의 값
위 코드 복습하기!!'PYTHON' 카테고리의 다른 글
20221017 = downcast, parquet (0) 2022.11.03 20221013 = random, triu (0) 2022.10.27 20221011 = crosstab, replace (0) 2022.10.27 20221006 = vscode 익스텐션 설치 / find_dayofweek (0) 2022.10.27 20221005 = 강의정리 (0) 2022.10.27