ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 20221012 = Streamlit 실습, concat
    PYTHON 2022. 10. 27. 16:32

    # Streamlit 생활코딩 실습진행하기 ( www.youtube.com/watch?v=XACHCUduqh0 )

    # pip install cufflinks 및 다른 라이브러리 설치하기!

    # 미니프로젝트할 때 kaggle / Dacon 참고해서 활용하기!

    # replace("변환할 값", "변환될 값") 으로 공백이나 문자열을 변경할 수 있음

    # lambda x 복습하기

    # df_first_melt["연도"] = df_first_melt["기간"].str.split("년", expand=True)[0].astype(int)
    df_first_melt["월"] = df_first_melt["기간"].str.split("년", expand=True)[1].str[:-1].astype(int)
    위 코드 복습하기 !!

    # def parse_year(date):
         return int(date.split("년")[0])
    def parse_month(date):
        return int(date.split("년")[1][:-1])
    위 코드 복습하기 !!

    # "2013" == 2013 = False / int 형이 아니면 값을 비교하거나 계산할 수 없기 때문에 int로 변경해야 함.
    int로 감싸줘야 연산이 가능하다. astype(int)로 int로 변경할 수 있다.

    # df.groupby("지역명")["평당분양가격"].agg(["mean"]) = agg는 집계를 의미함

    # df = pd.concat([df_first_prepare, df_last_prepare]) = concat으로 두 개의 데이터를 합칠 수 있음

    # 깔끔한 데이터란?? 

    # df = pd.melt(raw, id_vars=raw.columns[:4])
    => raw라는 데이터프레임을 id_vars로 raw.columns의 앞의 4개 컬럼만 사용하고 나머지는 행으로 melt한다!

    # dropna() 로 결측치를 제거할 수 있음

    # df.drop(columns="삭제할 컬럼명") -> drop으로 필요없는 컬럼을 삭제할 수 있음

    # df["연"] = df["연월"].apply(lambda x: int(x.split(".")[0])) -> "."을 기준으로 앞의 값
    df["월"] = df["연월"].apply(lambda x: int(x.split(".")[1])) -> "."을 기준으로 뒤의 값
    위 코드 복습하기!!

    'PYTHON' 카테고리의 다른 글

    20221017 = downcast, parquet  (0) 2022.11.03
    20221013 = random, triu  (0) 2022.10.27
    20221011 = crosstab, replace  (0) 2022.10.27
    20221006 = vscode 익스텐션 설치 / find_dayofweek  (0) 2022.10.27
    20221005 = 강의정리  (0) 2022.10.27
Designed by Tistory.