데이터 과학 – 파생 변수

파생 변수

– 기존 변수를 조합하여 생성된 새로운 변수

파생 변수의 예

– 온도, 습도, 풍속을 조합하여 생성하는 체감온도변수
– 상품주문건수와 환불건수를 합산하여 생성한 환불비율 변수
– 기존 매장 정보를 활용한 본점 방문 매장 변수

주요 기능

numpy-어디서()

– 조건에 따라 2개의 출력을 출력하는 기능
– if() 함수를 대체하고 조건을 작성할 수 있습니다.

참이면 값을 반환하고 거짓이면 값을 반환합니다.

팬더 – 이름 바꾸기()

– 데이터프레임 변수명 변경 방법
– 열 인수에 기존 변수 이름과 새 변수 이름의 쌍을 사전으로 입력합니다.

팬더 – 적용()

– 행 또는 열 방향으로 일괄 계산을 수행하는 방식
– 축 인수를 설정하여 실행 방향 설정 가능 (axis=0은 행 방향, axis=1은 열 방향)
– 사용자 정의 함수 또는 람다 함수(일회성 함수)로 복잡한 연산이 가능합니다.

판다-astype()

– 행의 속성을 변경하는 방법
– “int”/”float”/”str”은 각각 정수/실수/문자열을 의미하며 원하는 속성 부여 및 변경

팬더 – get_dummies()

– 편리한 변수 생성을 도와주는 기능 (One Hot Encoding)
– 열 인수에 명목 변수 지정 및 처리 기능
– drop_first 인자가 참이면 마지막 변수 번호를 제외하고 생성