이태극의 유튜브 요약 - 일잘러 장피엠님의 챗GPT 고급 데이터 분석
ChatGPT Code Interpreter의 장점
Exel보다 더 복잡하고 다양한 데이터 시각화 기능 가능하다.
프롬프트를 입력하면 알아서 결과물을 만들어준다.
파일명을 잘 입력하자
파일의 내용과 관련있는 제목을 짓는다.
파일명은 AI의 분석에 영향을 미치기 때문이다.
영어 권장(한국어도 되지만 오류가 발생할 수 있다)
프롬프트 작성 방법
수행할 것들을 단계적으로 연결지으며 명료하게 작성한다.
특정 값을 지정할 경우 열 이름을 명확하게 지시한다.
맨 처음에 데이터를 제공할 때, 그것이 어떤 내용인지 간략히 설명한다.
용도 1: 전처리 시키
AI가 실수했을 수 도 있으니 꼭 결과물을 확인하자.
한국어 패치하기
"Koreanize Matplot Libarary" 업로
프롬프트: "Code Interpreter를 활용해서 내가 제공한 whl file을 너의 가상환경에 설치해주세요. 그런 다음에 한국어 사용 설정을 해주세요. 차트에 한국어를 정상적으로 표시해 주세요."
용도 2: 데이터 시각화
지시해야할 내
차트 제목
차트 형식 (바, 라인, 원 등)
XY 축
데이터 레이블
레전드(범례)
스타일 (폰트 색, 선 색, 눈금자)
Order(배치 순서)
용도 3: 데이터 취합
여러 개의 파일 정보를 하나로 취합할 때
데이터 분석 절차
데이터 업로드 및 설명
데이터 전처리
탐색적 데이터 분석 (EDA - Exporartory Data Analysis)
분석 과제 설정
인사이트 도출
용도 4: 정량 분석 기초 단계
데이터 전처리하기
데이터 업로드하며 데이터의 내용 설명하기
전처리한 뒤 설치할 수 있는 다운로드 링크 달라하기
AI엑 데이터 내용 설명 요청하기
더 세부적으로 분석하기
"일변량 EDA" 또는 "다변량 EDA" 요청하
"일변량 EDA"를 한 다음 "다변량 EDA"를 하면 더 풍부한 결과를 얻을 수 있다.
정량 데이터 분석 사례
용도 5: 이커머스 구매 고객 데이터 분석
RFM 분석(Recency Frequency Monetary)
RMF에 따라 스코어를 메김
스코어를 기준으로 고객 세그먼트를 분류
고객 세그먼트별 프로모션 전략 수립 요청
용도 6: Google Analytics 유저 분석
용도 7: 주가 데이터 분석
정성 데이터 분석 사례
직무 만족도 요인 분석
회기분석으로 퇴사자 예측 모델 만들
고객 후기 분석
비정형 데이터 분석
텍스트 클러스터링 하기
Google Sheet로 각 행의 데이터를 전처리하기
용도: 간단한 웹 크롤링
좀 더 고급적인 기술이 필요하면 노코드 툴인 Octoparse를 사용하는 방법도 있다.