ChatGPT Data Analysis 업그레이드 - 인터랙티브 차트, 구글 드라이브, 원드라이브 연결
ChatGPT 데이터 분석 기능
ChatGPT Data Analysis 기능이 업데이트 되어서 사용해 봤습니다. 다음과 같은 기능들이 추가됐습니다.
구글 드라이브나 마이크로소프트 원드라이브에서 파일 업로드
인터랙티브 테이블과 차트를 확장가능한 보기에서 사용하기
차트를 커스타마이징하고 다운로드 받기 (프레젠테이션이나 문서에서 사용)
이 모델은 GPT-4o 에서 사용가능하며 ChatGPT 플러스, 팀, 엔터프라이즈 고객에게 수 주내에 배포됩니다.
데이터 파일을 올리고 파이썬 환경을 통해 데이터를 분석하고 LLM을 사용하여 다음과 같은 일들을 할 수 있습니다.
데이터셋을 합치고 정제하기
차트 만들기
인사이트 찾기
이렇게 파일 버튼을 누르면 구글 드라이브와 원드라이브를 연결할 수 있습니다.
저는 구글 드라이브를 연결하고 슈퍼 히어로 데이터셋에 대해서 질문해 보겠습니다.
확장하기 버튼을 눌러 테이블을 확장할 수 있습니다.
이렇게 행이나 열을 선택해서 질문할 수 있습니다.
퍼블리셔의 히어로 수에 따른 순위에 대해 알려줘
이렇게 질문했더니 피벗 테이블 (피벗 테이블은 대량의 데이터를 요약, 분석, 탐색 및 보고하기 위해 사용되는 도구) 을 만들어 알려줍니다.
마블이 히어로가 388명으로 가장 많네요.
이번에는 이 데이터셋을 바탕으로 시각화 (차트) 를 해 보겠습니다.
OpenAI 에서 직접 만든 Data Analyst GPT가 있는데 이를 사용해 보겠습니다. (ChatGPT - Data Analyst)
이 데이터에 대한 시각화를 도와줘.
역시 확장을 누르면 인터랙티브 차트를 볼 수 있습니다.
마우스를 올리면 숫자 등을 표시 해주고 역시 오른쪽에서 질문할 수 있습니다.
그리고 테이블이나 차트는 다운로드 받을 수 있습니다. 테이블은 csv 파일 등으로 차트는 그림 파일로 다운로드 됩니다.
이거 프레젠테이션 할 때 유용하겠네요.
예를 들어 회사의 연례 보고서를 올리고 매출과 비용을 계산한다거나, 필요한 비주얼 보조 자료를 생성할 때 많이 사용할 것 같습니다.
지원 가능한 파일
다양한 파일을 분석할 수 있습니다.
엑셀 (.xls / .xlsx)
csv
pdf
json
작동 원리
내부에서 파이썬을 활용해 데이터 분석에는 pandas, 차트 생성에는 matplotlib을 사용합니다. 분석 보기를 누르면 사용한 것을 확인할 수 있습니다.
만약 이 내역이 항상 표시되기를 원한다면 항상 세부 정보 표시를 체크하면 됩니다.
인터랙티브 차트의 종류
현재는 막대 차트 (bar), 파이 차트 (pie), 산점도 차트 (scatter 차트 = 두 변수 간의 관계를 시각적으로 나타내는 그래프) 가 가능합니다.
시사점
늘어난 토큰 윈도우로 큰 파일을 올리고 데이터 분석을 실시할 수 있을 것 같습니다.
직장인들의 경우 엑셀 등을 많이 활용하기 때문에 유용할 것 같습니다.