
ChatGPT Data Analysis 업그레이드 - 인터랙티브 차트, 구글 드라이브, 원드라이브 연결
ChatGPT 데이터 분석 기능
ChatGPT Data Analysis 기능이 업데이트 되어서 사용해 봤습니다. 다음과 같은 기능들이 추가됐습니다.
- 구글 드라이브나 마이크로소프트 원드라이브에서 파일 업로드 
- 인터랙티브 테이블과 차트를 확장가능한 보기에서 사용하기 
- 차트를 커스타마이징하고 다운로드 받기 (프레젠테이션이나 문서에서 사용) 
이 모델은 GPT-4o 에서 사용가능하며 ChatGPT 플러스, 팀, 엔터프라이즈 고객에게 수 주내에 배포됩니다.
데이터 파일을 올리고 파이썬 환경을 통해 데이터를 분석하고 LLM을 사용하여 다음과 같은 일들을 할 수 있습니다.
- 데이터셋을 합치고 정제하기 
- 차트 만들기 
- 인사이트 찾기 

이렇게 파일 버튼을 누르면 구글 드라이브와 원드라이브를 연결할 수 있습니다.
저는 구글 드라이브를 연결하고 슈퍼 히어로 데이터셋에 대해서 질문해 보겠습니다.

확장하기 버튼을 눌러 테이블을 확장할 수 있습니다.

이렇게 행이나 열을 선택해서 질문할 수 있습니다.
퍼블리셔의 히어로 수에 따른 순위에 대해 알려줘
이렇게 질문했더니 피벗 테이블 (피벗 테이블은 대량의 데이터를 요약, 분석, 탐색 및 보고하기 위해 사용되는 도구) 을 만들어 알려줍니다.

마블이 히어로가 388명으로 가장 많네요.
이번에는 이 데이터셋을 바탕으로 시각화 (차트) 를 해 보겠습니다.
OpenAI 에서 직접 만든 Data Analyst GPT가 있는데 이를 사용해 보겠습니다. (ChatGPT - Data Analyst)
이 데이터에 대한 시각화를 도와줘.

역시 확장을 누르면 인터랙티브 차트를 볼 수 있습니다.

마우스를 올리면 숫자 등을 표시 해주고 역시 오른쪽에서 질문할 수 있습니다.
그리고 테이블이나 차트는 다운로드 받을 수 있습니다. 테이블은 csv 파일 등으로 차트는 그림 파일로 다운로드 됩니다.

이거 프레젠테이션 할 때 유용하겠네요.
예를 들어 회사의 연례 보고서를 올리고 매출과 비용을 계산한다거나, 필요한 비주얼 보조 자료를 생성할 때 많이 사용할 것 같습니다.
지원 가능한 파일
다양한 파일을 분석할 수 있습니다.
- 엑셀 (.xls / .xlsx) 
- csv 
- pdf 
- json 
작동 원리
내부에서 파이썬을 활용해 데이터 분석에는 pandas, 차트 생성에는 matplotlib을 사용합니다. 분석 보기를 누르면 사용한 것을 확인할 수 있습니다.

만약 이 내역이 항상 표시되기를 원한다면 항상 세부 정보 표시를 체크하면 됩니다.
인터랙티브 차트의 종류
현재는 막대 차트 (bar), 파이 차트 (pie), 산점도 차트 (scatter 차트 = 두 변수 간의 관계를 시각적으로 나타내는 그래프) 가 가능합니다.
시사점
늘어난 토큰 윈도우로 큰 파일을 올리고 데이터 분석을 실시할 수 있을 것 같습니다.
직장인들의 경우 엑셀 등을 많이 활용하기 때문에 유용할 것 같습니다.