Slack의 사용자 메세지 AI 훈련 논란 정리

Slack의 사용자 메세지 AI 훈련 논란 정리 image 1

" AI/ML 모델을 개발 하기 위해 당사 시스템은 Slack에 제출된 고객 데이터 (예: 메시지, 콘텐츠, 파일 )와 개인정보 보호정책에 정의된 기타 정보 (사용 정보 포함)를 분석합니다. 고객 계약서에 나와 있습니다.”

새로 발표한 Slack의 데이터 보호 방침은사용자 데이터 보호를 위해 엄격한 접근 제한과 데이터 암호화를 사용하며, 사용자의 메시지와 컨텐츠는 AI 훈련에 사용되지 않으며, 사용자의 동의 없이 데이터를 사용하지 않음을 강조하고 있습니다.

그러나 Slack이 사용자 메시지를 스캔하여 AI 모델을 훈련시키고 있고 직접 메일을 보내야만 ML 모델 교육을 위한 데이터를 사용하지 않게 할 수 있다는 트윗이 논란이 되었는데, 이 과정에서 사용자 데이터의 프라이버시가 침해될 수 있는 우려가 제기되었습니다.

우선 슬랙의 입장대로라면, Slack은 플랫폼 수준에서 머신러닝(ML) 모델을 사용하여 채널 및 이모티콘 추천, 검색 결과 등을 제공합니다. 이렇게 훈련되는 머신러닝 모델은 생성적(generative) AI가 아니고 Slack AI와는 별도라고 합니다.

Slack의 데이터 보호 방침 (출처: Slack 공식 블로그 및 트위터)
- 플랫폼 수준의 머신러닝 모델 사용
  - Slack은 플랫폼 수준에서 머신러닝(ML) 모델을 사용하여 채널 및 이모티콘 추천, 검색 결과 등을 제공합니다.
  - 이러한 모델은 생성적(generative) AI가 아니며, 고객은 자신의 데이터를 이러한 모델의 훈련에서 제외시킬 수 있는 옵션을 가집니다.
- 고객 데이터의 소유권과 사용
  - Slack은 고객 데이터가 고객에게 속한다는 원칙을 강조합니다.
  - Slack은 이러한 ML 모델을 구축하거나 훈련시키지 않으며, 모델이 고객 데이터의 일부를 학습, 기억, 또는 재현할 수 없도록 합니다.
- 프라이버시 원칙과 데이터 관리
  - Slack은 검색, 학습, AI에 적용되는 프라이버시 원칙을 공개하고 있으며, 이는 Slack의 프라이버시 원칙 페이지에서 확인할 수 있습니다.
- Slack AI와 대규모 언어 모델(LLM)
  - Slack AI는 Slack에 내장된 생성적 AI 경험으로, 별도로 구매되는 추가 기능입니다.
  - 이 기능은 대규모 언어 모델(LLMs)을 사용하지만, 고객 데이터로 이러한 LLM을 훈련시키지 않습니다.
  - Slack AI는 모델을 자체 인프라에서 호스팅하며, 이는 고객 데이터가 Slack의 시스템 내에 남아 있고 LLM 제공 업체와 공유되지 않음을 의미합니다.
- 고객의 선택권
  - 사용자는 Slack의 ML 모델 훈련에 자신의 데이터를 사용하지 않도록 선택할 수 있으며, 이는 옵트 아웃(opt-out) 방식으로 제공됩니다.
트위터와 Engadget의 보도 내용 (출처: Engadget)
Engadget 보도에 따르면, Slack이 사용자 메시지를 스캔하여 AI 모델을 훈련시키고 있다고 합니다. 이 과정에서 사용자 데이터의 프라이버시가 침해될 수 있는 우려가 제기되었습니다.
1. 투명성 부족
  - Engadget은 Slack이 사용자 메시지를 AI 모델 훈련에 사용한다고 보도하면서, Slack이 이러한 사실을 사용자에게 충분히 공개하지 않았다고 지적했습니다.
2. 사용자 동의 문제
  - 보도에 따르면, Slack이 사용자의 명시적인 동의 없이 메시지 데이터를 분석하고 이를 AI 훈련에 활용한 것으로 보입니다. 특히 데이터 사용에 대한 접근 방식이 옵트 인(opt-in)이어야 한다고 주장하며, Slack의 정책에 대한 변경을 요구하는 의견도 있습니다.
3. 데이터 프라이버시 우려
  - 사용자 메시지를 스캔하고 분석하는 행위는 데이터 프라이버시에 대한 직접적인 우려를 낳습니다. 특히, 민감한 정보가 포함된 메시지가 AI 훈련 데이터로 사용될 가능성은 사용자에게 심각한 프라이버시 침해로 여겨질 수 있습니다.
  - Salesforce buys Slack for $27.7 billion 특히 세일스포스에 데이터가 넘어가지 않을까 하는 우려가 있습니다.
4. Slack의 AI 개선 방식
  - Slack이 서비스 개선을 위해 AI를 활용하는 것은 효율성과 기능성을 높이기 위한 일반적인 접근 방식입니다. 그러나 Engadget은 Slack이 이 과정에서 사용자 데이터를 어떻게 사용하는지에 대한 구체적인 설명 없이 일반적인 용도로 사용한다고만 언급했다고 지적했습니다.
5. 기술 기업에 대한 일반적인 시각
- 최근 몇 년간 여러 기술 기업들이 사용자 데이터를 활용하는 방식 때문에 비판을 받아왔습니다.
- Engadget의 보도는 이러한 큰 흐름 속에서 Slack의 행동을 비판적으로 바라본 것으로, 사용자 데이터 활용과 관련하여 기업들에게 더욱 엄격한 기준을 요구하는 시각을 반영하고 있습니다.