검색
회원가입로그인

AI 선구자들, 강화 학습 연구로 튜링 상 수상

  • 두 명의 선구적인 컴퓨터 과학자들이 강화 학습 분야에서의 업적으로 2024년 튜링상을 수상
  • 앤드류 G. 바르토(매사추세츠 대학교 암허스트 명예 교수)와 리처드 S. 서튼(앨버타 대학교 교수)가 주요 공헌자
  • 강화 학습은 보상에 기반한 시행착오 접근법을 통해 기계가 학습하는 방식
  • 초기 연구는 1980년대에 시작되었고, 시간차 학습이라는 강화 기법을 개발
  • 두 사람은 "Reinforcement Learning: An Introduction"이라는 학술 교과서를 공동 저술
  • 구글 딥마인드의 알파고가 강화 학습을 활용하여 세계 최고 바둑 선수들을 이기면서 최근 몇 년간 주목받음
  • 튜링상은 종종 "컴퓨팅의 노벨상"으로 불리며, 상금은 구글의 지원으로 제공되는 100만 달러
  • 바르토와 서튼의 연구는 강화 학습을 통해 컴퓨팅과 여러 다른 학문에서 큰 잠재력을 가지고 있다고 평가
  • 이전 튜링상 수상자 중에는 딥 뉴럴 네트워크 작업으로 2018년 메타의 최고 AI 과학자인 얀 르쿤도 포함
  • 기사는 폴 사워즈가 작성, 그는 런던 기반 시니어 작가로 주로 영국과 유럽의 스타트업 세계를 다룸

4techcrunch.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기