검색
검색
공개 노트 검색
회원가입로그인

4월 3주차 틸노트 AI 뉴스레터

틸노트 AI 주간 뉴스를 공유해드립니다.

  • firefly 로 이미지 생성하기 - 구조 참조 기능 등 : 이미지 생성 AI 인 파이어플라이를 사용해 봤습니다. 구조 참조 기능을 활용할 수 있네요.

  • Grok 1.5 Vision 출시 - 물리적 세계를 이해하는 멀티모달 모델 : Grok 의 멀티모달 모델인 Grok 1.5 Vision 이 출시되었습니다. 기존 모델들과도 성능이 어느정도 비슷한 것 같습니다. RealWorldQA 벤치마크가 추가됐는데 이건 실세계 공간 이해를 측정하는 것이라고 합니다. 이를 보면 물리적 세계 이해를 추구하는 것을 알 수 있습니다.

  • cohere rerank 3 출시 : cohere 에서 rerank3를 출시했습니다. 리랭크는 특정 질문에 대한 여러 결과에 순위를 매겨주는 것을 말합니다. RAG 를 한 후 에 여러 결과가 나왔다면 여기에서 우선순위를 만들 때 활용할 수 있습니다.

  • UDIO 노래를 생성하는 AI : 음악 생성 AI인 수노의 라이벌이 등장했습니다. 구글 딥마인드 출신의 연구자들이 참여한 프로젝트입니다. 뛰어난 퀄리티의 음악을 생성할 수 있습니다. 저도 써봤는데 아직 한글은 완벽하지 않더라구요. 그래도 굉장히 유망한 것 같습니다.

  • 구글 Cloud Next 2024 키노트 메모 : 구글이 클라우드 넥스트에서 다양한 소식들을 전했습니다. 먼저 백만 토큰 컨텍스트 윈도우의 Gemini 1.5 Pro가 일반 공개됐습니다. 또한 다양한 에이전트들을 만들 수 있는 Vertex AI의 에이전트 빌더도 공개했습니다. AI 기능이 내장된 동영상 편집 프로그램인 Google Vids도 워크스페이스에 포함될 예정이라고 합니다. 그 밖에는 Imagine 2.0의 움직이는 이미지 기능, Gemini Code Assist 등을 공개했습니다.

저는 프롬프트를 어떻게 사용하나 생각을 해봤더니 context와 cot를 많이 사용하는 것 같더라구요. context로 필요한 정보를 주고 질문을 많이 하는 편입니다. 그리고 cot로 사람의 추론을 더해서 문제를 해결하는 경우가 많은 것 같습니다. (이 코드가 안되는데 이 부분에 글로벌 변수를 만들어 상태를 체크하는 로직을 추가하면 되지 않을까?)

그리고 함께 AI에 대해 스터디하시고 싶으신 분들은 카카오톡 단톡방에 참여해 보세요. AI 스퀘어 (chatgpt,gemini,claude)

날씨가 슬슬 더워지는 것 같네요. 그럼 좋은 한 주 보내시길 바랍니다. 감사합니다!

조회수 : 144
heart
공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기
T
페이지 기반 대답
AI Chat