T
glevel
노트 검색
회원가입
로그인
인기순
전체
공개 노트
책
OpenAI 비동기 작업에 50%의 할인을 제공하는 BatchAPI 공개
Batch API OpenAI에서 기존의 요청에 50%까지 할인을 해주는 BatchAPI를 공개 했습니다. 대신 결과를 최대 24시간 내에 받아볼 수 있다고 합니다. 문서 : 에 POST 요청을 보냄으로써 활용할 수 있습니다. 1. file api 를 통해 ...
glevel
·
2024-04-17
4월 3주차 틸노트 AI 뉴스레터
틸노트 AI 주간 뉴스를 공유해드립니다. firefly 로 이미지 생성하기 구조 참조 기능 등 : 이미지 생성 AI 인 파이어플라이를 사용해 봤습니다. 구조 참조 기능을 활용할 수 있네요. Grok 1.5 Vision 출시 물리적 세계를 이해하는 멀티모달 모델 ...
glevel
·
2024-04-16
firefly 로 이미지 생성하기 - 구조 참조 기능 등
파이어 플라이로 이미지를 생성할 수 있습니다. 무료이고 상업적으로 사용이 가능합니다. 저는 빅뱅 우주 폭발, 초신성 폭발이라는 프롬프트로 이미지를 생성해 봤습니다. 이렇게 멋지게 생성이 되었네요. 구조 참조 기능 이미지를 입력하고 구조를 참조할 수 있는...
glevel
·
2024-04-16
틸노트 세이버 티저
디토님 이야기 듣고 주말에 세이버를 만들어 봤다. 버전 2로 들어갈 듯. 브라우저 하단에 항상 떠있어서 쉽게 메모할 수 있고, 저렇게 마우스를 클릭하면 노트로 바로 보낼 수 있다. 틸노트의 기본 비전인 기록과 공유를 쉽게할 수 있다를 조금 더 높은 resol...
glevel
·
2024-04-15
여태까지 프롬프트에 대해 알게 된 것 - context, cot
대부분은 지시문 + 맥락으로 처리됨. (Instruction = 알고리즘, context = 데이터) CoT는 중간 추론 단계를 넣어주는 기술임. AI에 사람의 추론을 더해 문제를 해결할 수 있음. 예를 들어 특정 문제를 해결하고 있지 못할 때 해당 문제를 해결할 수...
glevel
·
2024-04-15
Grok 1.5 Vision 출시 - 물리적 세계를 이해하는 멀티모달 모델
xAI에서 멀티모달 모델인 Grok-1.5 Vision 프리뷰 모델을 공개했습니다. 이 모델은 물리적 세계를 더 잘 이해한다고 합니다. Grok-1.5V는 표준 텍스트 기능 외에도 문서, 다이어그램, 그래픽, 스크린샷 및 사진 등 다양한 시각 정보를 처리할 수 있습...
glevel
·
2024-04-15
Suno로 음악 만들기 유튜브 튜토리얼 영상
Suno 로 음악을 만드는 것을 튜토리얼 영상식으로 만들어 봤습니다. 노래 만들 때는 두 파트로 나누어서 총 8줄 정도로 하는 것이 가장 좋다고 합니다. 놀랐던 것은 연주음악을 BGM으로 만들어 봤는데 퀄리티가 꽤 좋네요. game ost, electronic으...
glevel
·
2024-04-14
cohere rerank 3 출시
Rerank API Reference Cohere Docs cohere 에서 rerank3를 출시했습니다. 리랭크는 특정 질문에 대한 여러 결과에 순위를 매겨주는 것을 말합니다. RAG 를 한 후 에 여러 결과가 나왔다면 여기에서 우선순위를 만들 때 활용할 수 있습니...
glevel
·
2024-04-13
UDIO 노래를 생성하는 AI
Udio Make your music 수노와 같이 노래를 만들어 주는 AI 가 나왔습니다. blues about hometown 을 입력해 보겠습니다. 이런식으로 30초 분량의 음악 2개를 생성해 주네요. 퀄리티는 꽤 좋은 것 같습니다. Udio Br...
glevel
·
2024-04-12
구글 Cloud Next 2024 키노트 메모
Gemini 1.5 pro 백만 토큰의 컨텍스트 윈도우를 가진 제미나이가 일반 공개되었다. 에이전트 에이전트 개념을 기반으로 기업 시장을 공략하려는 것 같다. Vertex AI 의 Agent Builder 를 통해 맞춤형 에이전트를 구축할 수 있다. 커스토머 에...
glevel
·
2024-04-11
ClipChamp로 동영상의 무음 구간 자르기 + 자동 자막 기능
클립챔프에 무음 구간을 자동으로 잘라주는 기능이 있다. 타임라인 창에 별 아이콘을 누른 후 다듬기 및 정리를 누르면 된다. 한국어로 선택 후 전사를 클릭한다. 이렇게 일시 중지를 동영상에서 모두 찾게 된다. 나는 1개가 나왔다. 여기에서 모두 삭...
glevel
·
2024-04-10
구글 이매진 2.0 움직이는 이미지 기능 발표
구글 Next 컨퍼런스에서 Vertex AI를 위한 새로운 모델과 기능들이 발표되었습니다. 그 중 Image 2.0의 라이브 이미지 기능이 눈에 띄었습니다. 24 프레임의 4초 분량의 움직이는 이미지를 생성할 수 있습니다. 영화 같은 영상은 아니지만 이미지에 움...
glevel
·
2024-04-10
틸노트 4월 2주차 인공지능 뉴스레터 - 멀티모달과 에이전트
4월 2주차 인공지능 뉴스레터입니다. 편안한 하루 되시길 바랍니다. 구글 이매진 2.0 움직이는 이미지 기능 발표 : 구글 넥스트 컨퍼런스에서 백만 토큰 컨텍스트 윈도우의 제미나이 프로와 이매진 2.0 등 다양한 기능을 발표했는데요. 그 중 이매진 2.0의 라이브 ...
glevel
·
2024-04-10
Stable Video Diffusion 사용법
스테이블 비디오 디퓨전 사용법 (SVD) stablevideo.com 에서 사용할 수 있다. Stable Video Generate Videos with AI 로컬이나 ComfyUI와 같이 설치해서도 사용이 가능하다. 이미지로 생성하기 오픈 베타에는 ...
glevel
·
2024-04-09
AI 훈련 데이터 부족과 사용 문제
뉴욕 타임즈에 따르면 GPT-4가 유튜브 비디오 백만 시간 이상을 바탕으로 학습했다고 합니다. OpenAI는 이러한 일들을 공정 사용이라고 생각한다고 합니다. 구글에서는 이런 행동이 서비스 약관(https://...
glevel
·
2024-04-09
클로드 기본 모델이 하이쿠로 내려갔네요.
클로드 기본 모델이 소넷에서 하이쿠로 내려갔네요. 사용량이 많아져서 그런걸까요? 일시적으로 너프된건지 디폴트가 이렇게 된건지는 잘 모르겠습니다. 하지만 지금은 가장 작은 모델인 하이쿠가 기본 모델입니다. 챗봇 아레나의 리더보드인데요. 현재 무료 챗봇 중 ...
glevel
·
2024-04-08
Cohere 의 새로운 LLM Command R+ - RAG와 에이전트에 최적화된 모델
Cohere에서 기업용 애플리케이션을 위한 LLM 인 Command R+ 을 출시했습니다. 이 모델은 Retrieval Augmented Generation (RAG) 와 멀티 스텝 도구 사용(에이전트)에 특화되어 있습니다. 128k 토큰 컨텍스트 윈도우와 RAG를 ...
glevel
·
2024-04-08
ai 쇼츠 만들어 주는 서비스 - 긴 비디오를 10개의 쇼츠로 만들어주는 서비스
Opus 클립은 긴 비디오를 10개의 쇼츠로 만들어주는 서비스이다. Opus Clip: 처음 가입하면 7일동안 90분의 영상을 처리할 수 있다. 무료 버전은 한달에 60분을 처리할 수 있다. 1080p까지 지원하며 워터마크가 있다. 이런 식으로 유튜브 ...
glevel
·
2024-04-07
유튜브 썸네일 만들기 - 포토피아 활용 (포토샵 대체제)
오늘은 포토샵의 대체제인 포토피아로 유튜브 썸네일을 만들어 봤다. Photopea Online Photo Editor : 조금 버벅거리기는 하는데 간단하게 사용하기 나쁘지 않은 것 같다. chatGPT에게 썸네일 아이디어는 어떤게 있는지, photopea로 유...
glevel
·
2024-04-06
도구 사용은 에이전틱 워크플로우의 중요한 디자인 패턴이다. - 앤드류 응 교수님
정보 수집, 작업 수행 또는 데이터 조작을 위해 호출하도록 요청할 수 있는 함수를 LLM에 부여하는 도구 사용은 AI 에이전트 워크플로우의 핵심 설계 패턴입니다. 웹 검색을 수행하거나 코드를 실행할 수 있는 LLM 기반 시스템에 익숙할 것입니다. 일부 대규모 소비자 대...
glevel
·
2024-04-06