검색
검색
Search
회원가입
로그인
인기순
전체
공개 노트

Sam altman 이 블로그에 올린 gpt-4o 에 관한 글

샘 알트만이 굉장히 오랜만에 블로그에 글을 올렸네요. 영어 원문은 여기에서 읽을 수 있습니다. GPT-4o 다음은 gpt-4o로 번역한 글입니다. gpt-4o 오늘 발표에서 강조하고 싶은 두 가지가 있습니다. 첫째, 우리의 사명 중 중요한 부분은 매우 유능한 A...
glevel
glevel
·
2024-05-20

PaliGemma - 구글의 비전 오픈 모델

PaliGemma - 구글의 비전 오픈 모델

PaliGemma 팔리젬마는 구글에서 만든 경량의 개방형 비전 언어 모델 (VLM)입니다. SigLIP 비전 모델과 Gemma 언어 모델에 기반하여 만들어졌습니다. 이미지와 텍스트를 모두 입력으로 사용하며 세부 정보와 컨텍스트가 있는 이미지 관련 질문에 답변할 수 있...
glevel
glevel
·
2024-05-20
PaliGemma - 구글의 비전 오픈 모델

구글의 Project IDX - vscode 와 유사한 웹 코드 에디터

구글의 Project IDX - vscode 와 유사한 웹 코드 에디터

Projext IDX project idx는 클라우드 기반으로 사용할 수 있는 AI 보조 워크스페이스입니다. 다양한 프레임워크와 언어를 지원하고 개발 환경 부터 앱 출시까지 워크플로우를 지원합니다. Project IDX vs code 같은 구글의 웹 기반의 코드 ...
glevel
glevel
·
2024-05-20
구글의 Project IDX - vscode 와 유사한 웹 코드 에디터

GPT-4o 의 이미지 생성 기능은 아직 출시전입니다. + 데모

GPT-4o 의 이미지 생성 기능은 아직 출시전입니다. + 데모

그렉 브록만 트위터 GPT-4o 생성 이미지 GPT-4o의 이미지 생성 기능만으로도 탐색할 수 있는 것이 너무 많습니다. 팀은 이를 세상에 알리기 위해 열심히 노력하고 있습니다. 런칭하기 위해 팀이 열심히 일하고 있다고 하네요. 데모 이미지를 보시면 필기체 ...
glevel
glevel
·
2024-05-18
GPT-4o 의 이미지 생성 기능은 아직 출시전입니다. + 데모

GPT-4o의 새로운 보이스 모드는 아직 배포되지 않았습니다.

GPT-4o의 새로운 보이스 모드는 아직 배포되지 않았습니다.

샘 알트만 트위터 또한 명확성을 위해 새로운 음성 모드는 아직 출시되지 않았습니다(GPT-4o의 텍스트 모드는 출시되었지만). 현재 앱에서 사용할 수 있는 것은 이전 버전입니다. 새로운 것은 기다릴만한 가치가 있습니다 지금 보이스 모드는 아직 예전 버전입니다....
glevel
glevel
·
2024-05-18
GPT-4o의 새로운 보이스 모드는 아직 배포되지 않았습니다.

gpt4o 사용법 - 무료 사용량, 신기능 테스트

gpt4o 사용법 - 무료 사용량, 신기능 테스트

GPT-4o 사용법 chatgpt.com 에서 사용할 수 있습니다. 이제 메인 도메인을 chatgpt.com 으로 바꾼 것 같네요. 이 팝업 창이 나오면 지금 사용해 보기 클릭 선택하기 플러스 유저의 경우 상단에서 ChatGPT 4o 선택 무료 유저의 ...
glevel
glevel
·
2024-05-17
gpt4o 사용법 - 무료 사용량, 신기능 테스트

GPT-4o 로 한글 OCR 하기

GPT-4o 로 한글 OCR 하기

GPT-4o에서 정말 성능이 많이 향상된 것은 비전 능력입니다. 이 이미지 인식 능력을 활용해서 한글 OCR을 할 수 있는데요. 성능이 장난이 아닙니다. 이런 식으로 변형이 된 텍스트도 인식할 수 있습니다. 프롬프트는 다음 이미지 OCR 을 입력했습니다. 이번에...
glevel
glevel
·
2024-05-17
GPT-4o 로 한글 OCR 하기

Google의 최고 동영상 생성 모델 Veo - SORA의 경쟁자

Google의 최고 동영상 생성 모델 Veo - SORA의 경쟁자

Veo 비오는 구글의 현재 가장 높은 성능의 동영상 생성 모델입니다. 1080 해상도의 1분이 넘는 비디오를 생성할 수 있습니다. 또한 다양한 영화적이고 시각적인 스타일을 적용할 수 있습니다. (타임랩스, 항공샷 등) VideoFX 에서 사용할 수 있으며 대기자 리...
glevel
glevel
·
2024-05-16
Google의 최고 동영상 생성 모델 Veo - SORA의 경쟁자

Google 의 음악을 만들어 주는 MusicFX 한국에서 사용 가능!

Google 의 음악을 만들어 주는 MusicFX 한국에서 사용 가능!

MusixFX 구글 io 24에서 정말 많은 발표가 있었는데요. 그 중에서 여러 서비스는 labs.google 에서 사용이 가능합니다. 아직 imagen3 나 veo 같은 경우는 미국 먼저 공개이지만 다양한 AI 실험 기능들을 사용할 수 있습니다. 그 중에서 이번에...
glevel
glevel
·
2024-05-16
Google 의 음악을 만들어 주는 MusicFX 한국에서 사용 가능!

틸노트 5월 3주차 AI 뉴스레터 - OpenAI VS 구글

틸노트 5월 3주차 AI 뉴스레터 - OpenAI VS 구글

이번 주에는 AI 분야에 있어서는 굉장한 라이드였습니다. OpenAI Spring update GPT-4o 무료 제공, 데스크탑 앱, 향상된 보이스 모드 = 멀티 : 한국시간으로 5월 14일 오전 2시 오픈 AI에서 스프링 업데이트를 발표했습니다. 처음부터 멀티모달...
glevel
glevel
·
2024-05-15
틸노트 5월 3주차 AI 뉴스레터 - OpenAI VS 구글

Anthropic Console에서 클로드 만능 프롬프트 사용하기

Anthropic Console에서 클로드 만능 프롬프트 사용하기

Anthropic Console에 가면 간단한 프롬프트를 입력하면 이걸 정교한 프롬프트로 변경해 주는 Generate a prompt 기능이 생겼습니다. Dashboard 에서 Generate a prompt 를 클릭하면 됩니다. 여기에서 바꿀 간단한 프롬프트를 입력...
glevel
glevel
·
2024-05-15
Anthropic Console에서 클로드 만능 프롬프트 사용하기

Google IO 2024 이벤트 - Gemini Flash, AI 오버뷰, Project Astra, 음악 및 비디오 생성

Google IO 2024 이벤트 - Gemini Flash, AI 오버뷰, Project Astra, 음악 및 비디오 생성

한국 시간으로는 5월 15일 수요일 오전 2시에 열렸습니다. 정말 구글도 장난이 아니네요. Google I/O 2024 구글 키노트 AI 오버뷰 : SGE를 업그레이드. 검색 결과에서 AI가 생성한 답변을 볼 수 있음. 구글 포토 : 사진을 기반으로 AI로 ...
glevel
glevel
·
2024-05-14
Google IO 2024 이벤트 - Gemini Flash, AI 오버뷰, Project Astra, 음악 및 비디오 생성

ChatGPT 맥 앱 다운로드 링크

Chat GPT Desktop App for Mac ChatGPT 맥은 여기에서 다운로드 받을 수 있네요. 플러스 유저들에게 얼리 액세스 공개라고 합니다. OpenAI 직원이 링크가 맞다고 확인했습니다. url도 chatgpt에서 사용하는 url 입니다. 설치...
glevel
glevel
·
2024-05-14

GPT-4o 무료 사용자들에게 공개

OpenAI 에서 GPT-4o 모델을 런칭함. 늘어난 효율성으로 무료 사용자들에게 기존 Advanced 기능들을 무료로 제공. 유료 사용자들에게는 ChatGPT 플러스와 팀에 먼저 공개되고 엔터프라이즈는 곧 제공될 예정임. 플러스 유료 사용자는 5배 더 많은 사용량 ...
glevel
glevel
·
2024-05-14

GPT-4o - 새로운 GPT-4 멀티 모달 모델

GPT-4o - 새로운 GPT-4 멀티 모달 모델

GPT-4o (omni) OpenAI의 새로운 플래그십 모델. 오디오, 비전, 텍스트를 오가며 실시간으로 처리할 수 있다. GPT-4o는 자연스러운 인간-컴퓨터 인터랙션을 추구한다. 텍스트, 오디오, 이미지의 다양한 조합을 받을 수 있으며 역시 다양한 형식의 아...
glevel
glevel
·
2024-05-14
GPT-4o - 새로운 GPT-4 멀티 모달 모델

OpenAI Spring update - GPT-4o 무료 제공, 데스크탑 앱, 향상된 보이스 모드 = 멀티 모달 에이전트

OpenAI Spring update - GPT-4o 무료 제공, 데스크탑 앱, 향상된 보이스 모드 = 멀티 모달 에이전트

OpenAI에서 유튜브 라이브로 공개했습니다. GPT-4o (omnimodel) 새로운 플래그십 모델. GPT4 수준의 모델이지만 빠른 속도의 텍스트, 비전, 오디오 처리가 가능한 모델. GPT-4o의 효율성으로 다음과 같은 기존의 고급 기능들을 무료 사용자...
glevel
glevel
·
2024-05-14
OpenAI Spring update - GPT-4o 무료 제공, 데스크탑 앱, 향상된 보이스 모드 = 멀티 모달 에이전트

퍼플렉시티 사용법 - AI 검색으로 한방에 찾자

퍼플렉시티 사용법 - AI 검색으로 한방에 찾자

perplexity 사용법 퍼플렉시티는 인공지능 기반 검색입니다. 기존의 검색은 10개의 링크를 주고 여기에서 찾아가서 결과를 확인해야 했습니다. 하지만 AI 검색은 결과를 바탕으로 사용자의 질의에 대한 하나의 문서를 생성하여 대답을 해줍니다. 그러니깐 여러 검색 결...
glevel
glevel
·
2024-05-13
퍼플렉시티 사용법 - AI 검색으로 한방에 찾자

알파폴드 3 (AlphaFold 3) - 분자 구조를 예측하여 상호 작용을 이해하는 AI

알파폴드 3란? 알파폴드 3(AlphaFold 3)은 구글 딥마인드와 Isomorphic Labs에서 개발한 새로운 AI 모델로, 단백질, DNA, RNA, 리간드 등의 분자 구조를 정확하게 예측하여 이들 분자 간 상호작용을 이해하는 데 쓰이며, 약물 발견 분야에 기...
glevel
glevel
·
2024-05-13

OpenAI 라이브 이벤트 공개 예정 - 멀티모달 에이전트, GPT-4 Light?

월요일 10AM PT (한국시간 화요일 오전 2시)에 OpenAI에서 새로운 기능을 라이브로 공개한다고 해서 관심을 받고 있습니다. 아마 다중모드 AI 디지털 어시스턴트(GPT-Auto)의 데모나 GPT-4 빠른 모델 (GPT light) 정도가 되지 않을까 예상해 ...
glevel
glevel
·
2024-05-13

틸노트 Gist 기능 공개 - AI로 웹사이트 및 유튜브 요약해주는 서비스

틸노트 Gist 기능 공개 - AI로 웹사이트 및 유튜브 요약해주는 서비스

틸노트에 원래 요약 기능이 있었습니다. 그런데 친구가 좀 더 UI를 개선해 달라고 해서 틸노트 Gist 기능을 만들어 봤습니다. 에서 사용하실 수 있습니다. AI로 유튜브나 웹 사이트 링크를 요약해 주는 기능입니다. 원본을 보면서 메모도 할 수 있어서 편리합니다....
glevel
glevel
·
2024-05-11
틸노트 Gist 기능 공개 - AI로 웹사이트 및 유튜브 요약해주는 서비스

T
블로그 기반 대답
AI Chat