며칠 전 OpenAI에서 세상을 또 한번 떠들썩 하게 만들었습니다.
바로 이번에 새로 공개한 GPT-4o 의 엄청난 퍼포먼스 때문인데요,
그 중에서도 특히 챗GPT와 음성으로 대화를 하는데, 거의 실시간으로 대화하는 모습이 거의 충격적이었습니다. 마치 전화기를 통해 다른 사람과 대화하는 느낌이었죠.
혹시 못 보신 분들을 위해 전체 영상 URL은 글 마지막에 올려놓겠습니다. 우선 그 전에 GPT-4o의 실시간 대화가 어느 정도인지 간단한 데모 영상만 짧게 한번 보고 가시겠습니다.
정말 엄청나지 않습니까?
저는 정말 충격적이었는데요, 이게 어떻게 가능하지? 이런 생각 밖에 안 들어서, 일단 결재부터 했습니다. 빨리 써보고 싶어서요 ㅎㅎㅎ
참고로 한 가지 말씀드리면, OpenAI 에서 이번에 발표한 GPT-4o는 유료/무료 사용자 모두 사용할 수 있도록 해준다고 하네요.
해서 한번 테스트 삼아 사용해 보실 분들은 저처럼 유료 가입을 하실 필요는 없습니다. (유료 사용자의 경우, 무료 사용자 보다 좀 더 쾌적하게 사용할 수 있도록 사용량을 늘려주거나 할 거 같습니다.)
OpenAI의 GPT-4o 발표 내용
2024년 5월 13일, OpenAI는 봄 업데이트 행사에서 최신 AI 모델인 GPT-4o를 발표했습니다. 이번 행사에서는 GPT-4o의 다양한 기능과 개선 사항이 소개되었으며, 이는 AI 업계에 큰 반향을 일으켰습니다.
이번에 발표한 GPT-4o의 주요 특징들을 간단히 정리해보면 다음과 같습니다.
멀티모달 기능
GPT-4o는 텍스트, 음성, 비디오를 실시간으로 해석하고 상호 작용 할 수 있습니다. 예를 들어, 이미지를 분석하고 설명하거나 화면에 표시된 수학 문제를 도와줄 수 있습니다.
속도 및 비용 효율성 개선
이전 모델인 GPT-4 Turbo에 비해 두 배 빠르고, 사용 비용은 절반으로 감소했습니다. 이는 더 많은 개발자와 사용자가 접근할 수 있도록 합니다.
음성 및 감정 톤 감지
사용자의 음성에서 감정 톤을 감지하고 이에 맞게 응답할 수 있으며, 심지어 노래로도 답변할 수 있습니다. 이는 더 자연스럽고 매력적인 상호작용을 목표로 합니다.
이 부분이 가장 놀라웠는데요, 시연하는 장면을 보면 이제 기계랑 대화하는 것 같은 느낌 자체가 들지 않았습니다. 진짜 영화에서 보는 것 같은 장면이 연출 되었는데요, 이제는 진짜 챗GPT로 영어 회화 공부도 하고, 여행 가서 의사소통이 되지 않아도 이거 하나면 겁날 게 없어 보입니다.
다국어 지원
GPT-4o는 50개 이상의 언어를 지원하여 다국어 환경에서도 효율적으로 사용할 수 있습니다. 이는 전 세계적으로 AI 도구를 보다 쉽게 사용할 수 있도록 하기 위한 노력의 일환입니다.
무료 사용자에게 기능 확장
OpenAI는 데이터 분석, 사진 관련 대화, 파일 업로드 등의 기능을 무료 사용자에게도 제공합니다. 무료 사용자는 일정 메시지 제한에 도달하면 GPT-3.5로 자동 전환됩니다.
새로운 사용자 인터페이스 및 데스크탑 애플리케이션
새롭게 개편된 ChatGPT UI는 더 대화형으로 변모하였으며, macOS 데스크탑 앱이 출시되어 화면 콘텐츠를 직접 다루는 기능을 포함합니다. 윈도우 버전도 출시될 예정입니다.
기억 기능
사용자 선호도를 세션 간에 기억하여 개인 맞춤형 경험을 제공할 수 있습니다. 이 기능은 이제 무료 사용자에게도 제공됩니다.
GPT-4o 드디어 사용 가능!!!
결재하고 챗GPT 실행해 보니, 벌써 GPT-4o를 사용할 수 있게 준비가 되어있습니다!!
아래 입력창 보시면 상단에 GPT-4o라고 되어있는 거 보이시지요? 저도 깜짝 놀라서 벌써 사용이 가능하구나 싶어 질문 몇 개 던져봤는데, 저의 체감 상 정말로 GPT-4 보다 더 빨라진 거 같습니다. 속도가 빠르니까 사용하는데 훨씬 쾌적한 느낌이 들었구요,
인터넷 검색도 바로 가능한 거 같네요. 전에는 최근 정보를 정리하고 싶으면 별도 플러그인 같은 거 설치해서 했어야 하는데, GPT-4o에서는 질문할 때 ‘인터넷에서 검색해서…’ 또는 ‘가장 최근 자료 찾아서…’ 등의 명령을 넣으면 처음에 인터넷 검색을 한 후 내용을 보여줍니다.
내용도 전에 보다 훨씬 풍성하게 적어주는 거 같아요. 다시 유료 결재 한 보람을 느낍니다. ㅎㅎㅎ
몇 일 전까지 Claude-3로 갈아타고 있었는데, 현재 느낌으론 다시 돌아갈 거 같지 않습니다.
자 그럼, 가장 중요한 음성 대화 기능을 살펴봐야겠지요? 음성 대화는 Web Browser 상에서는 안되고 모바일에서 GPT 앱을 다운 받아 설치해야 가능합니다.
엥? 근데 음성 대화는 왜 이런 거야??
감격하여 태블릿에 설치해 놓은 GPT 앱을 실행해 봅니다.
GPT 앱에서 오른쪽 하단의 해드셋 아이콘을 누르면 음성 대화를 할 수 있는데요, 근데 느낌이 싸~ 합니다.
실제로 대화 해보면 엄청 느립니다. 제가 한 마디 하면 3~4초 있다가 대답 한번 하고 이런 식이에요. 이전 GPT-4랑 똑같습니다.
분명히 GPT-4o로 되어있는데, 혹시나 해서 설정도 들어가 보고 이것 저것 만져봐도 위의 데모 영상처럼 되지 않습니다. 완전 속은 기분인데요,
괜히 결재 했나 싶어 일단 인터넷으로 검색을 해봐도 정확한 이유를 알 수 없었는데, 기사 내용을 자세히 보니, 이번 GPT-4o는 바로 사용자에게 오픈 되었지만, 음성 서비스는 2~3주 후에 오픈 된다고 하네요. ㅎㅎ
완전 오해해서 혼자 열 내고 있었는데, 다행히(?) 저만 그런 게 아니라 어떤 유튜버도 똑같이 영상을 올렸더군요. 음성 대화 제대로 안된다고 ㅎㅎㅎ
마치며…
정리하면, 현재 GPT-4o로 텍스트 처리는 가능하지만, 음성 처리는 5월 말 정도나 되어야 오픈 될 것으로 보입니다.
저처럼 오해하는 일이 없으시길 바라면서, 획기적인 음성 서비스를 기대하신 분들은 조금만 더 기다려 주시길 바랍니다.
감사합니다~~~