OpenAI 비용 효율성을 극대화한 혁신적인 작은 모델 GPT-4o mini 공개
최근 OpenAI는 인공지능의 새로운 시대를 열며, 비용 효율적인 작은 모델인 GPT-4o mini를 공개했습니다.
이 모델은 AI 애플리케이션의 구축 범위를 크게 확장할 것으로 기대되며, 그 성능과 가격 면에서 많은 주목을 받고 있습니다. 이번 소개글에서는 GPT-4o mini의 흥미로운 특징과 성능, 그리고 이를 활용한 다양한 가능성에 대해 알아보겠습니다.
GPT-4o mini의 놀라운 성능과 경제성
GPT-4o mini는 MMLU에서 82%의 점수를 기록하며, 현재 LMSYS 리더보드의 채팅 선호도에서 GPT-4를 능가하는 성과를 보였습니다.
이 모델의 가격은 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트로, 이전 최첨단 모델보다 10배 저렴하며, GPT-3.5 Turbo보다 60% 이상 저렴합니다. 이는 AI 기술을 더욱 접근 가능하게 만들고, 다양한 분야에서 혁신을 촉진할 수 있는 기회를 제공합니다.
다양한 애플리케이션에 적합한 주요 기능
GPT-4o mini는 낮은 비용과 지연 시간으로 광범위한 작업을 수행할 수 있으며, 여러 모델 호출을 연결하거나 병렬화하는 애플리케이션(예: 여러 API 호출)에 적합합니다.
기능 | 설명 |
낮은 비용 | 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트 |
지연 시간 감소 | 빠른 응답 시간으로 다양한 작업 수행 가능 |
멀티모델 호출 | 여러 API 호출을 병렬화하거나 연결 가능 |
대용량 컨텍스트 처리 | 전체 코드 베이스나 대화 기록 등 많은 양의 컨텍스트 처리 가능 |
고객 지원 | 실시간 텍스트 응답을 주고받는 애플리케이션에 적합 |
멀티모달 지원 | 텍스트와 비전, 향후 이미지, 비디오, 오디오 입출력 지원 |
큰 컨텍스트 윈도우 | 128K 토큰의 컨텍스트 윈도우, 요청당 최대 16K 출력 토큰 지원 |
최신 지식 | 2023년 10월까지의 지식을 보유 |
또한, 모델에 많은 양의 컨텍스트를 전달하는 애플리케이션(예: 전체 코드 베이스 또는 대화 기록)에 적합하며, 고객과 빠르고 실시간으로 텍스트 응답을 주고받는 애플리케이션(예: 고객 지원 챗봇)에 특히 유용합니다.
GPT-4o mini는 API에서 텍스트와 비전을 지원하며, 향후 텍스트, 이미지, 비디오 및 오디오 입출력을 지원할 예정입니다. 128K 토큰의 컨텍스트 윈도우를 가지고 있으며, 요청당 최대 16K 출력 토큰을 지원합니다. 이는 복잡한 작업을 수행할 수 있는 능력을 보여주며, 2023년 10월까지의 최신 지식을 바탕으로 한 정확한 응답을 제공합니다.
우수한 성능을 자랑하는 GPT-4o mini
평가 | 기준점수 |
MMLU | 82.0% |
MGSM | 87.0% |
HumanEval | 87.2% |
MMMU | 59.4% |
텍스트 인텔리전스 | GPT-3.5 Turbo 및 기타 소형 모델을 능가 |
멀티모달 추론 | GPT-3.5 Turbo 및 기타 소형 모델을 능가 |
장문 컨텍스트 성능 | GPT-3.5 Turbo보다 향상 |
GPT-4o mini는 텍스트 인텔리전스와 멀티모달 추론 모두에서 GPT-3.5 Turbo 및 기타 소형 모델을 능가합니다. MMLU에서 82.0%, MGSM에서 87.0%, HumanEval에서 87.2%, MMMU에서 59.4%의 점수를 기록하며, 다른 소형 모델보다 우수한 성능을 보였습니다.
Evaluation Scores
이는 다양한 분야에서의 활용 가능성을 보여주며, 개발자들이 더 나은 AI 애플리케이션을 구축할 수 있는 기회를 제공합니다.
안전성과 신뢰성 강화
사전 학습 필터링 | 혐오 발언, 성인 콘텐츠, 개인 정보를 주로 수집하는 사이트, 스팸 등의 정보 필터링 |
사후 학습 | 인간 피드백을 통한 강화 학습(RLHF) 사용 |
안전 완화 기능 | GPT-4o와 동일한 안전 완화 기능 내장 |
외부 전문가 테스트 | 70명 이상의 외부 전문가들이 테스트하여 잠재적 위험 식별 및 해결 |
모델 탈옥 방지 | 명령 계층 방법을 적용하여 모델 탈옥, 프롬프트 주입 및 시스템 프롬프트 추출 저항 능력 개선 |
GPT-4o mini는 안전성 조치에서도 탁월한 성과를 보이고 있습니다. 사전 학습 시 모델이 학습하거나 출력하지 않기를 원하는 정보(예: 혐오 발언, 성인 콘텐츠, 개인 정보를 주로 수집하는 사이트, 스팸 등)를 필터링합니다.
사후 학습 시 인간 피드백을 통한 강화 학습(RLHF) 등의 기법을 사용하여 모델의 동작을 정책에 맞게 조정함으로써 모델 응답의 정확성과 신뢰성을 개선합니다.
GPT-4o mini는 GPT-4o와 동일한 안전 완화 기능이 내장되어 있으며, 70명 이상의 외부 전문가들이 GPT-4o를 테스트하여 잠재적 위험을 식별하고 해결했습니다. 이는 사용자들이 안전하고 신뢰할 수 있는 AI 솔루션을 사용할 수 있도록 보장합니다.
GPT-4o mini 가격 및 가용성
API 제공 | Assistants API, Chat Completions API, Batch API에서 텍스트 및 비전 모델 사용 가능 |
가격 | 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트 |
파인튜닝 출시 | 향후 며칠 내에 파인튜닝 출시 예정 |
ChatGPT 접근성 | 무료, 플러스, 팀 사용자는 오늘부터 GPT-3.5 대신 GPT-4o mini 사용 가능 |
엔터프라이즈 접근성 | 다음 주부터 엔터프라이즈 사용자도 접근 가능 |
GPT-4o mini는 Assistants API, Chat Completions API 및 Batch API에서 텍스트 및 비전 모델로 사용 가능하며, 개발자는 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트를 지불하게 됩니다.
향후 며칠 내에 GPT-4o mini에 대한 파인튜닝도 출시될 예정이며 또한, ChatGPT의 무료, 플러스 및 팀 사용자는 오늘부터 GPT-3.5 대신 GPT-4o mini에 액세스할 수 있으며, 엔터프라이즈 사용자도 다음 주부터 액세스 가능합니다.
GPT-4o mini는 AI 인텔리전스의 놀라운 발전과 함께 상당한 비용 절감을 이루어냈습니다.
이 모델의 토큰당 비용은 2022년에 도입된 text-davinci-003보다 99% 낮아졌으며, 모든 애플리케이션과 웹사이트에 원활하게 통합될 수 있는 미래를 구상하고 있으며 이는 IT 및 프로그램 개발자들이 강력한 AI 애플리케이션을 더 효율적이고 저렴하게 구축하고 확장할 수 있는 길을 열어줍니다.
'IT 리뷰 > ChatGPT' 카테고리의 다른 글
ChatGPT 5 멀티모달 기능 GPT-4 차이점과 기대 효과 (0) | 2024.07.24 |
---|---|
엔비디아 뜻 AI산업 주식 ChatGPT 성장 미래전망 예상 (0) | 2024.03.15 |
윈도우11 BingGPT Copilot 활성화 - 코파일럿 설치방법 (0) | 2024.01.09 |
댓글