본문 바로가기

OpenAI 비용 효율성을 극대화한 혁신적인 작은 모델 GPT-4o mini 공개

노랗 2024. 7. 23.
반응형

최근 OpenAI는 인공지능의 새로운 시대를 열며, 비용 효율적인 작은 모델인 GPT-4o mini를 공개했습니다.

이 모델은 AI 애플리케이션의 구축 범위를 크게 확장할 것으로 기대되며, 그 성능과 가격 면에서 많은 주목을 받고 있습니다. 이번 소개글에서는 GPT-4o mini의 흥미로운 특징과 성능, 그리고 이를 활용한 다양한 가능성에 대해 알아보겠습니다.

GPT-4o mini의 놀라운 성능과 경제성

GPT-4o mini는 MMLU에서 82%의 점수를 기록하며, 현재 LMSYS 리더보드의 채팅 선호도에서 GPT-4를 능가하는 성과를 보였습니다.

이 모델의 가격은 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트로, 이전 최첨단 모델보다 10배 저렴하며, GPT-3.5 Turbo보다 60% 이상 저렴합니다. 이는 AI 기술을 더욱 접근 가능하게 만들고, 다양한 분야에서 혁신을 촉진할 수 있는 기회를 제공합니다.

다양한 애플리케이션에 적합한 주요 기능

GPT-4o mini는 낮은 비용과 지연 시간으로 광범위한 작업을 수행할 수 있으며, 여러 모델 호출을 연결하거나 병렬화하는 애플리케이션(예: 여러 API 호출)에 적합합니다.

기능 설명
낮은 비용 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트
지연 시간 감소 빠른 응답 시간으로 다양한 작업 수행 가능
멀티모델 호출 여러 API 호출을 병렬화하거나 연결 가능
대용량 컨텍스트 처리 전체 코드 베이스나 대화 기록 등 많은 양의 컨텍스트 처리 가능
고객 지원 실시간 텍스트 응답을 주고받는 애플리케이션에 적합
멀티모달 지원 텍스트와 비전, 향후 이미지, 비디오, 오디오 입출력 지원
큰 컨텍스트 윈도우 128K 토큰의 컨텍스트 윈도우, 요청당 최대 16K 출력 토큰 지원
최신 지식 2023년 10월까지의 지식을 보유

또한, 모델에 많은 양의 컨텍스트를 전달하는 애플리케이션(예: 전체 코드 베이스 또는 대화 기록)에 적합하며, 고객과 빠르고 실시간으로 텍스트 응답을 주고받는 애플리케이션(예: 고객 지원 챗봇)에 특히 유용합니다.

GPT-4o mini는 API에서 텍스트와 비전을 지원하며, 향후 텍스트, 이미지, 비디오 및 오디오 입출력을 지원할 예정입니다. 128K 토큰의 컨텍스트 윈도우를 가지고 있으며, 요청당 최대 16K 출력 토큰을 지원합니다. 이는 복잡한 작업을 수행할 수 있는 능력을 보여주며, 2023년 10월까지의 최신 지식을 바탕으로 한 정확한 응답을 제공합니다.

우수한 성능을 자랑하는 GPT-4o mini

평가  기준점수
MMLU 82.0%
MGSM 87.0%
HumanEval 87.2%
MMMU 59.4%
텍스트 인텔리전스 GPT-3.5 Turbo 및 기타 소형 모델을 능가
멀티모달 추론 GPT-3.5 Turbo 및 기타 소형 모델을 능가
장문 컨텍스트 성능 GPT-3.5 Turbo보다 향상

GPT-4o mini는 텍스트 인텔리전스와 멀티모달 추론 모두에서 GPT-3.5 Turbo 및 기타 소형 모델을 능가합니다. MMLU에서 82.0%, MGSM에서 87.0%, HumanEval에서 87.2%, MMMU에서 59.4%의 점수를 기록하며, 다른 소형 모델보다 우수한 성능을 보였습니다.

Evaluation Scores Chart

Evaluation Scores

이는 다양한 분야에서의 활용 가능성을 보여주며, 개발자들이 더 나은 AI 애플리케이션을 구축할 수 있는 기회를 제공합니다.

안전성과 신뢰성 강화

사전 학습 필터링 혐오 발언, 성인 콘텐츠, 개인 정보를 주로 수집하는 사이트, 스팸 등의 정보 필터링
사후 학습 인간 피드백을 통한 강화 학습(RLHF) 사용
안전 완화 기능 GPT-4o와 동일한 안전 완화 기능 내장
외부 전문가 테스트 70명 이상의 외부 전문가들이 테스트하여 잠재적 위험 식별 및 해결
모델 탈옥 방지 명령 계층 방법을 적용하여 모델 탈옥, 프롬프트 주입 및 시스템 프롬프트 추출 저항 능력 개선

GPT-4o mini는 안전성 조치에서도 탁월한 성과를 보이고 있습니다. 사전 학습 시 모델이 학습하거나 출력하지 않기를 원하는 정보(예: 혐오 발언, 성인 콘텐츠, 개인 정보를 주로 수집하는 사이트, 스팸 등)를 필터링합니다.

사후 학습 시 인간 피드백을 통한 강화 학습(RLHF) 등의 기법을 사용하여 모델의 동작을 정책에 맞게 조정함으로써 모델 응답의 정확성과 신뢰성을 개선합니다.

GPT-4o mini는 GPT-4o와 동일한 안전 완화 기능이 내장되어 있으며, 70명 이상의 외부 전문가들이 GPT-4o를 테스트하여 잠재적 위험을 식별하고 해결했습니다. 이는 사용자들이 안전하고 신뢰할 수 있는 AI 솔루션을 사용할 수 있도록 보장합니다.

GPT-4o mini  가격 및 가용성

API 제공 Assistants API, Chat Completions API, Batch API에서 텍스트 및 비전 모델 사용 가능
가격 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트
파인튜닝 출시 향후 며칠 내에 파인튜닝 출시 예정
ChatGPT 접근성 무료, 플러스, 팀 사용자는 오늘부터 GPT-3.5 대신 GPT-4o mini 사용 가능
엔터프라이즈 접근성 다음 주부터 엔터프라이즈 사용자도 접근 가능

GPT-4o mini는 Assistants API, Chat Completions API 및 Batch API에서 텍스트 및 비전 모델로 사용 가능하며, 개발자는 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트를 지불하게 됩니다.

 

겜스고 ChatGPT 유료 최대 80% 할인코드 결제후기 - 노랗IT월드

오늘은 OTT 프리미엄 스트리밍 서비스를 혁신적으로 공유할 수 있는 플랫폼, Gamesgo에 대해 소개해 드리겠습니다. 현재 겜스고와 관련된 사기 논란이 있지만, 제가 3년 동안 직접 사용한 경험을 바

yellowit.co.kr

향후 며칠 내에 GPT-4o mini에 대한 파인튜닝도 출시될 예정이며 또한, ChatGPT의 무료, 플러스 및 팀 사용자는 오늘부터 GPT-3.5 대신 GPT-4o mini에 액세스할 수 있으며, 엔터프라이즈 사용자도 다음 주부터 액세스 가능합니다.

GPT-4o miniAI 인텔리전스의 놀라운 발전과 함께 상당한 비용 절감을 이루어냈습니다.

이 모델의 토큰당 비용은 2022년에 도입된 text-davinci-003보다 99% 낮아졌으며, 모든 애플리케이션과 웹사이트에 원활하게 통합될 수 있는 미래를 구상하고 있으며 이는 IT 및 프로그램 개발자들이 강력한 AI 애플리케이션을 더 효율적이고 저렴하게 구축하고 확장할 수 있는 길을 열어줍니다.

 

반응형

댓글