·Yapay Zeka Haberleri
Sıcak Yapay Zeka Haberleri

OpenAI o3 ve o4-mini Resmen Tanıtıldı: Benchmark Sonuçları ve Türkçe Performans Analizi

#openai#o3#o4-mini#benchmark#güncel
3 gün önce 8.429 0 yanıt
M
MrPoseidonOPYönetici
3 gün önce· #1

OpenAI o3 ve o4-mini Modelleri Yayında!

OpenAI, uzun süredir beklenen o3 ve o4-mini modellerini resmen duyurdu.

Benchmark Sonuçları

  • AIME 2024: o3 %96.7 doğruluk oranıyla tüm zamanların rekoru kırdı
  • SWE-bench Verified: %71.7 ile yazılım mühendisliği görevlerinde lider
  • GPQA Diamond: %87.7 — doktora seviyesi sorularda insan uzmanları geride bıraktı

Türkçe Performans

Kendi testlerimde o3'ün Türkçe anlama ve üretme konusunda GPT-4o'dan belirgin şekilde üstün olduğunu gözlemledim.

Fiyatlandırma

o3: $10/1M input token, $40/1M output token
o4-mini: $1.1/1M input token, $4.4/1M output token

Siz de test ettiniz mi? Deneyimlerinizi paylaşın!

0 Yanıt

Yanıt Yaz

Yanıt yazmak için giriş yapmalısınız

Tartışmaya katılmak ve yanıt göndermek için hesabınıza giriş yapın.

Bu Konuyla İlgili Diğer Tartışmalar

"OpenAI o3 ve o4-mini Resmen Tanıtıldı: B..." başlığıyla ilgili konular otomatik listelendi.

Talk with Us