Güncellenen Claude 3.5 Sonnet Modeli GPT-4o ve Gemini 1.5 Pro’ya Meydan Okuyor

Güncellenen Claude 3.5 Sonnet

Anthropic güncellenen Claude 3.5 Sonnet modelini ve yeni Claude 3.5 Haiku modelini duyurdu. Güncellenen Claude 3.5 Sonnet modeli, kodlamada önemli kazanımlarla birlikte genel olarak iyileştirmeler sunuyor. Claude 3.5 Haiku ise Anthropic’in OpenAI’ın GPT-4o Mini ve Google’ın Gemini 1.5 Flash’ına cevabı. Bu modelin öncekiyle aynı fiyat seviyesine sahip olacağı ancak önemli performans iyileştirmeleriyle sunulacağı ifade ediliyor.

Claude 3.5 Sonnet İyileştirmeleri

  • SWE-bench Doğrulanmış skoru %33,4’ten %49,0’a yükselerek sektördeki herhangi bir model tarafından şimdiye kadar elde edilen en iyi skor olmuştur.
  • TAU-bench skoru perakende alanında %62,6’dan %69,2’ye, havayolu alanında ise %36,0’dan %46,0’ya yükselmiştir.
  • GPQA ve MMLU Pro skorları, Gemini 1.5 Pro’dan daha iyi olan sırasıyla %65 ve %78’e yükselmiştir.

Claude 3.5 Haiku Neler Sunuyor?

Yeni Claude 3.5 Haiku modeli, Anthropic’in önceki neslindeki en büyük model olan Claude 3 Opus’u birçok yapay zeka karşılaştırmalarında geride bırakıyor. Claude 3.5 Haiku, SWE-bench Verified’da %40,6 puan alarak orijinal Claude 3.5 Sonnet ve OpenAI GPT-4 Turbo’yu geride bırakıyor. Claude 3.5 Haiku başlangıçta yalnızca metin içeren bir model olarak sunulacak ve daha sonra görüntü desteği eklenecek.

Anthropic ayrıca, yeni Claude 3.5 Sonnet modelinin ortak ön dağıtım testinin bu yılın başlarında imzaladıkları anlaşmanın bir parçası olarak ABD Yapay Zeka Güvenlik Enstitüsü (US AISI) ve İngiltere Güvenlik Enstitüsü (UK AISI) tarafından yürütüldüğünü vurguladı. Sorumlu Ölçeklendirme Politikalarına göre, güncellenen Claude 3.5 Sonnet modeli ASL-2 Standardı kapsamına giriyor.

Güncellenen Claude 3.5 Sonnet artık tüm geliştiriciler için Anthropic API, Amazon Bedrock ve Google Cloud Vertex AI üzerinden aynı fiyata sunuluyor. Yeni Claude 3.5 Haiku modeli ise bu ayın ilerleyen zamanlarında satışa sunulacak.

İlker Şekercioğlu

Tam bir teknoloji bağımlısı olan İlker, teknolojideki son gelişmeleri meraklıları ile paylaşmaktan keyif alıyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir