OpenAI, daha zor sorunları çözmek için geliştirdiği yeni bir yapay zeka modeli serisi olan o1-preview’i tanıttı. Bu yeni modeller, bilim, yazılım geliştirme ve matematik gibi alanlarda önceki modellere göre daha karmaşık görevleri çözme yeteneğine sahip.
Bu serinin ilk modeli ChatGPT ve API platformlarında önizleme olarak kullanıma sunuldu. Bu sürüm, düzenli olarak güncellenecek ve geliştirilmesi süren bir sonraki model için değerlendirme sonuçlarını da içeriyor.
Nasıl Çalışır?
Bu modeller tıpkı bir insan gibi, bir sorun üzerinde daha fazla düşünmek için eğitildi. Eğitim sürecinde, düşünme sürecini nasıl rafine edeceklerini, farklı stratejiler denemeyi ve hatalarını tanımayı öğreniyor.
Yapılan testlerde, güncellenen bu modelin fizik, kimya ve biyoloji gibi zorlu benchmark (Rakip analizi) görevlerinde doktora öğrencileriyle benzer bir performans sergilediği, ayrıca matematik ve yazılım geliştirme alanlarında da üstün başarı gösterdiği görüldü. Örneğin, Uluslararası Matematik Olimpiyatı (IMO) için yapılan yeterlilik sınavında, GPT-4o sadece %13 başarı sağlarken, yeni model %83 başarıya ulaştı. Kodlama yetenekleri ise Codeforces yarışmalarında %89’luk başarı dilimine ulaştı.
Erken aşamada olan bu model, internette gezinme veya dosya yükleme gibi ChatGPT’nin sunduğu bazı özellikleri henüz içermiyor. Ancak, karmaşık akıl yürütme görevlerinde büyük bir ilerleme sağlıyor. Bu nedenle, bu seriye OpenAI o1 adını verildi.
Güvenlik
Bu yeni modellerin geliştirilmesi sırasında, güvenlik ve uyum kurallarına daha iyi uymalarını sağlamak için akıl yürütme yeteneklerini kullanan yeni bir güvenlik eğitimi yaklaşımı benimsendi.
Modellin güvenliğini ölçmenin bir yolu, kullanıcıların güvenlik kurallarını aşmaya çalıştıkları durumlarda modellerin nasıl tepki verdiğini test etmektir. Bir jailbreak testinde, GPT-4o 100 üzerinden 22 puan alırken, o1-preview modeli 84 puan aldı.
Bu yeni modellerin yeteneklerine uygun olarak, güvenlik çalışmaları da güçlendirilmiş. ABD ve Birleşik Krallık Yapay Zeka Güvenlik Enstitüleri ile resmi anlaşmalar imzalayarak, bu modellere araştırma amaçlı erken erişim sağlandı. Bu iş birliği, gelecekteki modellerin kamuya sunulmadan önce araştırılması, değerlendirilmesi ve test edilmesi için önemli bir adım oldu.
Kullanım Alanları
Bu gelişmiş akıl yürütme yetenekleri, bilim, yazılım geliştirme ve matematik gibi karmaşık sorunlarla uğraşanlar için oldukça faydalı olabilir. Örneğin, o1 modeli, sağlık araştırmacıları tarafından hücre dizilimi verilerini açıklamak, fizikçiler tarafından kuantum optiği için karmaşık matematiksel formüller üretmek ve geliştiriciler tarafından çok adımlı iş akışlarını oluşturmak ve yürütmek için kullanılabilir.
OpenAI o1-mini
o1 serisi, karmaşık kodu doğru bir şekilde üretme ve hata ayıklamada oldukça başarılı. Geliştiriciler için daha verimli bir çözüm sunmak amacıyla OpenAI o1-mini modelini de tanıttı. Bu model, daha hızlı ve daha ucuz bir akıl yürütme modeli olup, özellikle yazılım geliştirmede etkili. o1-mini, o1-preview’e göre %80 daha ucuz ve dünya bilgisine ihtiyaç duymayan uygulamalar için güçlü bir maliyet-etkin modeldir.
OpenAI o1 Nasıl Kullanılır?
ChatGPT Plus ve Team kullanıcıları, o1 modellerine ChatGPT üzerinden erişebilirler. Hem o1-preview hem de o1-mini, model seçicisinden manuel olarak seçilebilir. Haftalık mesaj sınırları başlangıçta o1-preview için 30, o1-mini için ise 50 olarak belirlenmiştir.
ChatGPT Enterprise ve Edu kullanıcıları, önümüzdeki günlerde her iki modele de erişebilecekler.
Kaynak: https://openai.com/index/introducing-openai-o1-preview/
Bir yanıt yazın