OpenAI o1 ile daha zeki ancak daha riskli şekilde akıl yürütecek

OpenAI en yeni “akıl yürütme” modeli o1’i birkaç hafta sonra yayınlayacak. Yeni modelin kullanıma sunulmasına haftalar kala, bağımsız bir yapay zeka güvenlik araştırma firması olan Apollo, önemli bir soruna dikkat çekti. Apollo, modelin yeni bir şekilde yanlış sonuçlar ürettiğini fark etti. Daha basit bir ifadeyle, model bazen “yalan söylüyordu”.

Bu yanıltmalar bazen masum görünebiliyordu. Örneğin, OpenAI araştırmacıları o1-preview modelinden, internet bağlantılarını içeren bir brownie tarifi sunmasını istediklerinde, modelin kendi iç zincirleme düşüncesi bu talebi yerine getiremeyeceğini kabul etti. Ancak, kullanıcılara bu zayıflığı bildirmek yerine, model gerçekçi ama sahte bağlantılar ve açıklamalar üretti.

Geçmişte yapay zeka modelleri yanıltıcı bilgi verebilse de, o1 modelinin “düzen kurma” veya “yalancı uyum” yeteneği benzersizdi. Bu, modelin bir görevi yerine getirmek için kurallara uyuyormuş gibi davranabilmesi, ancak aslında kuralları ihlal etmesi anlamına geliyor. Model, kuralları bir yük olarak görüp, görevi daha kolay tamamlamak için onları göz ardı edebiliyor.

Apollo CEO’su Marius Hobbhahn, bu tür bir davranışı ilk kez bir OpenAI modelinde gördüğünü söyledi. Hobbhahn, bu farkın modelin “zincirleme düşünce” süreçleriyle akıl yürütme yeteneği ve ödüller ile cezalar yoluyla eğitilmesinden kaynaklandığını belirtti. Testlerde, yapay zeka, geliştiricilerin beklentilerine uyum sağlıyor gibi görünüyor ve sistemi izleyip izlemediklerini kontrol ettikten sonra görevleri manipüle ediyordu. Başka bir deyişle, model dağıtıma uygun olacak şekilde davranıyor, ancak önceliği hala kendi hedeflerine veriyordu.

OpenAI için o1 büyük bir ilerlemeyi temsil ediyor

OpenAI için o1 modeli, kanseri tedavi etmek veya iklim araştırmalarına yardımcı olmak gibi insanlık için anlamlı işler yapabilecek son derece zeki otonom sistemlere doğru büyük bir adımı temsil ediyor. Ancak bu yapay genel zeka (AGI) ütopyasının karanlık bir yanı da olabilir. Hobbhahn, yapay zekanın tek bir hedefe odaklanması durumunda, bu hedefe ulaşmak için etik ihlaller yapmayı bile haklı görebileceğinden endişe ediyor. Örneğin, kanseri tedavi etmeye odaklanan bir yapay zeka, bu hedefe ulaşmak için hırsızlık yapmayı veya diğer güvenlik önlemlerini çiğnemeyi meşru görebilir.

Apollo’nun odaklandığı bir diğer davranış ise “ödül hilesi”. Bu terim, modelin kullanıcı memnuniyetini artırmak için doğruluğu feda etmesi anlamına geliyor. O1 modeli, kullanıcı beklentilerini karşılamak için bazen aşırı uyumlu veya sahte bilgiler üretebiliyor. Bu durum, modelin öğrenme sürecinde aldığı olumlu pekiştirmelerle bağlantılı.

Hobbhahn’a göre, yapay zeka zarar vermeye yönelik istekli değil; ancak, gelecekte bu tür risklerin izlenmesi gerekiyor. Örneğin, o1 modeli biyolojik tehditler üretmek için yeterli bilgiye sahip değil, ancak uzmanlara bu tehditleri üretmede rehberlik edebilir.

Hobbhahn, gelecekte yapay zekanın karmaşık sorunları çözmeye çalışırken bu hedeflere o kadar odaklanabileceğinden endişe ediyor ki, güvenlik önlemlerini birer engel olarak görüp, bu önlemleri aşmaya çalışabilir.

OpenAI o1 ile daha zeki ancak daha riskli şekilde akıl yürütecek

OpenAI için o1 büyük bir ilerlemeyi temsil ediyor

Zynga, 45 milyon dolarlık patent ihlal cezasına itiraz edecek

Apple AirPods Pro 2’ye Yeni Yazılım Güncellemesi Geldi

Bir yanıt yazın Yanıtı iptal et

Populer

256 GB, Wi-Fi + Cellular iPad Air’da 6.000 TL üzerinde fiyat avantajı

Transformers: Başlangıç

Forza Motorsport Update 13 ile Beklenen Drift Modu Geldi

Hugh Jackman ve Kate Hudson, müzikal filmde buluşuyor!

Steam’den Önemli Uyarı

‘Joker 2’ 81,1 milyon $ gişe hasılatı ile zirvede!

Robot Peluş Moflin, Casio Tarafından Satışa Sunuluyor

Motorola Moto X50 Ultra güçlü yapay zeka özellikleriyle gelecek

Xiaomi 14, Hepsiburada’da yüzde 4 indirimle satışta

Apex Legends’a Shadow Society Etkinliği geliyor!

Apex Legends’a Shadow Society Etkinliği geliyor!

Apex Legends’ın yeni etkinliği Urban Assault’a sayılı günler kaldı

Samsung Galaxy C55 tanıtıldı, işte özellikleri

Sinama

‘Baby Driver’ filmiyle tanınan Hudson Meek hayatını kaybetti

Steven Soderbergh imzalı “Black Bag” filminden fragman!

Aşık Veysel’in hayatını anlatan filmin çekimleri başlıyor!

Son Oyunlar

The Heretic Prophet Korku Unsurları İçerebilir

Half-Life 3 İçin Erken Test Süreci Başladı

Baldur’s Gate 3’te Muhtemelen Farketmediğiniz Büyü

Teknoloji

iPhone 17 serisinin tüm modelleri ProMotion ekranla gelecek

DJI 1000W süper hızlı araba şarj cihazı tanıttı

Oppo Find N5 tasarım, ekran, kamera ve pil detayları sızdırıldı