
İyi de bu büyük araştırma şirketleri neden oyunlar üzerinde yapay zeka araştırmaları yapıyor, bu sonuçların kime ve neye faydası var? Kısaca bu soruya da bir açıklama getirmek istiyorum. Oyunlar üzerinde yapılan yapay zeka araştırmalarının temel sebebi, YZ sistemlerinin kompleks durumlarda karar alma yetisinin ve öğrenme mekanizmasının ne kadar kuvvetli ve gelişmiş olduğunu anlamak açısından mantıklı ve kolay bir yol olmasıdır. Zeka belirtisi göstermeyen ancak hızlı işlem gücü ve veri depolama gibi özelliklerde insan kabiliyetini geçen sistemler yıllardır zaten hayatımızın içinde (evet bu yazıyı okumanızı da sağlayan bilgisayarlar ve telefonları kastediyorum). Ancak popüler tabiri ile robotların, zekanın temelini oluşturan sezgi gibi bilişsel kabiliyetlere sahip olmaması, robotların daha kullanışlı ve zeki unsurlar olamamasının önündeki en büyük engel. Aslında yapay zeka araştırmalarının büyük çoğunluğunun da altında bu amaç yatıyor. Dolayısıyla insanların bilişsel yeteneklerini aktif kullanarak başarılı oldukları bu karmaşık oyunlarda yakalanacak başarılar aslında, Yapay Genel Zeka dediğimiz; düşünebilen, öğrenebilen, belirsizlik durumlarında optimum kararları verebilen sistemlerin geliştirilmesine yönelik atılmış bir adım olarak görülebilir.
Kaynak Yönetimi
Kaynak yönetimi de RL sistemlerinin başarılı olabildiği alanlardan biri. Burada kullandığımız kaynak kelimesinden aslında her türlü kaynağı algılayabilirsiniz. Bilgisayar ve Ağ sistemlerindeki kaynak yönetimi de [11], bir ticari organizasyonun ekonomik kaynaklarının yönetimi de bu alana dahil. Bunun yanında, enerji kaynaklarının yönetimi ve elektrik tüketimi optimizasyonu da RL’in çalışma alanlarına örnek olarak verilebilir.
Kimya
Kimyasal reaksiyonların DRL metotları kullanılarak optimize edilmesi örneği yardımıyla RL’in kimya alanındaki başarısını açıklayabiliriz. Normal çalışmalarda, kimyasal reaksiyonlarda istenilen sonucu elde edebilmek için deney ortamının ve şartlarının güncellenmesi gerekiyor. Sonuca göre değişkenleri optimal şekilde güncelleme kısmında ise DRL devreye giriyor. Bu alanda yapılan çalışmalara göre DRL algoritması sayesinde, önceden kullanılan en iyi algoritmadan %71 daha az adıma ihtiyaç duyuluyor ve bu, sürecin ciddi manada hızlanmasını sağlıyor [12].
Pazarlama ve Reklam
Pazarlamacıların karşılaştığı en büyük sorunlardan biri, iş dinamiklerinin ve insan tercihlerinin sürekli değişken olmasıdır. Bu dinamik ortamdaki değişkenleri öngörüp en kazançlı pazarlama stratejisini oluşturmaya da nihai amaç gözüyle bakabiliriz.
Tam olarak bu noktada ise RL devreye giriyor. Kişiselleştirilmiş öneriler, kitleye göre en uygun reklam içeriği, aşırı reklam yüklemesine sebep vermeyecek düzeyi yakalamak, fiyat değişikliklerine karşı müşteri tepkisini ölçmek gibi birçok uygulama alanında RL’in sağladığı avantajlardan faydalanıyor [13]. Bahsettiklerimin sadece teoride kalmadıklarını göstermek için bir örnek verelim, Moonrise [14]. Dünyanın en büyük teknoloji şirketlerinden Çin merkezli Baidu şirketinin bir ürünü olan Moonrise, aslında temel olarak RL tabanlı bir online marketing hizmeti olarak karşımıza çıkıyor. Bu örnekten yola çıkarak RL tabanlı sistemlerin endüstride de efektif bir şekilde kullanıldığı sonucuna ulaşabiliriz.