Microsoft kendi geliştirdiği ilk görsel üretim yapay zekasını tanıttı

Microsoft, tamamen kendi araştırma ekibi tarafından geliştirilen ilk metinden görsele yapay zeka modelini, MAI-Image-1 adıyla duyurdu. Şirketin Microsoft AI çatısı altında yürüttüğü bu proje, yapay zeka yolculuğumuzda bir sonraki adım olarak tanımlanıyor.

Microsoft’tan görsel üretim modeli

Yeni model, kısa sürede yapay zeka alanındaki performans karşılaştırma platformu LMArena’da ilk 10 arasına girmeyi başardı. LMArena, kullanıcıların farklı sistemlerin oluşturduğu görselleri oylayarak kalite karşılaştırması yaptığı önemli bir kıyaslama alanı olarak biliniyor. Aynı zamanda yeni modeli burada denemek de mümkün. Microsoft kısa süre içinde MAI-Image-1’in Copilot ve Bing Image Creator‘da kullanıma sunulacağını da belirtti.

Microsoft, MAI-Image-1’in geliştirilme sürecinde profesyonel sanatçılar ve tasarımcıların geri bildirimlerinden yararlandığını belirtiyor. Bu sayede modelin, piyasadaki benzer yapay zekalarda sıkça görülen tekrarlayan veya jenerik tarzlı üretimleri engellemek üzere optimize edildiği vurgulanıyor.

Teknoloji devi, modelin özellikle doğal manzaralar, fotogerçekçi sahneler üretmede “üstün” performans sergilediğini söylüyor. Ayrıca MAI-Image-1’in, daha büyük ve karmaşık modellere kıyasla istekleri daha hızlı işleyip sonuç üretebildiği ifade ediliyor.

MAI-Image-1, Microsoft’un diğer yapay zeka sistemleri olan MAI-Voice-1 (ses üretimi) ve MAI-1-preview (sohbet botu) ile aynı ekosistemde yer alıyor. Şirket, geçmişte OpenAI’a yaptığı yatırımlarla dikkat çekmişti ancak son dönemde iki taraf arasındaki iş birliği karmaşık bir hal aldı. Microsoft, bir yandan Anthropic modellerini Microsoft 365’in bazı özelliklerinde kullanmaya başlarken diğer yandan kendi modellerine yönelik ciddi yatırımlar yaptığını da vurguluyor.

Henüz bağımsız testler yapılmamış olsa da Microsoft, MAI-Image-1 için “güvenli ve sorumlu sonuçlar” üretme ilkesine bağlı kalacağını belirtiyor. Bu arada MAI-Image-1, ChatGPT ve Gemini Banana üzerinde aynı pomptu kullanarak modellerden bir görsel üretmelerini istedim. Örnekleri ve promptu aşağıda bulabilirsiniz.

MAI-Image-1 vs ChatGPT vs Gemini Nano Banana

Prompt: Photorealistic scene: at a gas station during nighttime, a black sports car with yellow rims gleaming under bright lights. A blonde woman in a red leather dress is refueling the car, holding the fuel pump with an elegant posture. Her skin glows warmly under the golden hour-like lighting. In the background, wet asphalt reflects neon lights, creating subtle reflections on the car’s body. The scene is shot with a wide-angle lens from a low camera angle, making the car appear powerful and dynamic. Soft natural light and cinematic contrast create a dramatic atmosphere.

MAI-Image-1:

ChatGPT:

Gemini Nano Banana:

Author: can tok

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir