Teknolojik yeniliklerle neredeyse eşanlamlı bir şirket olan Apple, kendisini bir kez daha yapay zekâ devriminin ön saflarında konumlandırdı.
Apple, kısa süre önce 3D avatarlar ve verimli dil modeli çıkarımı için yeni teknikler sunan iki yeni makale ile yapay zekâ araştırmalarında önemli adımlar attığını duyurdu. Bu gelişmelerin daha sürükleyici görsel deneyimler sağlayabileceği ve karmaşık yapay zekâ sistemlerinin iPhone ve iPad gibi tüketici cihazlarında çalışmasına olanak tanıyabileceği açıklandı.
İlk araştırma makalesinde Apple araştırmacıları, kısa monoküler videolardan (yani tek bir kameradan çekilen videolar) animasyonlu 3D avatarlar oluşturmak için Human Gaussian Splats (HUGS) yöntemini öneriyor. Başyazar Muhammed Kocabaş, "Yöntemimiz yalnızca az sayıda (50-100) kareden oluşan monoküler bir video alıyor ve 30 dakika içinde statik sahne ile tamamen canlandırılabilir bir insan avatarını birbirinden ayırmayı otomatik olarak öğreniyor" dedi.
100 KATA KADAR DAHA HIZLI
HUGS, verimli bir işleme tekniği olan 3D Gaussian splatting kullanarak hem insan hem de arka plan sahnesini temsil ediyor. İnsan modeli, SMPL adı verilen istatistiksel bir vücut şekli modelinden başlatılır. Ancak HUGS, Gaussların sapmasına izin vererek kıyafet ve saç gibi ayrıntıların yakalanmasını sağlıyor.
Önceki avatar oluşturma yöntemleriyle karşılaştırıldığında HUGS, eğitim ve render işlemlerinde 100 kata kadar daha hızlı olacak. Araştırmacılar, sistemi tipik bir oyun GPU'sunda sadece 30 dakika boyunca optimize ettikten sonra fotogerçekçi sonuçlar elde etti. HUGS, ayrıca 3D rekonstrüksiyon kalitesinde Vid2Avatar ve NeuMan gibi son teknoloji tekniklerden daha iyi performans gösteriyor.