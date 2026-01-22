Şirket, bu modeli fiziksel dünya yapay zekası kapsamında geliştirdiğini belirterek, robotların algılama, düşünme ve eylem kabiliyetlerini birleştiren ileri bir sistem sunduğunu açıkladı.

Rho-alpha, Microsoft’un Phi serisi görsel-dil modelleri temel alınarak tasarlanan ilk robotik model olarak öne çıkıyor. Şirket, modelin robotların çevreyi algılamasını, insan diliyle verilen komutları yorumlamasını ve bu komutlara fiziksel dünyada cevap vermesini hedeflediğini belirtti. Bu yaklaşım, geleneksel robotik programlamanın ötesine geçerek robotların insan gibi anlayıp eyleme geçmesine olanak tanıyor.

DUYULARI BİR ARADA KULLANABİLİYOR

Rho-alpha, yalnızca kameradan görme ve doğal dil anlama kullanmıyor, dokunsal algı yeteneklerini de entegre ediyor. Bu sayede robotlar, yalnızca görsel bilgiye dayanmak yerine temasla ilgili geri bildirimleri de işleyerek daha karmaşık görevlerde hassas hareket kabiliyeti sergileyebilecek. Şirket, ileriye dönük olarak kuvvet algısı gibi ek duyusal modların da modele ilave edileceğini belirtiyor.

Microsoft, Rho-alpha’nın öğrenme sürecini klasik sabit programlardan çıkarmaya çalışıyor. Model, robotun bir görevde hata yapması durumunda operatörlerin gerçek zamanlı müdahalesini örnek olarak alıp bunları öğrenme fırsatı olarak kullanabiliyor. Bu yöntem, robotların ortama ve kullanıcı tercihlerine daha dinamik şekilde uyum geliştirmesine yardımcı oluyor.

NASIL EĞİTİLİYOR?

Robotik verilerin toplanması, özellikle dokunsal geribildirim gibi duyusal veriler için zor ve maliyetli olduğundan, Microsoft çeşitli veri kaynaklarını bir araya getiriyor. Bunlar arasında: Gerçek robot gösterimleri, simülasyon ortamlarında üretilen sentetik veriler ve web ölçeğinde görsel soru-cevap (VQA) veri kümeleri bulunuyor.

Modelin eğitim sürecinde NVIDIA’nın Isaac Sim gibi gerçekçi simülasyon araçları kullanılıyor. Bu kombinasyon, robotlara daha geniş bir görev ve ortam çeşitliliğiyle çalışma imkanı tanıyor.

Rho-alpha’nın öne çıkan yeteneklerinden biri, robotların çift kollu (bimanual) görevlerde doğal dil komutlarını anlayıp yerine getirebilmesi. Örneğin, “Yeşil düğmeye sağ kol ile bas” veya “Kırmızı teli çek” gibi günlük ifadelerle verilen görevler özel bir programlama gerekmeden robot tarafından uygulamalı olarak gerçekleştirilebiliyor. Bu, robotların değişken ve öngörülemeyen çevrelerde çalışmasını kolaylaştırıyor.