Ekonomi

DeepSeek R2 modelinin lansmanını erteledi

Foreks – Çinli yapay zeka girişimi DeepSeek, Huawei’nin Ascend çiplerini kullanarak sistemi eğitirken karşılaştığı zorluklar nedeniyle R2 modelinin lansmanını erteledi ve Çin ile ABD yapımı yarı iletkenler arasındaki teknolojik uçurumun altını çizdi. Konuyla ilgili bilgi sahibi kişilere göre, başlangıçta Mayıs ayında piyasaya sürülmesi planlanan R2’nin gecikmesinin başlıca nedeni eğitim sırasında yaşanan teknik aksaklıklar.

Ocak ayında R1 modelini piyasaya sürdükten sonra DeepSeek, Çinli yetkililer tarafından Pekin’in kendi kendine yeterlilik çabasını desteklemek için Nvidia GPU’lardan Huawei’nin işlemcilerine geçmeye teşvik edildi. Ancak Ascend çiplerinin istikrarlı bir eğitim performansı sunamaması, şirketi model eğitimi için Nvidia çiplerine geri dönmeye ve çıkarım görevleri için Huawei çipleriyle çalışmaya devam etmeye zorladı.

Huawei’nin yardımcı olmak üzere mühendisler göndermesine rağmen, DeepSeek Ascend donanımında başarılı bir eğitim çalışmasını tamamlayamadı. Şirket şimdi R2’yi Ascend üzerinde çıkarım için optimize etmek üzere Huawei ile işbirliği yapıyor. Yavaş veri etiketleme gibi diğer aksaklıklar da gecikmeye katkıda bulundu.

Kurucu Liang Wenfeng’in R2’nin gelişim hızından duyduğu hayal kırıklığını dile getirdiği ve DeepSeek’in rekabet üstünlüğünü korumak için daha gelişmiş bir sürüm için bastırdığı bildirildi. Çin raporları R2’nin önümüzdeki haftalarda piyasaya sürülebileceğini gösteriyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu