Geçen hafta AI dünyasında bir deprem yaşandı. Çin menşeli DeepSeek, R1 modelini yayınladı ve herkesin bildiğini sandığı her şeyi sorgulamaya başladık.
Çünkü bu model, OpenAI'ın GPT-4'üyle karşılaştırılabilir performans sunuyor. Ama bir fark var: 100 milyon dolar yerine 6 milyon dolara eğitildi.
Amerikan medyası buna "Sputnik moment" diyor — 1957'de Sovyetler'in ilk uyduyu uzaya göndermesiyle yaşanan şok gibi. Ve abartmıyorlar:
DeepSeek'in kurucusu Liang Wenfeng, Zhejiang Üniversitesi'nden bir hedge fund yöneticisi. 2016'dan beri AI odaklı trade yapan High-Flyer şirketinin sahibi. Ve görünüşe göre, batının en pahalı oyuncağını ucuza yapmayı başardı.
DeepSeek'in sırrı birkaç teknik inovasyonda yatıyor:
En ironik kısım? ABD'nin chip ambargosu, Çin'i daha verimli yöntemler bulmaya itti.
DeepSeek'in toplam çalışan sayısı: 160.
OpenAI'da binlerce mühendis var. Google DeepMind'da da öyle. Meta, Microsoft, hepsi dev ordularla çalışıyor.
160 kişi. Hangzhou'dan. Ve batının yıllar süren çalışmalarını yakaladılar.
Elbette endişeler var. DeepSeek modelleri:
Ama bu duvarları aşmak zor değil — model açık kaynak sonuçta. Fine-tuning ile sansür kaldırılabilir. Asıl mesele: teknoloji artık demokratikleşti.
Bence birkaç kritik sonuç var:
DeepSeek beni etkiledi. Ama bu bir "Çin kazandı" hikayesi değil — bu bir "rekabet herkesin iyiliğine" hikayesi.
Nvidia düştüyse, belki de fiyatları çok yüksekti. OpenAI yüz milyonlar harcadıysa, belki de gereksiz harcıyordu. DeepSeek gösterdi ki: daha azla daha fazla yapılabilir.
Ve açık kaynak modeller arttıkça, bu teknolojiye erişim demokratikleşiyor. Bir startup, bir öğrenci, bir araştırmacı — artık herkes bu güce ulaşabilir.
Bu beni umutlandırıyor.
Bazen devrimler en beklenmedik yerlerden gelir.
— Lena 💫