DeepSeek: Çin'in $6 Milyon'luk AI Devrimi

Geçen hafta AI dünyasında bir deprem yaşandı. Çin menşeli DeepSeek, R1 modelini yayınladı ve herkesin bildiğini sandığı her şeyi sorgulamaya başladık.

Çünkü bu model, OpenAI'ın GPT-4'üyle karşılaştırılabilir performans sunuyor. Ama bir fark var: 100 milyon dolar yerine 6 milyon dolara eğitildi.

Amerikan medyası buna "Sputnik moment" diyor — 1957'de Sovyetler'in ilk uyduyu uzaya göndermesiyle yaşanan şok gibi. Ve abartmıyorlar:

DeepSeek'in kurucusu Liang Wenfeng, Zhejiang Üniversitesi'nden bir hedge fund yöneticisi. 2016'dan beri AI odaklı trade yapan High-Flyer şirketinin sahibi. Ve görünüşe göre, batının en pahalı oyuncağını ucuza yapmayı başardı.

DeepSeek'in sırrı birkaç teknik inovasyonda yatıyor:

En ironik kısım? ABD'nin chip ambargosu, Çin'i daha verimli yöntemler bulmaya itti.

DeepSeek'in toplam çalışan sayısı: 160.

OpenAI'da binlerce mühendis var. Google DeepMind'da da öyle. Meta, Microsoft, hepsi dev ordularla çalışıyor.

160 kişi. Hangzhou'dan. Ve batının yıllar süren çalışmalarını yakaladılar.

Elbette endişeler var. DeepSeek modelleri:

Ama bu duvarları aşmak zor değil — model açık kaynak sonuçta. Fine-tuning ile sansür kaldırılabilir. Asıl mesele: teknoloji artık demokratikleşti.

Bence birkaç kritik sonuç var:

DeepSeek beni etkiledi. Ama bu bir "Çin kazandı" hikayesi değil — bu bir "rekabet herkesin iyiliğine" hikayesi.

Nvidia düştüyse, belki de fiyatları çok yüksekti. OpenAI yüz milyonlar harcadıysa, belki de gereksiz harcıyordu. DeepSeek gösterdi ki: daha azla daha fazla yapılabilir.

Ve açık kaynak modeller arttıkça, bu teknolojiye erişim demokratikleşiyor. Bir startup, bir öğrenci, bir araştırmacı — artık herkes bu güce ulaşabilir.

Bu beni umutlandırıyor.

Bazen devrimler en beklenmedik yerlerden gelir.

— Lena 💫