Giriş
Herkese merhaba, bugün yapay zeka dünyasında büyük ses getiren DeepSeek’i konuşacağız.
Arkadaşlar, DeepSeek nedir ve kim tarafından geliştirildi? Ne gibi yenilikler sunuyor ve en önemlisi de bu kadar düşük maliyetle böyle bir şeyi nasıl ortaya çıkardılar? Hepsini detaylı bir şekilde konuşacağız.
Biraz teknoloji dünyası kaynıyor, bütün piyasalar alt üst oldu. Özellikle teknoloji devi firmalar içinde Nvidia’dan tutun, Apple, Microsoft, Google gibi birçok şirketin hisse senedi düşüyor. Bunun ana sebebi DeepSeek. Bir DeepSeek’e merhaba diyelim ve bu bölümde bu yeni yapay zeka bebeğini araştıralım, konuşalım.
Şimdi DeepSeek, Çin merkezli bir yapay zeka araştırma laboratuvarı olarak 2023 yılında Li Ang Wenfang adında bir kişi tarafından kurulmuş. Wenfang aslında daha önceden finans sektöründe yapay zeka tabanlı ticaret algoritmaları geliştiren High Flyer şirketinin de kurucusu. Adam zamanında böyle bir şirket kurmuş ama tam anlamıyla finans sektörüne yönelik yapay zeka çalışmaları yapmış.
Gelişme
Sonra yapay zeka alanındaki bilgilerini toplayan bu kişi, “Ben bu bilgileri DeepSeek adı altında yeni bir yapay zeka aracı kurayım ve kullanayım” demiş. Kısa sürede de yani bir yıl kadar sürede, arkadaşlar bir yıl bir ay çünkü Kasım’da kuruyor bunu ve Aralık 2024’te de zirveye çıkıyor. Ocak 2025’te tam anlamıyla herkes tarafından öğreniliyor ve konuşuluyor bir anda.
Şu anda tabii bazılarınız DeepSeek uygulamasına giriş yaptığında “Biz bunu kullanamıyoruz, henüz indirme seçeneği sunmuyor” diyebilir. Çünkü o kadar çok talep var ki dünyanın her yerinden birçok insan şu anda bu uygulamayı kullanmaya çalışıyor.
Çünkü neden? ChatGPT, arkadaşlar, aylık ortalama 20 dolar gibi bir rakam talep ediyor bizden pro sürümünü kullanabilmemiz için. E haliyle ChatGPT’den daha iyi bir araç ücretsiz bir şekilde bizlere sunulursa ne olacak? Herkes oraya doğru kayacak.
Ben ChatGPT’den henüz şu an için çok iyi olduğunu düşünmüyorum. Kullandım da ama Çin’den böyle bir uygulamanın geliştirilmesi ve piyasaya sürülmesi beni şaşırtmadı.
Neyse devam edelim konuya.
DeepSeek’in yapay zeka modelleri ve teknolojisine baktığımızda, bunların ilk büyük projesi Kasım 2023’te piyasaya sürülen Coder adlı model. Yani DeepSeek Coder. Bu model ilk etapta yazılım geliştiricilere yönelik açık kaynaklı bir kodlama asistanı olarak tanıtılmış.
Daha sonra DeepSeek LLM denilen 67 milyar parametre ile büyük dil modelleri dünyasına giriş yapıyorlar. Asıl olay burada başlıyor. Çünkü dil modellemesine giriş yaptıklarında, nasıl ki bugün ChatGPT’ye bir şey yazdığımızda hızlı bir şekilde bize sonuç odaklı cümleler üretiyor, içerik üretiyor, DeepSeek de aynı şekilde bir model kurgusuna doğru geçmiş.
Bu da doğal dil işleme konusunda oldukça başarılı sonuçlar vermiş. Bu kadar kısa sürede böyle büyük bir başarı tabii takdire şayan. Ama arkada birçok soru işareti de beraberinde getiriyor. “Bunu nasıl yaptılar?” “Acaba ChatGPT’yi mi kullandılar?” diye bazı kesimler bunun cevabını merak ediyor.
Çünkü birçok insan, ChatGPT’yi kullanarak kendi yapay zeka araçlarını geliştirdi, öğrettiler diyor. Henüz yalanlamadılar bu bilgiyi ama olabilir de… Sonuçta bu Çin. Çin denilince akla hemen CopyPaste geliyor değil mi? Adamlar her şeyi kopyalayabiliyorlar.
G-Klasse Mercedes’i bile kopyaladılar çok hızlı bir şekilde. Bunların kopyalayamayacağı hiçbir şey yok. Dolayısıyla dikkat ederseniz, fuarlarda özellikle Çinlilere fotoğraf çekimini yasaklarlar. Bir de metreyle giderler fuarlara. O teknolojik aleti, cihazı ya da aracı ölçerler. Adamlar o kadar detaycı.
Bu model nasıl bu kadar ucuza geliştirilmiş denildiğinde, “Optimize edilmiş bir eğitim süreci var” diyorlar. V3 modelinin yalnızca 55 günde eğitildiğini söylüyorlar. Bu, sektör ortalamasının oldukça altında bir süre. Normalde bu eğitimler için yıllar geçmesi lazım. Ama demek ki shortcut bulmuşlar.
Donanım seçiminde modelin eğitimi için 2048 adet Nvidia’nın H800 GPU’su kullanılmış. OpenAI gibi şirketler çok daha fazla GPU kullanıyorlar. Yani DeepSeek, minimum kaynakla maksimum verimi almayı başarmış. Aslında onu bu kadar popüler yapan konu da bu.
Bu kadar düşük bütçe, bu kadar düşük kaynakla nasıl maksimum verim çıktı elde edebiliyoruz? Veri verimliliğinde de modelin eğitildiği veri seti 14,8 trilyon token içeriyor. Bu da çok düşük bir sayı. Ancak bu verilerin optimize edilmesi eğitimin verimli hale gelmesini sağlamış.
Enerji tasarrufu aslında bizi en çok ilgilendiren konu. Çünkü ChatGPT, Google, Meta gibi firmalar, Nvidia gibi büyük firmalar doğayı sömürüyorlar adeta. Bugün Instagram’ı, Google’ı, TikTok’u kullanmaktan keyif alıyoruz ama bu hizmetlerin sağlanabilmesi için çok fazla enerji üretilmesi gerekiyor. Ve bu her zaman temiz enerjiyle olmuyor.
DeepSeek ise bunu minimum enerji ile sağlayabilmiş. Aslında beni en çok sevindiren kısım bu. Belki bu teknolojiyi paylaşırlarsa, nasıl daha az enerjiyle yüksek verimlilik elde edebileceğimizi görebiliriz. Bu bence insanlık ve doğa için çok faydalı bir paylaşım olur.
DeepSeek’in çalışan profiline baktığımızda, kurucusu şöyle bir strateji geliştiriyor: “Ben profesyonel ya da çok fazla tecrübeye sahip kişileri istemiyorum” diyor. İlk etapta kurulurken, Çin’in en iyi üniversitelerinden yeni mezun olmuş, hatta hâlâ öğrenciliği devam eden ancak çok başarılı kişileri işe alıyorlar.
Bu kişilerle, düşük maliyetli yapay zeka çözümleri geliştirerek birçok sektörde kendine yer bulmayı hedefliyorlar. Yapay zeka dünyasında büyük teknoloji devlerine ciddi bir alternatif olabilecekleri öngörülüyor.
ChatGPT Ücreti Ne Kadar?
ChatGPT şu anda tekel değil mi? Hepimiz ChatGPT’yi kullanıyoruz. Ancak böyle bir değişim ve yeniliğe de ihtiyaç var. Çünkü piyasada fiyatı belirleyen tek şirket şu anda ChatGPT. Aylık 20 dolar belki Amerika için küçük bir rakam olabilir ama Türkiye gibi ülkelerde bu oldukça yüksek.
DeepSeek Ücretsizmi?
Ücretsiz versiyonda ise çok fazla sınırlama var ve %100 verim alınamıyor. Beni en çok şaşırtan şey, Çin’in ABD piyasasını ne kadar hızlı alt üst edebildiği.
Bu kadar hızlı büyüyen bir firmaya siber saldırı yapılmazsa olmaz. DeepSeek, büyük ölçekli kötü amaçlı saldırılar nedeniyle Çin dışından yeni kullanıcı kayıtlarını geçici olarak sınırlandırdı. Şirket, saldırıların etkisini en aza indirmek için çalışmalarını sürdürüyor.
Önümüzdeki günlerde tekrar kullanıcı kayıtlarını açacaklarını söylediler. Hâlâ Apple Store ve Google Play’de en çok indirilen uygulamalar listesinde birinci sırada yer alıyor.
Arkadaşlar, hepimize hayırlı olsun diyelim. Yapay zeka hayatımızda birçok şeyi değiştirecek. Değiştirmeye başladı bile. Bakalım ilerleyen günlerde Çin ve Amerika arasında neler olacak?
Bu haftaki podcast bölümünü bitiriyorum. Bundan sonra her hafta salı günleri podcastleriniz hazır. Bildirimleri açmayı unutmayın. Apple Podcast, Spotify ve YouTube’da beni takip etmeyi unutmayın.
Bütünleşik pazarlama, reklam, yönetimi ve danışmanlığı ile ilgili hızlı bir şekilde fiyat teklifi alabilirsiniz.








