Data science ile yeni evrenler yaratıp yok edeceğimiz bu yazıda, son zamanlarda popülerliği giderek artan veri bilimi konusuna değineceğiz. Data science nedir? Veri bilimi hayatlarımızı nasıl etkiler? gibi soruların yanında evrenin nasıl çalıştığına dair de varoluş felsefesi perspektifinden açılımlar yapmaya çalışacağız.
Modern insanı tarif etmek için kullanılan “homosapiens” tabiri latince “bilen insan” anlamına gelir. Tarihsel süreçte Neandertal yani ilkel insan türü ile homosapiens bir dönem aynı dönemde yaşasa da neandertal türü yok olmaya yani nesli tükenmeye mahkum olmuş ve homosapiens türü ayakta kalmıştır. Bunun sebepleri araştırıldığında antropologlar çok bariz bir keşifle karşılaştılar: Neandertal türü deneyimlerinden ders çıkartamıyor; dolayısıyla daha gelişmiş aletler ya da daha gelişmiş bir medeniyet kuramıyordu. Homosapiens taşı taşa vurup şekil vermekten sistematik madenciliğe doğru yol alırken neandertal türü yerinde sayıyordu. Homosapiensin bu hızlı gelişimini sağlayan ise yaşadıkları kötü tecrübelerden (avlanırken öldürülme ya da açlıktan ölme vb.) ders çıkartıp bir sonraki denemede işe yaramayan aletleri, sistemleri, fikirleri ortadan kaldırmaları ya da fikri dönüştürmeleriydi. Bu basit gibi görünen yeti, günümüzdeki evrimsel süreci anlamak için bir anahtar.
Homosapiensi günümüze dek ulaştıran olgu veri idi. İnsan, mevcut verileri özümseyip işleyerek o veriden yeni veriler çıkarma yetisine sahip. Bu yeti sayesinde, sadece bir kuşun kanadına bakarak uçak yapma yani uçma becerisine sahip olabiliyoruz. (İlk uçak tasarımı kuşların kanadından ilham alınarak tasarlandı, bu sayede aerodinamik biliminin de temelleri atıldı.) Kullandığı tahta çubuk hemen kırılmasına rağmen dayanıksız mızraklar yapmaya devam eden neandertaller ayılar tarafından yenilirken homosapiensin taş uçlu mızraklar yaparak uzaktan kendilerini koruyabilmelerini sağlayan da bu veri işleme yetisiydi. Haliyle bu yeti de zaman içerisinde gelişti. Yani insanın teknolojik evrimine katkı sağlayan yetinin bizzat kendisi de evrimleşti. Artık sadece bir arı kolonisine bakarak nano teknolojiye sahip moleküller tasarlayabiliyoruz. Ya da kalkış anından defalarca parçalanarak düşen ilkel yakıt tanklarına sahip uzay roketleri yerine bu hatalardan ders çıkartıp marsa gidecek güçte tekrar tekrar kullanılabilir uzay araçları yapabiliyoruz. (Biz derken insanlık tabi, yoksa biz daha depoda duran havai fişeklere bile hakim olamıyoruz ki uzaya roket çıkartalım…)
Data Science Nedir? Veri Bilimi Tanımı
Tüm bu teknolojik hızlanışın ardında bir bilim var: Veri bilimi. Son yıllarda giderek popüler hale gelen data science tanımı şöyle yapılıyor
Data science ya da veri bilimi; yapılandırılmış ve yapılandırılmamış verilerden bilgi ve öngörü elde etmek için bilimsel yöntemleri, süreçleri, algoritmaları ve sistemleri kullanan çok disiplinli bir alandır.
–Vikipedi
Data science aslında homosapiens var olduğundan beri uygulanan bir bilim. Son zamanlarda daha sistematik hale gelmesiyle veri bilimi ismini aldı. Yazılım ve istatistik meraklıları konunun bir hayli içinde olsa da bu bilim genel toplum açısından yabancı bir alan. İsmiyle müsemma gibi görünse de aslında pek çok disiplini içinde barındıran ve geleceğimizi şekillendirme gücüne sahip, çok ama çok önemli bir konu. Şu an ülkeleri yönetenler tamamen bu bilimi kullanarak kararlar veriyor. (Elbette bizimki gibi ülkeler hariç 🙂 )
Veri Bilimi Örnekleri
Nasılını açıklamak için şu çarpıcı örnek üzerinden gidelim: Avrupa Uzay Ajansı’nın 2004’te fırlattığı “Rosetta” adlı uzay aracı 2014’te hareket halindeki bir kuyruklu yıldıza konarak söz konusu kuyruklu yıldızda çalışmalar yaptı. Yani 10 yıl önce fırlatılan bir uzay aracı, kuyruklu yıldızın tam 10 yıl sonra olacağı yere geldi ve kuyruklu yıldızla buluştu. Söz konusu proje 2004’ten 40 yıl önce tasarlanmış ve kuyruklu yıldızın 40 yıllık döngüleri izlenmiş. Yıldızın gözlemlenmesiyle elde edilen verilerin detaylı hesaplanmasıyla tam olarak yörünge döngüsü çıkartılmış ve ne zaman nerede olacağı bilinir hale gelmiş. Proje bu sayede başarılı olmuş.
Bu örnek veri biliminin gücünü gösteriyor. Arka planda teknokrasi ile yönetilen hükümetler de benzer bir yöntem kullanıyorlar. Halkın davranışlarını, ekonomik kararlarını, ithalat ve ihracat döngülerini, satın alma davranışlarını ve global ekonomik döngüleri hesaplayan ülkeler başkalarının kriz olarak gördüğü dönemleri birer fırsata dönüştürür. Çünkü verileri bilmek ve mevcut verileri yorumlamak aslında antik çağlarda kralın büyücüsünü yanına çağırıp gerçekleşecek olayları önceden söylemesi için büyülü küresine baktırmasına benziyor. Ki zaten o nedenle bilim kurgu üstadı yazar Arthur C. Clarcke’ın şu sözünü kişisel web sitemin girişine koydum: “Yeterince gelişmiş bir teknoloji büyüden ayırt edilemez.” Gerçekten de aslında büyü dediğimiz şey sadece çok gelişmiş bir teknolojidir. Onu henüz anlamıyor olmamız onun var olmadığı anlamına gelmez. Sadece anlamadığımızı gösterir. 🙂 Yukarıdaki örneklerde de gördüğünüz gibi teknolojik büyü yapabilen insanlar var ve bunlar buz dağının sadece görünen yüzü. Hükümetlerin kullandığı verilerin büyüklüğü o ülkenin halkını ne denli refaha kavuşturacağının ya da ne denli kukla gibi oynatacağının da bir göstergesi olur. Çünkü veriye sahip olan aslında manipülasyon gücüne yani özgür iradeye de sahip olur. Manipüle olmamak da kendi elimizde. Kendimizi gözlemleyerek, kendi üzerimizde veri bilimi uygulayarak… (Westworld dizisinin üçüncü sezonu tamamen bu konuyu anlatır ve veri bilimine dair zamanın ötesinde öngörüler içerir.)
Corona virüs pandemisinin en başından beri Güney Kore’nin krizi ne kadar iyi yönettiği konuşuldu. Güney Kore ne aşı çalışması yaptı ne sokağa çıkma yasağı ne de ekonomik kısıtlamalar… Tek yaptıkları virüslü olan insanları saymalarıydı. Çok fazla test yaptılar ve hasta insanların takibini çok sıkı tuttular. Bu kadar… Çünkü ortaya çıkan verilerle salgının gidişatını ön görüp sadece işe yarayan uygulamalara gittiler. Deneme yanılma yapmadıkları için ne yanlış verilen kararlardan ekonomileri etkilendi ne de ölüm oranları yükseldi. Bu elbette madalyonun bir yüzü. Diğer yüzünde devletin her vatandaşını 1984 romanındaki gibi gözetleyip kontrol altına alması da söz konusu. Fakat bu ayrı bir yazının konusu. Veri bilimi diğer tüm araçlar gibi hem muazzam iyiye hem de şeytanice kötüye kullanılabilecek bir araç. (Atomu parçalama teknolojisinden hem temiz enerji santralleri hem de atom bombası yapılabilmesi gibi ya da bir bıçakla hem muazzam güzellikte buzdan bir heykel yapılabilmesi hem de muazzam soğukkanlılıkla insan öldürülebilmesi gibi.)
Data Science ve Yapay Zeka
Data science / veri biliminin bir diğer boyutu da yapay zeka konusu. Size bir sır vereyim… Aslında yapay zeka denen ve dillere pelesenk olmuş mesele sadece veri biliminin süslü adıdır. 🙂 Yazılımcı okurlar bilir, yapay zekalı sistemler kodlamak demek aslında sadece titizce hazırlanan veri setlerini otomatik olarak kullanan kodlar yazmak demektir. Bu kodlar verileri alıp onlardan paternler yani örüntüler çıkartır. Buna da yine çok süslü ismi olan “machine learning” yani “makine öğrenmesi” denir. Eğer yukarıdaki örnekte kuyruklu yıldızı gözlemleyen bir kamera yerleştirirsek ve kameradan gelen görüntülerin koordinatlarını not eden bir yazılım geliştirirsek kuyruklu yıldızın yörüngesi otomatik olarak elimizde olur. Bu yörünge verisini alıp sonraki yıllara uygularsak spesifik bir gelecek tarihte kuyruklu yıldızın nerede olacağı bilinebilir. Elbette bu kadar basit değil, kuyruklu yıldızın kütle kaybından kaynaklı yörünge sapmaları vs. de hesaplamaya dahil edilmelidir ama kabaca sistem böyle işler.
Basit verilerden böyle kompleks hesaplamalar çıkartabiliyorsak, çok daha büyük verilerden yani teknik tabirle big data ile ne kadar gelişmiş bilgilere ulaşabiliriz hayal etmek güç değil. Bu sefer kendi uzmanlık alanımdan bir örnek vereyim… Bir dijital medya uzmanı olarak veri benim için her şey demek. Çünkü oluşturduğum bir web sitesi, yayınladığım bir Google reklamı ya da paylaştığım bir sosyal medya postundan gelen geri dönüşler bir sonraki paylaşımımı belirleyecek. Ya da temsil ettiğim şirketin hedef kitlesi hakkında bilgi edinmemi sağlayıp o hedef kitleye özel bir içerik oluşturmama imkan verecek. Böylece her yeni içerikte aslında hedef kitleye daha çok ulaşan bir başka içeriğin verisi çıkacak. Aksi taktirde yani veriler izlenmezse, kimsenin tıklamadığı reklamlar, kimsenin ilgisini çekmeyen görseller paylaşılmaya devam edilir.
Kullandığım veri kaynaklarından biri de “Google Analytics” adlı araç. Bilenlerin bilir fakat bilmeyenler için şu kadarını söyleyebiliriz: Kendi web sitenize giren kullanıcıların (anonim, yani isim ya da ip görünmüyor, sadece 1 kişi olarak görünüyor) davranışları, sitede ne kadar süre kaldıkları, hangi içeriklere daha çok tıkladıkları gibi verileri gösteren bir sistem. Bu sistemi kullanarak site yöneticileri çok ilgi çeken ürünlerini, içeriklerini ya da hizmetlerini görebiliyor, gerekirse bu ilgi çeken ürünlerle ilgili kampanyalar oluşturuyorlar. Ya da içeriklerini siteye giren kişilere göre yeniden dizayn ediyorlar.
Bir inşaat firması yeni oluşturdukları apartman site projesinin reklamını yapmadan önce eski projelerindeki web sitelerinin verilerini incelemişler. Verilerde inşaat firmasının web sitelerine giren kişilerin sinemayla çok ilgili olduklarını, genelde sinema sitelerinde gezdiklerini fark etmişler. Bunun üzerine tv reklam filmlerinin açılışında sanki yeni bir sinema salonunun açılışı gibi başlayıp devamında site projelerinin ortasında yer alan sinema salonundan bahsediyorlar. Böylece hedef kitlenin ilgisini reklamın başında çekmiş oluyorlar. Evet çok sert ve kapitalist bir yöntem ama adı üstünde… Kapitalizmden yumuşaklık beklemek aç bir sırtlandan merhamet beklemeye benzer. 🙂
Evren | Veri | Evrim
Data science konusunun daha çok teknik detayı ve örnek vakası olsa da aslında bunun evrensel evrim ve varoluşumuz için ne demek olduğunu anlamaya çalışacağız. Çünkü ufacık bir web sitesi bile sayfalar dolusu veri üretiyorken koca bir il, ülke ya da dünyanın bizzat kendisi ne kadar çok veri üretir tahayyül etmek güç. Peki ya evren? Her an patlayan süper novalar, oluşan yeni yıldızlar, belki yeni gezegenlerde oluşan yeni tek hücreli canlılar ya da başka galaksilerdeki hayatlar… Bunca veri boşlukta sadece salınıyor ve onları birinin bulup yorumlamasını mı bekliyor yoksa zaten tüm bu veriler her an bir gözlemci tarafından kaydediliyor, inceleniyor ve yorumlanıyor mu?
Peki ya bu gözlemci edindiği verilere göre tüm evreni, varoluşu yeniden ve yeniden oluşturuyorsa? Veri bilimi uygulayıp sistemi otomasyona bağladıysa ve yeni veriler otomatik olarak (machine learning) işlenip başka verilere dönüşüyorsa? Ya fizik kanunları dediğimiz şey aslında her atom altı parçacığın tek tek veri üretmesi ve ortaya çıkan verilere göre kendini re-organize edip “var” olması ise? Çünkü kauntum fiziğine göre aslında tek bir tür atom altı parçacık sonsuz sayıda olasılık arasından gözlemlenip kendini bir konumda belirliyor ve bu da şu an içinde bulunduğumuz fizik kanunlarını oluşturuyor. (Maddeyi, zamanı, mekanı vs…)
Bu gözlemci aslında kendini parçalayıp (big bang) kendi parçalarındaki verileri (big data) bir araya getirerek yeniden kendini tek ve bir yapmaya çalışıyorsa (big crunch)? Koca bir yapboz olarak kendi parçalarını birleştirmeye çalışan bir evren… Oldukça ütopik, bir o kadar da sanatsal. 🙂 Evren kendi yarattığı verilerden yeni veriler çıkartıp kendi tekil bütünlüğüne ulaşmaya çalışsın biz de birer mikro kozmoz olarak bilincimizin parçalarını toplayıp kendimizi bulmaya, kendi içimizde dengeli, bir ve bütün olmaya çalışıyoruz. Bunun için de etrafa bakınıyor, bizi açan, bize iyi gelen, kendimize yakın hissettiğimiz şeyleri arıyoruz. Bazen bir film, bir kitap, bir blog ya da bir şarkı… Bunlardan veriler çıkartarak aslında kendimize ait verileri, kim olduğumuza ait bilgileri topluyor, tefekkür ederek de veri analizini yapıyoruz.
Homosapiens – neandertal savaşında kazanan tarafın yaptığı gibi hatalarımızdan ders çıkartıyor, daha iyisi olmak için çabalıyoruz. Nasıl ki amaç “var” olmaksa biz de kendi benliğimizin soyunu tüketmeden, hep daha gelişerek; aslında daha çok aslımıza, asıl kendimize yakınlaşarak var oluşumuzu sürdürüyoruz.
O nedenle “ikra”. O nedenle “oku”.
Kendindeki veriyi oku. Zihninle analiz et. Kalbinle harekete geç. Ruhunla ol.
Data science ile verileri yorumlayan homosapiensten yani “bilen insandan”, verilerin kendisi olan insana yani “insanı-ı kamil” olma yolculuğumuzda zamanın ötesinde buluşmak üzere…
Taa ki veri kalmayana, yani hiç olana dek. 🙂
Patreon destekçileri: Ufuk Egemen, Barış Saydere ve @Ilgar Zamanın Ötesi’nin sonsuza dek internette var olabilmesi için verdikleri katkıdan dolayı çok teşekkürler.
Zamanın Ötesi sitesinden daha fazla şey keşfedin
Subscribe to get the latest posts sent to your email.
Şuan gtp-3 var ve yapabildikleri , işlediği veri miktarı,bu verileri kullanış şekli müthiş. Muhtemelen 8-10 sene içinde 13. Versiyonu, onun işlediği muazzam veri miktarı, kullanacağı komut miktarı ve alınacak sonuçları hayal etmek bile zor. Bu gelişim ve evrilme çok değil 20 sene sonra homo saphiens değil başka bir tür insan yaratır.
Evet, GPT-3 örneğini verdiğin iyi oldu çünkü durumun ciddiyetini somut olarak ortaya koyan bir proje. Bilmeyen okurlar için link: https://www.bbc.com/turkce/haberler-dunya-53692902
Elon Musk ve Mark Zuckerberg’in yapay zeka savaşında verilerin kimin elinde olduğu büyük önem taşıyacak ve Zuckerberg şimdiden tüm insanlığın verisine sahip. Açıkçası şu an sadece geriye yaslanıp süper bilgisayarlarının verileri işlemesini beklediğini düşünüyorum. 🙂 Akabinde şu anda pilot aşamasında olan simülasyon evrenini VR gözlükleriyle birlikte devreye sokacak ve insanlar artık o simülasyonda vakit geçirmeye başlayacak. Bilincin sunuculara taşınmasının ilk adımları böyle böyle başlıyor… Ve hepsi de verilerin işlenmesiyle gerçekleşecek. Verilerimizi gizlemek bir çözüm değil. Dediğim gibi bizim verileri nasıl okuduğumuz anahtar rol oyanayacak.
Ben data science yi helix jump oyununa benzetiyorum))veri en üst seviyeden aşağı bilinçlere düşerek eski veriyi kırıp yeni veriyi güncelliyor öyleki;en üst seviyedeki veri bilinmezliği ile superposizyon durumunda nötr(hiç) halindeyiz;aynı anda gözlemci ve gözlemlenen pozisyonuna geçip bilinmek derdimiz aslında)) gözlemci tarafından gözlemlenene(algı/veri yüklemesi tükendiğinde ve gözlem yapılmadığı anda düşünce yoğunluğunun bitmesi) üzere enerjinin yoğunlaşması olmayacağı için herşey gizlide tekil olarak açığa çıkar buradan da yunus emrenin meşhur sözüne bir ben vardır bende benden içeri))burayı daha çok arkalı önlü gözüken şeffaf plazma tv ye benzetiyorum;en/derinlik/boy burada daha bir hd işliyor ve nereye dönersek dönelim batında sonsuz olasılıkların var olduğu superpozisyon haldeki verinin oluşmamış oluşulmak için can atıp çırpındığı alan))burada kalınırmı?bilmem))
Şeffaf tv den anlatmak istediğin thor ragnarok filmindeki dr strange ve thor un tanışma sahnesini kastediyorsun,sistem aynen o şekilde işliyor adamım))
Evet izledim sahneyi;önce thora bir lokasyon veriliyor ve oraya vardığında dr strange mekanı zaman algısı dışında kendi yönetiyor))thoru istediği gibi yönlendiriyor ve çay ikram ediyor fakat thor çay içmediğini söyleyince bilinçaltındaki bilgiden birayı görüyor ve bira olarak değiştiriyor ve bira bardakta azaldıkça dolduruyor))farkettiysen insanların zevklerini tercihlerini önceden bilemiyoruz fakat etkileşime girip gözlemlediğimizde isteklerine cevap verebiliyoruz buda bizi ayrıcalıklı kılıyor ki sahnenin başında dr strange gök gürültüsü tanrısı olarak hitap ediyor ;thor tanrı olarak seni neden umursayayımki diyor ve olay kopuyor çünkü onun bilmediğini biliyor,enteresan olan thor telefonun olmadığını e posta yollasaydın diyor;yani sesle iletişime geçemediğimiz yerde…email in hızını bilmiyorum burada Z.Ö bu işlerin ustası olduğunu bildiğim için yorumlayamıyorum(email de mesafe önemlimi yoksa hızı sabitmi)bu konu hakkında bilgim yok(((ayrıca 4 dk sahneyi yorumlarsan seviniriz z.ö))teşekkürler şimdiden
[…] evrenimizde duvarlar, mesafeler, yalanlar ve sırlar var. Elbette hepsi bir gereklilik için var. Kişisel verilerimizin whatsapp gibi mesajlaşma uygulamalarıyla reklamlar için yapay zekâlı yazılımlar tarafından […]