- 1 Ocak 2024
ChatGPT ile Nitel Veri Analizi
ChatGPT ile nitel veri analizi yapılabilir mi? Cevap kısmen evet. Bunu bu yazımızda size kanıtlayacağız. Ancak önce nicel ve nitel veri analizinin ne olduğuna dair kısa bir genel bakış sunalım.
Nicel ve nitel veri analizi, araştırmalarda kullanılan iki ana analiz yaklaşımıdır. Bu iki yöntem, veri toplamadan raporlamaya kadar çok farklı yollar izler. Nicel veri analizinde, araştırmacının yorumlarından bağımsız olarak sayısal ve büyük örneklem boyutları kullanılarak elde edilen veriler istatistiksel analiz yoluyla işlenir ve grafikler, çizelgeler ve tablolar halinde raporlanır ve sunulurken, nitel veri analizinde katılımcıların deneyimleri, algıları ve duyguları gibi sayısal olmayan veriler, yoruma açık ortak temalar ve örüntüler bağlamında oldukça esnek bir şekilde analiz edilir ve bulgular, hikayeler, alıntılar ve açıklamalar şeklinde raporlanır ve sunulur.
İki analiz yöntemi hakkında verilen bu kısa bilgiler ışığında, nicel veri analizinin aynı dili konuştukları için bilgisayarların deterministik dünyası için büyük bir sorun teşkil etmeyeceğini söylemek yanlış olmaz. Aslında günümüzde neredeyse tamamen otomatik olarak nicel veri analizi yapan ve araştırmalarda sıklıkla kullanılan bilgisayar programları bulunmaktadır.
Ancak nitel veri analizi için aynı şeyi söylemek çok zordur. Nitel veri analizi özünde metinsel ve görsel öğelerden oluşur. Günümüzde gelişen teknoloji metin ve görsel öğelerin işlenmesini kolaylaştırsa da aynı zamanda nitel veri analizinde araştırmacıların bakış açıları ve yorumları da analizin bir parçasıdır ve aynı veri farklı araştırmacılar tarafından farklı şekillerde işlenebilir.
Sohbet Robotlarının Yükselişi ve ChatGPT
Yapay zeka (AI) ve doğal dil işleme (NLP) alanındaki son gelişmeler, sohbet robotlarının günlük hayata daha fazla entegre olmasına yol açtı. Sohbet robotlarının yolculuğu, Joseph Weizenbaum’un MIT’de başlangıçta bir psikoterapisti taklit etmek üzere tasarladığı 1966’daki programıyla başladı. 2000’li yıllarda web sitelerinde metin tabanlı robotlar yükselişe geçti. 2010’lara gelindiğinde, özellikle e-ticaret platformlarında kullanımları yaygınlaştı. Son yıllarda ChatGPT-3 ve 4’ün kayda değer başarısıyla bu evrimde bir zirve yaşandı. Muhtemelen bu teknolojik gelişimin hala erken aşamalarındayız.
ChatGPT, OpenAI tarafından geliştiriliyor ve GPT-4 mimarisi üzerine kurulu. GPT-4, “Transformer” adlı bir sinir ağı mimarisine dayanıyor. Bu modeller, dilin karmaşıklığını ve bağlamını anlamak için çok etkilidir. ChatGPT, kitaplardan, makalelerden, web sitelerinden ve diğer birçok kaynaktan toplanan çok miktarda eğitim verisiyle eğitilir ve Doğal Dil İşleme teknolojileriyle çok yönlü bir kullanım sunar. Aynı zamanda ChatGPT, kullanıcı etkileşimleri aracılığıyla kendini sürekli olarak eğitmeye devam ediyor. Tüm bu teknolojilerin birleşimi, ChatGPT’nin karmaşık dil görevlerinde etkili bir şekilde çalışmasını ve kullanıcılarla doğal, anlamlı ve bilgilendirici sohbetler yapmasını sağlıyor.
ChatGPT, özellikle dijital olarak yönlendirilen işletmelerde ciddi bir kullanıma sahip. Metin yazarlığından reklamcılığa, bir program kodundaki hataları tespit etmekten farklı dilleri birbirine çevirmeye kadar birçok farklı görevi başarıyla gerçekleştirebilir. Ancak bugün makalemizin geri kalanında, insanların belki de en çok ihtiyaç duyduğu nitel veri analizinde ChatGPT’nin yeterliliğini inceleyeceğiz.
Nitel Veri Analizi
Verimizin Kaynağı
Veri analizine başlarken öncelikle veri setimizden bahsetmemiz gerekiyor. Kaggle.com‘da kısa bir arama yaptıktan sonra “Famous Words Twitter Dataset“ adlı bir veri setini seçtik. Dürüst olmak gerekirse veri setine karar verirken pek fazla kriterimiz yoktu. Chat GPT’nin çok fazla çalışılmamış verilerle sonuç üretip üretemeyeceğini görmek istedik. Bu bağlamda, farklı anahtar kelimelere referansla toplanan yaklaşık 130.000 tweet içeren “Famous Words Twitter Dataset” adlı bir veri setini kullanmaya karar verdik.
130.000 tweet bizim için çok fazla. Bu nedenle yine ChatGPT kullanarak “Covid-19” ve “Vaccine” anahtar kelimelerini içeren bu veriyi filtreledik ve geriye 10.000 tweet bıraktık.
Verilerin Tanımlaması ve Temizlenmesi
Hala çok sayıda tweetimiz var, ancak birlikte daha fazla eleme yapacağız. Öncelikle, tüm süreç için ChatGPT-4 tarafından sağlanan Veri Analizi eklentisini kullanacağız. Öncelikle tuttuğumuz verileri bir excel dosyası olarak Veri Analizi eklentisine gönderiyoruz ve ilk sorumuzu soruyoruz; “Bu veriler ne hakkında?”
ChatGPT bize bu veri setinin ne içerdiğine dair bir özet verdi. Daha sonra veri setinde hangi anahtar kelimelerin olduğunu sorduk ve doğru cevabı aldık. Hatırlarsanız, veri setimizi “COVID-19” ve “Vaccine” anahtar kelimeleriyle sınırlamıştık.
Şimdi Veri Analizi’ne, veri kümesinden “Vaccine” anahtar sözcüğüne sahip verileri silmesini söylüyoruz. “Vaccine” anahtar sözcüğüne sahip verileri sildikten sonra geriye 5001 tweet kalıyor. Bu komutlar ChatGPT’nin veri analizi yetenekleri için çok kolaydır. İşleri biraz daha zorlaştırmanın zamanı geldi.
ChatGPT ile Nitel Veri Analizine Başlayalım
Chat GPT’den ilk isteğimiz, nitel veri analizi için üç ana tema belirlemesi ve bu temaları veri setinde en sık karşılaşılan temalar arasından seçmesi. Bilim insanları ve araştırmacılar genellikle bu temaları kendileri buluyor ve bu çok acı verici bir süreç. Bu makale akademik bir makale değil, bu yüzden ChatGPT’nin bize yardımcı olmasında bir sorun yok.
Daha sonra ChatGPT’den tweetleri belirlediği temalarla etiketlemesini ve yeni bir excel dosyası oluşturup bize göndermesini istedik. Açıkçası, bu aşamada hala ona güvenmiyoruz ve tweetlerin doğru temalarla etiketlendiğinden emin olmak için kendimiz kontrol ediyoruz. ChatGPT’nin etiketlemesi çoğunlukla doğruydu, ancak tek kelimelik veya gerçekten anlamsız bazı tweetlerde bazı hatalar yaptı. Veri setimiz son derece sağlıksız olduğu ve daha önce düzenlenmediği için bunları görmezden gelebiliriz.
Ana temalarımızı belirledikten sonra yapmamız gereken bir sonraki şey bu ana temaların altındaki alt temaları belirlemektir. Bunun için önce ChatGPT’ye “Bu temalardan “Politika ve Hükümet Tepkisi” etiketli verileri alarak, bu verilerin ortak olduğu 3 alt tema oluşturmamız gerekiyor.” gibi bir şey söyledik. Bunu mükemmel bir şekilde yaptığında, diğer iki tema için de aynı analizi yapmasını ve alt temalar oluşturmasını istedik.
Bu aşamada nitel veri analizinden çıkıp nicel verilerle ilgilenmek istiyoruz. ChatGPT’ye temalar ve alt temalarla etiketlenen tweet sayısını soruyoruz ve bunları bize çubuk grafikler olarak göstermesini istiyoruz. Grafiklerimizi birkaç saniye içinde hiçbir zorluk çekmeden üretiyor.
Nitel veri analizimize geri dönersek, nitel veri analizinde temalara ait verilerin tırnak işaretleri ile gösterildiğini belirtmiştik. Bunu başarmak için ChatGPT’den, oluşturduğu her alt tema için alt temayı en iyi yansıtan üç tweeti göstermesini istiyoruz. Burada yine, temaları etiketlerken tek kelimeden oluşan veya gerçekten anlamsız tweetleri de etiketlediği gerçeğiyle karşı karşıyayız. Gönderdiği örneklerdeki birkaç tweet tam olarak böyle. İşte alt temalara dair bazı örnekler;
Bu aşamada, ChatGPT’nin akademik bir makale için baştan sona nitel veri analizi yapamayacağından eminiz. Aslında, bunu sorduğumuzda, bunu yapamayacağını söyleyerek benzer bir cevap verdi. Yine de harika bir yardımcı. ChatGPT, nitel veri analizinde sıklıkla kullanılan ve aslında tamamen insan müdahaleci olan standart masaüstü yazılımlarından çok daha hızlı sonuçlar üretebilir.
Peki ChatGPT çıkarımlar yapma yeteneğine sahip mi? Bunu öğrenmek için, tüm bu analizlerden sonra, uygun gördüğü şekilde yazılmış 2000 kelimelik bir rapor hazırlamasını istiyoruz. ChatGPT burada bizi şaşırtan bir sonuç üretiyor. Basit bir blog yazısı gibi bir rapordan ziyade ciddi bir yapıya sahip bir analiz raporu üretiyor. Ancak önce bize raporun yapısı hakkında ayrıntılı bilgi veriyor. ChatGPT’nin 2000 kelimelik ilk analiz raporunun PDF’sini bu bağlantıdan indirip inceleyebilirsiniz.
Raporun yapısı harika görünse de, 2000 kelime ile sınırlandırdığımız için rapor yeterince ayrıntılı değil. ChatGPT bu yapıya göre bir rapor hazırladıktan sonra, bu 2000 kelime nedeniyle yeterli ayrıntı olmaması sorunu hakkında bizi bilgilendiriyor. Biz de ondan raporu genişletmesini istiyoruz. Genişletilmiş raporun PDF’sini bu bağlantıdan indirip inceleyebilirsiniz.
Raporda ChatGPT analiz aşamalarını, metodolojiyi, nicel ve nitel yöntemlerle elde edilen verileri açıklıyor. Tartışma bölümünde ise kamuoyunun çok yönlü doğasından bahsediyor. Sosyal medyanın kamuoyunu şekillendirmedeki etkisinin altını çiziyor. Hatta referanslar bile veriyor. Elbette bazı hatalar da yapıyor. Örneğin, tamamen bizim isteğimiz üzerine oluşturduğu alt tema çeşitliliğine dayanarak tweetlerdeki konuşmaların karmaşık bir dokuya sahip olduğunu öne sürüyor. Daha az alt tema ile denediğimizde ise bundan hiç bahsetmiyor.
Akademik bir makalede ChatGPT ile veri analizi yaparken, onu bir asistan olarak düşünmekte fayda var. Yapay zeka henüz insanlar adına karar verecek ve yorum yapacak kadar mükemmel değil. Elbette bunları yapabilir ama bu hem etik tartışmalar hem de doğruluk açısından sorun yaratabilir.
ChatGPT ile Literatür Taraması
Son olarak ChatGPT’ye bu analizler sonucunda bir makale yazmak istediğimizi söylüyoruz ve bize yardımcı olması için bir literatür taraması yapmalarını istiyoruz. ChatGPT’nin literatür taramasının cevabına bu bağlantıdan ulaşabilirsiniz. Deneyimizde birçok ilgili kaynak bulduk, bazılarını kontrol ettik ve kaynakların doğru olduğunu gördük. Bunu bize sistematik ve anlaşılır bir dille sunması harika. Elbette bilimsel bir makale için tam bir literatür taraması yapmak kolay değil. Lütfen böyle bir literatür taramasının araştırmacıların günlerce süren çalışmalarının sonucu olduğunu unutmayın.
Tartışma ve Sonuç
ChatGPT ayrıca temalar arasında diyagramlar oluşturabilir, analiz sırasında kullandığı teknikler hakkında ayrıntılı bilgi verebilir ve verilerinizi ve grafiklerinizi farklı dillere çevirebilir. Ayrıca sizi etik değerler konusunda da sık sık uyaracaktır. Bu konuda da hassasız. Bilimsel bir makale yazmanın, bu alanda yıllarını geçirmiş bilim insanları için bile çok acı verici, emek yoğun ve bilgi yoğun bir süreç olduğunu unutmayın. ChatGPT gibi yapay zekâ uygulamaları bu konuda size yardımcı olabilir, ancak buna tamamen güvenmek için henüz çok erken.
Sonuç olarak, ChatGPT’nin nitel veri analizi alanındaki uygulamaları, bu teknolojinin yalnızca etkileşimli bir sohbet aracından daha fazlası olduğunu göstermektedir. Makalemiz boyunca sunulan örnekler ve analizler, ChatGPT’nin metin tabanlı verileri derinlemesine anlama, karmaşık temaları aydınlatma ve insan deneyimlerini dijital bir formatta yorumlama kapasitesini göstermektedir. Bu, araştırmacılara, pazarlamacılara ve veri analistlerine geleneksel yöntemlerle elde edilmesi zor olan içgörüler ve anlamlar sunar. ChatGPT, nitel veri analizinin sınırlarını genişletir ve bu süreci daha erişilebilir, hızlı ve etkili hale getirir. İleride, AI’nın bu kapasitesinin daha da gelişmesini, nitel veri analizinin doğasını ve uygulamalarını dönüştürmesini bekleyebiliriz. Bu heyecan verici gelişmeler ışığında, ChatGPT ve benzeri teknolojilerin geleceği yalnızca veri analizi alanında değil, aynı zamanda insan bilgisi ve deneyimlerine ilişkin anlayışımızda da yeni ufuklar açıyor.
Bizi sosyal medya hesaplarımızdan takip etmeyi unutmayın!