Big Data nedir?
Big Data nedir?
Big Data nedir?
Big Data nedir? Politikacılar teknoloji devlerini bir asırdan fazla bir süre önce iktidara gelen ABD petrol şirketleriyle karşılaştırırken, veriler sürekli olarak “yeni petrol” olarak anılıyor.
Bu “yeni yağ” yerden emilmiyor. Bunun yerine, çevrimiçi hizmetleri, araçları ve uygulamaları kullanan kişilerden büyük miktarlarda toplanıyor.
Aslında o kadar çok veri var ki, bunları depolamak ve işlemek için doğru araçlar olmadan, kuruluşlar onu anlamlandırmakta zorlanabilir. Bu devasa bilgi dizisi topluca ‘büyük veri’ olarak adlandırılır.
Her gün üretilen hacimler hakkında fikir sahibi olmak için çevrimiçi bir form doldurduğunuz, dijital bir hizmete kaydolduğunuz veya bir anket doldurduğunuz zamanları düşünmeniz yeterlidir. Buna , dünyanın her yerindeki web bağlantılı cihazlar, sosyal medya ve sensörler tarafından üretilen çok büyük miktarda veriyi eklediğinizde, uğraşmanız gereken hayal edilemeyecek kadar büyük miktarda bilginiz olur.
Büyük verilerin büyümesi, işletmeler için inanılmaz derecede değerlidir. Düzgün bir şekilde toplayıp saklayabilir ve etkili bir şekilde analiz edebilirlerse, önemli kararlar almalarına yardımcı olabilecek değerli bilgiler ve içgörüler elde edebilirler.
Büyük verinin unsurları
Bir büyük veri analitiği programını uygulamaya yönelik herhangi bir adım atmadan önce, onu bir şirketin veri depolarında geleneksel olarak bulabileceği diğer verilerden farklı kılan temel ilkeleri bilmek önemlidir.
Büyük veriyi tam olarak neyin oluşturduğu konusunda bazı anlaşmazlıklar olsa da, çoğu uzman beş temel unsur üzerinde hemfikirdir: hacim, hız, çeşitlilik, doğruluk ve değer.
Hacim: Bu, büyük verinin temel bileşenidir. Geçmişte kuruluşlardaki verilerin çoğunluğunu çalışanlar oluşturuyordu, ancak veriler artık çoğunlukla sistemler, ağlar, sosyal medya ve IoT cihazları aracılığıyla ve analiz edilmesi gereken çok büyük miktarda veriyle üretiliyor.
Hız: Bir dizi farklı kaynaktan bu kadar büyük bir bilgi yelpazesi geldiğinden, verilerin bir kuruluşa akma hızı son derece önemlidir. Bu veri akışı çok büyük ve süreklidir ve her gün her dakika gelen e-postalar, kısa mesajlar, sosyal medya gönderileri gibi bilgileri içerir. Değerli iş kararları, işlenmesi ve analiz edilmesi gereken mevcut gerçek zamanlı verilere dayanmalı ve alınmalıdır. Bunu yapmak için, veri boru hattıyla başa çıkmak için yük devretme özelliklerine sahip yüksek düzeyde kullanılabilir sistemler gerekir.
Çeşitlilik: Veri türleri ve kaynakları çok çeşitlidir ve iki farklı biçimde gelirler; yapılandırılmış ve yapılandırılmamış. Yapılandırılmış veriler, normalde bir veritabanından gelen bilgilerdir, bu nedenle iyi organize edilmiş ve nettir. Öte yandan, yapılandırılmamış, Facebook veya Twitter gibi sosyal medya web siteleri de dahil olmak üzere başka yerlerden gelen ve fotoğraflar, videolar, ses dosyaları ve daha fazlası gibi diğer veri formatlarını içerdiğinden genellikle daha kaotik olan verilerdir. Yapılandırılmamış verilerin oldukça büyük bir çeşitliliği olduğundan, işlenmesi, analiz edilmesi ve saklanması için sorunlu olabilir. Büyük verileri içeren araçlar, bu yapılandırılmamış verileri anlamak için işlemeye çalışır ve bunun kaotik kısmını işlemek, büyük verilerin temel bir bileşenidir.
Değer: Çalışmak için çok büyük miktarda veriye sahip olabilirsiniz, ancak günün sonunda, ne kadar değer katabileceğini anlamak için onunla akıllı olmadığınız sürece bunun bir önemi olmayacaktır. V’lerin geri kalanını bir araya getirdiğinizde, analizden topladığınız içgörülerin işletmeniz veya kuruluşunuz için değerli olup olmadığını kendinize sormanız gerekir. Verileriniz akıllıca kullanılmazsa, ne yazık ki sonunda çok fazla değer sağlamayabilir.
Doğruluk: Hacmi, çeşitliliği ve hızı düşünüldüğünde çok fazla veri akarken, bilginin kalitesini değerlendirmek bazen zor olabilir. Bu verilerden kaynaklanan analizin kalitesi bundan büyük ölçüde etkilenmektedir. Bir büyük veri projesi başlatırken, verilerin temiz olduğundan ve istenmeyen bilgilerin oluşmasını ve analizinizin kalitesini ve dolayısıyla sonuçlarınızı etkilemesini önlemek için belirli süreçlerin mevcut olduğundan emin olmak için yardım istemek akıllıca olacaktır.
Makalenin orjinal kaynağını bu linkten okuyabilirsiniz.
Tüm yazılarımızı buradan okuyabilirsiniz.
Geri bildirim: Veri Madenciliğindeki Teknikler, Parametreler ve Görevler - Bilişim Profesyonelleri