Dataset Search'in Tanımı

Dataset Search'in Tanımı

20 Temmuz 2019


DATASET SEARCH’İN TANIMI

DATASET SEARCH NEDİR?

Google Veri Kümesi Arama’da arama yapmak, yalnızca arama terimlerinizi girmeniz ve ardından aramanız gereken normal bir arama sorgusu yapmakla aynıdır. Veri Kümesi Aramasını farklı kılan, daha kesin arama terimleri aramanın daha kolay olmasıdır.

Örneğin, sadece spor ligine, yarışma aşamasına ve görmek istediğiniz mevsim veya yıla girerek belirli bir mevsimdeki spor istatistiklerinin veri kümelerini bulabilirsiniz. Sunulan veri miktarının hala birkaç güncellemeye ihtiyacı olsa da, Google’ın gelecekte daha fazla benzersiz veri kümesi bulmanın mümkün olacağından emin olmayı planladığını görebilirsiniz.

Mevcut Veri Kümesi Aramasının ne kadar etkili olduğunu görmek için, farklı sektörlerden gelen veri kümelerini arayabiliriz. Google’ın arama ürününde bulunan veri kümeleri sayısız kullanım alanına konabilir. İlgili veri kümeleri, yeni başlayanlar için makine öğrenmesi algoritmalarını eğitmek için kullanılabilir. Ayrıca, bazı küçük veri kümelerinin birleştirilmesi daha büyük eğilimlerin ortaya çıkmasına izin verebilir.

Günümüz dünyasında, birçok disiplindeki bilim insanları ve gittikçe artan sayıda gazeteci verileri yaşıyor. Milyonlarca veri kümesine erişim sağlayan, web üzerinde binlerce veri havuzu vardır; dünyadaki yerel ve ulusal hükümetler de verilerini yayınlamaktadır. Bu verilere kolay erişim sağlamak için Dataset Search'ü kullanabiliriz, böylece bilim adamları, veri gazetecileri, veri meraklıları veya başkaları çalışmaları ve hikayeleri için gereken verileri bulabilir ya da sadece entelektüel meraklarını tatmin edebiliriz.

DATASET SEARCH NASIL ÇALIŞIR?

Google Akademik’in çalışma biçimine benzer şekilde, Dataset Search ile Google yayıncının sitesi, dijital kütüphane veya yazarın kişisel web sayfası olsun, barındırıldığı her yerde veri kümelerini bulmanıza olanak sağlar. Veri kümesi araması oluşturmak için veri kümesi sağlayıcılarının verilerini Google’ın (ve diğer arama motorlarının) sayfalarının içeriğini daha iyi anlayabileceği şekilde tanımlamaları için kılavuzlar geliştirmişlerdir. Bu kurallar veri kümeleri hakkında göze çarpan bilgileri içerir: veri kümesini kim oluşturdu, yayınlandığında, verilerin nasıl toplandığını, verilerin kullanımına ilişkin terimlerin ne olduğunu, vb. veri kümesi olabilir ve veri setini tanımlayan veya tartışan yayınlar bu sayede bulunabilir.

Dataset Search sayesinde bu bilgileri tanımlamak için açık bir standart olan schema.org kullanılınır ve veri yayınlayan herkes veri setini bu şekilde tanımlayabilir. Tüm veri kümelerinin bu sağlam ekosistemin bir parçası olması için, büyük ve küçük veri kümesi sağlayıcılarını bu ortak standarda uymaları için sistem teşvik eder.