Google Kitaplar'da 'Ngram Görüntüleyici' Aracı Nasıl Kullanılır?

Genellikle N-gram olarak adlandırılan bir Ngram, metinde bir çeşit öğenin n sayısını (bir sayı) bulmak için metin veya konuşma içeriğinin istatistiksel bir analizidir. Fonemler, önekler, deyimler veya harfler gibi her türlü şey olabilir. Her ne kadar N-gram araştırmacı dışında bir şekilde karanlık olsa da, aslında çeşitli alanlarda kullanılmaktadır ve doğal konuşma dilini anlayan ve cevap veren bilgisayar programları yapan insanlar için çok fazla etkisi vardır. Özetle, Google'ın fikriyle ilgisi olacaktır.

Google Kitaplar Ngram Görüntüleyici söz konusu olduğunda, incelenecek metin Google'ın Google Kitaplar arama motorunu doldurmak için halk kütüphanelerinden taranan çok sayıda kitaptan geliyor. Google Kitaplar Ngram Görüntüleyici için, "corpus" olarak arama yapacağınız metne başvururlar. İngiliz ve Amerikan İngilizcesini ayrı ayrı analiz edebileceğiniz veya birlikte toplayabildiğiniz halde Ngram Viewer'daki şirket dili tarafından bölünmüştür. İngilizceden Amerikan koşullarına geçiş yapmak ve grafiklerin değişimini görmek son derece ilginç.

Ngram nasıl çalışır?

  1. Books.google.com/ngrams adresinden Google Kitaplar Ngram Görüntüleyicisine gidin.
  2. Öğeler, Google Web aramalarının aksine büyük / küçük harfe duyarlıdır. Bu nedenle, uygun isimlerden yararlanmayı unutmayın.
  3. Analiz etmek istediğiniz herhangi bir cümle veya ifadeyi yazın. Her ifadeyi virgülle ayırdığınızdan emin olun. Google, başlamanız için "Albert Einstein, Sherlock Holmes, Frankenstein" ı önerdi.
  4. Ardından, bir tarih aralığı girin. Varsayılan değer 1800 ila 2000'dir, ancak daha yeni kitaplar vardır (2011, Google'ın belgelerinde listelenen en son tarihti, ancak bu değişmiş olabilir.)
  5. Bir corpus seçin. Yabancı dil veya İngilizce metinleri arayabilir ve standart seçimlere ek olarak, "İngilizce (2009) veya Amerikan İngilizcesi (2009)" gibi şeyleri de altta görebilirsiniz. Bunlar, Google'ın güncellemesinden bu yana eski şirketlerden oluşuyor, ancak eski veri kümeleriyle karşılaştırmanızı yapmak için bir nedeniniz olabilir. Çoğu kullanıcı bunları görmezden gelebilir ve en yeni corpora'ya odaklanabilir.
  6. Yumuşatma seviyesini ayarlayın. Düzeltme grafiğin sonunda ne kadar düzgün olduğunu ifade eder. En doğru gösterim, 0 seviyesinin düzgünleştirilmesi olacaktır, ancak okunması zor olabilir. Varsayılan 3 olarak ayarlanmıştır. Çoğu durumda, bunu ayarlamanıza gerek yoktur.
  1. Arama çok sayıda kitap düğmesine basın. (Ayrıca arama sorgusuna sadece isabetle girebilirsiniz.)

Ngram Gösteren Nedir?

Google Kitaplar Ngram Görüntüleyici, kitaplarda belirli bir ifadenin zaman içinde kullanımını temsil eden bir grafik çıkarır. Birden fazla kelime veya kelime öbeği girdiyseniz, farklı arama terimlerini karşılaştırmak için renk kodlu çizgiler görürsünüz. Bu Google Eğilimler'e oldukça benzer, yalnızca arama daha uzun bir süreyi kapsar.

İşte gerçek hayattaki bir örnek. Son zamanlarda sirke turtalarını merak ediyorduk. Laura Ingalls Wilder'ın Prairie dizisindeki Little House'ında bahsediyorlar, ama hiç böyle bir şey duymadık. İlk olarak sirke turtaları hakkında daha fazla bilgi edinmek için Google'ın Web aramasını kullandık. Görünüşe göre, Amerikan Güney mutfağının bir parçası olarak kabul ediliyorlar ve gerçekten sirkeden yapılmışlar. Herkesin yılın her zamanında taze ürünlere erişemediği zamanlarda tekrar dinlerler. Bütün hikaye bu mu?

Google Ngram Görüntüleyici'yi aradık ve hem 1800'lerin başlarında hem de 1800'lerde pastanın bazı sözleri, 1940'larda birçok söz ve son zamanlarda artan sayıda söz (belki de bazı turta nostaljisi var). Verilerin 3. düzleştirme seviyesindeki problemi. 1800'lerde bahsi geçenler üzerinde bir yayla var. Elbette, her yıl beş yıl boyunca belirli bir turta eşit sayıda bahsetmiyor muydu? Neler oluyor, çünkü o zamanlar yayınlanmış pek çok kitap yok ve verilerimiz pürüzsüz hale getirildiğinden, resmi bozuyor. Muhtemelen, sirke turtası yazan bir kitap vardı ve bir başaktan kaçınmak için ortalaması alındı. Yumuşamayı 0'a ayarlayarak, bunun tam olarak böyle olduğunu görebiliriz. Başak 1869 ve 1897 ve 1900 yıllarında bir başka başak var.

Kimse geri kalanı sirke turşularından bahsetmedi mi? Muhtemelen o turtalar hakkında konuşmuşlar. Her yerde yüzen yemek tarifleri vardı. Onlar sadece kitaplarda yazmadılar ve bu Ngram aramalarının bir sınırlaması.

Gelişmiş Ngram Aramalar

Ngram’ların her türlü farklı metin aramalarından oluşabileceğini nasıl söylediğimizi hatırlıyor musunuz? Google, Ngram Görüntüleyici ile de biraz incelemenize olanak tanır. Eğer balık için balık yerine fiil aramak istiyorsanız, etiketleri kullanarak bunu yapabilirsiniz. Bu durumda, "fish_VERB" yi arardınız

Google, kullanabileceğiniz komutların tam listesini ve web sitelerinde diğer gelişmiş belgeleri sağlar.