URL Kodlamasına Kısa Giriş

Yaygın olarak "web sitesi adresi" olarak bilinen bir web sitesinin URL'si , belirli bir web sitesine erişmek için bir kullanıcının web tarayıcısına gireceği şeydir. Bir URL aracılığıyla bilgi aktardığınızda, yalnızca izin verilen belirli karakterleri kullandığınızdan emin olmanız gerekir. Bu izin verilen karakterler, alfabetik karakterler, rakamlar ve URL dizesinde anlam içeren birkaç özel karakter içerir. URL'ye eklenmesi gereken diğer karakterler, aradığınız sayfaları ve kaynakları bulmak için tarayıcının gezisi sırasında sorun oluşturmaması için kodlanmalıdır.

Bir URL kodlama

URL dizesindeki en yaygın kodlanmış karakter karakteridir. Bir URL'de artı işaretini (+) gördüğünüzde bu karakteri görürsünüz. Bu boşluk karakterini temsil eder. Artı işareti, bir URL'deki o alanı temsil eden özel bir karakter gibi davranır. Bunu görmenin en yaygın yolu, bir konu içeren bir mailto bağlantısındadır. Konunun içinde boşluk olmasını istiyorsanız, bunları artı olarak kodlayabilirsiniz:

mailto:? eposta subject = Bu + benim + konu + is

Metni kodlayan bu bit, "bu benim öznem" konusunu aktarabilirdi. Kodlamadaki "+" karakteri, tarayıcıda oluşturulduğunda gerçek bir ile değiştirilir.

Bir URL'yi kodlamak için, özel karakterleri kodlama dizgisiyle değiştirin. Bu neredeyse her zaman% karakteriyle başlayacaktır.

Bir URL kodlama

Kesin olarak, bir URL’de bulunan özel karakterleri her zaman kodlamanız gerekir. Önemli bir not, tüm bu konuşma ya da kodlamalardan biraz korktuğunuzda, normalde formdaki veriler dışında normal içeriğinin dışında bir URL'de özel karakterler bulamayacağınızdır.

Çoğu URL, her zaman izin verilen basit karakterleri kullanır, dolayısıyla kodlamaya gerek yoktur.

GET yöntemini kullanarak CGI komut dosyalarına veri gönderirseniz, verileri URL üzerinden gönderilecek şekilde kodlamanız gerekir. Örneğin, bir RSS özet akışını tanıtmak için bir bağlantı yazıyorsanız, URL'nizin, üzerinde tanıtmakta olduğunuz komut dosyasına URL eklemek için kodlanması gerekir.

Kodlanmış Ne?

Alfabetik bir karakter olmayan bir karakter, bir sayı veya normal bağlamının dışında kullanılan özel bir karakterin sayfanızda kodlanması gerekecektir. Aşağıda, bir URL'de bulunabilecek ortak karakterlerin bir tablosu ve kodlamaları bulunmaktadır.

Ayrılmış Karakterler URL Kodlaması

Karakter URL'de Amaç Kodlama
: Adresden ayrı protokol (http) % 3B
/ Ayrı alan ve dizinler % 2F
# Ayrı çapa % 23
? Ayrı sorgu dizesi % 3F
& Ayrı sorgu öğeleri % 24
@ Alan adından ayrı kullanıcı adı ve şifre % 40
% Kodlanmış bir karakteri gösterir % 25
+ Bir boşluk olduğunu gösterir % 2B
URL’lerde önerilmez % 20 veya +

Bu kodlanmış örneklerin, HTML özel karakterleriyle bulduğunuzdan farklı olduğunu unutmayın. Örneğin, bir ampersan (&) karakteri olan bir URL'yi kodlamanız gerekiyorsa, yukarıdaki tabloda gösterilenin% 24'ünü kullanırsınız. HTML yazıyordunuz ve metne bir ve işareti eklemek istiyorsanız,% 24'ü kullanamazsınız. Bunun yerine, "& amp;" ya da "& # 38;", her ikisi de işlendiğinde HTML sayfasında & nez. Bu ilk başta kafa karıştırıcı gibi görünebilir, ancak temelde HTML kodunun bir parçası olan sayfada görünen metin ile ayrı bir varlık olan ve dolayısıyla farklı kurallara tabi olan URL dizgisi arasındaki farktır.

"&" Karakterinin yanı sıra diğer birçok karakterin de her ikisinin de görünebileceği gerçeği, ikisinin arasındaki farklar konusunda sizi şaşırtmamalıdır.

Jennifer Krynin tarafından yazılmış orijinal makale. Jeremy Girard tarafından düzenlenmiştir.