Yazılım Yazarı Menu

All items for Eylül, 2013

Permalink:

Karakter Setleri (charset) Hakkında

Merhaba arkadaşlar bugün herkesin kullandığı ama çoğu kişinin hakkında tam bilgi sahibi olmadığı karakter setinden (charset) bahsedeceğim.
Bilgisayarlar ilk çıktığı zamanlar makine dili (assembly) ile programlanıyor ve mikro denetçiler, işlemciler bu dil ile programlanıyordu.
Şimdi bilgisayarların binary kodlardan oluştuğunu (0 ve 1’ler) varsayarsak ve her şeyin programlanması gerektiğini, bir bilgisayarı üretip tüm ülkelere satabilmek için bir diğer deyişle farklı dillerde kullanabilmek için bir şey yapılmalıydı. Örneğin; sadece İngilizce dili için bir kodlama yapılsaydı bu sefer Türkçe alfabesinde bulunup, İngilizcede kullanılmayan ğ,ü,ş,i,ç,ö harfleri bilgisayar tarafından desteklenmeyecek, tanınmayacak, tanınsa bile başka tanınacaktı ve istenen sonucu bize vermeyecekti. Üstelik Arapça, Çince gibi dilleri düşünürsek bu iş çok daha farklı bir noktaya varıyordu. Bu yüzden karakter seti kavramı ortaya çıkmıştır bilgisayarla bizim dilimiz arasındaki bağı kuran karakter setidir. Böylelikle bir bilgisayarda ilgili kodların karakter setinde hangi harfe denk geldiğine bakılarak bizim dilimize göre yazmamız ve okumamız sağlanıyor..

Karakter setlerini biz webte de kullanmaktayız. Hatta bununla ilgili sorunlar bazen bizi uğraştırmakta, vakit kaybı yaşatmaktadır.
Düşünün öyle bir sistem ki siz kod yazarken yazdıklarınız işlemciye iletip bilgisayarınızın karakter setinde geri döndürüyor ve dosyaya yazıyor, dosyaya yazarken de dosyanın karakter setine göre yazıyor daha sonra dosyayı çalıştırdığınız da o karakter setine göre çalıştırdığı gibi dosya içinde bir karakter seti veriyorsunuz ve dosyayı tarayıcı okurken o karakter setine göre okuyor.
Karmaşıklığından mıdır bilmem, başladığımdan beri araştırarak öğrenebildiğim en sade bilgiler bunlardır.
İnternette kesin bir bilgi yok yada ben bulamadım ama iyi araştırdığımdan eminim. Ancak bu kadar bilgi toplayabildim. Detayları da var ama hem kafa karıştırıcı, hem şaka gibi hemde emin olmadığım için detaya girmeden bu yazıma son veriyorum.
Eğer karakter setlerinde neler var derseniz;
Buraya tıklayarak siteyi ziyaret edip karakter setlerini görebilirsiniz.

Bunlar arasında en sık kullandığımız UTF – 8 (Unicode Transformation Format) yani 8 bitlik evrensel karakter setini kullanmaktayız.

İyi günler.
Yazılım Yazarı

(2349) kez okundu.

  • IBRA

    “Türkçe falan kolay, acep Çince gibi geniş bi dilde bilgisayar yorulmuyor mudur?” gibi cahilce bir soru sorarak konuyu baltalamak istemezdim :(

  • Yorum bırakıyor olduğunuz için teşekkürler.