[]
Python 2.x karakter sorunu
Merhaba ;
Python da sıkıntı yaşadığım bir konu var. Web'de araştırdım ama çözemedim. Yardımcı olabilirseniz sevirim.
Bir adet text belgem var : content.txt , tek satır içerik var şöyle :
ÇEMIŞ
Kodlarım da şu şekilde:
# -*- coding: utf-8 -*-
#metin belgesinden gelen yazıdan türkçe karakterleri replace ediyor.
def tr2en(str):
replace_chars = [ ('ı','i'), ('İ','I'), ('ü','u'), ('Ü','U'), ('ö','o'), ('Ö','O'), ('ç','c'), ('Ç','C'), ('ş','s'), ('Ş','S'), ('ğ','g'), ('Ğ','G') ]
for search, replace in replace_chars:
str = str.replace(search, replace)
return str
with open("content.txt" ,"r") as txt:
line = txt.read()
print tr2en(line)
test_line = "ÇEMİŞ"
print tr2en(test_line)
#ilk cikti CEMIS olmalı fakat hiçbir değişiklik olmuyor , ikinci çıktı olması gerktiği gibi CEMIS
print type(line)
print type(test_line)
#burada iki değer de str olarak geliyor
Not : Tablar için özür dilerimi kodları buraya taşıyınca yazım bozuk oldu
Python da sıkıntı yaşadığım bir konu var. Web'de araştırdım ama çözemedim. Yardımcı olabilirseniz sevirim.
Bir adet text belgem var : content.txt , tek satır içerik var şöyle :
ÇEMIŞ
Kodlarım da şu şekilde:
# -*- coding: utf-8 -*-
#metin belgesinden gelen yazıdan türkçe karakterleri replace ediyor.
def tr2en(str):
replace_chars = [ ('ı','i'), ('İ','I'), ('ü','u'), ('Ü','U'), ('ö','o'), ('Ö','O'), ('ç','c'), ('Ç','C'), ('ş','s'), ('Ş','S'), ('ğ','g'), ('Ğ','G') ]
for search, replace in replace_chars:
str = str.replace(search, replace)
return str
with open("content.txt" ,"r") as txt:
line = txt.read()
print tr2en(line)
test_line = "ÇEMİŞ"
print tr2en(test_line)
#ilk cikti CEMIS olmalı fakat hiçbir değişiklik olmuyor , ikinci çıktı olması gerktiği gibi CEMIS
print type(line)
print type(test_line)
#burada iki değer de str olarak geliyor
Not : Tablar için özür dilerimi kodları buraya taşıyınca yazım bozuk oldu
python 3.5'de kodun çalıştığını söylemek için geldim. yalnızca print'e parantezler ekledim. bir de txt dosyası ansi formatında kayıtlı. dosya unicode ise karakterler başka şeylere dönüştüğünden fonksiyon dokunamadı, utf-8'de de direkt dosya okuma hatası verdi.
- kaichi (05.01.17 10:42:40 ~ 10:43:35)
1