2015年7月11日土曜日

pythonの全角¥で詰まる

pythonで、文字列から円マークを消したいってことで
price = "¥1300"
price = price.strip("\\") #¥1300

っていうコードを書いてちゃんとstripしてくれないんで詰まってました.
結論:全角¥とバックスラッシュ¥は文字コードが違うから出来ません
Python source codeu"\uFFE5"
http://www.fileformat.info/info/unicode/char/ffe5/index.htm
らしいです.

ちゃんと文字コードも勉強しないと駄目みたいですね…

ちなみに文字列からある文字を消す方法にも複数あるんですね

  1. 文字列による単純な置換(str,replace(置換基,置換後)
  2. 正規表現による置換(re.sub(正規表現,置換後文字列,置換する文字列)
    ex).
    import re
    str = "Carp lose this game."
    dst = re.sub(r'[a-z]+','xxx',str) #'Cxxx xxx xxx xxx'
  3. 置き換え str.translate({ord(u'置換元'):u'置換後',…})
http://orangain.hatenablog.com/entry/20100503/1272900555
http://sucrose.hatenablog.com/entry/2013/01/10/193205

言語仕様ちゃんと覚えんとあかんっすね