【Python3】HTMLのエスケープされた記号を元に戻す
環境
Python 3.4.3
方法
xml.sax.saxutils
モジュールのunescape
メソッドを使えばOK。
from xml.sax.saxutils import unescape text = '& < >' print(unescape(text)) # => '& < >'
第二引数にdictを与えると、独自辞書の定義も可能とのこと。
from xml.sax.saxutils import unescape text = '<ルイズ貧乳>' unescape(text, {'貧乳': 'かわいい'}) # => '<ルイズかわいい>'
参考
19.11. xml.sax.saxutils — SAX ユーティリティ — Python 2.7ja1 documentation
236:HTMLをエスケープする