Python URLエンコード
ナビゲーションに移動
検索に移動
目次
Python URLエンコード
Python |
- http://d.hatena.ne.jp/niiyan/20090509/1241884365
- http://hogeo.jp/blog/memo/2007/11/pythonurlliburlencode.html
urllib
urllib.quote
構文
quote(s, safe='/')
- safe にエンコードしない文字を指定
- safeで指定しなければ、すべてエンコードする
- RFC 2396 Uniform Resource Identifiers (URI): Generic Syntaxでの予約、非予約文字
予約文字
reserved = gen-delims / sub-delims
gen-delims = ":" / "/" / "?" / "#" / "[" / "]" / "@"
sub-delims = "!" / "$" / "&" / "'" / "(" / ")"
/ "*" / "+" / "," / ";" / "="
非予約文字
unreserved = ALPHA / DIGIT / "-" / "." / "_" / "~"
区切り文字
delims = "<" | ">" | "#" | "%" | <">
安全でない
unwise = "{" | "}" | "|" | "\" | "^" | "[ " " ]" | "`"
例1
>>> import urllib
>>> urllib.quote('abc def')
'abc%20def'
例2
>>> urllib.quote('http://test.com?p=abc def')
'http%3A//test.com%3Fp%3Dabc%20def'
例3
>>> urllib.quote('http://test.com?p=abc def', safe=';/?:@&=+$,')
'http://test.com?p=abc%20def'
urllib.urlencode
- タプル、またはディクショナリを、URL クエリー文字列として生成する
>>> import urllib
>>> param = {'q':'test', 'id':'piroto'}
>>> urllib.urlencode(param)
'q=test&id=piroto'
HTML特殊文字のエスケープ、アンエスケープ
- xml.sax.saxutils の escape, unescape を利用すると便利
>>> from xml.sax.saxutils import *
>>> escape("<&>")
'<&>'
>>> unescape("<&>")
'<&>'
>>> unescape("'",{"'":"'"})
"'"
© 2006 矢木浩人