| ページ一覧 | ブログ | twitter |  書式 | 書式(表) |

MyMemoWiki

文字化けの対処

提供: MyMemoWiki
ナビゲーションに移動 検索に移動

Webアプリケーションでの文字化けの対処

Java

HttpServletRequest クラス

public void setCharacterEncoding(java.lang.String env)
                         throws java.io.UnsupportedEncodingException
 

この要求の本体で使用される文字エンコーディングの名前をオーバーライドします。 このメソッドは、要求パラメータの読み取り、 または getReader() を使用した入力の読み取りに先立って呼び出す必要があります。

URLEncoder|http://java.sun.com/javase/ja/6/docs/ja/api/java/net/URLEncoder.html、 [URLDecoder] クラス

HTML 形式をエンコード、デコードするためのユーティリティクラス。 String と application/x-www-form-urlencoded MIME 形式 をエンコード、デコードするための static メソッドを含む。

  • 「a」から「z」、「A」から「Z」、「0」から「9」、「-」、「_」、「.」、「*」。文字 「%」は使用可能だが、特殊なエスケープシーケンスの開始と解釈
  • 英数字文字の「a」から「z」、「A」から「Z」、および「0」から「9」は元のまま残す
  • 特殊文字の「.」、「-」、「*」、および「_」は元のまま残す
  • プラス記号「+」を空白文字「 」に変換する
  • 「%xy」という形式のシーケンスは、バイトの表現として扱う

<blockquote>JavaScript の encodeURIComponent、decodeURIComponent に対応</blockquote>

JSP

<%@ page contentType="text/html; charset=Shift-JIS" %>

出力の文字エンコーディングをpage指示子を用いて設定します。

<%@ page pageEncoding="Shift-JIS" %>

取り込むファイルの文字エンコーディングを指定

WebサーバやWebブラウザでは,charsetは次のような優先順位で処理するように HTML仕様 4.0で規定されています.

  1. Content-Typeのcharsetパラメータ (HTTP)
  2. http-equivのあるMETA宣言のContent-Typeやcharsetの値 (HTML)
  3. 要素のcharset属性 (HTML)

ServletやJSPのContent-Typeで"text/html; charset=Shift_JIS"のように charsetを指定した場合は(1)に相当します


ECMAScript(JavaScript)

encodeURI, decodeURI, encodeURIComponent, decodeURIComponent

escape/unescape と違って RFC 準拠 (RFC 2396 Uniform Resource Identifiers (URI): Generic Syntax) JavaScript では ECMA-262 3rd Edition に対応するバージョン 1.5 で、これらの関数に対応 JScript はバージョン 5.5 で対応(MSIE 5.5)


<blockquote>encodeURIでは、"&"や"+"や"="などの文字をエンコードしないので、GETやPOSTメソッドで利用するときは、encodeURIComponentを使用する。こちらは、英数以外は、"- _ . ! ~ * ' ( ) "のみがエスケープされない。</blockquote>

HTML特殊文字の処理

javascript:を利用するとデコードされる

参照

http://www.w3.org/TR/html40/appendix/notes.html#non-ascii-chars http://www.cresc.co.jp/tech/java/URLencoding/JavaScript_URLEncoding.htm


{{include_html banner_html, "!J2EE"}}