
日期:2006-08-28 作者:喜騰小二 來源:PHPChina
來源:http://coolcode.cn
作者 andot
通常情況下,我們的網頁要指定一個編碼字元集,如 GB2312、UTF-8、ISO-8859-1 等,這樣我們就可以在網頁上顯示我們指定編碼的文字了。但是我們很可能會遇到這種情況,那就是我們可能希望在 ISO-8859-1 編碼的網頁上顯示漢字,或者在 GB2312 編碼的網頁上顯示韓文等。當然一種解決辦法就是我們不用 ISO-8859-1 或者 GB2312 編碼,而統統都采用 UTF-8 編碼,這樣我們只要在這種編碼下,就可以混合顯示各國文字了,這是現在很多網站采用的方法。
而我這裡所說的並非上麵這種方法,因為上麵這種方法必須要指定字元集為 UTF-8 才可以,一旦使用者手工指定為其他字元集,或者可能因為某些原因,那個字元集設定沒起作用,而浏覽器又沒有正確自動識別的話,我們看到的網頁還是亂碼,尤其是在某些用框架作的網頁中,某個框架中的页面如果字元集設定沒起作用,在 firefox 中顯示亂碼而且還沒法改變(我是說在不裝RightEncode外掛程式的情況下)。
而我這裡介紹的方法即使是把網頁指定為 ISO-8859-1 字元集,也能夠正確顯示漢字、日文等。原理很簡單,就是把除了 ISO-8859-1 編碼中前128個字元以外的所有其他的編碼都用 NCR(Numeric character reference) 來表示。比如“漢字”這兩個字,如果我們寫成“汉字”這種形式,那麼它在任意字元集下都可以正確顯示。根據這個原理,我寫了下麵這個程式,它可以把現有的網頁轉化為在任意字元集下都能顯示的網頁。妳隻需要指定源網頁的字元集和源網頁,點提交按鈕,就可以得到目的網頁了。妳也可以隻轉化某些文字,隻需要把文字填寫到文字方塊中,並指定這些文字原來的字元集,點提交按鈕,就會在页面上麵顯示編碼後的文字了。另外我還編寫了 WordPress 的外掛程式,現在我的 Blog 已經可以在任意字元集下都能正確顯示了。
轉化程式地址:http://test.coolcode.cn/nochaoscode/
下載: nochaoscode.php<?php function nochaoscode($encode, $str, $isemail = false) { $str = iconv($encode, "UTF-16", $str); for ($i = 0; $i < strlen($str); $i++,$i++) { $code = ord($str{$i}) * 256 + ord($str{$i + 1}); if ($code < 128 and !$isemail) { $output .= chr($code); } else if ($code != 65279) { $output .= "&#".$code.";"; } } return $output; } $encode = $_POST['encode']; if ($encode == '') $encode = 'UTF-8'; if ($_FILES['file']['size'] > 0) { $data = nochaoscode($encode, file_get_contents($_FILES['file']['tmp_name'])); header ("Content-type: application/octet-stream;"); header ("Content-length: ".strlen($data)); header ("Content-Disposition: attachment; filename=".$_FILES['file']['name']); echo $data; } else { header ("Content-type: text/html; charset=UTF-8"); if ($_POST['email']) { echo htmlentities(nochaoscode($encode, $_POST['email'], true)); } else { echo htmlentities(nochaoscode($encode, $_POST['content'])); } ?>
<?php } ?>