<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.1//EN" "http://www.wapforum.org/DTD/wml_1.1.xml">
<wml xml:lang="zh">
<head>
<meta http-equiv="Content-Type" content="text/vnd.wap.wml; charset=utf-8"/>
<meta http-equiv="Cache-Control" content="no-cache"/></head>
<card title="您会选择什么编码？ - Gracecode.com">
<p>有关 Web 字符编码的问题，已经是老生常谈。今天看到 <a href="http://www.ruanyifeng.com/blog/2008/05/growth_of_utf-8_on_the_web.html" title="http://www.ruanyifeng.com/blog/2008/05/growth_of_utf-8_on_the_web.html">一峰</a> 兄弟和 <a href="http://www.lunaticsun.com/article/utf8-gb2312" title="http://www.lunaticsun.com/article/utf8-gb2312">Lunatic Sun</a> 不谋而合的谈到有关 UTF-8 的使用现状，也谈谈我的看法。</p>

<p><img src="http://pic.yupoo.com/feelinglucky/88667584dc9c/medium.jpg" alt="http://pic.yupoo.com/feelinglucky/88667584dc9c/medium.jpg" title="http://pic.yupoo.com/feelinglucky/88667584dc9c/medium.jpg" /></p>

<p>上图是 <a href="http://www.w3.org/QA/2008/05/utf8-web-growth.html" title="http://www.w3.org/QA/2008/05/utf8-web-growth.html">Google 根据近年 Web 页面编码趋势的一个总结</a>。我很欣喜的看到 UTF-8 编码已经成为了主流，而犹如 一峰 兄弟所言，让人堪忧的是中文字符编码还是呈现很平稳的趋势，这说明目前 UTF-8 编码并没有在中文网站中推广开来。</p>

<p>究其原因，本人认为会有如下几点：</p>

<p>第一，中文编码（无论是 GBK、GB2312、GB18030 等）都变成了“传统”，毕竟这是 <em>中文</em> 的编码。开发者不愿意在字符编码这块花太多的心思。</p>

<p>第二，由于早期项目的原因，不得不继续使用 GBK 等中文编码。</p>

<p>我曾经就遇到过这样的一个项目，当时我很奇怪他们为什么不用 UTF-8，因为他们面对的客户不仅仅是国内用户。而解决这一方案的办法就只能是<a href="http://www.gracecode.com/Archive/Display/595" title="http://www.gracecode.com/Archive/Display/595">使用非常劳累的手段</a>，但这是指标不治本的办法。虽然最后，在本人的一再坚持下，最后还是转成了 UTF-8 编码，但相信国内还有很多项目都会碰到类似的问题。</p>

<p>第三，开发工具方面的支持，尤其是国内的一些产品。从根本上说，除了基本的思想意识以外，还有就是开发工具的问题。或许有一天，开发者相关的开发工具都默认的就是 Unicode 的话，这样转换的成本就会非常的低。</p>

<p>第四（感谢小马补充），流量大、文字多的中文站点通常都会使用 GB2312，原因很简单，页面下载量会比 UTF-8 小（GBK 编码只需要两个字节，而 Unicode 需要三个或者以上）。</p>

<p>那么，我经常使用的些主要的中文站点，目前在使用什么编码呢？下面是一个不完全的列表，供大家参考一下（以页面 meta 标签的 Content-type 为准）。</p>

<ol>
    <li>淘宝 - GB2312</li>
    <li>支付宝 - GB2312</li>
    <li>口碑 - GBK</li>
    <li>中国雅虎 - GB2312</li>
    <li>163 - GB2312</li>
    <li>新浪 - GB2312</li>
    <li>搜狐 - GB2312</li>
    <li>豆瓣 - UTF-8</li>
    <li>Yupoo - UTF-8</li>
    <li>谷歌 - UTF-8</li>
    <li>...</li>
</ol>

<p>从上述的站点看来，目前国内一般门户类型的站点基本上都是 GBK 等编码，而类似 <a href="http://www.gracecode.com/Archive/Display/675" title="http://www.gracecode.com/Archive/Display/675">豆瓣</a>、<a href="http://www.gracecode.com/Archive/Display/375" title="http://www.gracecode.com/Archive/Display/375">Yupoo</a> 这样的新兴 “Web2.0 式站点”已经开始尝试 UTF-8 。在我看来，Unicode 在中文站点的推广，任重而道远。</p>

<p>那么接下来，在您以后的项目中，您会选择什么字符编码？</p>

<p>另，有关字符编码方面的知识，一峰 兄弟的<a href="http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html" title="http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html">相关文章</a>，很受用。</p>


<p>
<a href="http://www.gracecode.com/wap/">Gracecode.com</a> |
<a href="http://www.gracecode.com/wap/d/1527 ">Permalink</a>(<a href="http://www.gracecode.com/Archive/Display/1527 ">xHTML</a>) |
<a href="http://www.gracecode.com/Trackback/Recieve/1527/gw2hkf">Trackback</a> |
<a href="http://rss.gracecode.com">Rss</a>
</p>
</card>
</wml>