Windows notepad ANSI, Unicode, UTF-8 File Length

Posted on 2015-05-13

在使用 windows notepad 存檔時,選擇不同的檔案格式計算字元的方式不太一樣,下面單純的計錄一下計算的方式,不講古。

ANSI

預設的存檔格式就是使用 ANSI,英文字為 1 byte,中文字為 2 byte 所以 ABC中文字 總共為 9 byte,檔案大小也是 9 byte

Unicode

1 個字元為 2 byte,所以 ABC中文字 總共為 12 byte,

因為會在字元的最前面加上 2 byte 的 BOM (Byte Order Mark),所以檔案大小為 14 byte

UTF-8

ASCII 的部份 (< 127) 為 1 byte,其它的 (>= 127) 為 3 byte

所以 ABC中文字 總共為 12 byte,而 BOM 為 3 byte,所以檔案大小為 15 byte

參考連結