- Published on
Windows notepad ANSI, Unicode, UTF-8 File Length
在使用 windows notepad 存檔時,選擇不同的檔案格式計算字元的方式不太一樣,下面單純的計錄一下計算的方式,不講古。
ANSI
預設的存檔格式就是使用 ANSI,英文字為 1 byte
,中文字為 2 byte
所以 ABC中文字
總共為 9 byte
,檔案大小也是 9 byte
Unicode
1 個字元為 2 byte
,所以 ABC中文字
總共為 12 byte,
因為會在字元的最前面加上 2 byte 的 BOM (Byte Order Mark)
,所以檔案大小為 14 byte
UTF-8
ASCII 的部份 (< 127) 為 1 byte
,其它的 (>= 127) 為 3 byte
,
所以 ABC中文字
總共為 12 byte
,而 BOM 為 3 byte,所以檔案大小為 15 byte