Để hiển thị một trang HTML một cách chính xác, một trình duyệt web phải biết các bộ ký tự (mã hóa ký tự) để sử dụng.
Character Encoding là gì?
ASCII là tiêu chuẩn mã hóa ký tự đầu tiên (còn gọi là bộ ký tự). Nó định nghĩa 127 ký tự chữ số khác nhau mà có thể được sử dụng trên internet.
ASCII được hỗ trợ số (0-9), chữ cái tiếng Anh (AZ), và một số ký tự đặc biệt như thế! $ + - () @ <>.
ANSI (Windows-1252) là bản gốc của Windows ký tự. Nó hỗ trợ 256 mã ký tự khác nhau.
ISO-8859-1 là nhân vật mặc định thiết lập cho HTML 4. Nó cũng hỗ trợ 256 mã ký tự khác nhau.
Bởi vì ANSI và ISO đã được hạn chế, mã hóa ký tự mặc định đã được thay đổi để UTF-8 trong HTML5.
UTF-8 (Unicode) bao gồm hầu như tất cả các ký tự và biểu tượng trong thế giới.
Tất cả 4 bộ vi xử lý HTML cũng hỗ trợ UTF-8. |
Charset Thuộc tính HTML
Để hiển thị một trang HTML một cách chính xác, một trình duyệt web phải biết các bộ ký tự được sử dụng trong trang.
Điều này được quy định trong các thẻ <meta>:
Đối với HTML4:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Đối với HTML5:
<meta charset="UTF-8">
Nếu một trình duyệt phát hiện ISO-8859-1 trong một trang web, nó mặc định là ANSI, vì ANSI là giống với tiêu chuẩn ISO-8859-1 trừ ANSI đó có 32 nhân vật phụ. |
Sự khác nhau giữa tự Sets
Bảng dưới đây hiển thị sự khác biệt giữa các bộ ký tự mô tả ở trên:
Tê | ASCII | ANSI | 8859 | UTF-8 | Sự miêu tả |
---|---|---|---|---|---|
32 | không gian | ||||
33 | ! | ! | ! | ! | dấu chấm than |
34 | " | " | " | " | dấu ngoặc kép |
35 | # | # | # | # | số hiệu |
36 | $ | $ | $ | $ | ký hiệu đô la |
37 | % | % | % | % | dấu phần trăm |
38 | & | & | & | & | dấu và |
39 | ' | ' | ' | ' | phép điểm danh |
40 | ( | ( | ( | ( | ngoặc trái |
41 | ) | ) | ) | ) | ngoặc đúng |
42 | * | * | * | * | dấu |
43 | + | + | + | + | dấu cộng |
44 | , | , | , | , | dấu phẩy |
45 | - | - | - | - | gạch nối-trừ |
46 | . | . | . | . | ngừng hẳn |
47 | / | / | / | / | gạch chéo ở cuối |
48 | 0 | 0 | 0 | 0 | chữ số không |
49 | 1 | 1 | 1 | 1 | một chữ số |
50 | 2 | 2 | 2 | 2 | chữ số hai |
51 | 3 | 3 | 3 | 3 | ba chữ số |
52 | 4 | 4 | 4 | 4 | chữ số bốn |
53 | 5 | 5 | 5 | 5 | chữ số năm |
54 | 6 | 6 | 6 | 6 | chữ số sáu |
55 | 7 | 7 | 7 | 7 | chữ số bảy |
56 | số 8 | số 8 | số 8 | số 8 | chữ số tám |
57 | 9 | 9 | 9 | 9 | chữ số chín |
58 | : | : | : | : | dấu hai chấm |
59 | ; | ; | ; | ; | dấu chấm phẩy |
60 | < | < | < | < | ít hơn so với dấu |
61 | = | = | = | = | dấu bằng |
62 | > | > | > | > | dấu lớn hơn |
63 | ? | ? | ? | ? | dấu chấm hỏi |
64 | @ | @ | @ | @ | thương mại tại |
65 | Một | Một | Một | Một | Latin vốn chữ A |
66 | B | B | B | B | Latin vốn chữ B |
67 | C | C | C | C | vốn chữ Latin C |
68 | D | D | D | D | vốn chữ Latin D |
69 | E | E | E | E | vốn chữ Latin E |
70 | F | F | F | F | vốn chữ Latin F |
71 | G | G | G | G | vốn chữ Latin G |
72 | H | H | H | H | vốn chữ Latin H |
73 | tôi | tôi | tôi | tôi | Latin vốn chữ I |
74 | J | J | J | J | vốn chữ Latin J |
75 | K | K | K | K | vốn chữ Latin K |
76 | L | L | L | L | vốn chữ Latin L |
77 | M | M | M | M | vốn chữ Latin M |
78 | N | N | N | N | vốn chữ Latin N |
79 | O | O | O | O | Latin vốn chữ O |
80 | P | P | P | P | vốn chữ Latin P |
81 | Q | Q | Q | Q | Latin vốn chữ Q |
82 | R | R | R | R | Latin vốn chữ R |
83 | S | S | S | S | vốn chữ Latin S |
84 | T | T | T | T | vốn chữ Latin T |
85 | U | U | U | U | vốn chữ Latin U |
86 | V | V | V | V | Latin vốn chữ V |
87 | W | W | W | W | vốn chữ Latin W |
88 | X | X | X | X | vốn chữ Latin X |
89 | Y | Y | Y | Y | vốn chữ Latin Y |
90 | Z | Z | Z | Z | Latin vốn chữ Z |
91 | [ | [ | [ | [ | khung vuông bên trái |
92 | \ | \ | \ | \ | gạch chéo ở cuối ngược |
93 | ] | ] | ] | ] | khung vuông bên phải |
94 | ^ | ^ | ^ | ^ | giọng circumflex |
95 | _ | _ | _ | _ | dòng thấp |
96 | ' | ' | ' | ' | dấu huyền |
97 | một | một | một | một | Latin nhỏ một lá thư |
98 | b | b | b | b | Latin nhỏ thư b |
99 | c | c | c | c | Latin nhỏ chữ c |
100 | d | d | d | d | Latin nhỏ chữ d |
101 | e | e | e | e | Latin nhỏ thư điện tử |
102 | f | f | f | f | Latin nhỏ thư f |
103 | g | g | g | g | Latin nhỏ thư g |
104 | h | h | h | h | Latin thư h nhỏ |
105 | tôi | tôi | tôi | tôi | Latin tôi bức thư nhỏ |
106 | j | j | j | j | Latin thư j nhỏ |
107 | k | k | k | k | Latin nhỏ thư k |
108 | l | l | l | l | Latin l bức thư nhỏ |
109 | m | m | m | m | Latin thư m nhỏ |
110 | n | n | n | n | Latin thư n nhỏ |
111 | o | o | o | o | Latin chữ o nhỏ |
112 | p | p | p | p | Latin chữ p nhỏ |
113 | q | q | q | q | Latin q bức thư nhỏ |
114 | r | r | r | r | Latin r bức thư nhỏ |
115 | S | S | S | S | Latin nhỏ lá thư của |
116 | t | t | t | t | Latin thư t nhỏ |
117 | u | u | u | u | Latin bức thư nhỏ u |
118 | v | v | v | v | Latin nhỏ thư v |
119 | w | w | w | w | Latin bức thư nhỏ w |
120 | x | x | x | x | Latin nhỏ thư x |
121 | y | y | y | y | Latin thư y nhỏ |
122 | z | z | z | z | Latin nhỏ thư z |
123 | { | { | { | { | khung nhọn trái |
124 | | | | | | | | | đường thẳng đứng |
125 | } | } | } | } | khung nhọn đúng |
126 | ~ | ~ | ~ | ~ | dấu ngã |
127 | DEL | ||||
128 | € | dấu euro | |||
129 | KHÔNG ĐƯỢC SỬ DỤNG | ||||
130 | , | single-9 thấp dấu ngoặc kép | |||
131 | ƒ | Latin chữ thường f móc | |||
132 | " | double-9 thấp dấu ngoặc kép | |||
133 | ... | ellipsis ngang | |||
134 | † | dao găm | |||
135 | ‡ | dao đôi | |||
136 | thư sửa đổi giọng circumflex | ||||
137 | ‰ | mỗi dấu mille | |||
138 | S | Latin vốn chữ S với các dấu mũ ngược | |||
139 | < | đơn dấu ngoặc góc trái chỉ | |||
140 | Œ | Latin chữ ghép vốn OE | |||
141 | KHÔNG ĐƯỢC SỬ DỤNG | ||||
142 | Ž | Latin chữ Z vốn bằng dấu mũ ngược | |||
143 | KHÔNG ĐƯỢC SỬ DỤNG | ||||
144 | KHÔNG ĐƯỢC SỬ DỤNG | ||||
145 | ' | trái dấu nháy đơn | |||
146 | ' | đúng dấu nháy đơn | |||
147 | " | trái dấu ngoặc kép | |||
148 | " | đúng dấu ngoặc kép | |||
149 | • | đạn | |||
150 | - | en dash | |||
151 | - | gạch đầu | |||
152 | ~ | dấu ngã nhỏ | |||
153 | ™ | dấu hiệu thương hiệu | |||
154 | S | Latin nhỏ thư s với dấu mũ ngược | |||
155 | > | đơn phải trỏ đánh dấu góc báo giá | |||
156 | œ | Latin oe chữ ghép nhỏ | |||
157 | KHÔNG ĐƯỢC SỬ DỤNG | ||||
158 | § | Latin z thư nhỏ với dấu mũ ngược | |||
159 | Ÿ | vốn chữ Latin Y với dấu tách đôi | |||
160 | không phá vỡ không gian | ||||
161 | ¡ | ¡ | ¡ | dấu chấm than ngược | |
162 | ¢ | ¢ | ¢ | dấu phần trăm | |
163 | £ | £ | £ | dấu hiệu pound | |
164 | ¤ | ¤ | ¤ | dấu tiền tệ | |
165 | ¥ | ¥ | ¥ | ký hiệu yen | |
166 | | | | | | | thanh bị hỏng | |
167 | § | § | § | ký hiệu phần | |
168 | ¨ | ¨ | ¨ | dấu tách đôi | |
169 | © | © | © | dấu bản quyền | |
170 | ª | ª | ª | chỉ số thứ tự nữ tính | |
171 | « | « | « | trái chỉ góc đôi dấu ngoặc kép | |
172 | ¬ | ¬ | ¬ | không ký | |
173 | gạch nối mềm | ||||
174 | ® | ® | ® | dấu hiệu đăng ký | |
175 | ¯ | ¯ | ¯ | làm dấu | |
176 | ° | ° | ° | dấu bằng | |
177 | ± | ± | ± | cộng-trừ dấu | |
178 | ² | ² | ² | superscript hai | |
179 | ³ | ³ | ³ | superscript ba | |
180 | ' | ' | ' | nhấn sắc | |
181 | μ | μ | μ | dấu hiệu vi | |
182 | ¶ | ¶ | ¶ | dấu pilcrow | |
183 | · | · | · | dot trung | |
184 | ¸ | ¸ | ¸ | dấu trước a, o, u dưới c đọc như s | |
185 | ¹ | ¹ | ¹ | một superscript | |
186 | º | º | º | chỉ số thứ tự nam tính | |
187 | » | » | » | phải trỏ góc đôi dấu ngoặc kép | |
188 | ¼ | ¼ | ¼ | phần thô tục một phần tư | |
189 | ½ | ½ | ½ | phần thô tục một nửa | |
190 | ¾ | ¾ | ¾ | phần thô tục ba phần tư | |
191 | ¿ | ¿ | ¿ | dấu hỏi ngược | |
192 | À | À | À | Latin vốn chữ A với mộ | |
193 | Á | Á | Á | Latin vốn chữ A với cấp tính | |
194 | Â | Â | Â | Latin vốn chữ A với circumflex | |
195 | Ã | Ã | Ã | Latin vốn chữ A với dấu ngã | |
196 | Ä | Ä | Ä | Latin vốn chữ A với dấu tách đôi | |
197 | Å | Å | Å | Latin vốn chữ A với chiếc nhẫn trên | |
198 | Æ | Æ | Æ | vốn chữ Latin AE | |
199 | Ç | Ç | Ç | Latin vốn chữ C với dấu móc dưới | |
200 | È | È | È | Latin vốn chữ E với mộ | |
201 | É | É | É | Latin vốn chữ E với cấp tính | |
202 | Ê | Ê | Ê | Latin vốn chữ E với circumflex | |
203 | Ë | Ë | Ë | Latin vốn chữ E với dấu tách đôi | |
204 | TÔI | TÔI | TÔI | vốn chữ Latin tôi với mộ | |
205 | TÔI | TÔI | TÔI | vốn chữ Latin tôi với cấp tính | |
206 | TÔI | TÔI | TÔI | vốn chữ Latin tôi với circumflex | |
207 | TÔI | TÔI | TÔI | vốn chữ Latin tôi với dấu tách đôi | |
208 | Ð | Ð | Ð | vốn chữ Latin Eth | |
209 | Ñ | Ñ | Ñ | Latin vốn chữ N với dấu ngã | |
210 | Ò | Ò | Ò | Latin chữ O vốn với mộ | |
211 | Ó | Ó | Ó | Latin chữ O vốn bằng cấp | |
212 | Ô | Ô | Ô | Latin chữ O vốn bằng circumflex | |
213 | O | O | O | Latin chữ O vốn bằng dấu ngã | |
214 | Ö | Ö | Ö | Latin chữ O vốn bằng dấu tách đôi | |
215 | × | × | × | dấu nhân | |
216 | Ø | Ø | Ø | Latin chữ O vốn bị đột quỵ | |
217 | Ù | Ù | Ù | vốn chữ Latin U nấm mồ | |
218 | Ú | Ú | Ú | vốn chữ Latin U với cấp tính | |
219 | Û | Û | Û | vốn chữ Latin U với circumflex | |
220 | Ü | Ü | Ü | vốn chữ Latin U với dấu tách đôi | |
221 | Ý | Ý | Ý | vốn chữ Latin Y bằng cấp | |
222 | Þ | Þ | Þ | Latin Thorn chữ hoa | |
223 | ß | ß | ß | Latin chữ nhỏ sắc nét | |
224 | à | à | à | Latin một lá thư nhỏ với mộ | |
225 | á | á | á | Latin một lá thư nhỏ với cấp tính | |
226 | â | â | â | Latin một lá thư nhỏ với circumflex | |
227 | ã | ã | ã | Latin một lá thư nhỏ với dấu ngã | |
228 | ä | ä | ä | Latin một lá thư nhỏ với dấu tách đôi | |
229 | å | å | å | Latin một lá thư nhỏ với chiếc nhẫn trên | |
230 | æ | æ | æ | Latin ae thư nhỏ | |
231 | ç | ç | ç | Latin bức thư nhỏ c với dấu móc dưới | |
232 | è | è | è | Latin e bức thư nhỏ với mộ | |
233 | é | é | é | Latin e bức thư nhỏ với cấp tính | |
234 | ê | ê | ê | Latin e bức thư nhỏ với circumflex | |
235 | ë | ë | ë | Latin e bức thư nhỏ với dấu tách đôi | |
236 | tôi | tôi | tôi | Latin bức thư nhỏ tôi với mộ | |
237 | tôi | tôi | tôi | Latin bức thư nhỏ tôi với cấp tính | |
238 | tôi | tôi | tôi | Latin bức thư nhỏ tôi với circumflex | |
239 | tôi | tôi | tôi | Latin bức thư nhỏ tôi với dấu tách đôi | |
240 | ð | ð | ð | Latin ETH bức thư nhỏ | |
241 | ñ | ñ | ñ | Latin n chữ thường với dấu ngã | |
242 | ò | ò | ò | Latin bức thư nhỏ o nấm mồ | |
243 | ó | ó | ó | Latin bức thư nhỏ o với cấp tính | |
244 | ô | ô | ô | Latin bức thư nhỏ o với circumflex | |
245 | O | O | O | Latin bức thư nhỏ o với dấu ngã | |
246 | ö | ö | ö | Latin bức thư nhỏ o với dấu tách đôi | |
247 | ÷ | ÷ | ÷ | dấu chia | |
248 | ø | ø | ø | Latin bức thư nhỏ o bị đột quỵ | |
249 | ù | ù | ù | Latin bức thư nhỏ u nấm mồ | |
250 | ú | ú | ú | Latin bức thư nhỏ u với cấp tính | |
251 | û | û | û | Latin thư nhỏ với circumflex | |
252 | ü | ü | ü | Latin bức thư nhỏ u với dấu tách đôi | |
253 | ý | ý | ý | Latin y thư nhỏ với cấp tính | |
254 | þ | þ | þ | Latin gai chữ nhỏ | |
255 | ÿ | ÿ | ÿ | Latin y thư nhỏ với dấu tách đôi |
Các ASCII Character Set
ASCII sử dụng các giá trị 0-31 (và 127) cho các ký tự điều khiển.
ASCII sử dụng các giá trị 32-126 cho các chữ cái, chữ số, và các ký hiệu.
ASCII không sử dụng các giá trị 128-255.
Các ANSI Character Set (Windows-1252)
ANSI là giống hệt nhau để ASCII cho các giá trị 0-127.
ANSI có một bộ quyền sở hữu của nhân vật cho các giá trị 128-159.
ANSI là giống hệt với UTF-8 cho các giá trị 160-255.
Các tiêu chuẩn ISO-8859-1 Character Set
8859-1 là giống hệt nhau để ASCII cho các giá trị 0-127.
8859-1 không sử dụng các giá trị 128-159.
8859-1 là giống hệt với UTF-8 cho các giá trị 160-255.
UTF-8 Character Set
UTF-8 là giống hệt nhau để ASCII cho các giá trị 0-127.
UTF-8 không sử dụng các giá trị 128-159.
UTF-8 là giống nhau cho cả hai ANSI và 8859-1 cho các giá trị 160-255.
UTF-8 tiếp tục từ giá trị 256 với hơn 10 000 nhân vật khác nhau.
Đối với một cái nhìn gần hơn, nghiên cứu của chúng tôi hoàn HTML Character Set tham khảo .
0 Bình luận:
Đăng nhận xét
Khi các bạn đóng góp ý kiến nhớ chú ý ngôn từ cho phù hợp với thuần phong ,mỹ tục văn hóa nước ta. Cảm ơn!