Thứ Bảy, 21 tháng 5, 2016

13:37:00
Để hiển thị một trang HTML một cách chính xác, một trình duyệt web phải biết các bộ ký tự (mã hóa ký tự) để sử dụng.

Character Encoding là gì?

ASCII là tiêu chuẩn mã hóa ký tự đầu tiên (còn gọi là bộ ký tự). Nó định nghĩa 127 ký tự chữ số khác nhau mà có thể được sử dụng trên internet.
ASCII được hỗ trợ số (0-9), chữ cái tiếng Anh (AZ), và một số ký tự đặc biệt như thế! $ + - () @ <>.
ANSI (Windows-1252) là bản gốc của Windows ký tự. Nó hỗ trợ 256 mã ký tự khác nhau.
ISO-8859-1 là nhân vật mặc định thiết lập cho HTML 4. Nó cũng hỗ trợ 256 mã ký tự khác nhau.
Bởi vì ANSI và ISO đã được hạn chế, mã hóa ký tự mặc định đã được thay đổi để UTF-8 trong HTML5.
UTF-8 (Unicode) bao gồm hầu như tất cả các ký tự và biểu tượng trong thế giới.
chú thíchTất cả 4 bộ vi xử lý HTML cũng hỗ trợ UTF-8.

Charset Thuộc tính HTML

Để hiển thị một trang HTML một cách chính xác, một trình duyệt web phải biết các bộ ký tự được sử dụng trong trang.
Điều này được quy định trong các thẻ <meta>:

Đối với HTML4:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

Đối với HTML5:

<meta charset="UTF-8">
chú thíchNếu một trình duyệt phát hiện ISO-8859-1 trong một trang web, nó mặc định là ANSI, vì ANSI là giống với tiêu chuẩn ISO-8859-1 trừ ANSI đó có 32 nhân vật phụ.

Sự khác nhau giữa tự Sets

Bảng dưới đây hiển thị sự khác biệt giữa các bộ ký tự mô tả ở trên:
ASCIIANSI8859UTF-8Sự miêu tả
32không gian
33!!!!dấu chấm than
34""""dấu ngoặc kép
35####số hiệu
36$$$$ký hiệu đô la
37%%%%dấu phần trăm
38&&&&dấu và
39''''phép điểm danh
40((((ngoặc trái
41))))ngoặc đúng
42****dấu
43++++dấu cộng
44,,,,dấu phẩy
45----gạch nối-trừ
46....ngừng hẳn
47////gạch chéo ở cuối
480000chữ số không
491111một chữ số
502222chữ số hai
513333ba chữ số
524444chữ số bốn
535555chữ số năm
546666chữ số sáu
557777chữ số bảy
56số 8số 8số 8số 8chữ số tám
579999chữ số chín
58::::dấu hai chấm
59;;;;dấu chấm phẩy
60<<<<ít hơn so với dấu
61====dấu bằng
62>>>>dấu lớn hơn
63????dấu chấm hỏi
64@@@@thương mại tại
65MộtMộtMộtMộtLatin vốn chữ A
66BBBBLatin vốn chữ B
67CCCCvốn chữ Latin C
68DDDDvốn chữ Latin D
69EEEEvốn chữ Latin E
70FFFFvốn chữ Latin F
71GGGGvốn chữ Latin G
72HHHHvốn chữ Latin H
73tôitôitôitôiLatin vốn chữ I
74JJJJvốn chữ Latin J
75KKKKvốn chữ Latin K
76LLLLvốn chữ Latin L
77MMMMvốn chữ Latin M
78NNNNvốn chữ Latin N
79OOOOLatin vốn chữ O
80PPPPvốn chữ Latin P
81QQQQLatin vốn chữ Q
82RRRRLatin vốn chữ R
83SSSSvốn chữ Latin S
84TTTTvốn chữ Latin T
85UUUUvốn chữ Latin U
86VVVVLatin vốn chữ V
87WWWWvốn chữ Latin W
88XXXXvốn chữ Latin X
89YYYYvốn chữ Latin Y
90ZZZZLatin vốn chữ Z
91[[[[khung vuông bên trái
92\\\\gạch chéo ở cuối ngược
93]]]]khung vuông bên phải
94^^^^giọng circumflex
95____dòng thấp
96''''dấu huyền
97mộtmộtmộtmộtLatin nhỏ một lá thư
98bbbbLatin nhỏ thư b
99ccccLatin nhỏ chữ c
100ddddLatin nhỏ chữ d
101eeeeLatin nhỏ thư điện tử
102ffffLatin nhỏ thư f
103ggggLatin nhỏ thư g
104hhhhLatin thư h nhỏ
105tôitôitôitôiLatin tôi bức thư nhỏ
106jjjjLatin thư j nhỏ
107kkkkLatin nhỏ thư k
108llllLatin l bức thư nhỏ
109mmmmLatin thư m nhỏ
110nnnnLatin thư n nhỏ
111ooooLatin chữ o nhỏ
112ppppLatin chữ p nhỏ
113qqqqLatin q bức thư nhỏ
114rrrrLatin r bức thư nhỏ
115SSSSLatin nhỏ lá thư của
116ttttLatin thư t nhỏ
117uuuuLatin bức thư nhỏ u
118vvvvLatin nhỏ thư v
119wwwwLatin bức thư nhỏ w
120xxxxLatin nhỏ thư x
121yyyyLatin thư y nhỏ
122zzzzLatin nhỏ thư z
123{{{{khung nhọn trái
124||||đường thẳng đứng
125}}}}khung nhọn đúng
126~~~~dấu ngã
127DEL
128dấu euro
129KHÔNG ĐƯỢC SỬ DỤNG
130,single-9 thấp dấu ngoặc kép
131ƒLatin chữ thường f móc
132"double-9 thấp dấu ngoặc kép
133...ellipsis ngang
134dao găm
135dao đôi
136thư sửa đổi giọng circumflex
137mỗi dấu mille
138SLatin vốn chữ S với các dấu mũ ngược
139<đơn dấu ngoặc góc trái chỉ
140ŒLatin chữ ghép vốn OE
141KHÔNG ĐƯỢC SỬ DỤNG
142ŽLatin chữ Z vốn bằng dấu mũ ngược
143KHÔNG ĐƯỢC SỬ DỤNG
144KHÔNG ĐƯỢC SỬ DỤNG
145'trái dấu nháy đơn
146'đúng dấu nháy đơn
147"trái dấu ngoặc kép
148"đúng dấu ngoặc kép
149đạn
150-en dash
151-gạch đầu
152~dấu ngã nhỏ
153dấu hiệu thương hiệu
154SLatin nhỏ thư s với dấu mũ ngược
155>đơn phải trỏ đánh dấu góc báo giá
156œLatin oe chữ ghép nhỏ
157KHÔNG ĐƯỢC SỬ DỤNG
158§Latin z thư nhỏ với dấu mũ ngược
159Ÿvốn chữ Latin Y với dấu tách đôi
160không phá vỡ không gian
161¡¡¡dấu chấm than ngược
162¢¢¢dấu phần trăm
163£££dấu hiệu pound
164¤¤¤dấu tiền tệ
165¥¥¥ký hiệu yen
166|||thanh bị hỏng
167§§§ký hiệu phần
168¨¨¨dấu tách đôi
169©©©dấu bản quyền
170ªªªchỉ số thứ tự nữ tính
171«««trái chỉ góc đôi dấu ngoặc kép
172¬¬¬không ký
173gạch nối mềm
174®®®dấu hiệu đăng ký
175¯¯¯làm dấu
176°°°dấu bằng
177±±±cộng-trừ dấu
178²²²superscript hai
179³³³superscript ba
180'''nhấn sắc
181μμμdấu hiệu vi
182dấu pilcrow
183···dot trung
184¸¸¸dấu trước a, o, u dưới c đọc như s
185¹¹¹một superscript
186ºººchỉ số thứ tự nam tính
187»»»phải trỏ góc đôi dấu ngoặc kép
188¼¼¼phần thô tục một phần tư
189½½½phần thô tục một nửa
190¾¾¾phần thô tục ba phần tư
191¿¿¿dấu hỏi ngược
192ÀÀÀLatin vốn chữ A với mộ
193ÁÁÁLatin vốn chữ A với cấp tính
194ÂÂÂLatin vốn chữ A với circumflex
195ÃÃÃLatin vốn chữ A với dấu ngã
196ÄÄÄLatin vốn chữ A với dấu tách đôi
197ÅÅÅLatin vốn chữ A với chiếc nhẫn trên
198ÆÆÆvốn chữ Latin AE
199ÇÇÇLatin vốn chữ C với dấu móc dưới
200ÈÈÈLatin vốn chữ E với mộ
201ÉÉÉLatin vốn chữ E với cấp tính
202ÊÊÊLatin vốn chữ E với circumflex
203ËËËLatin vốn chữ E với dấu tách đôi
204TÔITÔITÔIvốn chữ Latin tôi với mộ
205TÔITÔITÔIvốn chữ Latin tôi với cấp tính
206TÔITÔITÔIvốn chữ Latin tôi với circumflex
207TÔITÔITÔIvốn chữ Latin tôi với dấu tách đôi
208ÐÐÐvốn chữ Latin Eth
209ÑÑÑLatin vốn chữ N với dấu ngã
210ÒÒÒLatin chữ O vốn với mộ
211ÓÓÓLatin chữ O vốn bằng cấp
212ÔÔÔLatin chữ O vốn bằng circumflex
213OOOLatin chữ O vốn bằng dấu ngã
214ÖÖÖLatin chữ O vốn bằng dấu tách đôi
215×××dấu nhân
216ØØØLatin chữ O vốn bị đột quỵ
217ÙÙÙvốn chữ Latin U nấm mồ
218ÚÚÚvốn chữ Latin U với cấp tính
219ÛÛÛvốn chữ Latin U với circumflex
220ÜÜÜvốn chữ Latin U với dấu tách đôi
221ÝÝÝvốn chữ Latin Y bằng cấp
222ÞÞÞLatin Thorn chữ hoa
223ßßßLatin chữ nhỏ sắc nét
224àààLatin một lá thư nhỏ với mộ
225áááLatin một lá thư nhỏ với cấp tính
226âââLatin một lá thư nhỏ với circumflex
227ãããLatin một lá thư nhỏ với dấu ngã
228äääLatin một lá thư nhỏ với dấu tách đôi
229åååLatin một lá thư nhỏ với chiếc nhẫn trên
230æææLatin ae thư nhỏ
231çççLatin bức thư nhỏ c với dấu móc dưới
232èèèLatin e bức thư nhỏ với mộ
233éééLatin e bức thư nhỏ với cấp tính
234êêêLatin e bức thư nhỏ với circumflex
235ëëëLatin e bức thư nhỏ với dấu tách đôi
236tôitôitôiLatin bức thư nhỏ tôi với mộ
237tôitôitôiLatin bức thư nhỏ tôi với cấp tính
238tôitôitôiLatin bức thư nhỏ tôi với circumflex
239tôitôitôiLatin bức thư nhỏ tôi với dấu tách đôi
240ðððLatin ETH bức thư nhỏ
241ñññLatin n chữ thường với dấu ngã
242òòòLatin bức thư nhỏ o nấm mồ
243óóóLatin bức thư nhỏ o với cấp tính
244ôôôLatin bức thư nhỏ o với circumflex
245OOOLatin bức thư nhỏ o với dấu ngã
246öööLatin bức thư nhỏ o với dấu tách đôi
247÷÷÷dấu chia
248øøøLatin bức thư nhỏ o bị đột quỵ
249ùùùLatin bức thư nhỏ u nấm mồ
250úúúLatin bức thư nhỏ u với cấp tính
251ûûûLatin thư nhỏ với circumflex
252üüüLatin bức thư nhỏ u với dấu tách đôi
253ýýýLatin y thư nhỏ với cấp tính
254þþþLatin gai chữ nhỏ
255ÿÿÿLatin y thư nhỏ với dấu tách đôi

Các ASCII Character Set

ASCII sử dụng các giá trị 0-31 (và 127) cho các ký tự điều khiển.
ASCII sử dụng các giá trị 32-126 cho các chữ cái, chữ số, và các ký hiệu.
ASCII không sử dụng các giá trị 128-255.

Các ANSI Character Set (Windows-1252)

ANSI là giống hệt nhau để ASCII cho các giá trị 0-127.
ANSI có một bộ quyền sở hữu của nhân vật cho các giá trị 128-159.
ANSI là giống hệt với UTF-8 cho các giá trị 160-255.

Các tiêu chuẩn ISO-8859-1 Character Set

8859-1 là giống hệt nhau để ASCII cho các giá trị 0-127.
8859-1 không sử dụng các giá trị 128-159.
8859-1 là giống hệt với UTF-8 cho các giá trị 160-255.

UTF-8 Character Set

UTF-8 là giống hệt nhau để ASCII cho các giá trị 0-127.
UTF-8 không sử dụng các giá trị 128-159.
UTF-8 là giống nhau cho cả hai ANSI và 8859-1 cho các giá trị 160-255.
UTF-8 tiếp tục từ giá trị 256 với hơn 10 000 nhân vật khác nhau.
Đối với một cái nhìn gần hơn, nghiên cứu của chúng tôi hoàn HTML Character Set tham khảo .

0 Bình luận:

Đăng nhận xét

Khi các bạn đóng góp ý kiến nhớ chú ý ngôn từ cho phù hợp với thuần phong ,mỹ tục văn hóa nước ta. Cảm ơn!