รหัสแทนข้อมูล |
รหัสแทนข้อมูล
คอมพิวเตอร์ทำงานด้วยหลักการทางอิเล็กทรอนิกส์
ที่แทนสัญญาณทางไฟฟ้าด้วยตัวเลขศูนย์และหนึ่ง ซึ่งเป็นตัวเลขในระบบเลข
ฐานสองแต่ละหลักเรียกว่าบิต (binary digit : bit) บิต
เป็นหน่วยข้อมูลที่เล็กที่สุด และเมื่อนำตัวเลขหลาย ๆ บิตมาเรียงกัน
จะใช้สร้างรหัสแทน ความหมายจำนวน หรือตัวอักษร
หรือสัญลักษณ์ทั้งภาษาอังกฤษและภาษาไทยได้
และเพื่อให้การแลกเปลี่ยนข้อความ ระหว่างมนุษย์กับ
คอมพิวเตอร์เป็นไปในแนวเดียวกัน
จึงมีการกำหนดมาตรฐานรหัสตัวเลขในระบบเลขฐานสองสำหรับแทนสัญลักษณ์เหล่านี้
รหัสมาตรฐาน ที่นิยมใช้กันมากมีสองกลุ่ม
แต่ต่อมาได้มีการพัฒนาเพิ่มขึ้นอีกเป็น 3 กลุ่ม คือ
1)
รหัสแอสกี
รหัสแอสกี
(ASCII)
เป็นเป็นรหัสที่กำหนดขึ้นโดยหน่วยงานกำหนดมาตรฐานของสหรัฐอเมริกา
ย่อมาจาก American Standard Code for Information Interchange
เป็นรหัส 8 บิต ใช้แทนสัญลักษณ์ต่าง ๆ ได้ 256 ตัว
นิยมใช้กันแพร่หลายกับระบบคอมพิวเตอร์ทั่วไป และระบบสื่อสารข้อมูล
บิตที่ 7 6 5 4 3 2 1 0
โครงสร้างของรหัสแอสกี
มีดังนี้
บิตที่
4 - 7
ประเภทของตัวอักขระ
0010
เครื่องหมายต่าง
ๆ
0011
ตัวเลขและเครื่องหมายต่าง
ๆ
0100
A - O
0101
P
- Z และเครื่องหมายต่าง
ๆ
0110
a
-
o
0111
p
- z และเครื่องหมายต่าง
ๆ
บิตที่
0 ถึง 3 เป็นรหัสแทนอักขระแต่ละตัวในกลุ่ม
ตัวอย่าง
รหัสแทนข้อมูลแบบ
ASCII
บิตที่ | 7 | 6 | 5 | 4 | 3 | 2 | 1 | 0 | |
0 | 0 | 1 | 1 | 0 | 1 | 1 | 1 | แทน 7 | |
0 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | แทน G | |
0 | 1 | 1 | 0 | 0 | 1 | 1 | 1 | แทน g | |
0 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | แทน J | |
0 | 0 | 1 | 0 | 1 | 0 | 1 | 1 | แทน + |
2)
รหัสเอ็บซีดิก
รหัสเอ็บซีดิก
(EBCDIC) เป็นคำย่อมาจาก Extended Binary Coded Decimal Interchange
Code พัฒนาและใช้งานโดยบริษัทไอบีเอ็ม
เครื่องคอมพิวเตอร์เมนเฟรมของไอบีเอ็มยังคงใช้รหัสนี้
การกำหนดรหัสจะใช้ 8 บิต หรือ 1 ไบต์ ต่อหนึ่งอักขระเหมือนกับรหัสแอสกี
แต่รูปแบบของรหัสที่กำหนดจะแตกต่างกัน
บิตที่
0 1 2 3 4 5 6 7
โครงสร้างรหัสเอ็บซีดิก
มีดังนี้
บิตที่
รหัส
ประเภทของตัวอักขระ
0
-
1
01
สัญลักษณ์ต่าง
ๆ
10
ตัวหนังสือภาษาอังกฤษแบบพิมพ์ตัวเล็ก
11
ตัวหนังสือภาษาอังกฤษแบบพิมพ์ตัวใหญ่และตัวเลข
2
- 3
00
A
- I
01
J
-
R
10
S
-
Z
11
ตัวเลข
4
- 7
รหัสแทนอักขระแต่ละตัวในกลุ่ม
ตัวอย่างรหัสแทนข้อมูลแบบเอ็บซีดิก
บิตที่ | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | |
1 | 1 | 1 | 1 | 0 | 1 | 1 | 1 | แทน 7 | |
1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | แทน G | |
1 | 0 | 0 | 0 | 0 | 1 | 1 | 1 | แทน g | |
1 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | แทน J | |
0 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | แทน + |
3) รหัสยูนิโค้ด
(Unicode)
เป็นรหัสที่สร้างขึ้นมาในระยะหลัง
ที่มีการสร้างแบบตัวอักษรของภาษาต่าง ๆ
รหัสยูนิโค้ดมีความแตกต่างจากรหัส 2 ชนิดที่กล่าวมาแล้วข้างต้น คือ
ใช้เลขฐานสอง 16 บิต แทนตัวอักษร
ทั้งนี้เนื่องจากหลายประเทศมีการสร้างแบบตัวอักษร (Font) ของภาษาต่าง ๆ
ทั่วโลก เช่น ภาษาจีน ภาษาญี่ปุ่น หากใช้รหัสเลขฐานสอง 8 บิต
จะสามารถแทนรูปแบบตัวอักษรได้เพียง 256 รูปแบบเท่านั้น
แต่รหัสยูนิโค้ดสามารถแทนรูปแบบตัวอักษรได้ถึง 65,536 ตัว
ซึ่งมากพอที่จะใช้แทนสัญญลักษณ์กราฟิก และ
สัญญลักษณ์ทางคณิตสาตร์ได้อีกด้วย