´ÙÀ½ÀÇ ³»¿ëÀº º»ÀÎÀÌ ÇѱÛÀ» Áö¿øÇÏ´Â ¿©·¯ Àåºñ¿Í ¿¬µ¿ÀÛ¾÷À» ÇÏ¸é¼ Èûµé¾ú´ø
ÇѱÛȣȯ ¹®Á¦¸¦ ÇØ°áÇϱâ À§ÇØ Á÷Á¢ Á¤¸®ÇÑ ÀÚ·áÀÔ´Ï´Ù.
¿©·¯ºÐ¿¡°Ô µµ¿òÀÌ µÇ¾úÀ¸¸é ÇÏ´Â ¹Ù¶÷¿¡¼ ÆÁÁ¤º¸·Î ¿Ã¸³´Ï´Ù.
Á¦°¡ À߸ø ÀÌÇØ Ç߰ųª Ʋ¸° ºÎºÐÀÌ ÀÖÀ¸¸é ¾Ë·Á ÁÖ½Ã¸é ¼öÁ¤Åä·Ï ÇÏ°Ú½À´Ï´Ù.
[¿ë¾îÁ¤¸®]
ÇÑ±Û - ¿Ï¼ºÇü ÄÚµå : ÇÑ±Û ÇѱÛÀÚ ÇѱÛÀÚ¿¡ ÇØ´çÇÏ´Â ÄÚµåÇ¥¸¦ ¸¸µé¾î 1:1 ¸ÉÇÎ ÇÏ¿© ±ÛÀÚ¸¦ ã´Â ¹æ½Ä (³í¸®¼º ¾øÀ½)
Àü¼¼°è ¹®ÀÚ°¡ ÇѱÛó·³ °úÇÐÀûÀ¸·Î ¸¸µé¾î ÁöÁö ¸øÇÏ°í ±×¸²ÇüÅ·Π¸¸µé¾îÁø ¹®ÀÚ°¡ ¸¹±â ¶§¹®.
ÇÑ±Û - Á¶ÇÕÇü ÄÚµå : ³í¸®Àû ÄÚµå»ý¼º
º¯È¯´Ü°è 1 - ±âº» Ãʼº, Áß¼º, Á¾¼º ÄÚµåÇ¥¸¸À» »ç¿ëÇÏ¿© ÄÚµå °Ë»ö
¿¹) Àå ¤¸ 01110 + ¤¿ 00011 + o 10111 +
º¯È¯ ´Ü°è 2 : 01110(5bit) + 00011(5bit) + 10111(5bit) ÇÕ¼º( ÃÑ 15bit ) º¯È¯ ´Ü°è 3 : 1+ 01110(5bit) + 00011(5bit) + 10111(5bit) ÇÕ¼º( ÃÖÁ¾ ÃÑ 16bit »ý¼º) º¯È¯ ´Ü°è 2 Á¦ÀÏ ¼±µÎ¿¡ 1 Ãß°¡ Çؼ 16bit (2byte) ¹®ÀÚÄÚµå »ý¼º ÇѱÛÇÐȸ ÇѱÛâ½ÃÀÇ °úÇÐÀû ¿ì¼ö¼ºÀ» »ì¸®±â À§ÇØ Á¶ÇÕÇüÀÌ ÇÑ±Û Ç¥ÁØÀ¸·Î äÅõǾî¾ß ÇÑ´Ù°í ÁÖÀå. (¼ø¼ö Ãʼº,Áß¼º,Á¾¼º ÀÇ Á¶ÇÕ¹ýÀ» °Á¶ )
Çѱ¹ÀÎ ÀÔÀå¿¡¼´Â ¸Â´Â ¸»ÀÌÁö¸¸ Àü¼¼°è ¾ð¾î ±Ô°ÝÈ ÀÔÀå¿¡¼ ºÃÀ»¶§ Çѱ۸¸ ¿¹¿Ü¸¦ µÑ ¼ö ¾ø¾î¼ MS ´Â ÇÑ±Û ¿Ï¼ºÇü ¹æ½ÄÀ» ¿ì¼±ÀûÀ¸·Î »ç¿ë
ÀÎÄÚµù
-¹®ÀÚ¸¦ ÄÄÇ»ÅÍ¿¡ ÀúÀåÇϰųª Åë½ÅÀ¸·Î Àü¼ÛÇÒ ¸ñÀûÀ¸·Î ºÎÈ£È ÇÏ´Â ¹æ¹ýÀ» °¡¸®Å²´Ù.
À¯´ÏÄÚµå¶õ ?
¿ì¸®´Â ÈçÈ÷ À¯´ÏÄÚµå¶ó ÇÔÀº ¹®ÀÚ¸¦ 2byte ·Î ÀÎÄÚµù ÇÏ´Â ±â¹ýÀ̶ó ¾Ë°í ÀÖ´Ù.
¾Æ·¡ Euc-KR°ú CP949 ÀÇ ¿ä¾à³»¿ëÀ» º¸¸é ¾Ë°ÚÁö¸¸ ÀÌ µÑÀº ¸ðµÎ 2byte 󸮱â¹ýÀ» »ç¿ëÇÏ°í ÀÖ´Ù.
±×·³ °ú¿¬ Euc-KR°ú CP949 ¸¦ À¯´ÏÄÚµå¶ó ¸í¸íÇÒ ¼ö Àִ°¡?
´äÀº ¾ÈµÈ´Ù ÀÌ´Ù. ÀÌÀ¯´Â ´ÙÀ½°ú °°´Ù.
À¯´ÏÄÚµå¶õ À̸§¿¡¼ ¾Ë¼ö ÀÖµí Àü¼¼°è ¸ðµç ¹®ÀÚ¸¦ ÇϳªÀÇ ÄÚµåÇ¥·Î ÅëÇÕ½ÃŲ °³³äÀÌ´Ù. Áï, À¯´ÏÄÚµå ¾È¿¡´Â Àü¼¼°è ¸ðµç ¾ð¾îÀÇ ¹®ÀÚ°¡ µé¾î ÀÖ¾î¾ß ÇÑ´Ù´Â ´ë ÀüÁ¦°¡ ÀÖ´Ù.
ÇÏÁö¸¸, Euc-KR °ú CP949 ¾È¿¡´Â Åë»ó¹®ÀÚ(¿µ¾î, Ư¼ö¹®ÀÚ) ¿Í ÇÑ±Û ¹Û¿¡´Â ¾ø´Ù. ±×·¯¹Ç·Î Euc-KR °ú CP949 ¸¦ °¡Áö°í À¯´ÏÄÚµå¶õ Ç¥ÇöÀ» ¾²¸é ¾ÈµÈ´Ù.
±×·¯¹Ç·Î ¿ì¸®´Â Àü¼¼°è ¸ðµç ¹®ÀÚ¸¦ Ç¥Çö ÇÒ ¼ö ÀÖ´Â ÀÎÄÚµùÀÎ UTF ¸¦ À¯´ÏÄÚµå¶ó ÇÒ ¼ö ÀÖ´Ù.
ACSII ÀÎÄÚµù
-128 °³ÀÇ ¹®ÀÚÄÚµå Á¤¸®Ç¥·Î ¿ÀÁ÷ 1byte ÀÎÄÚµù
-¿µ¾î, Åë»ó Ư¼ö¹®ÀÚ¸¸ Ç¥Çö°¡´É
-ÇÑ±Û ¹× ±âŸ ¿Ü±¹¾î Ç¥Çö ¾ÈµÊ
Euc-KR ÀÎÄÚµù ( Extended Unix Code Page)
-¿Ï¼ºÇü ÄÚµåÆäÀÌÁö
-À¯´Ð½º °è¿ÀÇ ÄÚµåÆäÀÌÁö
-°¡º¯±æÀÌ ¹æ½ÄÀÇ ¿µ¾î, Ư¼ö¹®ÀÚ, ÇѱÛ, ÀϺÎÇÑÀÚ ¸¸ Ç¥Çö°¡´É Åë»ó¹®ÀÚ (¿µ¾î.Ư¼ö¹®ÀÚ) ÀÏ °æ¿ì 1 Byte KS X 1003 ÄÚµåÇ¥ ÂüÁ¶ (1Byte) ÇÑ±Û ÀÏ °æ¿ì 2 Byte KS X 1001 ÄÚµåÇ¥ ÂüÁ¶ (2Byte)
- 2,350 ÀÚÀÇ ÇÑ±Û Ç¥Çö °¡´É
-ISO/IEC 2022 Ç¥ÁØ
CP949 ÀÎÄÚµù ( Extended Windows Code Page )
-È®Àå ¿Ï¼ºÇü ÄÚµå ÆäÀÌÁö / Euc-KR °ú ȣȯ µÊ) ¿Ï¼ºÇü ÄÚµåÇ¥¿¡ ¾ø´Â ÇÑ±Û ±ÛÀÚ¸¦ Á¶ÇÕÇüÀ¸·Î ó¸®ÇÏ´Â ·ÎÁ÷À» °¡Áö°í ÀÖÀ½
-À©µµ¿ì °è¿ÀÇ ÄÚµå ÆäÀÌÁö
-°¡º¯±æÀÌ ¹æ½ÄÀÇ ¿µ¾î, Ư¼ö¹®ÀÚ, ÇѱÛ, ÀϺÎÇÑÀÚ ¸¸ Ç¥Çö°¡´É
Åë»ó¹®ÀÚ (¿µ¾î.Ư¼ö¹®ÀÚ) ÀÏ °æ¿ì 1 Byte KS X 1003 ÄÚµåÇ¥ ÂüÁ¶ (1Byte) ÇÑ±Û ÀÏ °æ¿ì 2 Byte KS X 1001 ÄÚµåÇ¥ ÂüÁ¶ (2Byte) ±×¿Ü Á¶ÇÕÇü º´Çà »ç¿ë
11,172 ÀÚÀÇ ÇÑ±Û Ç¥Çö °¡´É
-Euc-KRº¸´Ù ¸¹Àº ÇÑ±Û ¼ö Ç¥Çö °¡´É
-CP949 ¿¡¼ Euc-KR ·Î º¯È¯ÀÌ Àß ¾ÈµÉ °æ¿ìÀÇ ¿øÀÎ : CP949 °¡ Euc-kR º¸´Ù ´õ ¸¹Àº ¹®ÀÚÁ¶ÇÕÀÇ °æ¿ì ¼ö¸¦ °¡Áö°í Àֱ⠶§¹®
-Euc-KR ¸¦ µû¶óÇÑ °³³äÀ¸·Î ISO/IEC 2022 Ç¥ÁØ Ã¤ÅÃÀº ¾ÈµÇ¾î ÀÖÀ½.
-µ¨ÆÄÀÌ ÇÑ±Û Ç¥±â¿¡ »ç¿ë
UTF-8 ÀÎÄÚµù (À¯´ÏÄÚµå) -À¯´Ð½º/À©µµ¿ì ¾çÂÊ °è¿ ¸ðµÎ¿¡¼ »ç¿ëµÇ´Â È®Àå ¿Ï¼ºÇü ÄÚµå ÆäÀÌÁö
-Àü [ ¼¼°è ¸ðµç ¹®ÀÚ ÄÚµå ÆäÀÌÁö ] Æ÷ÇÔ
-°¡º¯±æÀÌ ¹®ÀÚ ÀÎÄÚµù ¹æ½Ä -Åë»ó¹®ÀÚ (¿µ¾î.Ư¼ö¹®ÀÚ) ÀÏ °æ¿ì 1Byte »ç¿ë ASCII ÄÚµå 1 Byte ·Î Ç¥Çö (±×·¯¹Ç·Î ASCII ÄÚµå´Â UTF-8ÀÇ ÀϺκÐÀÌ´Ù.)
-Euc-KR °ú CP949 ÄÚµåÇ¥¿Í ȣȯ¼º ¾øÀ½
UTF-8 ³»ºÎ ÀúÀå¹æ½ÄÀ» º¸¸é
ÇÑ ¹®ÀÚ¸¦ Ç¥Çö/ÀúÀåÇϱâ À§ÇØ ÃÖ¼Ò 1byte ¿¡¼ ÃÖ´ë 4 byte ±îÁö µ¿ÀûÀ¸·Î »ç¿ëÇÑ´Ù. (´Ù¸¥ ¹®ÀÚ´Â ´Ù¸¥ ¹ÙÀÌÆ® ¼ö·Î Ç¥Çö µÉ ¼ö ÀÖ´Ù.) 1Byte ÀÇ ÃÖ»óÀ§ 4bit ¿¡ ¹®ÀÚ±â·Ï¿¡ »ç¿ëµÇ´Â byte ¼ö ±â·Ï
¹®ÀÚ±â·Ï¿¡ ÇÊ¿äÇÑ byte ¼ö°¡ 1byte ÀÏ °æ¿ì ÃÖ»óÀ§ bit ´Â 0 À¸·Î ½ÃÀÛ ¹®ÀÚ±â·Ï¿¡ ÇÊ¿äÇÑ byte ¼ö°¡ 2byte ÀÏ °æ¿ì ÃÖ»óÀ§ bit ´Â 110 À¸·Î ½ÃÀÛ ¹®ÀÚ±â·Ï¿¡ ÇÊ¿äÇÑ byte ¼ö°¡ 3byte ÀÏ °æ¿ì ÃÖ»óÀ§ but ´Â 1110 À¸·Î ½ÃÀÛ ¹®ÀÚ±â·Ï¿¡ ÇÊ¿äÇÑ byte ¼ö°¡ 4byte ÀÏ °æ¿ì ÃÖ»óÀ§ but ´Â 1111 À¸·Î ½ÃÀÛ
ASCII ´Â 1byte »ç¿ë, ÇѱÛÀº ¹«Á¶°Ç 3byte ÀÎÄÚµùÀÌ´Ù.
Áï ³»ºÎÀûÀ¸·Î ºÃÀ»¶§ À¯´ÏÄÚµå´Â ¹«Á¶°Ç 2byte 󸮶õ ¸»Àº ¿ÏÀüÈ÷ Ʋ¸° °³³äÀÌ´Ù. ÀÌ ¸»À» ¾î´À ´©°¡ Á¦ÀÏ ¸ÕÀúÇÏ°í ÀüÆĽÃŲ Áö´Â¸ð¸£°ÚÀ¸³ª À¯´ÏÄڵ尡 2byte ¶õ °³³äÀº ¿ÏÀüÈ÷ À߸øµÈ °³³äÀÌ´Ï Áö±Ý ºÎÅÍ´Â ¿Ã¹Ù¸£°Ô ÀÌÇØÇϱ⠹ٶõ´Ù.
UTF-8 Àº ÇÑ±Û ¹®ÀÚ¿¡ ¹«Á¶°Ç 2byte ÄÚµåÇ¥¸¦ ÂüÁ¶ÇÏ´Â Euc-KR °ú CP949 ¿Í´Â ¿ÏÀüÈ÷ ´Ù¸¥ °³³äÀÌ´Ù.
-2014³â ÇöÀç 1,114,112 °³ÀÇ ±ÛÀÚ Ç¥Çö °¡´É ( ¸Å³â Áö¼ÓÀûÀÎ ¹öÁ¯¾÷À¸·Î ±ÛÀÚ¼ö Ãß°¡Áß )
UTF-16/UTF-32
UTF-8 A¶ó´Â ¹®ÀÚÇ¥ÇöÀ» 0x41 1Byte ·Î Ç¥ÇöÇÔ
UTF-16 A¶ó´Â ¹®ÀÚÇ¥ÇöÀ» 0x0041/0x4100 2Byte ·Î Ç¥ÇöÇÔ (Little-Endian/Big-Endian ´ßÀÌ ¸ÕÀú³Ä ¾ËÀÌ ¸ÕÀú³Ä)
UTF-32 A¶ó´Â ¹®ÀÚÇ¥ÇöÀ» 0x00000041/0x41000000 4byte ·Î Ç¥ÇöÇÔ (LE/BE ´ßÀÌ ¸ÕÀú³Ä ¾ËÀÌ ¸ÕÁ®³Ä)
ÄÄÆÄÀÏ·¯¿¡ µû¶ó Little-Endian ÀÎÁö Big-Endian ÀÎÁö¸¦ °¡¸®±â ¶§¹®¿¡ ÀÌ ¿É¼ÇÀÌ Ãß°¡ µÈ °Í °°´Ù.
À¯´ÏÄÚµå(Little-Endian)
À¯´ÏÄÚµå(Big-Endian)
Áö±Ý±îÁö Á¤¸®ÇÑ ³»¿ëÀº ÀÌ·¸½À´Ï´Ù. º¸´Ù ÁÁÀº Á¤º¸ Ãß°¡ÇØ ÁÖ½Ç ºÐ ÀÖÀ¸½Ã¸é ¸»¾¸ÇØ ÁÖ½Ã¸é ´Ù½Ã Á¤¸®ÇØ º¸°Ú½À´Ï´Ù.
|