Unicode

1. UTF-8

μ˜€λŠ˜λ‚  κ°€μž₯ 많이 μ‚¬μš©ν•˜λŠ” λ¬Έμžμ—΄ 인코딩. UTF-8은 8λΉ„νŠΈ(1λ°”μ΄νŠΈ)둜 μΈμ½”λ”©ν•œλ‹€λŠ” 것을 μ˜λ―Έν•œλ‹€.

  • μ΅œμ†Œ 1λ°”μ΄νŠΈ, μ΅œλŒ€ 6λ°”μ΄νŠΈλ₯Ό μ‚¬μš©ν•œλ‹€. κ·ΈλŸ¬λ‚˜ λŒ€λΆ€λΆ„ 4λ°”μ΄νŠΈ λ‚΄λ‘œ 처리

  • μ•„μŠ€ν‚€ μ½”λ“œμ™€ ν˜Έν™˜ κ°€λŠ₯

  • μœˆλ„μš°, μžλ°”, μž„λ² λ””λ“œλ₯Ό μ œμ™Έν•œ 거의 λͺ¨λ“  ν™˜κ²½μ—μ„œμ˜ λ¬Έμžμ—΄ 처리 ν‘œμ€€μ΄λ‹€.

  • JSON은 UTF-8 μΈμ½”λ”©λ§Œ μ‚¬μš©ν•˜λ©°, λ‹€λ₯Έ λ¬Έμžμ—΄ 인코딩은 μ§€μ›ν•˜μ§€ μ•ŠλŠ”λ‹€.

보톡 일반적인 λ¬ΈμžλŠ” 3λ°”μ΄νŠΈ λ‚΄λ‘œ 처리되며, 4λ°”μ΄νŠΈ μ˜μ—­μ—λŠ” 이λͺ¨μ§€(emoji)같은 λ¬Έμžκ°€ μžˆλ‹€. κ³ λŒ€ 문자 같은 것을 μ‚¬μš©ν•˜μ§€ μ•ŠλŠ” ν•œ 5λ°”μ΄νŠΈ 이상을 μ“°λŠ” κ²½μš°λŠ” 거의 μ—†λ‹€.


2. UTF-16

UTF-16은 16λΉ„νŠΈ(2λ°”μ΄νŠΈ)둜 μΈμ½”λ”©ν•˜λŠ” 것을 μ˜λ―Έν•œλ‹€. μžλ°”μ™€ μœˆλ„μš°λŠ” μœ λ‹ˆμ½”λ“œλ₯Ό μ‚¬μš©ν•˜κΈ° μ „λΆ€ν„° κ³ μ •λœ 2λ°”μ΄νŠΈ 길이의 문자 집합을 μ‚¬μš©ν–ˆλ‹€. κ·Έλž˜μ„œ UTF-16은 λ©€ν‹° λ°”μ΄νŠΈλΌκ³ λ„ ν•œλ‹€. 두 ν™˜κ²½μ—μ„œμ˜ ν˜Έν™˜μ„± 외에 UTF-16을 μ‚¬μš©ν•  μ΄μœ λŠ” μ—†λ‹€.

  • 2λ°”μ΄νŠΈ λ˜λŠ” 4λ°”μ΄νŠΈ 길이의 λ¬Έμžμ—΄μ„ μ‚¬μš©

  • μ•„μŠ€ν‚€ μ½”λ“œμ™€ ν˜Έν™˜λ˜μ§€ μ•ŠλŠ”λ‹€.

  • UTF-16 기반 ν™˜κ²½μ—μ„œ UTF-8을 μ‚¬μš©ν•  λ•ŒλŠ” μ‚¬μš© μ˜μ—­μ„ λͺ…ν™•νžˆ κ΅¬λΆ„ν•˜λŠ”κ²Œ μ’‹λ‹€.


3. UTF-32

  • 4λ°”μ΄νŠΈλ₯Ό κ³ μ •μ μœΌλ‘œ μ‚¬μš©

  • λ°˜λ“œμ‹œ UTF-32λ₯Ό μ‚¬μš©ν•΄μ•Όν•˜λŠ” ν™˜κ²½μ΄ μ•„λ‹ˆλΌλ©΄ μ‚¬μš©ν•˜μ§€ μ•ŠλŠ”λ‹€.

Last updated