Elixir và unicode, phần 1: unicode và utf

Intro

Đây là bài xích dịch thứ nhất vào series về Elixir với Unicode của tác giả Nathan Long, Các chúng ta có thể phát âm phần 2 tại đâyBài gốc: Part 1 | Part 2Đây là một trong series vô cùng chi tiết cùng dễ nắm bắt, bản thân gồm sửa đổi cùng bổ sung 1 chút ít, mong muốn đem đến cho rất nhiều bạn 1 ánh nhìn rõ ràng độc nhất về Unicode cùng UTF-8, đồ vật họ chạm chán tương đối nhiều nhưng mà không kiên cố đang biết rõ

*

(Shame on other languages

*

Source: Zazzle

Trước Khi nói về Unicode, hãy nói về ASCII, trang bị nhưng những người nói tiếng Anh nhỏng tôi Lúc nhắc đến vẫn nghĩ về ngay đến những đoạn văn uống bạn dạng thông thường. Nếu chạy lệnh man ascii bên trên sản phẩm công nghệ của người sử dụng, các bạn sẽ nhận được kết quả tương tự như như vậy này.

*

Về cơ phiên bản, ASCII dễ dàng là một cách ánh xạ (mapping) từ bỏ kí từ quý phái số. Đây là việc chấp nhận giữa những lập trình sẵn viên rằng chữ a hoa, A, có thể được trình diễn ngay số 65 và tương tự cho những kí tự không giống (Tại sao lại là 65 ??? có lí bởi riêng biệt mang lại vấn đề này đấy

*

Tạm thời họ vẫn ổn với giải pháp encode này, tuy nhiên bọn họ ý muốn viết nhiều hơn nữa hồ hết kí từ bỏ thông thường. Chúng ta ao ước viết:

Những kí trường đoản cú kèm theo cùng với trọng âm

á é í ó ú ü ñ ź đẹp trai

Chữ Hi Lạp

λ φ θ Ω

Kí hiệu toán học

∫f(x)dx ∞ △ABC ~ △DEF

Chữ tượng hình Trung Quốc

夜露死苦

Vẽ ttrẻ ranh chắc chắn cũng không chết ai đâu nhỉ