← RFC Reference

RFC 6531 – Tiện ích mở rộng SMTP để Email Quốc tế hóa

Proposed Standard Core SMTP & Message Format Obsoletes RFC 5321 Published March 2026
ELI5: Các địa chỉ email truyền thống chỉ có thể sử dụng các chữ cái tiếng Anh, chữ số và một vài ký hiệu. Điều đó có nghĩa là hàng tỷ người trên toàn thế giới không thể có địa chỉ email bằng chữ viết của riêng họ — không có ký tự Trung Quốc, không có tiếng Ả Rập, không có tiếng Kirin. SMTPUTF8 giải quyết vấn đề này bằng cách mở rộng SMTP để xử lý toàn bộ Unicode, để ai đó có thể có một địa chỉ như `émilie@exemple.fr` hoặc một địa chỉ bằng tiếng Hindi, tiếng Nhật, hoặc bất kỳ hệ thống chữ viết nào khác.

Tại Sao RFC Này Tồn Tại

Email được thiết kế trong thời đại ASCII. Đặc tả SMTP gốc (RFC 5321) giới hạn các địa chỉ email và lệnh envelope thành các ký tự ASCII 7-bit. Điều này hoạt động tốt cho tiếng Anh, nhưng loại trừ phần lớn các ngôn ngữ trên thế giới. Một địa chỉ email như 田太郎@例.jp đơn giản là không thể.

RFC 6531 định nghĩa phần mở rộng SMTPUTF8, cho phép mã hóa UTF-8 trong envelope SMTP — cụ thể là trong MAIL FROM, RCPT TO, và miền EHLO. Đây là một phần của bộ RFC được gọi chung là Email Address Internationalization (EAI), cũng bao gồm RFC 6532 cho các tiêu đề thư quốc tế.

Phần mở rộng này mở email cho mọi hệ thống viết được Unicode hỗ trợ, điều cần thiết cho việc chấp nhận email toàn cầu.

Cách Hoạt Động

  1. Máy khách gửi EHLO và xác nhận máy chủ quảng cáo SMTPUTF8 trong danh sách khả năng của nó.
  2. Khi gửi một thư sử dụng địa chỉ không phải ASCII (trong envelope, tiêu đề, hoặc cả hai), máy khách thêm tham số SMTPUTF8 vào lệnh MAIL FROM.
  3. Các địa chỉ MAIL FROMRCPT TO hiện có thể chứa các ký tự UTF-8.
  4. Các tiêu đề thư cũng có thể chứa UTF-8 (theo RFC 6532), thay thế các cách dùng RFC 2047 encoded-word cũ.
  5. Nếu máy chủ hop tiếp theo không hỗ trợ SMTPUTF8, máy chủ gửi phải hạ cấp thư hoặc từ chối nó — nó không thể âm thầm xóa các ký tự quốc tế.

Ví Dụ SMTP

Gửi thư với địa chỉ quốc tế hóa:

S: 220 mx.example.com ESMTP C: EHLO sender.example.net S: 250-mx.example.com S: 250-SMTPUTF8 S: 250-8BITMIME S: 250-STARTTLS S: 250 SIZE 52428800 # Tham số SMTPUTF8 cần thiết khi sử dụng địa chỉ quốc tế C: MAIL FROM:<émilie@exemple.fr> SMTPUTF8 S: 250 2.1.0 OK C: RCPT TO:<田太郎@例.jp> S: 250 2.1.5 OK C: DATA S: 354 Start mail input C: From: Émilie Dupont <émilie@exemple.fr> C: To: 田太郎 <田太郎@例.jp> C: Subject: Meeting confirmation C: Date: Wed, 11 Mar 2026 10:00:00 +0100 C: MIME-Version: 1.0 C: Content-Type: text/plain; charset=UTF-8 C: C: Confirming our meeting for next week. C: . S: 250 2.0.0 OK, queued

Chi Tiết Kỹ Thuật Chính

Tham Số SMTPUTF8

Từ khóa SMTPUTF8 trên MAIL FROM báo hiệu rằng thư này sử dụng nội dung quốc tế hóa. Nó phải có mặt bất cứ khi nào bất kỳ điều sau đây chứa ký tự không phải ASCII:

Nếu tham số SMTPUTF8 không được khai báo và envelope chứa ký tự không phải ASCII, máy chủ phải từ chối lệnh.

Tên Miền: IDN và UTF-8

Tên miền quốc tế hóa (IDN) đã tồn tại nhiều năm bằng cách sử dụng mã hóa Punycode (ví dụ: xn--e1afmapc.xn--p1ai cho пример.рф). SMTPUTF8 cho phép hình thức UTF-8 của tên miền trực tiếp trong SMTP, mặc dù Punycode (A-labels) vẫn hợp lệ. Đối với các tra cứu DNS, miền phải được chuyển đổi thành hình thức A-label của nó.

Hạ Cấp và Dự Phòng

Thách thức lớn nhất với SMTPUTF8 là khả năng tương tác với các máy chủ không hỗ trợ nó. Khi chuyển tiếp thư đến máy chủ không SMTPUTF8:

Tương Tác với Xác Thực

Các cơ chế xác thực email cần cập nhật cho các địa chỉ quốc tế hóa:

Những Sai Lầm Phổ Biến

Tác Động Khả Năng Gửi

Related RFCs