Google và Monotype bắt tay nhau “số hóa” ngôn ngữ của nhân loại

Noto là dự án typographic lớn nhất, bao gồm hơn 800 ngôn ngữ, 100 hệ thống chữ viết, ký hiệu âm nhạc, dấu câu và tất nhiên, cả biểu tượng cảm xúc.

id

Noto đã nhổ rễ “tofu” vĩnh viễn.

idesign google va monotype bat tay so hoa ngon ngu cua nhan loai 01

Khi máy tính thiếu bộ code của một số loại phông, màn hình sẽ hiển thị các ký tự dạng ô vuông nhỏ. Chúng được gọi là “tofu”, biểu tượng thay thế của một ký tự kỹ thuật số không được mã hóa. Nhưng nhờ Google và Monotype, hiện tượng này chỉ còn là quá khứ.

Kamal Mansour, một nhà typography ngôn ngữ làm việc tại Monotype ở San Francisco chia sẻ: “Đã có nhiều thay đổi trong 20 năm qua”. Tiêu chuẩn Unicode hiện nay yêu cầu mã code cho tất cả ký tự của mọi hệ thống chữ viết. Ví dụ, trong trường hợp chữ Miến Điện, nó đã nằm trong tiêu chuẩn 15 năm trước hoặc hơn thế, nhưng khi ấy Miến Điện bế quan tỏa cảng, do đó, không có nhiều nhu cầu về chữ viết. Giờ đây, khi đất nước mở cửa, ngày càng có nhiều phông chữ được tạo ra với nhiều chi tiết đáng chú ý.

“Mặt khác, có một vài “ngôn ngữ thiểu số” chưa bao giờ được liệt kê trong tiêu chuẩn Unicode. Có một quy trình nhất định cho việc này,  mọi người cần thu thập tất cả các ký tự, tài liệu cần thiết và gửi đề xuất đến hội đồng kỹ thuật Unicode. Khi đã gán mã cho các ký tự, bạn có thể biểu thị bất kỳ ngôn ngữ nào được viết trong tập lệnh cụ thể đó.”

Đội ngũ của Mansour, hợp tác với Google, vừa phát hành phiên bản đầu tiên của một bộ chữ mở chứa tất cả các ngôn ngữ trên thế giới, cả trong quá khứ và hiện tại. Noto là dự án typographic lớn nhất của loại hình này, bao gồm hơn 800 ngôn ngữ, 100 hệ thống chữ viết khác nhau, ký hiệu âm nhạc, dấu câu và tất nhiên, cả biểu tượng cảm xúc.

“Bạn không thể thực sự đại diện cả một nền văn hóa, di sản, kỹ thuật số, trừ khi bạn có mã code cho mỗi ký tự chữ viết”, Mansour nói. “Đối với tiếng Anh và các ngôn ngữ châu Âu nói chung, điều này đã có sẵn trong nhiều thập kỷ, nhưng đối với một số các “ngôn ngữ thiểu số”, điều đó chỉ mới được thực hiện gần đây.”

idesign google va monotype bat tay so hoa ngon ngu cua nhan loai 02

Các vùng như dân tộc Cherokee ở Hoa Kỳ đang làm việc chăm chỉ để bảo tồn ngôn ngữ của họ và dạy cho các thế hệ trẻ hơn đảm bảo sự sống còn của ngôn ngữ. “Việc “số hóa” thực sự quan trọng”, Bob Jung của Google nói, “bởi tất cả các thiết bị mà con cái họ đang sử dụng có thể thực sự hiển thị bằng ngôn ngữ mẹ đẻ. Chúng tôi cần những ngôn ngữ này để sẵn sàng cho mọi thiết bị, nhưng Google luôn lảng tránh vì họ muốn một ngôn ngữ phổ biến để tất cả mọi người có thể hiểu được thông tin, tôi nghĩ rằng chúng tôi cần khuyến khích văn hóa bảo tồn ngôn ngữ, và cả những thông tin được ghi lại bằng các ngôn ngữ ấy.”

Đối với các ngôn ngữ thiểu số, Noto đại diện cho cơ hội để bảo tồn lịch sử văn hóa và ngôn ngữ của họ, lập nên các hồ sơ truyền thống mà nếu không làm thì sau này sẽ không có cơ hội để làm. Với việc đầu tư khổng lồ vào dự án, đội ngũ chuyên gia tại Google và Monotype đã cùng hợp tác trong hơn 5 năm. Cho đến nay, họ đã tạo ra một bộ phông sans serif gần như hoàn chỉnh, bộ serif vẫn còn phát triển nhiều, và thách thức hiện tại là điều chỉnh nó cho 8 phiên bản khác nhau. Đối với Mansour, đó là công việc xác-định-nghề-nghiệp.

“Tôi có nền tảng đa ngành: thiết kế, ngôn ngữ học, và khoa học máy tính.” Mansour nói. “Kiến thức mà tôi học được thông qua dự án này thực sự là quá nhiều. Tôi không thể đòi hỏi điều gì tốt hơn nữa.”

idesign google va monotype bat tay so hoa ngon ngu cua nhan loai 03

Việc chạy dự án Noto đòi hỏi nghiên cứu chuyên sâu đặc biệt từ Mansour, Jung, và cả đội ngũ của họ, để lấp đầy những điểm yếu trong hệ thống Unicode và trong nhiều trường hợp tạo ra kiểu chữ kỹ thuật số đầu tiên cho một ngôn ngữ nhất định. Trong trường hợp tiếng Tây Tạng, họ phải dịch một hệ thống chữ viết với hàng ngàn năm tuổi. Để dễ dàng hơn, Mansour và nhà thiết kế Toshi Omagari, đã làm việc chặt chẽ với một nhóm các nhà sư Phật giáo.

Mansour nói: “Hệ thống chữ viết Tây Tạng đã được mã hóa theo tiêu chuẩn Unicode từ rất sớm. Nhưng chữ Tây Tạng không phát triển kiểu chữ theo phong cách đồ họa và typoraphy. Tất cả mọi thứ đều theo phong cách chữ tượng hình, cho đến những thập kỷ gần đây.” Ngay cả kiểu chữ người ta đã tạo ra cho hệ thống chữ viết Tây Tạng trong 10-15 năm qua, tất cả trông giống hệt phong cách chữ tượng hình. Trong trường hợp này, Toshi muốn thể hiện một cái gì đó theo phong cách hiện đại nhưng vẫn duy trì các đặc điểm truyền thống, kết hợp cả hai để người bản địa cảm thấy thân thuộc và dễ tiếp cận hơn.

“Chúng tôi đã được đến tu viện này ở Nhật Bản chỉ vì chúng tôi biết người quản lý tu viện ấy. Thật trùng hợp và thú vị! Ông ấy và Toshi đã trao đổi rất nhiều ý tưởng và thu thập dữ liệu trước khi đưa ra quyết định cuối cùng. Chúng tôi đã trình bày đề xuất phác thảo cho Google nhưng bị từ chối — họ cho rằng dự án quá “cồng kềnh” và không quan tâm đến truyền thống của họ. Trong thiết kế mà Toshi thực hiện sau đó, họ lại thấy thích thú, đây thực sự là một thành tựu. Bằng chứng chính là sự chấp thuận của những người tu sĩ”.

Ở một nơi khác, dự án đã dẫn đến sự phát triển của bảng chữ cái hiện tại, không chỉ là “số hóa” những chữ viết tay trước đây mà còn tạo ra các tham số mới có thể sử dụng được cho các trường hợp khác nhau. Bảng chữ cái Cherokee đã tồn tại trong Unicode trong hơn một thập kỷ, nhưng chúng được mã hóa trên giả định rằng nó sẽ chỉ hoạt động cho các ký tự chữ viết thường. Khi làm việc với Noto, Cherokee quyết định họ cũng cần bộ chữ viết hoa, nghĩa là Mansour và đội ngũ của ông đã phải tạo ra một bộ chữ hoàn toàn mới từ đầu.


Mansour cho biết: “Điều khác biệt đáng kể của các hệ thống chữ viết là một số hệ thống đã được ghi chép rất kỹ càng và chúng tôi có thể dễ dàng tìm thấy tài liệu tham khảo. Một số khác, không có bất kì tài liệu nào. Đôi khi có nhưng các nguồn có sẵn rất cũ và không biết liệu chúng có phù hợp để sử dụng cho hệ thống chữ hiện đại hay không. ”

“Câu hỏi về sự phù hợp” cũng được nêu ra khi nhắc đến các phiên bản sans serif và serif của Noto. Serif là một phông chữ đặc biệt đối với truyền thống chữ Latin, nhưng khó áp dụng vào hệ thống chữ phương đông và chữ tượng hình. Đồng nhất các bảng chữ cái này để phù hợp với tiêu chuẩn phương tây là một vấn đề mà đội ngũ của ông cố ý tránh né, do đó, phiên bản serif của Noto đã được thiết kế một cách đơn giản và được xem như là phông chữ chính thức cho cả phương đông và phương tây.

“Sự phân biệt thường thấy ở sans serif và serif của Noto là ở điểm “chính thức” và “không chính thức”. Sans serif sẽ là không chính thức và serif được xem là chính thức. Nếu bạn nhìn qua một số hệ thống chữ viết của Ấn Độ như Urdu, và nhìn vào phiên bản serif so với các phiên bản sans, bạn sẽ nhận thấy sự thay đổi từ “không chính thức” đến “chính thức”. Rõ ràng Urdu không có chân chữ, nhưng sự chính thức thể hiện qua các nét cuối sắc nét, góc nhìn cổ điển, vân vân.”

Đối với Mansour, việc tạo ra Noto là tác phẩm của cả một cuộc đời, và nhiệm vụ đó thật sự khiến ông trăn trở. “Thực sự rất ngạc nhiên. Số lượng công việc xuất phát từ dự án này thật đáng kinh ngạc. Tôi thấy các đồng nghiệp thiết kế của tôi bị choáng ngợp; có quá nhiều chi tiết liên quan đến việc thiết kế, và không có sự chung tay góp sức của mọi người, mọi công sức sẽ đổ sông đổ bể.”

Những “mốt” Gradient không thể bỏ qua trong thiết kế web

Bạn có biết sự khác nhau giữa bàn phím số trên di động và bảng tính?

Tác giả: James Cartwright
Dịch giả: Thảo Tăng
Nguồn: eyeondesign