Netflix: Tất cả đều do thuật toán chi phối

Trải nghiệm trên Netflix đều được thuật toán chi phối: xếp loại, nghiên cứu, đánh giá và nhiều hơn thế nữa.

Hơn 80 phần trăm các chương trình TV và phim ảnh mà mọi người xem trên Netflix đều được điều khiển bởi hệ thống đề nghị. Điều đó có nghĩa là khi chọn xem một chương trình trên Netflix thì bạn đang lựa chọn trong tất cả các khả năng được xây dựng bởi thuật toán.

Bài viết bởi Josefina Blattmann, nhà hoạch định chiến lược thương hiệu.


Có vô số chương trình hay ho trên Netflix để bạn dạo chơi, và mỗi người dùng đều được đề nghị một số tựa đề để xem. Nếu đang sử dụng Netflix, bạn sẽ thấy họ thậm chí còn tạo ra các thể loại chương trình gọi một cách chính xác là: Những Chương Trình Truyền Hình Lãng Mạn Có Nhân Vật Chính Thuận Tay Trái. Làm sao mà họ có được những loại hình chương trình như vậy? Làm sao mà họ có thể đề nghị chương trình cho hơn 100 triệu người dùng? Đó chính là do máy móc học, thuật toán và sáng tạo. Đây là tất cả những công cụ cần thiết để phân tích hành vi khách hàng và đề nghị các chương trình tương thích. Đối với những ai đang muốn tìm hiểu thuật toán là gì, nó là một danh sách các chỉ dẫn theo dữ liệu với chức năng hướng dẫn Netflix làm việc.

Hệ thống đề nghị chương trình làm việc để kết hợp dữ liệu thu thập từ nhiều nơi khác nhau. Tất cả đều dựa vào hành vi khi xem chương trình của bạn. Đó là lý do bạn biết khi nào mà em trai của bạn đã sử dụng tài khoản của mình để xem Peppa Pig. Cụ thể, thuật toán thường được ứng dụng để hỗ trợ machine learning (máy học). Những hệ thống như Netflix dựa vào machine learning để thích nghi với hành vi người dùng của nó. Mỗi khi bạn nhấn nút chạy chương trình để xem TV hay một bộ phim nào đó, Netflix sẽ thu thập dữ liệu để báo cáo cho thuật toán và làm mới tất cả. Bạn xem càng nhiều thì thuật toán càng được cập nhật nhanh chóng.

Dữ liệu thu được vô cùng đa dạng và phức tạp, nhưng nó sẽ được dùng để làm nhiều thứ hơn là chỉ phân tích loại chương trình đang xem và đề nghị cho người xem đúng loại đó. Todd Yellin, Phó giám đốc đảm nhận phần cải tiến sản phẩm của Netflix, nói với Wired năm 2017: “Tất cả những gì mà tôi thấy được từ những hồ sơ ấy là sự tuân theo một số loại dữ liệu - những gì người ta xem trước và sau đó, xem vào một năm trước, hiện tại và vào một buổi nào đó trong ngày.”

Trải nghiệm trên Netflix đều được thuật toán chi phối: xếp loại, nghiên cứu, đánh giá và nhiều hơn thế nữa. Họ không thể nào đưa ra toàn bộ mọi chương trình một lần, vì thế họ cần phải quản lý tất cả. Vì chất lượng đi đôi với sở thích, Netflix không thể nào làm giống như Rotten Tomatoes, Pitchfork hay IMDb, họ cần phải tìm hiểu người dùng và thiết kế hệ thống đề nghị chương trình xem thích hợp.

Sự phát triển trong hành trình cá nhân hóa giao diện người dùng.
(Tiên đoán đánh giá cá nhân -> Đánh giá cá nhân -> Tạo lập trang cá nhân hóa

Netflix làm việc với đội ngũ tìm hiểu sở thích và thói quen của người xem. Mỗi người xem sẽ được xếp loại vào một số nhóm người dùng và điều này sẽ ảnh hưởng đến danh sách chương trình được đề nghị trên đầu màn hình giao diện, cách mà các loại chương trình được trình bày và sắp xếp. Nếu sở thích và thói quen xem chương trình của bạn giống với người khác thì Netflix cũng sẽ đề nghị chương trình xem dựa vào hành vi của người ấy.

Cách gọi mà chúng ta thường nghe về thuật toán đều giống nhau ở mọi nơi trên thế giới. Netflix đã trang bị cho mình một hình nhân thực để phân loại các chương trình TV và phim ảnh để ứng dụng các tag nhằm có được những thể loại chương trình vô cùng cụ thể như “những bộ phim truyền hình mãn nhãn đầy hoài niệm” hay “những bộ phim hành trình lãng mạn nhẹ nhàng”.

Mỗi loại data thu thập được kết hợp để xác định nhóm người xem tương thích. Màn hình của mỗi người dùng sẽ xuất hiện ngày càng nhiều những chương trình đề nghị dựa vào nhóm mà ta được phân loại.

Tầm quan trọng của mô hình định hướng.
Người xem thường lướt qua nội dung theo chiều ngang hơn là chiều dọc.


Tại sao nội dung được bố trí theo hàng ngang?

Chris Alvino, kĩ sư thiết kế machine learning tại Netflix, giải thích rằng họ phân loại nội dung theo chiều ngang để khiến người xem định hướng dễ dàng hơn trong hàng tá nội dung. Thông qua việc trình bày các đoạn video theo hàng, định tên cho mỗi hàng và có thứ tự hợp lý, người dùng có thể nhanh chóng quyết định trong hàng video ấy có cái nào thích hợp với mình vào lúc đó không. Điều này cho phép người xem tìm hiểu kĩ hơn và tìm ra nhiều video cùng loại hơn hoặc chuyển qua hàng nội dung khác.

Mỗi thiết bị sẽ có công suất phần cứng khác nhau, điều này có thể giới hạn số hàng thể hiện trên màn hình trong một lần và kích cỡ của trang web. Đây là lý do vì sao Netflix cần nắm rõ giới hạn của từng thiết bị.

Bên trái: Con số đa dạng cho các video có thể xuất hiện trên 1 hàng
(có thể lên tới 10,000 hàng)
Bên phải: 1 trang được cá nhân hóa trên 1 thiết bị (10-40 hàng được xuất hiện)

Mỗi hàng có thể chứa những video được tùy chỉnh theo từng cá nhân để người dùng chọn lựa. Khó khăn của Netlflix là tạo ra một nhóm các video liên quan để nhấn mạnh tính chất của nó và giúp người xem tìm hiểu sâu hơn về chủ đề mà đang có hứng thú hoặc tìm kiếm những thể loại mới. Các đề nghị về chương trình cần phải được làm mới và tương thích, đồng thời nó cũng cần phải ổn định để người xem có cảm giác quen thuộc khi đến trang chủ và có thể dễ dàng tìm thấy video được đề nghị trước đó.

Một dòng tiêu đề được tìm thấy trên Netflix 
(‘Được xem bởi Claire Underwood/)


Một bức ảnh đáng giá ngàn lời

Netflix đã thiết kế một thuật toán mới dựa vào tác phẩm nghệ thuật. Nó cho phép người dùng có thể tiếp cận những khung hình tùy chỉnh thích hợp hơn. Những hình ảnh này được thiết kế nhằm hỗ trợ người dùng kết nối với Netflix. Nhiều dữ liệu đồng nhất sẽ được tích hợp vào trong thuật toán trên.

Gopal Krishnan giải thích tất tần tật về loại thuật toán này trong bài blog kĩ thuật của anh. Netflix đã tiến hành tạo ra một khung hình cho phép họ kết hợp hiệu quả dữ liệu lớn và sáng tạo nhằm giúp người dùng khám phá chương trình và nội dung phim ảnh. Đồng thời sẽ giúp họ tìm kiếm nội dung nhanh hơn và tránh khỏi cảm giác bị choáng ngợp trước nội dung đồ sộ của Netflix. Kết quả là họ đã có khả năng độc đáo để phân loại hình ảnh thích hợp cho mỗi tài khoản người dùng.

Họ nói rằng nếu không theo dõi người dùng trong vòng 90 giây, họ sẽ mất dần hứng thú và có xu hướng chuyển qua một hoạt động khác. Vì chỉ có một khoảng thời gian ít ỏi để thu hút người dùng, hình ảnh là công cụ hiệu quả nhất để giúp người dùng tìm thấy nội dung đúng đắn nhanh nhất.

Trang chủ của Netflix không chứa artwork nào khác.
Điều này thể hiện cách mà thuật toán sử dụng
lịch sử người dùng để đề nghị chương trình.

Họ đã xây dựng một hệ thống thử nghiệm hình ảnh trên nhiều tựa đề nhằm có được hình ảnh cuốn hút để liên kết khách hàng. Thông qua nhiều thử nghiệm, Netflix kết luận được rằng việc thấy được các trạng thái cảm xúc sẽ thu hút người dùng lướt qua một chương trình TV hoặc phim ảnh. Điều này có lẽ là do những trạng thái cảm xúc phức tạp sẽ truyền tải nhiều thông tin hơn đến người dùng liên quan đến nội dung cảm xúc, tuy nhiên thật thú vị khi biết rằng bao nhiêu người sẽ phản ứng theo cách này trong khảo sát. Điều này được thể hiện rõ trong phần 2 của bộ phim Unbreakable Kimmy Schmidt bên dưới:

Phần ảnh tốt nhất sẽ là cái thu hút nhiều và thích hợp nhất với người dùng Netflix. Tuy nhiên họ đã thiết kế nhiều hình ảnh đa dạng cảm xúc và quyết định sử dụng artwork khác nhau cho từng người dùng để nhấn mạnh tính chất của chương trình hoặc bộ phim liên quan đến họ.

Artwork của bộ phim Stranger Things.
Những hình ảnh khác nhau cho thấy nhiều chủ đề mới lạ trong chương trình
chứ không giới hạn ở bất kì một hình ảnh đơn lẻ nào cả.

Để chọn một hình ảnh thích hợp và trưng bày trên trang chủ của một người dùng nào đó, Netflix tập trung tìm hiểu những chương trình hoặc bộ phim khác mà họ đã từng xem qua. Ví dụ, một người đã từng xem qua bộ phim có diễn viên Uma Thurman đóng sẽ vô cùng đón nhận artwork liên quan đến Pulp Fiction.  Trong khi đó, một fan hâm mộ của bộ phim John Travolta sẽ tỏ ra thích thú khi xem Pulp Fiction nếu phần artwork có mặt của John.

Không phải tất cả những trường hợp cá nhân hóa artwork đều rõ ràng như thế này, tuy nhiên việc thu thập dữ liệu là rất quan trọng để Netflix có thể cải thiện trải nghiệm người dùng (và thu hút người dùng).

Việc tạo ra một trang web có tính cá nhân hóa cao là một thách thức và cần đến nhiều yếu tố hỗ trợ liên quan. Có rất nhiều tiềm năng để cải thiện trang chủ và những yếu tố nội hàm mà Netflix đang làm.

Công nghệ có quyền năng vô cùng kì diệu! Tuy nhiên, liệu chất lượng của chương trình TV và phim ảnh được nâng cao là để chiều lòng nhiều khách hàng hơn hay níu kéo họ ở lại? Việc đó có liên quan gì tới bộ não con người? Việc được xem hết tập phim này tới tập khác thật tuyệt vời - nhưng lý do là gì? Có lẽ câu trả lời nằm ở sự cân bằng. Chúng ta vẫn chưa tường tận được mọi thứ nhưng chắc chắn nó là một vấn đề vô cùng thú vị để khám phá.


Tác giả: Josefina Blattmann
Người dịch: Đáo
Nguồn: Uxplanet