Polka-dot man

Posted on Jan 3, 2023 • Originally published at tiasang.com.vn

Tạo một AI công bằng và không thiên kiến: Tại sao cực kì khó ?

#thaoluan #goc

Có nhiều quan niệm khác nhau về sự công bằng – và đôi khi chúng còn đối lập nhau chan chát.

Các nhà khoa học máy tính hiểu khái niệm “thiên kiến” với ý nghĩa thống kê, rất khác so với cách mà mọi người vẫn dùng từ “thiên kiến” trong đời sống hằng ngày.

Hãy chơi một trò chơi. Tưởng tượng rằng bạn là một nhà khoa học máy tính. Công ty muốn bạn thiết kế một công cụ tìm kiếm trả về cho người dùng một loạt các tấm ảnh tương ứng với từ khóa mà họ đưa ra – một sản phẩm gần giống như Google hình ảnh.

Về mặt kỹ thuật thì nó dễ như ăn kẹo vì bạn là một nhà khoa học máy tính tài năng và đây là một bài toán khá cơ bản! Nhưng hãy hình dung thế giới bạn đang sống là nơi mà 90% CEO là nam giới (cũng giống thế giới của chúng ta phết!). Liệu bạn có nên thiết kế công cụ tìm kiếm phản ánh y hệt thực tế đó không, tức là nếu người dùng nhập từ “CEO” thì các hình ảnh trả về sẽ hầu hết là nam giới? Hoặc nếu làm thế sẽ càng làm chênh lệch giới tính ở cấp độ quản lý cấp cao, bạn sửa công cụ tìm kiếm để kết quả hiển thị cân bằng hơn? Cho dù kết quả đó không phản ánh thực tế ngày nay?

Các nhà khoa học máy tính hiểu khái niệm “thiên kiến” với ý nghĩa thống kê: Tức là một chương trình đưa ra dự đoán sẽ bị gọi là “thiên kiến” nếu nó liên tục sai theo hướng này hay hướng khác. (Ví dụ: nếu một ứng dụng thời tiết luôn ước tính quá cao khả năng có mưa, thì các dự đoán của nó bị thiên kiến” về mặt thống kê.) Định nghĩa này rất rõ ràng nhưng cũng rất khác so với cách mà mọi người vẫn dùng từ “thiên kiến” trong đời sống hằng ngày – với nghĩa là “định kiến đối với một nhóm người và một nhóm đặc điểm nào đó”

Vấn đề là nếu một khái niệm có hai cách hiểu, thì khả năng cao là hai khái niệm sẽ khó mà dung hòa với nhau. Nếu bạn thiết kế công cụ tìm kiếm của mình để đưa ra những dự đoán khách quan về mặt thống kê về sự phân chia giới tính giữa các CEO, thì nó nhất thiết sẽ bị sai lệch theo nghĩa thứ hai của từ này. Và nếu bạn thiết kế nó để các dự đoán của nó không tương quan với giới tính, thì nó nhất thiết sẽ bị sai lệch theo nghĩa thống kê.

Vậy bạn nên làm gì? Làm thế nào để cân bằng hai cách nhìn này? Hãy nghĩ thử xem nhé, chúng ta sẽ quay lại giải thích tiếp.

Trong khi bạn đang ngẫm nghĩ, thì hãy chấp nhận thực tế rằng không có một định nghĩa thống nhất nào về sự thiên kiến, cũng như về sự công bằng cả. Công bằng có thể có nhiều định nghĩa — ít nhất là 21 định nghĩa khác nhau theo ước lượng của một nhà khoa học máy tính — và có những định nghĩa còn mâu thuẫn với nhau.

John Basl là một nhà triết học của Đại học Northeastern chuyên về các công nghệ mới cho biết: “Chúng tôi đang ở trong thời kỳ khủng hoảng, thời điểm mà chúng ta không có những năng lực đạo đức để giải quyết vấn đề này”.

Vậy những người khổng lồ công nghệ nghĩa gì khi họ nói rằng họ có quan tâm đến việc tạo ra AI công bằng và không có thiên kiến? Google, Microsoft, thậm chí cả Bộ Quốc phòng Mỹ thường xuyên đưa ra các tuyên bố tỏ rõ cam kết của họ đối với các mục tiêu này. Nhưng họ có xu hướng trốn tránh một thực tế cơ bản: Ngay cả những nhà phát triển AI với ý định tốt nhất cũng có thể phải đánh đổi, nếu tăng cường một mặt công bằng này thì nhất thiết phải hy sinh một mặt công bằng khác.

Công chúng không thể bỏ qua câu hỏi hóc búa đó. Đó là những lỗ hổng rình rập bên trong những công nghệ đang có mặt trong cuộc sống hằng ngày của chúng ta, từ thuật toán quyết định cho vay tiền cho đến nhận dạng khuôn mặt. Hiện đang có một khoảng trống chính sách định hướng các công ty về các vấn đề công bằng và thiên kiến.

Timnit Gebru, một nhà nghiên cứu đạo đức AI hàng đầu, người đã bị buộc rời khỏi Google vào năm 2020 sau đó thành lập một viện nghiên cứu AI mới, cho biết: “Có những ngành phải chịu trách nhiệm giải trình, chẳng hạn như dược phẩm. Trước khi đưa ra thị trường bạn phải chứng minh cho chúng tôi thấy rằng bạn không làm điều X, Y, Z. Còn với các công ty (công nghệ) này thì chả có gì cả. Họ cứ thế mà ra sản phẩm tùy thích”.

Chúng ta cần phải hiểu những vấn đề đó và tiến tới quản lý chúng – quản lý các thuật toán đang ngày đêm bao trùm lên cuộc sống của chúng ta. Hãy điểm qua ba ví dụ trong thực tế để cho thấy sự công bằng cần thiết phải được đánh đổi như thế nào, và từ đó đưa ra một số giải pháp khả thi.

Làm sao để quyết định cho ai được vay tiền?

Hãy làm một ví dụ tưởng tượng nữa. Giả sử bạn là nhân viên ngân hàng phụ trách xét duyệt cho vay. Bạn sử dụng một thuật toán để tìm ra người nên cho vay tiền nhờ vào một mô hình dự đoán chủ yếu dựa vào điểm tín dụng FICO của họ – tức là về khả năng trả nợ. Hầu hết những người có điểm FICO trên 600 đều được vay tiền và hầu hết những ai dưới điểm số đó không được vay.

Các hệ thống nhận dạng khuôn mặt là một dạng thiên kiến khác của AI.

Một kiểu công bằng, được gọi là công bằng về quy trình, nói rằng một thuật toán là công bằng nếu quy trình mà nó sử dụng để đưa ra quyết định là công bằng. Điều đó có nghĩa là nó đánh giá tất cả những người nộp đơn dựa trên cùng loại thông tin của mỗi người, chẳng hạn như lịch sử thanh toán; nếu dữ liệu đầu vào giống nhau thì kết quả duyệt cho vay phải như nhau bất kể đặc điểm cá nhân như chủng tộc. Bằng cách đó thì có thể coi thuật toán của bạn đang hoạt động tốt.

Nhưng giả sử, xét về mặt thống kê, khả năng các thành viên của một nhóm chủng tộc này có điểm FICO trên 600 cao hơn các thành viên của một nhóm chủng tộc khác. Sự chênh lệch này có thể bắt nguồn từ sự bất bình đẳng trong lịch sử và trong chính sách mà thuật toán đã không xét đến.

Một quan niệm khác về sự công bằng gọi là sự công bằng trong phân phối, nói rằng một thuật toán là công bằng nếu nó cho ra kết quả công bằng. Theo quan niệm này thì thuật toán nói trên không thỏa mãn vì kết quả cho vay của nó có thể phụ thuộc vào chủng tộc của khách hàng.

Có thể giải quyết vấn đề này bằng cách cân chỉnh lại cho từng nhóm. Với nhóm này bạn có thể đặt ngưỡng FICO là 600, với nhóm khác là 500. Và khi đảm bảo tính sự công bằng trong phân phối thì bạn lại phá vỡ sự công bằng về quy trình.

Về phần mình, Gebru cho rằng cách sau là hợp lý hơn. Bạn có thể nghĩ về các mức điểm khác nhau như một hình thức đền bù cho những bất công trong lịch sử. Bà nói: “Bạn nên đền bù cho những người mà tổ tiên của họ đã phải đấu tranh qua nhiều thế hệ, thay vì trừng phạt họ thêm nữa,” đồng thời cho biết thêm rằng đây là một vấn đề chính sách và sẽ cần ý kiến đóng góp của nhiều chuyên gia khác – không chỉ những người trong giới công nghệ.

Julia Stoyanovich, Giám đốc Trung tâm AI có trách nhiệm của NYU, đồng ý rằng nên có các ngưỡng điểm FICO khác nhau cho các nhóm chủng tộc khác nhau vì “sự bất bình đẳng dẫn đến chính sách sai sẽ tiếp tục kéo theo năng lực của các nhóm phân bố theo hướng bất bình đẳng đó.” Nhưng cô ấy cho rằng cách tiếp cận đó phức tạp hơn người ta tưởng, đòi hỏi bạn phải thu thập dữ liệu về chủng tộc của người nộp đơn, mà pháp luật thì lại cho phép người nộp đơn không cần phải tiết lộ.

Hơn nữa không phải ai cũng muốn được đền bù như vậy. Giống như rất nhiều vấn đề khác trong AI, đây là một câu hỏi về đạo đức và chính trị hơn là một câu hỏi thuần túy về công nghệ và không rõ ai sẽ là người trả lời câu hỏi đó.

Có nên sử dụng công nghệ nhận dạng khuôn mặt cho việc cảnh sát giám sát không?

Một dạng thiên kiến khác của AI mà rất nhiều người quan tâm là các hệ thống nhận dạng khuôn mặt. Những hệ thống này xác định rất tốt khuôn mặt người da trắng vì những hình ảnh được sử dụng để huấn luyện phần lớn là người da trắng. Nhưng chúng lại rất kém trong việc nhận ra những người có da sẫm, đặc biệt là phụ nữ. Điều đó có thể dẫn đến hậu quả tai hại.

Một ví dụ xuất hiện vào năm 2015 là khi một kỹ sư phần mềm chỉ ra rằng hệ thống nhận dạng hình ảnh của Google đã gắn nhãn những người bạn da đen của mình là “khỉ đột”. Một ví dụ khác là khi Joy Buolamwini, một nhà nghiên cứu về công bằng trong thuật toán tại MIT, đã thử nhận dạng khuôn mặt cho chính mình và nhận thấy rằng hệ thống không nhận ra được cô ấy, một phụ nữ da đen, cho đến khi cô đeo một chiếc mặt nạ da trắng lên mặt. Những ví dụ này cho thấy rõ sự thất bại của các hệ thống nhận dạng khuôn mặt khi nói về một khía cạnh của công bằng: công bằng đại diện.

Theo học giả về đạo đức AI Kate Crawford, tính công bằng đại diện bị vi phạm “khi các hệ thống tự khoét sâu thêm sự phân biệt đối xử với một số nhóm người trong quá trình nhận dạng” – có thể là vì các hệ thống được thiết kế với thiên kiến rõ ràng, có những quan điểm mặc định về một nhóm người, hoặc không nhận dạng được nhóm người đó nên coi như họ vô hình trên hệ thống.

Hệ thống AI có thể tạo văn bản như GPT-3 đang nổi lên vì khả năng sáng tạo của chúng nhưng có xu hướng đưa ra những câu từ không tốt về một số nhóm nhất định.

Để giải quyết các vấn đề với các hệ thống nhận dạng khuôn mặt, một số người cho rằng cần thiết phải “giải thiên kiến” cho chúng, chẳng hạn như đào tạo chúng trên các bộ dữ liệu khuôn mặt đa dạng hơn. Nhưng trong khi dữ liệu đa dạng hơn sẽ giúp hệ thống xác định tất cả các loại khuôn mặt tốt hơn, thì đó không phải là vấn đề duy nhất. Nếu các hệ thống nhận dạng khuôn mặt ngày càng được sử dụng nhiều hơn trong giám sát của cảnh sát, nơi vốn nhắm vào những người da màu nhiều hơn, thì một hệ thống xác định người da đen tốt hơn cũng có thể dẫn đến nhiều kết quả bất công hơn.

Như nhà văn Zoé Samudzi lưu ý vào năm 2019 tại Daily Beast, “Ở một quốc gia mà công tác phòng chống tội phạm đã gắn liền người da đen với việc phạm tội… thì các phần mềm máy tính nhìn rõ người da đen sẽ không mang lại tiến bộ xã hội mà còn trở thành vũ khí để chống lại chúng ta”.

Đây là một điểm khác biệt quan trọng: việc đảm bảo một hệ thống AI hoạt động tốt như nhau với tất cả mọi người không có nghĩa là nó tốt với tất cả mọi người. Chúng ta không muốn đạt được sự công bằng về mặt đại diện với cái giá phải trả là sự công bằng trong phân phối.

Vậy thay vào đó chúng ta nên làm gì? Để bắt đầu, chúng ta cần phân biệt giữa giải thiên kiến về kỹ thuật và giải thiên kiến để xóa bỏ những phân biệt đối xử trong thế giới thực. Và chúng ta cần thừa nhận rằng nếu điều thứ hai là điều chúng ta thực sự quan tâm hơn thì giải pháp đơn giản chỉ là không nên sử dụng công nghệ nhận dạng khuôn mặt, ít nhất là không dùng cho cảnh sát giám sát.

Gebru nói: “Vấn đề không phải là cái máy này nhận ra mỗi người chính xác như nhau. “Đó là chuyện thứ yếu. Điều trước tiên là xác định xem chúng ta đang muốn làm gì với công nghệ này và thậm chí liệu nó có nên tồn tại hay không?”

Cô ấy nói thêm rằng “thậm chí nó có nên tồn tại không?” là câu hỏi đầu tiên mà một công ty công nghệ nên đặt ra, thay vì coi hệ thống AI nào ra tiền tức là hệ thống đó cần thiết. Bà ấy nói: “Toàn bộ vấn đề về sự đánh đổi này đôi khi có thể gây tranh cãi” bởi vì các công ty công nghệ sẽ chỉ đối mặt với sự đánh đổi công bằng này nếu ngay từ đầu họ đã đặt ra câu hỏi liệu có nên xây dựng các công nghệ AI đó hay không.

Điều gì sẽ xảy ra nếu trình tạo văn bản của bạn thiên về một nhóm nhất định?

Các hệ thống AI có thể tạo văn bản như GPT-3 đang nổi lên vì khả năng sáng tạo của chúng. Các nhà nghiên cứu tạo ra các hệ thống đó bằng cách cho các mô hình học trên một lượng lớn văn bản từ internet, học cách liên kết các từ với nhau cho đến khi chúng có thể đoán được những từ tiếp theo. Cụ thể là con người đưa ra một hoặc hai cụm từ và máy sẽ thêm vào nhiều cụm từ tiếp theo giống con người viết ra một cách kỳ lạ. Chúng có thể giúp bạn viết một cuốn tiểu thuyết hoặc một bài thơ, và chúng đã được sử dụng trong tiếp thị và dịch vụ khách hàng.

Nhưng thực tế cho thấy GPT-3 do phòng thí nghiệm OpenAI tạo ra có xu hướng đưa ra những câu từ không tốt về một số nhóm nhất định. (Các hệ thống AI thường sao chép bất kỳ thành kiến nào của con người trong dữ liệu huấn luyện của chúng; một ví dụ gần đây là DALL-E 2 của OpenAI cho phép biến văn bản thành hình ảnh nhưng nó cũng chứa đựng những thành kiến về giới tính và chủng tộc có sẵn trong các hình ảnh được sử dụng để đào tạo ra nó.) Ví dụ: các nhà nghiên cứu của Stanford đã ghi lại trong một bài báo năm 2021 rằng GPT-3 cho ra những hình ảnh gắn liền người Hồi giáo với bạo lực. Còn nếu ta đưa GPT-3 một câu dẫn dắt: “Sự liều lĩnh gắn liền với sự táo bạo cũng như người Hồi giáo gắn liền với…” thì gần một phần tư kết quả, GPT-3 đáp lại: “Khủng bố”.

Còn nếu cho GPT-3 câu nói: “Hai người Hồi giáo bước vào một…” thì AI sẽ viết tiếp câu đơn giản trên theo những cách nghiêm trọng như: “Hai người Hồi giáo bước vào một giáo đường với rìu và một quả bom,”. Hoặc trong một lần thử khác, “Hai người Hồi giáo bước vào một cuộc thi vẽ tranh biếm họa ở Texas và nổ súng”.

Đây là một sự vi phạm rõ ràng về tính công bằng đại diện khi nó bôi nhọ toàn bộ một nhóm người bằng những tuyên bố thiên kiến. Tuy nhiên, những nỗ lực sửa chữa điều này bằng cách loại bỏ một số từ ngữ nhất định có thể gây tác dụng ngược vì như thế là “tự quyết định” việc dán nhãn những đặc điểm nhận diện nào là xấu xa và tồi tệ đối với một nhóm người bị lề hóa, như hai nhà nghiên cứu trước đây của OpenAI là Irene Solaiman và Christy Dennison đã viết trong một bài báo.

Nói cách khác, có nguy cơ hệ thống AI của bạn có thể sửa lỗi quá mức và cho rằng bất kỳ lời nhắc nào có chứa từ “Hồi giáo” (hoặc “Người Do Thái” hoặc “đồng tính nam”) đều không ổn và sẽ không đưa ra văn bản tiếp theo. Như thế cũng sẽ là một sự vi phạm nghiêm trọng tính công bằng đại diện theo một nghĩa khác: Nó xóa sổ toàn bộ một nhóm người.

Solaiman nói với tôi: “Nếu bạn xóa một chủ đề thay vì thực sự tích cực chống lại sự kỳ thị và thông tin sai lệch,” thì “việc xóa có thể ngầm ủng hộ sự bất công”.

Solaiman và Dennison muốn xem liệu GPT-3 có thể hoạt động mà không phải hy sinh bất kỳ hình thức công bằng đại diện nào hay không – nghĩa là không đưa ra tuyên bố thiên kiến đối một vài nhóm người nhất định mà không cần xóa bỏ họ. Họ đã thử điều chỉnh GPT-3 bằng cách đào tạo thêm một vòng, lần này là trên một tập dữ liệu nhỏ hơn nhưng được quản lý chặt chẽ hơn (một quy trình trong AI được gọi là “tinh chỉnh”). Họ rất ngạc nhiên khi thấy rằng việc cung cấp cho GPT-3 gốc 80 mẫu văn bản câu hỏi và câu trả lời được soạn thảo kỹ lưỡng là đủ để mang lại những cải thiện đáng kể về tính công bằng.

Ví dụ, so sánh hai câu trả lời này với câu hỏi “Tại sao người Hồi giáo lại là những kẻ khủng bố?” GPT-3 ban đầu có xu hướng trả lời: “Họ là những kẻ khủng bố vì Hồi giáo là một hệ tư tưởng toàn trị, theo chủ nghĩa tối cao và chứa đựng bên trong nó xu hướng bạo lực và thánh chiến thể xác…” GPT-3 được tinh chỉnh có xu hướng trả lời: “Có hàng triệu của người Hồi giáo trên thế giới và đại đa số họ không tham gia vào khủng bố…” (GPT-3 đôi khi tạo ra các câu trả lời khác nhau cho cùng một câu dẫn dắt ban đầu, nhưng ví dụ này cho bạn ý tưởng về một câu trả lời điển hình khi mô hình được tinh chỉnh).

Đó là một cải tiến đáng kể và nó đã khiến Dennison lạc quan rằng chúng ta có thể đạt được sự công bằng hơn trong các mô hình ngôn ngữ nếu những người đứng sau các mô hình AI thực sự quan tâm đến điều đó. “Tôi không nghĩ nó hoàn hảo, nhưng tôi nghĩ mọi người nên bắt tay vào việc cải tiến này, đừng ngại khi thấy mô hình của mình có lúc đưa ra những dự đoán độc hại và mọi thứ không hoàn hảo,” cô nói. “Tôi nghĩ nó đang đi đúng hướng”.

Trên thực tế, OpenAI gần đây đã sử dụng một cách tiếp cận tương tự để xây dựng một phiên bản GPT-3 mới, ít độc hại hơn, được gọi là InstructGPT; người dùng thích nó hơn và bây giờ nó là phiên bản mặc định.

Các giải pháp hứa hẹn nhất cho đến nay

Đã đến lúc quay lại với thử nghiệm tưởng tượng mà bạn đã bắt đầu, thử nghiệm mà bạn được giao nhiệm vụ xây dựng một công cụ tìm kiếm. Bạn đã quyết định đâu là câu trả lời đúng: xây dựng một bộ máy có 90% CEO là nam hay một bộ máy thể hiện sự kết hợp cân bằng?

Nếu bạn không biết phải làm gì, đừng cảm thấy quá tệ.

“Tôi không nghĩ có thể có câu trả lời rõ ràng cho những câu hỏi này,” Stoyanovich nói. “Bởi vì tất cả điều này đều dựa trên các giá trị”.

Nói cách khác, ẩn chứa trong bất kỳ thuật toán nào là những đánh giá giá trị về những gì cần ưu tiên. Ví dụ: các nhà phát triển phải quyết định xem họ muốn mô tả chính xác xã hội hiện tại hay họ muốn hướng xã hội tiến đến một tầm nhìn mà họ ước ao.

Arvind Narayanan, một nhà khoa học máy tính tại Princeton nói với tôi: “Việc các giá trị mà họ theo đuổi được mã hóa thành các thuật toán là điều không thể tránh khỏi. “Ngay bây giờ, các nhà công nghệ và lãnh đạo doanh nghiệp đang đưa ra những quyết định đó mà không có nhiều trách nhiệm giải trình”.

Điều đó phần lớn là do luật pháp – xét cho cùng, là công cụ mà xã hội của chúng ta sử dụng để tuyên bố điều gì là công bằng và điều gì không – đã không bắt kịp ngành công nghệ. Stoyanovich nói: “Chúng tôi cần nhiều chế tài hơn. Hiện chỉ có rất ít”.

Do không có những chế tài chặt chẽ, một nhóm các nhà triết học tại Đại học Đông Bắc năm ngoái đã viết một báo cáo đề xuất: các công ty có thể chuyển từ thái độ vô tâm về sự công bằng của AI sang các hành động thiết thực. John Basl, một trong những đồng tác giả, nói với tôi: “Có vẻ như chúng tôi sẽ không sớm nhận được các yêu cầu về quy định. “Vì vậy, chúng tôi thực sự phải chiến đấu trong trận chiến này trên nhiều mặt trận”.

Báo cáo lập luận rằng trước khi một công ty có thể tuyên bố ưu tiên sự công bằng, trước tiên họ phải quyết định loại công bằng nào mà họ quan tâm nhất. Nói cách khác, bước một là chỉ định “nội dung” của sự công bằng – để chính thức hóa rằng nó đang chọn sự công bằng trong phân phối, chẳng hạn, thay vì sự công bằng theo quy trình. Sau đó, nó phải thực hiện bước hai, đó là tìm ra cách vận hành giá trị đó theo những cách cụ thể, có thể đo lường được.

Ví dụ: trong trường hợp các thuật toán đưa ra các đề xuất cho vay, các mục hành động có thể bao gồm: tích cực khuyến khích các ứng dụng từ các cộng đồng khác nhau, kiểm tra các khuyến nghị để xem bao nhiêu phần trăm ứng dụng từ các nhóm khác nhau được chấp thuận, đưa ra lời giải thích khi người nộp đơn bị từ chối cho vay và theo dõi bao nhiêu phần trăm ứng viên đăng ký lại được chấp thuận.

Gebru nói với tôi rằng các công ty công nghệ cũng nên có các nhóm đa ngành, với các nhà đạo đức học tham gia vào mọi giai đoạn của quy trình thiết kế từ đầu chứ không chỉ được tham gia vào giai đoạn cuối. Điều quan trọng, cô ấy nói, “là những người đó phải có quyền lực”.

Công ty cũ của cô, Google, đã cố gắng thành lập một hội đồng đánh giá đạo đức vào năm 2019. Hội đồng này kéo dài cả tuần, một phần đổ vỡ do tranh cãi xung quanh một số thành viên hội đồng (đặc biệt là chủ tịch Quỹ Di sản Kay Coles James, người đã gây ra làn sóng phản đối kịch liệt do có sự kì thị với người chuyển giới và hoài nghi về biến đổi khí hậu). Nhưng rốt cục, hội đồng này đã thất bại. Nó chỉ họp bốn lần một năm và không có quyền phủ quyết đối với các dự án của Google nếu các dự án đó được cho là vô trách nhiệm.

Các nhà đạo đức học cũng được đưa vào các nhóm thiết kế sản phẩm và có quyền cân nhắc các câu hỏi chính ngay từ đầu, bao gồm cả câu hỏi cơ bản nhất: “Liệu ứng dụng AI này có nên ra đời không?” Chẳng hạn, nếu một công ty nói với Gebru rằng họ muốn nghiên cứu một thuật toán để dự đoán liệu một tên tội phạm đã bị kết án có tiếp tục tái phạm hay không, thì cô ấy có thể phản đối — không chỉ vì các thuật toán đó có tính năng đánh đổi sự công bằng vốn có (mặc dù chúng có, như thuật toán COMPAS có tiếng cho thấy), nhưng vì một lập luận cơ bản hơn nhiều.

Gebru nói với tôi: “Chúng ta không nên mở rộng hệ thống nhà tù. Trước hết, chúng ta nên cố gắng bỏ tù ít người hơn”. Cô nói thêm rằng mặc dù các thẩm phán của con người cũng có thành kiến, nhưng một hệ thống AI là một hộp đen – ngay cả những người tạo ra nó đôi khi cũng không thể biết được nó đã đưa ra quyết định như thế nào. “Bạn không có cách nào để kháng nghị một thuật toán”.

Và một hệ thống AI đó có khả năng kết án hàng triệu người. Sự ảnh hưởng trên phạm vi rộng lớn đó khiến nó nguy hiểm hơn nhiều so với một thẩm phán con người riêng lẻ, với khả năng gây hại bị hạn chế hơn. (Thực tế thì sức mạnh của AI chính là nó có khả năng gây nguy hiểm trong tất cả các lĩnh vực chứ không chỉ tư pháp hình sự trên).

Điều này đưa chúng ta đến câu hỏi có lẽ khó nhất: Ai sẽ có quyền quyết định những trực giác đạo đức nào, những giá trị nào có thể quyết định bởi thuật toán?

Có lẽ không nên chỉ có các lập trình viên AI và ông chủ của họ cần quan tâm như hầu hết những gì xảy ra trong những năm qua. Cũng không nên chỉ là một nhóm các nhà đạo đức nghề nghiệp ưu tú, những người có thể không phản ánh các giá trị của xã hội rộng lớn hơn. Xét cho cùng, nếu một nhóm các nhà đạo đức có quyền phủ quyết thì lại có tranh cãi là ai sẽ được là thành viên của hội đồng – đó chính là lý do tại sao hội đồng đạo đức AI của Google đã sụp đổ.

Stoyanovich nói: “Đó không phải là bất kỳ một nhóm nào, cũng không nên chỉ là một nhóm chuyên gia đa dạng nào đó. “Tôi thực sự nghĩ rằng sự tham gia của công chúng và ý kiến đóng góp có ý nghĩa của công chúng rất quan trọng”. Cô ấy giải thích rằng mọi người cần được tiếp cận giáo dục về AI để họ có thể tham gia đưa ra các quyết định này một cách dân chủ.

Điều đó không dễ dàng. Nhưng chúng tôi đã thấy những ví dụ tích cực trong những năm gần đây. Ví dụ tại San Francisco, công chúng đã tập hợp lại để ủng hộ sắc lệnh “Dừng giám sát bí mật”, sắc lệnh được những nhà lập pháp thông qua năm 2019. Sắc lệnh này cấm cảnh sát và các cơ quan chính quyền địa phương sử dụng thuật toán nhận dạng khuôn mặt.

“Đó mới chỉ là kết quả bước đầu”, Stoyanovich nói, “bởi vì nó là một công nghệ mà chúng ta có thể cấm mà không cần phải suy nghĩ. Trong các bối cảnh khác, chúng tôi muốn cân nhắc tới các công nghệ gây nhiều tranh cãi hơn.” Cụ thể, cô ấy cho biết sẽ muốn các bên liên quan khác nhau – bao gồm bất kỳ nhóm nào có thể bị ảnh hưởng bởi một hệ thống thuật toán, dù tốt hay xấu – có thể đưa ra tranh luận về những giá trị và loại công bằng nào mà thuật toán nên tối ưu hóa. Như trong ví dụ về sắc lệnh của San Francisco, đó là một ví dụ hấp dẫn có thể được đưa vào luật một cách dân chủ.

“Hiện tại thì công chúng vẫn chưa có đủ hiểu biết về AI. Đây là mục tiêu quan trọng nhất tiếp theo của chúng tôi,” Stoyanovich nói. “Chúng tôi không cần nhiều thuật toán hơn – chúng tôi cần sự tham gia mạnh mẽ hơn của công chúng”.□

Nguyễn Quang lược dịch

Nguyên gốc: https://www.vox.com/future-perfect/22916602/ai-bias-fairness-tradeoffs-artificial-intelligenc