Điểm mù của AI: Máy móc không thể phân tách sự thật khỏi tiếng ồn

Chúng tôi kinh ngạc trước sự thông minh mà các mô hình AI mới nhất đã đạt được — cho đến khi chúng tự tin trình bày cho chúng tôi những điều vô nghĩa hoàn toàn. Sự mỉa mai thật khó bỏ qua: khi các hệ thống AI ngày càng mạnh mẽ, khả năng phân biệt giữa sự thật và hư cấu không nhất thiết cải thiện. Theo một cách nào đó, nó đang trở nên tồi tệ hơn.

Tóm tắt

  • AI phản ánh những thiếu sót thông tin của chúng ta. Các mô hình như GPT-5 gặp khó khăn vì dữ liệu đào tạo bị ô nhiễm bởi nội dung viral, thúc đẩy tương tác mà ưu tiên sự giật gân hơn là độ chính xác.
  • Sự thật không còn là trò chơi có tổng bằng không. Nhiều “sự thật” đồng tồn tại, nhưng các nền tảng hiện tại tập trung hóa dòng thông tin, tạo ra các buồng vang và thiên kiến nuôi dưỡng cả con người lẫn AI.
  • Phân bổ phi tập trung khắc phục chu kỳ. Các hệ thống liên kết danh tiếng và danh tính, được hỗ trợ bởi các nguyên tắc tiền điện tử, có thể thưởng cho độ chính xác, lọc tiếng ồn và đào tạo AI trên dữ liệu có thể xác minh, đáng tin cậy.

Xem xét những phát hiện của chính OpenAI: một phiên bản của GPT-4 ( mang mã “o3”) đã đưa ra câu trả lời sai lệch khoảng 33% thời gian trong các bài kiểm tra chuẩn, theo tài liệu của công ty. Người kế nhiệm nhỏ hơn của nó ( “o4-mini”) đã mắc sai lầm gần một nửa thời gian. Mẫu mới nhất, GPT-5, được cho là sẽ khắc phục điều này và thực sự tuyên bố rằng nó mắc sai lầm ít hơn nhiều ( ~9%). Tuy nhiên, nhiều người dùng có kinh nghiệm thấy GPT-5 kém thông minh hơn trong thực tế—chậm hơn, do dự hơn, và vẫn thường sai ( cũng chứng minh rằng các bài kiểm tra chuẩn chỉ đưa chúng ta đi xa đến vậy ).

Sự thất vọng của CTO Nillion, John Woods, đã rõ rệt khi ông nói rằng ChatGPT đã chuyển từ ‘cần thiết sang rác rưởi’ sau khi phát hành GPT-5. Tuy nhiên, thực tế là, các mô hình tiên tiến hơn sẽ ngày càng kém trong việc phân biệt sự thật với tiếng ồn. Tất cả chúng, không chỉ riêng GPT.

Tại sao một AI tiên tiến hơn lại cảm thấy kém đáng tin cậy hơn các phiên bản trước đó? Một lý do là các hệ thống này chỉ tốt như dữ liệu đào tạo của chúng, và dữ liệu mà chúng ta cung cấp cho AI về cơ bản là sai lệch. Ngày nay, dữ liệu này chủ yếu đến từ một mô hình thông tin nơi sự tham gia vượt trội hơn sự chính xác trong khi các Người giữ cửa tập trung khuếch đại tiếng ồn hơn tín hiệu để tối đa hóa lợi nhuận. Do đó, thật ngây thơ khi mong đợi AI trung thực mà không giải quyết trước vấn đề dữ liệu.

AI phản ánh sự đầu độc thông tin tập thể của chúng ta

Dữ liệu đào tạo chất lượng cao đang biến mất nhanh hơn chúng ta tạo ra. Có một vòng lặp suy thoái tái diễn đang hoạt động: AI chủ yếu tiêu hóa dữ liệu từ web; web đang ngày càng bị ô nhiễm với những thông tin sai lệch, không thể xác minh từ AI; dữ liệu tổng hợp đào tạo thế hệ mô hình tiếp theo trở nên càng xa rời thực tế hơn.

Hơn cả bộ dữ liệu huấn luyện kém, đó là về kiến trúc cơ bản của cách chúng ta tổ chức và xác minh thông tin trực tuyến. Hơn 65% dân số thế giới dành hàng giờ trên các nền tảng mạng xã hội được thiết kế để tối đa hóa sự tương tác. Do đó, chúng ta bị phơi bày, ở quy mô chưa từng có, trước các thuật toán vô tình thưởng cho thông tin sai lệch.

Những câu chuyện sai lệch kích thích phản ứng cảm xúc mạnh mẽ hơn, vì vậy chúng lan truyền nhanh hơn các tuyên bố sửa chữa. Do đó, nội dung dễ lan truyền nhất — tức là, nội dung có khả năng cao nhất được hấp thụ bởi các quy trình đào tạo AI — có hệ thống thiên lệch về cảm xúc hơn là độ chính xác.

Các nền tảng cũng thu lợi từ sự chú ý, không phải sự thật. Những người tạo dữ liệu được thưởng cho sự lan truyền, không phải độ chính xác. Các công ty AI tối ưu hóa cho sự hài lòng và tương tác của người dùng, không phải độ chính xác về sự thật. Và ‘thành công’ đối với chatbot là giữ cho người dùng bị cuốn hút với những phản hồi nghe có vẻ hợp lý.

Nói như vậy, cuộc khủng hoảng dữ liệu/niềm tin của AI thực sự là một phần mở rộng của việc đầu độc đang diễn ra trong ý thức tập thể của nhân loại. Chúng ta đang cung cấp cho AI những gì chúng ta đang tiêu thụ. Các hệ thống AI không thể phân biệt sự thật với tiếng ồn, bởi vì chính chúng ta cũng không thể.

Sự thật cuối cùng là sự đồng thuận. Ai kiểm soát dòng thông tin cũng kiểm soát các câu chuyện mà chúng ta tập thể cảm nhận như là ‘sự thật’ sau khi chúng được lặp đi lặp lại đủ nhiều lần. Và ngay bây giờ, một đám công ty khổng lồ nắm giữ dây cương của sự thật, không phải chúng ta với tư cách cá nhân. Điều đó có thể thay đổi. Nó phải.

Sự xuất hiện của AI trung thực là một trò chơi tổng dương.

Chúng ta sửa chữa điều này như thế nào? Chúng ta điều chỉnh lại hệ sinh thái thông tin của mình — và do đó, AI — theo hướng sự thật như thế nào? Nó bắt đầu bằng việc tái tưởng tượng cách mà sự thật được tạo ra và duy trì từ đầu.

Trong thực trạng hiện nay, chúng ta thường xem sự thật như một trò chơi tổng bằng không được quyết định bởi ai có tiếng nói lớn nhất hoặc quyền lực cao nhất. Thông tin bị phân lập và kiểm soát chặt chẽ; mỗi nền tảng hoặc tổ chức đều đẩy phiên bản thực tế riêng của mình. Một AI ( hoặc một người) bị kẹt trong một trong những silo này sẽ có được một thế giới quan hẹp và thiên lệch. Đó là cách chúng ta tạo ra các buồng vang, và đó là cách cả con người và AI đều bị dẫn dắt sai lầm.

Nhưng nhiều sự thật trong cuộc sống không phải là những đề xuất nhị phân, có tổng bằng không. Thực tế, hầu hết những sự thật có ý nghĩa đều là tổng dương — chúng có thể đồng tồn tại và bổ sung cho nhau. Nhà hàng “tốt nhất” ở New York là gì? Không có câu trả lời đúng duy nhất, và đó chính là vẻ đẹp của nó: sự thật phụ thuộc vào khẩu vị của bạn, ngân sách của bạn, tâm trạng của bạn. Bài hát yêu thích của tôi, là một bản jazz cổ điển, không làm bài hát pop yêu thích của bạn trở nên “không đúng” đối với bạn. Sự hiểu biết của một người không nhất thiết phải đồng nghĩa với sự mất mát của người khác. Quan điểm của chúng ta có thể khác nhau mà không làm mất giá trị lẫn nhau.

Đây là lý do tại sao việc xác thực thuộc tính và các nguyên lý danh tiếng lại rất quan trọng. Sự thật không chỉ đơn thuần là về nội dung của một tuyên bố — mà còn phải liên quan đến ai đang đưa ra tuyên bố đó, động lực của họ là gì, và hồ sơ quá khứ của họ ra sao. Nếu mỗi tuyên bố trực tuyến đều đi kèm với một chuỗi tác giả rõ ràng và một điểm danh tiếng đang hoạt động, chúng ta có thể lọc qua tiếng ồn mà không phải nhường quyền kiểm soát cho các người điều phối tập trung. Một tác nhân có động cơ xấu cố gắng lan truyền thông tin sai lệch sẽ thấy danh tiếng của họ bị suy giảm với mỗi tuyên bố sai lệch. Một người đóng góp có suy nghĩ với hồ sơ dài về độ chính xác sẽ thấy danh tiếng — và ảnh hưởng — của họ gia tăng.

Crypto cung cấp cho chúng ta các khối xây dựng để làm điều này: các định danh phi tập trung, các đăng ký được quản lý bằng token, các cơ chế staking, và các cấu trúc khuyến khích biến độ chính xác thành một hàng hóa kinh tế. Hãy tưởng tượng một đồ thị tri thức nơi mỗi tuyên bố gắn liền với một danh tính có thể xác minh, mỗi quan điểm mang theo một điểm uy tín, và mỗi tuyên bố sự thật có thể bị thách thức, staking chống lại, và phân xử trong một hệ thống mở. Trong thế giới đó, sự thật không được truyền đạt từ một nền tảng duy nhất — nó nổi lên một cách tự nhiên từ một mạng lưới các tiếng nói có thuộc tính, được cân nhắc theo uy tín.

Một hệ thống như vậy đảo ngược bối cảnh khuyến khích. Thay vì những người sáng tạo nội dung chạy theo sự nổi tiếng với cái giá phải trả cho độ chính xác, họ sẽ đặt cược danh tiếng của mình — và thường là những token cụ thể — vào tính hợp lệ của những đóng góp của họ. Thay vì AI được đào tạo trên những dữ liệu ẩn danh kém chất lượng, nó sẽ được đào tạo trên dữ liệu có thuộc tính, được cân nhắc dựa trên danh tiếng, nơi sự thật và độ tin cậy được tích hợp vào bản chất của thông tin.

Bây giờ hãy xem AI trong bối cảnh này. Một mô hình được đào tạo trên một đồ thị nhận thức đến danh tiếng như vậy sẽ tiêu thụ một tín hiệu sạch hơn rất nhiều. Nó sẽ không chỉ lặp lại những tuyên bố lan truyền nhất; nó sẽ học cách xem xét nguồn gốc và độ tin cậy. Theo thời gian, chính các tác nhân có thể tham gia vào hệ thống này — đặt cược vào sản phẩm của họ, xây dựng danh tiếng của riêng họ và cạnh tranh không chỉ về sự hùng biện mà còn về độ tin cậy.

Đó là cách chúng ta phá vỡ vòng xoáy của thông tin độc hại và xây dựng AI phản ánh một tầm nhìn về sự thật phi tập trung, có lợi cho tất cả. Nếu không có sự dẫn nguồn có thể xác minh và danh tiếng phi tập trung, chúng ta sẽ luôn bị mắc kẹt trong việc ủy thác “sự thật” cho các nền tảng tập trung, và chúng ta sẽ luôn dễ bị tổn thương trước sự thao túng.

Với họ, cuối cùng chúng ta có thể vượt qua quyền lực không có lợi và tiến tới một hệ thống mà sự thật xuất hiện một cách năng động, linh hoạt và — quan trọng nhất — cùng nhau.

Billy Luedtke

Billy Luedtke

Billy Luedtke đã xây dựng ở tiên phong của blockchain kể từ Bitcoin năm 2012 và Ethereum năm 2014. Ông đã giúp khởi động thực hành tư vấn blockchain của EY và dành hơn năm năm tại ConsenSys để hình thành hệ sinh thái Ethereum thông qua các vai trò trong R&D, Quan hệ Nhà phát triển, kỹ thuật token và danh tính phi tập trung. Billy cũng đã giúp tiên phong danh tính tự chủ với vai trò là Trưởng phòng Doanh nghiệp tại uPort, Đồng Chủ tịch Nhóm Làm việc về Danh tính Kỹ thuật số của EEA, và là thành viên sáng lập của Quỹ Danh tính Phi tập trung. Hiện nay, ông là người sáng lập Intuition, chuỗi gốc cho Tài chính Thông tin, biến đổi danh tính, yêu cầu và danh tiếng thành dữ liệu có thể xác minh, có thể kiếm tiền cho internet tiếp theo.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)