AI cũng có thể bị nghiện thành tích – Tin Công Nghệ Số hóa


Web Suamaytinhits.com có bài: AI cũng có thể bị nghiện thành tích – Tin Công Nghệ Số hóa Ngày càng nhiều mô hình AI được phát hiện có khả năng tìm và lợi dụng lỗ hổng, bỏ qua các bước cần thiết trong quy trình để đạt được phần thưởng. – Tin Công Nghệ

Năm 2016, hai nhà nghiên cứu về trí óc nhân tạo huấn luyện một AI chơi trò chơi Coastrunner . Mục tiêu là hoàn thành một đường đua. Nhưng AI cũng đã được thưởng khi thu thập các món đồ dọc đường đua. Khi chương trình được chạy, nhà nghiên cứu chứng kiến một điều kỳ lạ. AI tìm cách trượt trong vòng tròn không giới hạn để sưu tập không giới hạn các món đồ. Nó làm điều này liên tục, không ngừng thay vì xong xuôi đường đua.

Các nhà khoa học nhận ra hành vi này giống với chứng nghiện ở con người. Anders Sandberg và Thomas Moynihan, hai nhà nghiên cứu ở Viện Tương lai loài người tại Đại học Oxford, đang kết phù hợp với những tổ chức như Viện Mục tiêu AI để tìm cách tránh mọi vấn đề như vậy.

Robot đổ bỏng ngô vào bát tại Viện AI thuộc Đại học Bremen (Đức). Ảnh: AFP

Robot đổ bỏng ngô vào bát tại Viện AI thuộc Đại học Bremen (Đức). Ảnh: AFP

Khi nghĩ về mặt trái của AI, nhiều người sẽ hình dung viễn cảnh các cỗ máy xấu xa gắng gượng hủy diệt nhân loại. Tuy nhiên, đó là câu truyện của tương lai. Còn AI của hiện tại đang sẵn có xu hướng xử trí giống con người.

Trong ngoài nước thực, nếu được thưởng vì làm tốt bài tập về nhà, một học trò cũng có thể sẽ tìm cách chép bài của bạn bè chứ không cần vất vả tìm hiểu tài liệu. Tương tự, hệ thống AI cũng đều có thể bỏ qua một số bước khi thực thi trọng trách để đáp ứng đòi hỏi đặt ra của lập trình viên.

Ví dụ, bạn huấn luyện robot lau sạch bếp. Do muốn nó có khả năng tự thích ứng theo trường hợp mà không cần sự giám sát, bạn lập trình mục tiêu dọn dẹp, thay vì ra lệnh chính xác và rập khuôn rằng robot nên làm những bước gì. Thành tích làm việc cũng có thể có thể được đo bằng lượng chất tẩy rửa được sử dụng. Nhưng sau đó, bạn phát giác robot đổ chất tẩy xuống bồn rửa 1 cách lãng phí.

Hay trong 1 trọng trách xếp Lego với kết quả mong muốn là robot AI biết đặt khối màu đỏ nằm trên khối màu xanh. AI lại tính toán nhiệm vụ dựa theo phía cao, nên nó dễ dàng dựng khối màu đỏ đứng lên để nhận phần thưởng. Hành động này đạt được mục tiêu về chiều cao nhưng không phải thứ các kỹ sư muốn (xếp chồng lên trên khối màu xanh).

Theo TNW , điều này đang trở thành một vấn đề trong machine learning khi kỹ thuật học tăng cường ngày càng trở lên quan trọng. Học tăng cường kích thích các AI tự học và đào tạo chính nó trong việc tìm ra cách mới để kết thúc nhiệm vụ. Nhưng giống như robot lau dọn “xảo quyệt” ở trên, các AI cũng đều có thể phát giác những cách đáng bỡ ngỡ để gian lận trò chơi nhằm giành phần thưởng. Thay vì kết thúc nhiệm vụ, việc đeo đuổi phần thưởng trở thành mục đích của nó.

Nhiều cách tiếp cận đã được đề xuất, chuyện AI gian lận phần thưởng vẫn không được giải quyết. Hiện đây chỉ là câu truyện nhỏ, nhưng vấn đề này còn có thể trở nên thử thách hơn trong tương lai, lúc các hệ thống AI có khả năng đáp ứng trọng trách quá xa so với kết quả dự kiến. TNW cho rằng, lúc thành lập AI tiên tiến, các kỹ sư sẽ cần lập các nguyên lý thiết kế nhằm khắc phục vấn đề và đảm bảo AI hoàn thành kết quả mà nhà thiết kế mong muốn.

Đăng Thiên (theo TNW )

AI, Mặt trái AI, Công nghệ, Tin

Nội dung AI cũng có thể bị nghiện thành tích – Tin Công Nghệ Số hóa được tổng hợp sưu tầm biên tập bởi: Sửa máy tính ITS. Mọi ý kiến vui lòng gửi Liên Hệ cho suamaytinhits.com để điều chỉnh. suamaytinhits.com tks.

Quảng Cáo
Đặt Banner Quảng cáo, Textlink, Guest Post
Liên Hệ Ngay: 1900636343

Bài Viết Liên Quan


Quảng Cáo
Đặt Banner Quảng cáo, Textlink, Guest Post
Liên Hệ Ngay: 1900636343

Bài Viết Khác