Getty Images/iStockphoto Getty Images/iStockphoto
Sementara tidak ada yang bisa memprediksi apa yang akan terjadi di masa depan,
hal terbaik adalah mencegah daripada mengobati, dan itulah yang coba dilakukan
oleh Google dan OpenAI.
Seperti yang dilaporkan Engadget,
kedua perusahaan ini telah merilis sebuah artikel penelitian, dimana mereka
telah mengemukakan metode pembelajaran mesin baru yang memerlukan isyarat dari
manusia, sebagai lawan untuk membiarkan mereka berpikir sendiri yang terkadang
dapat menimbulkan konsekuensi yang tidak diinginkan.
Misalnya artikel tersebut
menguraikan bagaimana salah satu masalah utama yang terlibat dalam AI adalah
ketika mengetahui bahwa kecurangan terkadang bisa menjadi cara yang paling
efisien untuk mencapai reward maksimum, itulah yang terjadi ketika OpenAI
mencoba membuat AI bermain game, di mana AI ditipu dengan mencetak poin dengan
berkeliling di seputar lawan untuk menyelesaikan permainan.
Jadi dengan menggunakan isyarat
reward dari manusia, berlawanan dengan sistem reward otomatis selama tujuan tercapai,
masa depan AI akhirnya bisa sampai pada titik di mana ia dapat berperilaku
dengan cara yang sesuai dengan tujuan sambil memuaskan preferensi kita sebagai
manusia. Namun ada kelemahan dari metode ini, yakni bahwa hal itu memerlukan
banyak feedback dari manusia yang mungkin belum ideal atau efisien.
