Ada ironi yang indah dalam perkembangan AI.

Kita sudah menciptakan sistem yang bisa mengalahkan grandmaster catur, menulis puisi, menganalisis data medis, bahkan lulus ujian bar. Tapi minta robot melipat handuk dengan rapi?

Masih pekerjaan rumah yang belum selesai.

Paradoks Moravec

Pada tahun 1980-an, peneliti AI Hans Moravec menyadari sesuatu yang aneh. Hal-hal yang sulit bagi manusia seperti matematika kompleks, strategi catur, dan analisis logis ternyata relatif mudah untuk komputer. Sebaliknya, hal-hal yang mudah bagi manusia seperti berjalan, mengenali wajah, dan melipat baju justru luar biasa sulit untuk mesin.

Ini dikenal sebagai Paradoks Moravec.

Penjelasannya terletak pada evolusi. Manusia menghabiskan ratusan juta tahun mengembangkan kemampuan motorik dan persepsi. Keterampilan ini begitu fundamental sehingga tersimpan dalam lapisan otak paling primitif. Beroperasi secara tidak sadar, efisien, hampir tanpa usaha.

Sebaliknya, matematika dan logika abstrak baru berkembang dalam sekejap mata evolusioner, mungkin beberapa ratus ribu tahun. Keterampilan ini conscious, lamban, dan melelahkan.

Ketika kita memprogram AI, kita memulai dari conscious skills. Yang mudah dirumuskan dalam aturan. Yang bisa dituliskan dalam kode. Kita tidak tahu cara menuliskan “bagaimana berjalan tanpa jatuh” karena kita sendiri tidak sadar bagaimana kita melakukannya.

Dunia Nyata Itu Berantakan

Komputer hidup di dunia yang bersih.

Data masuk dalam format terstruktur. Environment terprediksi. Setiap pixel di tempatnya. Setiap bit bisa diandalkan.

Dunia fisik tidak seperti itu.

Handuk tidak pernah berbentuk sama dua kali. Cahaya berubah sepanjang hari. Permukaan meja mungkin licin, atau lengket, atau berdebu. Udara bergerak. Gravitasi bekerja. Setiap aksi memiliki konsekuensi yang harus diantisipasi.

Robot yang mencoba melipat handuk harus memproses visual yang ambigu, merencanakan gerakan dalam ruang tiga dimensi, menyesuaikan tekanan genggaman secara real-time, dan merespons ketika handuk berperilaku tidak sesuai prediksi. Yang hampir selalu terjadi.

Semua ini harus terjadi dalam milidetik. Berulang-ulang. Tanpa lelah.

Simulasi Tidak Cukup

“Latih saja di simulasi,” kata banyak orang.

Dan memang, banyak kemajuan robotik datang dari training di lingkungan virtual. Lebih murah, lebih cepat, lebih aman. Robot bisa gagal jutaan kali tanpa rusak.

Tapi ada masalah fundamental yang disebut sim-to-real gap.

Simulasi adalah aproksimasi. Secanggih apapun, ia tidak bisa menangkap semua nuansa dunia nyata. Bagaimana kain berinteraksi dengan udara. Bagaimana gesekan berubah dengan kelembaban. Bagaimana cahaya memantul dari permukaan mengkilap.

Robot yang sempurna di simulasi sering gagal ketika dilepas ke dunia nyata. Seperti orang yang jago main flight simulator tapi panik di kokpit pesawat sungguhan.

Kemajuan yang Lambat tapi Pasti

Tapi jangan salah. Progres sedang terjadi.

Pendekatan baru seperti end-to-end learning membiarkan robot belajar langsung dari pengalaman fisik, tanpa programmer harus menjelaskan setiap aturan. Foundation models yang dilatih pada jutaan video manusia beraktivitas mulai memberikan robot intuisi tentang bagaimana dunia fisik bekerja.

Startup seperti Physical Intelligence dan Figure AI membuat robot yang bisa melakukan tugas rumah tangga dasar. Masih lambat, masih awkward, masih butuh supervisi. Tapi lima tahun lalu, ini adalah fiksi ilmiah.

Apa yang Ini Ajarkan tentang Kecerdasan

Mungkin kesulitan robot melipat handuk mengajarkan kita sesuatu yang penting.

Kecerdasan bukan hanya tentang memproses informasi. Bukan hanya tentang mengenali pola atau membuat prediksi. Kecerdasan adalah kemampuan berinteraksi dengan dunia. Dunia yang tidak teratur, tidak terprediksi, dan tidak memaafkan.

Bayi manusia menghabiskan tahun pertama hidupnya belajar bagaimana tubuhnya bekerja dalam ruang. Bagaimana menggenggam, melepas, menjatuhkan, mengambil lagi. Ini bukan buang waktu. Ini fondasi dari semua kecerdasan yang akan datang.

AI kita masih bayi dalam hal ini. Masih belajar bahwa dunia punya tekstur, berat, dan momentum.


Ketika robot akhirnya bisa melipat handuk serapi ibumu, mungkin saat itulah kita benar-benar menciptakan kecerdasan buatan.