MEDIAKOMPETEN.CO.ID - Fenomena baru dalam ekonomi digital kini tengah berkembang pesat, di mana banyak orang secara sukarela menjual identitas digital mereka untuk kebutuhan pelatihan kecerdasan buatan (AI). Imbalan finansial yang dijanjikan, seringkali dalam mata uang dolar, membuat banyak pihak tertarik untuk berpartisipasi meski risiko yang menyertai tidak kecil.

Salah satu contohnya adalah Jacobus Louw, pria berusia 27 tahun dari Cape Town, Afrika Selatan, yang berhasil mendapatkan USD 14 (sekitar Rp 230.000) dari rekaman video kakinya saat berjalan di trotoar. Pendapatan tersebut setara dengan separuh kebutuhan belanja mingguan baginya, mengingat upah minimum di negaranya.

Video yang ia sumbangkan tersebut merupakan bagian dari tugas 'Navigasi Perkotaan' yang ia temukan melalui Kled AI, sebuah aplikasi yang memang berfungsi membayar kontributor untuk mengunggah berbagai data seperti foto dan video guna melatih model kecerdasan buatan. Dalam beberapa minggu, Louw tercatat telah mengumpulkan USD 50 atau sekitar Rp 800.000 dari unggahan aktivitas hariannya.

Di belahan dunia lain, di Ranchi, India, Sahil Tigga, seorang siswa berusia 22 tahun, juga memanfaatkan tren ini untuk mendapatkan pemasukan rutin. Ia mengizinkan aplikasi bernama Silencio mengakses mikrofon ponselnya untuk merekam kebisingan lingkungan sekitar, seperti suasana restoran atau lalu lintas padat.

Sahil juga aktif mengunggah rekaman suaranya sendiri, bahkan melakukan perjalanan khusus demi mengabadikan suasana unik di lokasi seperti lobi hotel yang belum terpetakan di sistem Silencio. Melalui aktivitas ini, ia berhasil meraup lebih dari USD 100 atau sekitar Rp 1,6 jutaan per bulan, cukup untuk menanggung seluruh biaya makannya.

Sementara itu, di Chicago, Amerika Serikat, Ramelio Hill, seorang pekerja berusia 18 tahun, mendapatkan beberapa ratus dolar dengan menjual rekaman percakapan telepon pribadinya dengan keluarga dan teman. Transaksi ini dilakukan melalui Neon Mobile, sebuah platform pelatihan AI percakapan yang memberikan bayaran USD 0,50 per menit rekaman.

Permintaan data masif ini timbul karena model bahasa AI, termasuk ChatGPT dan Gemini, membutuhkan materi pembelajaran dalam jumlah yang sangat besar, sementara sumber data utama mulai mengalami keterbatasan. Sumber pelatihan yang dominan seperti C4, RefinedWeb, dan Dolma, yang mencakup seperempat data web berkualitas tinggi, kini mulai membatasi akses bagi perusahaan AI generatif.

Para peneliti memprediksi bahwa perusahaan AI akan mengalami kehabisan teks segar berkualitas tinggi untuk sesi pelatihan pada tahun 2026. Meskipun beberapa laboratorium mulai mencoba menggunakan data sintetis yang dihasilkan oleh AI itu sendiri, proses rekursif semacam ini dikhawatirkan dapat memicu munculnya kesalahan fatal pada model.

"Data manusia, untuk saat ini, adalah standar terbaik untuk mengambil sampel dari luar distribusi model," tutur Veniamin Veselovsky, seorang peneliti AI.