Ilusi Keahlian: Mengapa Saran Medis AI Bisa Sangat Menyesatkan

3

Ketika model bahasa besar menjadi lebih terintegrasi ke dalam kehidupan sehari-hari, terjadi pergeseran perilaku pengguna: semakin banyak orang yang memperlakukan chatbot AI sebagai sumber daya kesehatan utama, bukan sekadar alat produktivitas. Meskipun model-model ini cepat, tersedia, dan sangat pandai berbicara, sebuah penelitian baru-baru ini mengungkapkan kesenjangan yang signifikan antara seberapa “otoritatif” suatu AI terdengar dan seberapa akurat AI tersebut secara medis.

Studi: Menguji Batasan Kecerdasan AI

Para peneliti baru-baru ini melakukan evaluasi menyeluruh terhadap lima model AI yang banyak digunakan untuk menentukan keandalannya dalam menjawab pertanyaan kesehatan sehari-hari. Studi ini berfokus pada topik yang sering menjadi sasaran misinformasi, termasuk kanker, vaksin, sel induk, nutrisi, dan performa atletik.

Untuk mensimulasikan penggunaan di dunia nyata, para peneliti beralih dari pertanyaan sederhana “ya atau tidak”. Mereka menggunakan 50 pertanyaan yang dirancang untuk meniru cara pasien sebenarnya mencari informasi—seringkali melalui pertanyaan yang terbuka, bernuansa, atau “menyenggol” yang mengarah ke area abu-abu medis.

Hasilnya sungguh menyedihkan. Para ahli mengevaluasi tanggapan tersebut berdasarkan keakuratan, kelengkapan, dan potensi bahaya, dan menemukan bahwa:
50% dari seluruh respons ditandai sebagai bermasalah.
30% tidak memiliki konteks penting atau terlalu menyederhanakan realitas medis yang kompleks.
20% dianggap sangat bermasalah, memberikan saran yang dapat mengarahkan pengguna pada keputusan kesehatan yang tidak efektif atau bahkan berbahaya.

Dimana Modelnya Gagal

Studi ini mengidentifikasi tiga area spesifik di mana kinerja AI menurun, sehingga menciptakan “titik buta” bagi pengguna:

1. Jebakan Pertanyaan Terbuka

Model tersebut memiliki kinerja terbaik dengan pertanyaan tertutup yang memiliki jawaban pasti dan berdasarkan bukti. Namun, mereka kesulitan secara signifikan dengan perintah yang bersifat terbuka. Karena kebanyakan orang menanyakan pertanyaan umum—seperti “Apa diet terbaik untuk keseimbangan hormon?” —mereka secara tidak sengaja mengarahkan AI ke mode operasinya yang paling tidak dapat diandalkan.

2. Kerentanan Khusus Topik

Keandalan suatu jawaban sering kali bergantung pada pokok bahasannya:
Keandalan Tinggi: Vaksin dan kanker, dimana terdapat penelitian ilmiah yang luas, konsisten, dan sangat terstruktur.
Keandalan Rendah: Nutrisi, kebugaran, dan terapi baru (seperti sel induk), yang konsensus ilmiahnya sering kali berkembang, bernuansa, atau sangat dipengaruhi oleh tren gaya hidup.

3. “Kesenjangan Keyakinan” dan Halusinasi

Mungkin elemen AI yang paling menipu adalah nadanya. Chatbots jarang mengungkapkan ketidakpastian. Berbeda dengan dokter manusia yang mungkin berkata, “Buktinya tidak meyakinkan,” AI sering kali menyampaikan informasi spekulatif dengan kepastian mutlak. Hal ini diperburuk oleh dua kegagalan teknis:
Kutipan Buatan: Model AI sering kali memberikan referensi yang “berhalusinasi” atau tidak lengkap terhadap penelitian yang sebenarnya tidak ada.
Kompleksitas Semu: Model sering kali menggunakan bahasa akademis yang canggih sehingga menimbulkan kesan kredibilitas palsu, sehingga jawaban yang salah terasa lebih “profesional”.

Menavigasi AI sebagai Alat Kesehatan

Tujuan dari penelitian ini bukan untuk menyatakan bahwa AI tidak ada gunanya, namun untuk menyoroti perlunya jenis literasi digital yang baru. Untuk menggunakan AI dengan aman dalam konteks medis, pengguna harus mengambil pendekatan yang lebih skeptis:

  • Perbaiki dorongan Anda: Daripada meminta solusi “terbaik”, tanyakan tentang risiko spesifik, trade-off, dan bukti ilmiah terkini.
  • Verifikasi “Kepastian”: Jika AI memberikan jawaban hitam-putih terhadap berbagai masalah medis, perlakukan itu sebagai tanda bahaya. Ilmu pengetahuan sejati jarang sekali bersifat mutlak.
  • Periksa fakta sumbernya: Jangan pernah berasumsi bahwa penelitian yang dikutip adalah nyata. Jika Anda tidak dapat menemukan penelitian tersebut melalui mesin pencari independen, abaikan klaim tersebut.
  • Identifikasi peran AI: Gunakan AI untuk meringkas istilah-istilah kompleks atau untuk membantu Anda menyiapkan daftar pertanyaan untuk dokter Anda. Jangan menggunakannya untuk membuat keputusan klinis.

Intinya: AI adalah mesin prediktif yang dirancang untuk menghasilkan teks yang terdengar masuk akal, bukan mesin profesional medis yang dirancang untuk memberikan kebenaran. Ini adalah titik awal untuk pemahaman, bukan pengganti keahlian klinis.


Kesimpulan: Meskipun AI dapat menjadi alat yang ampuh untuk menyederhanakan konsep medis yang kompleks, kecenderungannya terhadap terlalu percaya diri dan bukti palsu menjadikannya sumber berisiko tinggi untuk mendapatkan nasihat medis langsung. Pengguna harus mendekati informasi kesehatan yang dihasilkan AI dengan sangat hati-hati, memperlakukannya sebagai alat bantu percakapan dan bukan sebagai otoritas medis yang definitif.