ChatGPT mampu mengungguli dokter manusia dalam mendiagnosis penyakit dan kondisi medis dalam sebuah penelitian. Hasil penelitian yang dipublikasikan bulan lalu dan menyoroti bahwa chatbot dengan kecerdasan buatan (AI) mungkin lebih efisien dalam menganalisis riwayat dan kondisi pasien serta memberikan diagnosis yang lebih akurat. Meskipun penelitian ini bertujuan untuk memahami apakah chatbot yang didukung AI dapat membantu dokter memberikan diagnosis yang lebih baik, hasilnya secara tidak terduga mengungkapkan bahwa chatbot yang didukung GPT-4 OpenAI memiliki kinerja yang jauh lebih baik saat bekerja tanpa bantuan manusia dibandingkan saat dipasangkan dengan dokter.
ChatGPT mengungguli dokter dalam mendiagnosis penyakit
itu Dia belajarHal ini diterbitkan dalam jurnal JAMA Network Open, dan dilakukan di Beth Israel Deaconess Medical Center di Boston oleh sekelompok peneliti. Uji coba tersebut bertujuan untuk mengetahui apakah kecerdasan buatan dapat membantu dokter mendiagnosis penyakit dengan lebih baik dibandingkan metode tradisional.
Menurut New York Times sebuah laporanUji coba tersebut melibatkan 50 dokter yang merupakan campuran residen dan dokter yang terdaftar di sekolah kedokteran. Mereka direkrut melalui beberapa sistem rumah sakit besar di Amerika Serikat dan diberikan enam catatan kasus pasien. Subyek dilaporkan diminta untuk menyarankan diagnosis untuk setiap kondisi dan memberikan penjelasan mengapa mereka memilih atau mengesampingkan diagnosis tertentu. Dikatakan juga bahwa dokter diberi peringkat berdasarkan kebenaran diagnosis akhir mereka.
Untuk mengevaluasi kinerja setiap peserta, ahli medis dipilih sebagai siswa di kelas tersebut. Meskipun mereka diberitahu untuk diperlihatkan jawabannya, mereka tidak diberitahu apakah jawabannya berasal dari dokter yang memiliki akses terhadap AI, hanya dari dokter, atau hanya dari ChatGPT.
Selain itu, untuk menghilangkan kemungkinan catatan kasus yang tidak realistis, para peneliti dilaporkan memilih catatan kasus pasien nyata yang telah digunakan oleh para peneliti selama beberapa dekade namun tidak pernah dipublikasikan untuk menghindari kontaminasi. Poin ini penting karena ChatGPT tidak bisa dilatih pada data yang belum pernah dipublikasikan.
Hasil penelitian tersebut sungguh mengejutkan. Dokter yang tidak menggunakan alat AI apa pun untuk mendiagnosis riwayat kasus memiliki skor rata-rata sebesar 74%, sedangkan dokter yang menggunakan chatbot memperoleh skor rata-rata 76%. Namun, ketika ChatGPT sendiri menganalisis riwayat kasus dan memberikan diagnosis, skornya rata-rata 90%.
Meskipun berbagai faktor dapat mempengaruhi hasil penelitian – mulai dari tingkat pengalaman dokter hingga bias individu dalam diagnosis tertentu – para peneliti yakin penelitian ini menyoroti bahwa potensi sistem AI di institusi medis tidak dapat diabaikan.