AI Medis Milik Microsoft Bisa Saingi Dokter Manusia dalam Diagnosis Pasien
kumparanTECH July 10, 2025 12:00 PM
Riset terbaru Microsoft mengungkap bahwa kecerdasan buatan (artificial intelligence/AI) kini mampu melakukan diagnosis medis berurutan (sequential diagnostics) dengan akurasi dan efisiensi yang dapat bersaing dengan dokter manusia, bahkan melampauinya.
Studi yang diumumkan pada Senin (30/6) lalu menyoroti dua hal, pertama memperkenalkan tolok ukur baru untuk menguji performa alat diagnosis AI dibanding para ahli medis, serta hadirnya model-agnostic orchestrator untuk mengukur kemampuan AI ketika dibandingkan dengan tolok ukur tersebut.
Mustafa Suleyman, CEO Microsoft AI, menyebut pencapaian ini sebagai langkah besar menuju apa yang ia sebut sebagai superintelijensi medis.
“Cara mudah memahami superintelijensi medis adalah, model ini berkali-kali lebih baik dari manusia terbaik di dunia, memiliki keluasan wawasan dari sebagian besar dokter ahli di seluruh dunia, dan kedalaman pengetahuan layaknya pakar terbaik,” ujar Suleyman, mengutip Newsweek.
Untuk menguji kemampuan AI dalam dunia medis nyata, Microsoft mengembangkan Sequential Diagnosis Benchmark (SDBench), yakni simulasi interaktif berbasis 304 kasus klinis kompleks dari New England Journal of Medicine (NEJM). Kasus-kasus ini memang terkenal sulit didiagnosis bahkan oleh para ahli.
SDBench menyajikan ringkasan kasus kepada dokter atau model AI. Selanjutnya, mereka harus mengajukan pertanyaan atau melakukan pemeriksaan medis untuk mengonfirmasi diagnosisnya. Diagnosis akhir dibandingkan dengan standar emas milik NEJM, dinilai berdasarkan akurasi dan efisiensi biaya.
Ilustrasi Artificial Intelligence (AI). Foto: Shutterstock
zoom-in-whitePerbesar
Ilustrasi Artificial Intelligence (AI). Foto: Shutterstock
Hasilnya mencengangkan. Model baru Microsoft bernama MAI Diagnostic Orchestrator (MAI-DxO) berhasil mencapai akurasi diagnosis sebesar 85,5%, jauh melampaui dokter umum yang rata-rata hanya mencapai 20% akurasi. Tak hanya itu, MAI-DxO juga mampu mengurangi biaya diagnosis hingga 20%, berkat kemampuannya dalam memilih pemeriksaan yang lebih relevan dan lebih cepat mengambil keputusan klinis.
Karena bersifat model-agnostic, MAI-DxO dapat digunakan bersama berbagai model kecerdasan buatan seperti OpenAI, Gemini, Claude, Grok, DeepMind, hingga Llama.
Namun, studi ini memiliki keterbatasan. Panel yang terdiri dari 21 dokter asal AS dan Inggris, dengan rata-rata pengalaman 12 tahun, tidak diizinkan menggunakan mesin pencari, model bahasa, atau sumber informasi eksternal saat berinteraksi dengan SDBench.
Padahal, riset terbaru menunjukkan bahwa sekitar 1 dari 5 dokter telah menggunakan AI generatif, dan 7 dari 10 menggunakan mesin pencari dalam praktik sehari-hari. Artinya, performa dokter manusia mungkin akan lebih tinggi jika diberi akses ke sumber daya digital yang biasa mereka gunakan.
Meski begitu, tim Microsoft menegaskan bahwa hasil ini membuktikan bahwa sistem AI yang diarahkan untuk berpikir ulang dan bertindak bijak, dapat meningkatkan akurasi diagnosis sekaligus menekan biaya klinis.
MAI-DxO belum diluncurkan untuk digunakan secara luas, namun performa awalnya memberikan gambaran kuat tentang potensi di masa depan. Alat ini dikembangkan oleh divisi kesehatan Microsoft AI, unit riset yang diam-diam dibentuk pada akhir 2024.
Ilustrasi periksa ke dokter. Foto: Shutterstock
zoom-in-whitePerbesar
Ilustrasi periksa ke dokter. Foto: Shutterstock
Tim pengembangnya mencakup klinisi, desainer, insinyur, dan ilmuwan AI yang bekerja di bawah arahan Suleyman, yang juga merupakan salah satu pendiri DeepMind (perusahaan AI yang diakuisisi Google senilai 400 juta dollar AS pada 2014). Salah satu sosok kunci lainnya adalah Dr. Dominic King, Wakil Presiden Kesehatan Microsoft AI, dan mantan pemimpin di Google Health dan Google DeepMind.
“Ada dua hal yang sangat kami banggakan: menciptakan tolok ukur baru untuk menguji performa AI, dan membuktikan bahwa sistem orchestrator kami tampil luar biasa melampaui tolok ukur tersebut,” ujar King sebagaimana dikutip Newsweek. “Ini mungkin adalah proyek paling menegangkan dan menggairahkan yang pernah saya kerjakan.”
Setiap hari, lebih dari 50 juta pencarian terkait kesehatan dilakukan melalui produk Microsoft yang menggunakan AI, seperti Copilot, Bing, Edge, dan MSN. Masyarakat kini semakin mengandalkan AI untuk memahami keluhan fisik atau gejala medis, dari sekadar sakit kepala hingga kondisi serius lainnya.
“Kami punya AI bernama Copilot, dan orang-orang datang untuk bicara soal kecemasan mereka, sakit kepala anak mereka, hingga penyakit yang mereka takutkan,” kata Suleyman. “Ini adalah percakapan yang berlangsung terus-menerus. Copilot bisa bekerja lebih baik jika punya pemahaman diagnostik yang kuat.”
Penelitian Microsoft ini juga bisa membawa manfaat besar bagi dunia medis, seperti membantu dokter mencapai diagnosis yang lebih akurat, dengan lebih cepat dan biaya lebih murah.
Di Amerika Serikat saja, sekitar 7,4 juta orang salah diagnosis di ruang gawat darurat setiap tahun. Dari jumlah tersebut, 1 dari 350 kasus menyebabkan kematian atau kecacatan permanen, menurut studi 2023 dari Agency for Healthcare Research and Quality.
Selain itu, miliaran dolar dihabiskan untuk tes yang tidak perlu, memperburuk biaya kesehatan nasional dan meruncingkan hubungan antara rumah sakit dan perusahaan asuransi.
Saat ini, Microsoft tengah bekerja sama dengan sejumlah institusi kesehatan (yang belum disebutkan namanya) untuk melakukan uji coba lanjutan dan mengulang kesuksesan awal dari MAI-DxO.
“Ini adalah sinyal awal yang sangat menjanjikan,” ujar King, “Tapi kami melihat ini sebagai perjalanan panjang bertahun-tahun yang butuh kolaborasi intensif dari seluruh sistem layanan kesehatan agar bisa berjalan dengan benar.”
AI tak hanya mampu menggantikan proses diagnosis manusia, tapi bisa menjadi alat bantu penting yang menyelamatkan nyawa, menekan biaya, dan mempercepat pelayanan medis. Dunia medis sedang berubah, dan AI ada di garis depan perubahan itu.
© Copyright @2025 LIDEA. All Rights Reserved.