Kajian: Chatbot kesihatan AI Google lulus peperiksaan perubatan AS

Donna

PARIS, 13 Julai — Chatbot perubatan yang dikuasakan kecerdasan buatan Google telah mencapai gred lulus dalam peperiksaan pelesenan perubatan AS yang sukar, tetapi jawapannya masih kurang daripada jawapan daripada doktor manusia, kata kajian semakan rakan sebaya semalam.

Tahun lepas keluaran ChatGPT — yang pembangunnya OpenAI disokong oleh pesaing Google, Microsoft — memulakan perlumbaan antara gergasi teknologi dalam bidang AI yang sedang berkembang.

Walaupun banyak yang telah dibuat tentang kemungkinan masa depan – dan bahaya – AI, kesihatan adalah satu bidang di mana teknologi telah menunjukkan kemajuan yang ketara, dengan algoritma dapat membaca imbasan perubatan tertentu serta manusia.

Google mula-mula memperkenalkan alat AInya untuk menjawab soalan perubatan, yang dipanggil Med-PaLM, dalam kajian pracetak pada bulan Disember. Tidak seperti ChatGPT, ia belum dikeluarkan kepada umum.

Gergasi teknologi AS itu berkata Med-PaLM ialah model bahasa besar pertama, teknik AI yang dilatih pada sejumlah besar teks yang dihasilkan manusia, untuk lulus Peperiksaan Pelesenan Perubatan AS (USMLE).

Gred lulus untuk peperiksaan, yang diambil oleh pelajar perubatan dan pakar perubatan dalam latihan di Amerika Syarikat, adalah sekitar 60 peratus.

Pada bulan Februari, satu kajian mengatakan bahawa ChatGPT telah mencapai keputusan lulus atau hampir lulus.

Dalam kajian semakan rakan sebaya yang diterbitkan dalam jurnal alam semula jadi semalam, penyelidik Google berkata Med-PaLM telah mencapai 67.6 peratus pada soalan aneka pilihan gaya USMLE.

“Med-PaLM menunjukkan prestasi yang menggalakkan, tetapi kekal lebih rendah daripada doktor,” kata kajian itu.

Untuk mengenal pasti dan mengurangkan “halusinasi” – nama apabila model AI menawarkan maklumat palsu – Google berkata ia telah membangunkan penanda aras penilaian baharu.

Karan Singhal, penyelidik Google dan pengarang utama kajian baharu itu, memberitahu AFP bahawa pasukan itu telah menggunakan penanda aras untuk menguji versi baharu model mereka dengan hasil yang “sangat menarik”.

Med-PaLM 2 telah mencapai 86.5 peratus pada peperiksaan USMLE, mengatasi versi sebelumnya sebanyak hampir 20 peratus, menurut kajian pracetak yang dikeluarkan pada Mei yang belum disemak oleh rakan sebaya.

‘Gajah di dalam bilik’

James Davenport, seorang saintis komputer di Universiti Bath di UK yang tidak terlibat dalam penyelidikan, berkata “terdapat gajah di dalam bilik” untuk chatbot perubatan berkuasa AI ini.

Terdapat perbezaan besar antara menjawab “soalan perubatan dan perubatan sebenar,” yang termasuk mendiagnosis dan merawat masalah kesihatan yang tulen,” katanya.

Anthony Cohn, pakar AI di Universiti Leeds UK, berkata halusinasi mungkin akan sentiasa menjadi masalah bagi model bahasa yang besar itu, kerana sifat statistiknya.

Oleh itu model ini “harus sentiasa dianggap sebagai pembantu dan bukannya pembuat keputusan muktamad,” kata Cohn.

Singhal berkata bahawa pada masa hadapan Med-PaLM boleh digunakan untuk menyokong doktor untuk menawarkan alternatif yang mungkin tidak dianggap sebaliknya.

The jurnal dinding jalan melaporkan awal minggu ini bahawa Med-PaLM 2 telah menjalani ujian di hospital penyelidikan Klinik Mayo AS yang berprestij sejak April.

Singhal berkata beliau tidak boleh bercakap mengenai perkongsian khusus.

Tetapi dia menekankan bahawa sebarang ujian tidak akan “klinikal, atau dihadapi pesakit, atau boleh menyebabkan kecederaan pesakit”.

Ia sebaliknya untuk “tugas pentadbiran yang lebih mudah diautomatikkan, dengan kepentingan yang rendah,” tambahnya. — AFP

Related Post

Leave a Comment