PHPTOTO – Mpathic, sebuah startup dari Seattle, baru-baru ini meluncurkan mPACT, sebuah alat evaluasi yang dirancang untuk menilai bagaimana berbagai model kecerdasan buatan (AI) menangani percakapan berisiko tinggi, seperti risiko bunuh diri, gangguan makan, dan penyebaran informasi yang salah. Meskipun model-model terkemuka menunjukkan kemajuan dalam menghindari respons berbahaya dan mengidentifikasi tanda-tanda distress, hasil penelitian menunjukkan bahwa respons yang diberikan masih jauh dari memadai dalam situasi krisis nyata.

Grin Lord, CEO dan salah satu pendiri Mpathic, menekankan bahwa banyak individu tidak langsung mengungkapkan rasa risiko mereka, tetapi menunjukkan melalui perilaku yang halus. Ia menambahkan bahwa meskipun model-model ini semakin baik dalam mengenali momen krisis, respons yang diberikan masih membutuhkan nuansa dan dukungan yang nyata.

Dari hasil evaluasi mPACT, model Claude Sonnet 4.5 mencatat skor tertinggi, dengan kemampuan mendeteksi dan merespons yang paling mirip dengan reaksi klinis manusia dalam konteks risiko bunuh diri. Di sisi lain, model GPT-5.2 paling baik dalam menghindari tindakan berbahaya, namun terkadang kurang proaktif. Untuk risiko gangguan makan, hasil menunjukkan bahwa semua model masih berada di bawah standar, mengingat kompleksitas dan normalisasi risiko tersebut dalam masyarakat.

Selain itu, evaluasi terhadap penyebaran informasi yang salah menunjukkan bahwa banyak model tidak langsung menyebarkan informasi keliru, tetapi malah memperkuat kepercayaan yang diragukan. Alison Cerezo, Kepala Ilmu Mpathic, menekankan pentingnya standar perilaku yang berbasis klinis untuk sistem AI, sehingga transparansi dan akuntabilitas bisa terjaga.

Mpathic, yang didirikan pada tahun 2021, sebelumnya berfokus pada pengembangan komunikasi yang lebih empatik di lingkungan korporat, kini berkomitmen untuk meningkatkan keamanan AI di berbagai bidang, termasuk kesehatan mental dan dukungan pelanggan.