Untuk mendapatkan maklumat terkini, ikuti kami melalui Telegram
Langgan SekarangKredit foto: Khairul Azhar
Bangi – Ahli terminologi dan pensyarah terjemahan serta linguistik di Université du Québec à Trois-Rivières, YBhg. Profesor Dr. Kara Warburton, menekankan bahawa konteks budaya kebangsaan perlu diintegrasikan dalam peristilahan model bahasa besar (large language model atau LLM) seperti kecerdasan buatan (AI) untuk memastikan hal tersebut memenuhi keperluan rakyat Malaysia.
Menurut beliau, penggunaan AI yang tidak dikontekstualisasikan atau disesuaikan dengan latar belakang budaya Malaysia yang pelbagai boleh membawa kesan yang memudaratkan. Jawapan kepada carian atau arahan (prompt) mungkin tidak relevan dengan konteks masyarakat Malaysia.
“Jika masyarakat tempatan terus menggunakan LLM dalam bahasa Inggeris yang asasnya berlandaskan budaya Amerika Syarikat, keadaan ini akan memberikan kesan kepada identiti masyarakat, dan saya rasa itu bakal menjadi masalah besar.”
Dalam pembentangan kertas ucap utama II Persidangan Antarabangsa Peristilahan (PERANTIS) 2024, beliau juga menekankan bahawa Malaysia mempunyai sejarah leksikografi bahasa Melayu yang telah dibina berabad lamanya. Oleh itu, pakar bahasa perlu memanfaatkan asas berbentuk karya kreatif dan warisan intelektual yang ditinggalkan oleh nenek moyang untuk melaksanakan tanggungjawab sosial dalam mengintegrasikan kandungan bahasa Melayu ke dalam sistem LLM dan AI.
“Pada pendapat saya, integrasi kandungan bahasa Melayu dalam sistem LLM ialah perkara utama yang perlu dilakukan, terutamanya kandungan berkaitan dengan budaya, identiti dan istilah tempatan yang unik kepada warga Malaysia. Semua elemen ini akan menjadi sangat penting dalam penambahbaikan sistem LLM pada masa hadapan,” jelas beliau dalam temu bual eksklusif bersama-sama wartawan JendelaDBP di Persidangan Antarabangsa Peristilahan (PERINTIS) 2024 hari ini.
Hal ini membawa kepada isu yang sering dibangkitkan, iaitu apakah langkah untuk merapatkan jurang sosiolinguistik dalam LLM bagi populasi Malaysia yang heterogen dari segi etnik dan bahasa?
Beliau mencadangkan agar usaha khusus dalam membina sumber pengetahuan luaran (external source knowledge) seperti rangkaian semantik, ontologi dan taksonomi bahasa Melayu yang tepat berdasarkan kepelbagaian masyarakat Malaysia dapat dilaksanakan.
YBhg. Profesor Dr. Kara Warburton juga meramalkan bahawa masalah yang mungkin timbul dengan pembangunan LLM tempatan ialah penyalahgunaan harta intelek. Oleh itu, Malaysia perlu menetapkan tadbir urus yang ketat ke atas LLM tersebut bagi memastikan bahan harta intelek tidak digunakan sebagai sumber pengetahuan luaran.
“Selain itu, antara cara yang boleh digunakan untuk memastikan harta intelek tidak disalahgunakan termasuklah dengan memaparkan sumber maklumat dalam jawapan AI bagi mengekalkan ketelusan,” tambah beliau.
Beliau juga mengakui bahawa membina sumber pengetahuan luaran adalah kompleks, dan mencadangkan pembinaan model bahasa besar tempatan sebagai penyelesaian yang lebih baik untuk menangkap kandungan yang benar-benar spesifik kepada Malaysia dalam bahasa Melayu.
Namun, untuk merealisasikan integrasi bahasa Melayu dan budaya Malaysia dalam sesebuah LLM, beliau menegaskan bahawa pihak berkuasa perlu menetapkan tatacara tadbir urus yang efisien ke atas LLM yang digunakan di Malaysia.
Jika Malaysia ingin mengawal penggunaan maklumat dan dapatan kembali maklumat (information retrieval) oleh AI, YBhg. Profesor Dr. Kara Warburton juga mencadangkan agar pihak kerajaan membina LLM sendiri, kerana model generik seperti GPT-4 ialah kotak hitam (black box) yang sukar dikawal akan kandungannya oleh pakar tempatan.