Common Voice Hadir dalam Lebih Banyak Bahasa

Kami kabarkan dengan gembira bahwa Common Voice, inisiatif Mozilla untuk menghimpun semua data suara manusia untuk dipakai dalam teknologi suara, akan menghadirkan lebih banyak bahasa! Berkat upaya yang luar biasa dari komunitas Mozilla dan para mitra kami yang sangat aktif, sekarang Anda dapat mendonasikan suara Anda dalam bahasa Jerman, Perancis dan Welsh, dan kami tengah mempersiapkan peluncuran 40 bahasa lainnya lagi. Namun, ini hanyalah permulaan. Kami ingin Common Voice menjadi alat bagi komunitas apapun untuk menyediakan teknologi suara dalam bahasa mereka sendiri.

Karena kami meluncurkan Common Voice Juli lalu, kami telah berhasil mengumpulkan ratusan ribu sampel suara dalam bahasa Inggris melalui situs kami dan aplikasi iOS. November lalu, kami menayangkan versi pertama dataset Common Voice. Data ini telah diunduh ribuan kali dan kami mencatat data ini telah dipakai dalam produk-produk suara komersial dan piranti lunak open source seperti Kaldi dan proyek Deep Speech, mesin pengenal suara Mozilla sendiri.

Hingga kini, Common Voice baru tersedia dalam bahasa Inggris. Akan tetapi, Common Voice selalu bertujuan mendukung banyak bahasa sehingga kami bisa memenuhi misi kami untuk membuat teknologi suara lebih terbuka, dapat diakses dan lebih inklusif bagi siapapun. Itulah alasan mengapa upaya utama kami selama beberapa bulan terakhir berfokus pada pertumbuhan dan pemberdayaan komunitas-komunitas bahasa untuk meluncurkan Common Voice di berbagai belahan dunia, dalam bahasa dan dialek setempat.

Di samping melokalkan situs ini, komunitas-komunitas ini mengisi Common Voice dengan kalimat-kalimat yang bebas dari hak cipta sehingga dapat dibaca semua orang yang memiliki karakteristik wajib tersebut untuk dataset berkualitas tinggi. Mereka juga membantu mempromosikan situs ini di negara-negara mereka, membangun sebuah komunitas kontributor, dengan tujuan menaikkan jumlah total jam data yang tersedia dalam setiap bahasa.

Selain bahasa Inggris, kami sekarang tengah menghimpun sampel-sampel suara dalam bahasa Perancis, Jerman dan Welsh. Dan telah ada lebih dari 40 bahasa lainnya yang tengah dalam pengerjaan - tidak hanya bahasa-bahasa besar seperti bahasa Spanyol, Mandarin atau Rusia, tetapi juga bahasa-bahasa yang lebih kecil seperti Frisian, Norwegia atau Chuvash. Bagi kami, bahasa-bahasa yang lebih kecil ini penting karena mereka kadang kurang terlayani dengan baik oleh layanan-layanan pengenal suara komersial yang sudah ada. Dengan menyediakan data tersebut, kami dapat memberdayakan para entrepreneur dan komunitas untuk mengatasi kesenjangan ini sendiri.

Membidik banyak bahasa menandai sebuah langkah besar bagi Common Voice dan kami berharap hal ini juga langkah besar bagi teknologi suara secara umum. Membuat teknologi suara lebih terbuka tak hanya akan menyingkirkan kendala bagi inovasi global, tetapi juga kendala akses terhadap informasi. Hal ini terutama ditemui pada masayarakat yang secara tradisional memiliki akses lebih rendah - misalnya kelompok tuna netra, orang-orang yang tidak pernah belajar membaca, anak-anak, para manula dan masih banyak lagi yang lain.

Kami sangat bersemangat menyaksikan bertambahnya dukungan yang kami dapatkan dalam membangun dataset suara multibahasa yang terbesar di dunia ini. Anda juga bisa membantu kami sekarang dengan mendonasikan suara Anda. Anda juga bisa menggunakan aplikasi iOS. Jika Anda hendak membantu dengan menyediakan Common Voice dan teknologi suara dalam bahasa Anda, kunjungi laman bahasa kami. Dan jika Anda merupakan bagian dari sebuah organisasi dan memiliki gagasan untuk ikut serta dalam proyek ini, silakan hubungi kami ( Alamat surel ini dilindungi dari robot spam. Anda perlu mengaktifkan JavaScript untuk melihatnya ).

Forum kami memberikan lebih banyak rincian mengenai cara-cara untuk membantu, dan tempat yang tepat untuk bertanya dan bertemu dengan komunitas.

Ucapan Terima Kasih Khusus

Kami ucapkan terima kasih pada Grup Penasihat Suara kami, yakni mereka yang telah menjadi penasihat pakar dan kontributor untuk proyek Common Voice:

  • Francis Tyers?—?Asisten pengajar di Computational Linguistics, Higher School of Economics, Moskow
  • Gilles Adda?—?Ilmuwan suara
  • Thomas Griffiths?—?Pegawai Layanan Digital, Office of the Legislative Assembly, Australia
  • Joshua Meyer?—? kandidat PhD dalam Speech Recognition
  • Delyth Prys?—?Teknologi bahasa di pusat penelitian Bangor University
  • Dewi Bryn Jones?—?Teknologi bahasa di pusat penelitian Bangor University
  • Wael Farhan?—?MS dalam Machine Learning dari UCSD, saat ini meneliti Arabic NLP di Mawdoo3.com
  • Eren Gölge?—?Ilmuwan pembelajaran mesin yang saat ini mengerjakan TTS untuk Mozilla
  • Alaa Saade?—?Ilmuwan Senior Pembelajaran Mesin @ Snips (Paris)
  • Laurent Besacier?—?Pengajar di Université Grenoble Alpes, NLP, pemrosesan suara, bahasa bersumber daya rendah
  • David van Leeuwen?—?Pakar teknologi ujaran
  • Benjamin Milde?—?kandidat PhD di NLP/pemrosesan ujaran
  • Shay Palachy?—?M.Sc. dalam Ilmu Komputer, Pimpinan Ilmuwan Data dalam sebuah usaha rintisan

***

Common Voice melengkapi karya Mozilla di bidang pengenalan ujaran, yang dijalankan dengan nama proyek “Deep Speech”, sebuah mesin pengenalan suara open-source yang mendekati akurasi manusia, yang dirilis November 2017. Bersama dengan dataset Common Voice kami yakin teknologi ini bisa dan akan memungkinkan terjadi gelombang produk dan layanan inovatif serta bahwa teknologi ini seharusnya terbuka bagi siapa saja.

Sumber : medium.com

Diterjemahkan oleh Akhlis Purnomo.