Friday, January 5, 2007

Karakter Mandarin Diurutkan Berdasarkan Apa?

Pada umumnya, kita tahu bahwa karakter Latin itu diurutkan mulai dari huruf a, b, c, hingga terakhir z. Nah, karakter Mandarin sebenarnya diurutkan berdasarkan apa?

Suatu hari, di kelas kuliahku Advance Database, pertanyaan ini pernah ditanyakan kepada orang asli Taiwan yang terpelajar (lagi S2 loh..). Setelah mereka memikir agak lama..... mereka tidak bisa menjawab! Jawaban akhirnya adalah karakter Mandarin (Taiwan) diurutkan berdasarkan kode internal. Mereka sama sekali tidak pernah mempersoalkan urutan, apalagi memperhatikannya.

Berdasarkan Windows Mandarin (China) yang kupakai, karakter Mandarin (China) diurutkan berdasarkan Hanyu Pinyin (bentuk Latin dari huruf Mandarin). Dan aku yakin jika pertanyaan di atas tadi ditanyakan kepada orang Tiongkok, mereka bisa menjawabnya dengan cepat! (urut berdasarkan pinyin).

Bukankah urutan sangat penting di dalam penyimpanan data atau database? Perintah SQL saja ada ORDER BY.

Penasaran dengan hal sepele tetapi penting ini, akhirnya saya menemukan cara pengurutan setiap bahasa, melalui setting Windows!

Coba lihat salah satu cara pengurutan pada gambar di bawah ini:


Nama file paling atas dalam Hanyu Pinyin adalah Liu De Hua..., depannya L.

File kedua teratas: Zhou Jie Lun..., depannya Z.

Sedangkan file kedua terbawah: Rong Zu Er..., depannya R!

Dari L, pindah huruf terakhir Z, lalu balik R lagi --> tidak urut. Pengurutan tidak sesuai dengan Hanyu Pinyin, ini karena setting pada Regional and Language Options adalah:

Saya pakai Windows Mandarin (China), harap maklum :P. Maksud setting di atas adalah menggunakan standard format Indonesia. Tidak salah kalau pengurutan karakter Mandarinnya jadi kacau. Standard format English (US) juga menghasilkan cara pengurutan yang sama.

Sekarang coba lihat cara pengurutan yang benar di bawah ini:

File pertama: Liu De Hua..., depannya L.

File kedua: Pan Wei Bai..., depannya P.

File kelima: Rong Zu Er..., depannya R.

File terakhir: Yang Cheng Lin..., depannya Y.

Huruf-huruf L, P, R, Y, susunannya telah urut abjad (Hanyu Pinyin), ini karena setting format standard adalah Chinese (PRC), ditunjukkan pada gambar di bawah:

Kenapa orang Taiwan tidak tahu bahwa karakternya diurutkan berdasarkan pinyin juga? Karena memang tidak! Coba lihat cara pengurutan dengan format standard Chinese (Taiwan) di bawah ini:


File pertama: Cao Ge..., depannya C.

File kedua: Guo Fu Cheng..., depannya G.

File kedua terakhir: Cai Min You..., depannya C! Dari G, belakang kembali ke C, depan.

Mengingat jawaban orang Taiwan di atas, rasanya memang karakter Mandarin diurutkan berdasarkan kode internal menurut standard Taiwan. Mengapa karakter Mandarin Taiwan tidak diurutkan dengan cara yang lebih masuk akal? Entah bagaimana ya kalau mereka mencari satu nama di antara daftar nama yang panjang?

No comments:

Post a Comment