Beberapa waktu yang lalu pernah dibahas tentang cara penggunaan OmegaT secara singkat yang diantaranya sedikit menyinggung memori terjemahan atau translation memory. Dalam kesempatan ini akan dibahas secara lebih mendalam tentang keberadaan memori terjemahan dalam OmegaT dan bagaimana keterkaitannya dengan efisiensi dan efektivitas proses penerjemahan.
1.1. folder tmx - lokasi dan kegunaan
Proyek OmegaT dapat mempunyai beberapa file memori terjemahan - i.e. file berekstensi tmx - di empat tempat berbeda:
Folder omegaT berisi project_save.tmx dan barangkali sejumlah file TMX cadangan. File project_save.tmx berisi semua segmen yang telah terekam di memori sejak Anda memulai proyek. File ini selalu ada di dalam proyek. Isinya akan selalu diurut menurut abjad berdasarkan segmen sumber.
Folder main project berisi 3 file tmx, project_name-omegat.tmx, project_name-level1.tmx dan project_name-level2.tmx (project_name sebagai nama proyek Anda).
- File level 1 berisi hanya informasi textual.
- File level 2 melingkupi tag spesifik OmegaT pada tag tmx yang benar sehingga file tersebut dapat digunakan dengan informasi pemformatannya dalam suatu alat bantu terjemahan yang mendukung memori tmx level 2, atau OmegaT itu sendiri.
- File OmegaT mencakup tag pemformatan spesifik OmegaT sehingga file tersebut dapat digunakan dalam proyek OmegaT lain
Semua file ini merupakan salinan file project_save.tmx, yaitu memori terjemahan utama proyek, tidak termasuk apa yang disebut sebagai segmen piatu (orphan segment). Mereka membawa nama yang diubah secara layak, sehingga isinya masih tetap dapat dikenali, ketika digunakan di lain tempat, misalnya di subfolder tm dari suatu proyek lain (lihat di bawah ini).
Folder /tm/ folder dapat berisi sejumlah memori terjemahan pelengkap - yaitu file tmx. File tersebut dapat dibuat dalam salah satu ketiga variasi yang tercantum di atas. Catat bahwa alat bantu terjemahan (CAT) lain dapat mengekspor (dan juga mengimpor) file tmx, biasanya dalam ketiga bentuk tersebut. Hal terbaik tentu saja menggunakan file TMX spesifik-OmegaT (lihat di atas), bahwa pemformatan segaris di dalam segmen dipertahankan.
Isi memori terjemahan dalam subfolder tm menghasilkan saran untuk teks yang akan diterjemahkan. Setiap teks, yang pernah diterjemahkan dan disimpan di dalam file tersebut, akan muncul di antara fuzzy match, jika teks tersebut cukup mirip dengan teks yang sedang diterjemahkan.
Jika segmen sumber dalam salah satu TM pelengkap serupa dengan teks yang sedang diterjemahkan, OmegaT bertindak sebagaimana ditetapkan dalam jendela dialog Options → Editing Behavior.... Sebagai contoh (jika default diterima), terjemahan dari TM pelengkap diterima dan diawali dengan [fuzzy], sehingga penerjemah dapat mengkaji terjemahan pada tahap akhir dan memeriksa apakah segmen memiliki susunan tag seperti itu, telah diterjemahkan dengan benar (lihat bab Editing behavior).D:\TRANSLATION\Omega T Translation Memories\target\chapter.translation.editing.html
Bisa saja terjadi memori terjemahan yang ada dalam subfolder tm berisi segmen dengan teks sumber yang serupa, tetapi dengan teks sumber yang berbeda. File TMX dibaca urut berdasarkan nama dan segmennya di dalam suatu file TMX tertentu baris per baris. Segmen terakhir dengan teks sumber yang serupa kemudian oleh karenanya akan berlaku (Catatan: tentu saja lebih masuk akal untuk menghindari terjadinya hal ini sejak awal).
Jika jelas sedari awal bahwa terjemahan dalam suatu TM tertentu semuanya benar, penerjemah dapat meletakkannya dalam folder tm/auto dan menghindari konfirmasi banyaknya kasus [fuzzy]. Hal ini akan secara efektif menerjemahkan lebih dulu teks sumber: semua segmen dalam teks sumber, dimana terjemahan dapat dijumpai dalam TM "auto" tersebut, akan sampai di TM utama proyek tersebut tanpa intervensi pengguna.
Sebagai pilihan lain, Anda dapat membuat OmegaT memiliki file tmx tambahan (gaya OmegaT) di mana saja Anda tentukan, yang berisi semua segmen dapat diterjemahkan dari proyek tersebut. Lihat memori terjemahan semu di bawah ini.
Catat bahwa semua memori terjemahan dimuat kedalam memori pada saat proyek dibuka. Cadangan dihasilkan secara reguler atas memori terjemahan proyek (lihat bab berikut), dan project_save.tmx juga disimpan/dimutakhirkan pada saat proyek tersebut ditutup atau dimuat lagi. Hal ini berarti bahwa Anda tidak perlu keluar dari suatu proyek yang sedang Anda kerjakan jika Anda memutuskan untuk menambahkan TM pelengkap padanya: Anda cukup memuat kembali (reload) proyek tersebut, dan perubahan yang telah Anda lakukan akan termasuk di dalamnya.
Lokasi berbagai memori terjemahan yang berbeda untuk suatu proyek tertentu ditetapkan oleh pengguna (lihat jendela dialog Project dalam pedoman Instant start)D:\TRANSLATION\Omega T Translation Memories\target\chapter.instant.start.guide.html
Tergantung situasinya, strategi yang berbeda karenanya dimungkinkan, misalnya:
beberapa proyek mengenai subyek yang sama: pertahankan struktur proyek, dan ubah direktori sumber dan sasaran (Sumber = source/order1, sasaran = target/order1 etc). Catat bahwa segmen dari order1, yang tidak ada dalam order2 dan tugas lain berikutnya, akan memiliki susunan tag sebagai segmen piatu; akan tetapi, mereka masih akan berguna untuk memperoleh fuzzy match.
beberapa penerjemah yang mengerjakan proyek yang sama: bagi file sumber menjadi source/Alice, source/Bob... dan alokasikan file tersebut ke anggota tim (Alice, Bob ...). Mereka dapat menciptakan proyeknya sendiri dan, menyerahkan project_save.tmx mereka sendiri, pada saat selesai atau pada saat tonggak tertentu telah dicapai. File project_save.tmx kemudian terkumpul dan kemungkinan konflik berkenaan dengan terminologi dapat diselesaikan. Versi baru TM induk kemudian tercipta, baik untuk diletakkan dalam tm/autosubdirectory anggota tim atau menggantikan file project_save.tmx mereka. Tim juga dapat menggunakan struktur subfolder yang sama untuk file sasaran tersebut. Hal ini memungkinkan mereka untuk memeriksa setiap saat apakah versi sasaran untuk proyek yang rampung masih OK
Saat Anda menerjemahkan file, OmegaT menyimpan hasil kerja Anda secara berkesinambungan dalam project_save.tmx dalam subdirektori /omegat proyek tersebut.
OmegaT juga merekam cadang memori terjemahan ke project_save.tmx.YEARMMDDHHNN.bak dalam subfolder yang sama ketika sebuah proyek dibuka atau dimuat ulang. YEAR adalah tahun berjumlah 4 digit, MM adalah bulan, DD hari bulan, HH dan NN adalah jam dan menit pada saat memori terjemahan sebelumnya tersimpan.
Jika Anda yakin bahwa telah terjadi kehilangan data terjemahan, ikuti prosedur berikut ini:
- Tutup proyek
- Namai ulang file project_save.tmx (misalnya menjadi project_save.tmx.temporary)
- Pilih memori terjemahan cadangan yang paling bisa dipastikan - misalnya yang terbaru, atau versi terakhir dari hari sebelumnya) berisi data yang Anda sedang cari
- Salin ke project_save.tmx
- Buka proyek
file tmx berisi unit terjemahan, yang terdiri dari sejumlah segmen setara dalam beberapa bahasa. Sebuah unit terjemahan terdiri dari sekurang-kurangnya dua variasi unit terjemahan. Salah satunya dapat digunakan sebagai sumber atau sasaran.
Pengaturan dalam proyek Anda menandakan mana yang bahasa sumber dan mana yang bahasa sasaran. OmegaT oleh karenanya mengambil segmen variasi unit terjemahan yang bersesuaian dengan kode bahasa sumber dan sasaran proyek tersebut dan menggunakannya sebagai segmen sumber dan sasaran. OmegaT mengenali kode bahasa dengan menggunakan dua kaidah baku berikut ini:
- 2 huruf (misalnya JA untuk Japanese atau bahasa Jepang), atau
- kode bahasa 2- atau 3-huruf yang diikuti dengan kode negara 2-huruf (misalnya EN-US - Lihat daftar kode Appendix E, Languages - ISO 639 untuk sebagian daftar kode bahasa dan negara).D:\TRANSLATION\Omega T Translation Memories\target\appendix.languages.html
Jika kode bahasa proyek dan kode bahasa tmx sepenuhnya cocok, segmennya dimuat kedalam memori. Jika bahasanya cocok namun bukan negaranya, segmennya tetap akan dimuat. Jika baik kode bahasanya maupun kode negaranya tidak cocok, segmennya akan diabaikan.
File TMX pada umumnya dapat berisi unit terjemahan dengan beberapa kandidat bahasa. Jika untuk suatu segmen sumber tertentu tidak ada masukan untuk bahasa sasaran terpilih, semua segmen sasaran lain dimuat, terlepas dari bahasanya. Sebagai contoh, jika pasangan bahasa proyek tersebut adalah DE-FR, ada yang kena sasaran dalam terjemahan DE-EN masih bisa berguna, jika tidak ada satu pun yang kena sasaran dalam pasangan DE-FR.
File project_save.tmx berisi semua segmen yang telah diterjemahkan sejak Anda memulai proyek tersebut. Jika Anda mengubah segmentasi proyek atau menghapus file dari sumber, sebagian padanan dapat muncul sebagai untai piatu dalam Match Viewer: padanan tersebut mengacu ke segmen yang tidak ada lagi dalam dokumen sumber, karena padanan tersebut bersesuaian dengan segmen yang telah diterjemahkan dan direkam sebelum perubahan terjadi.
No comments:
Post a Comment