Využití překladových pamětí
 18  VI
Soubor ke stažení: cs_vi


Obsah

Nội dung

A.

A.

Úvod - charakteristika základních souborů

Giới thiệu - đặc tính của bộ cơ bản

B.

B.

Podrobnější charakteristika

Thông số kỹ thuật chi tiết

C.

C.

Využití překladových pamětí (Translation Memory = TM)

Sử dụng bộ nhớ dịch thuật (TM = Translation Memory)

D.Odkazy a ukázky

D. Tham khảo và lấy mẫu

A.

A.

Úvod - charakteristika základních souborů

Giới thiệu - đặc tính của bộ cơ bản

1.

1.

Bitext a tabulka v DOC (RTF)

Bitext một bảng trong Word (RTF)

1.1.

1.1.

Bitext obsahuje texty ve dvou jazycích.

Bitext chứa những bản văn bằng hai ngôn ngữ.

Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné.

Tập tin không chứa mã ngôn ngữ, và mã hóa để người đọc cả hai ngôn ngữ.

Jde nejčastěji o TXT soubor, který může mít národní kódování pro

Nó thường là một tập tin TXT có thể được mã hóa của các quốc gia

a) DOS, Unix (Linux), Mac

a) DOS, UNIX (Linux), Mac

b) ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1250)

b) ANSI (Windows), các trang web của các ngôn ngữ quốc gia và tương đương cho HTM (Séc Win-1250)

Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce).

Các bảng trong Word (RTF) tài liệu có chứa các mã ngôn ngữ của các trường có chứa văn bản (các nguồn và ngôn ngữ mục tiêu).

c) UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16

c) UTF-8 được sử dụng thường xuyên nhất, bởi vì cả hai ngôn ngữ là con người có thể đọc được, nó được sử dụng cho các tập tin bản đồ (UTF-7 là không được sử dụng trong ngành công nghiệp dịch) và các tập tin được nhỏ hơn trong UTF-16

d) Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd.

d) Unicode (UTF-16) sử dụng MS Word và các chương trình (CAT), mà nó hoạt động để hiển thị các tập tin văn bản, nó có thể là một chương trình chuyển đổi của địa phương hoặc cơ sở dữ liệu web,, vv

e) Unicode Big Endian pro zobrazení východoasijského písma (CJK = čínština, japonština a korejština)

e) Unicode Big Endian để xem các font Đông Á (CJK = tiếng Trung, tiếng Nhật, và Hàn Quốc)

1.2.

1.2.

Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI

Các bảng trong Word (RTF) các tài liệu có chứa mã ngôn ngữ và văn bản được lưu trữ trong ANSI

2.

2.

Glosář a obdobné soubory

Thuật ngữ và tương tự như các tập tin

Slovník - obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady.

Từ điển - có chứa mật khẩu + nói + + + các hình thức từ các ví dụ về việc sử dụng các bản dịch.

Bývá tříděn abecedně podle hesel.

Được sắp xếp theo thứ tự abc theo mục.

Překladový slovník - obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi

Dịch từ điển - có chứa một biểu thức bao gồm 1-5 từ và bản dịch của mình và được lưu trữ trong cơ sở dữ liệu

Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole)

Thuật ngữ - có chứa các từ từ một đến năm chữ và bản dịch của mình và được lưu trữ trong một tập tin văn bản hoặc XLS (tối đa hai lĩnh vực)

Glosář - slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí

Thuật ngữ - một glossary + lĩnh vực bổ sung cho các quan sát và dữ liệu eventuáleně như có thể được các thuộc tính của những kỷ niệm dịch thuật

3.

3.

Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu

Phân đoạn tài liệu Trados (DOC hoặc RTF), uncleaned giấy xếp trong MS Word

Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word.

Thường phát sinh trong quá trình dịch thuật tại Cat công cụ, trong đó sử dụng một trình soạn thảo văn bản MS Word.

Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru.

Đôi khi nó xuất khẩu ứng dụng đã được sử dụng để dịch các loại tập tin khác.

Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody.

Tài liệu chứa đựng một đơn vị dịch thuật, nghĩa là một cặp câu, nơi câu đầu tiên là trong ngôn ngữ nguồn và câu thứ hai trong các ngôn ngữ mục tiêu, nhãn hiệu ly thân và con số, mà thể hiện tỷ lệ tuân thủ.

4.

4.

Překladová paměť

 

4.1.

4.1.

Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru.

Mỗi công cụ CAT sử dụng (bản địa) loại tập tin riêng của họ.

Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM.

Tiếng Anh Translation Translation Bộ nhớ và bộ nhớ được gọi là TM viết tắt.

Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů.

Mặc dù các dữ liệu chứa trong bộ nhớ dịch thuật tương tự, định dạng khác nhau, cấu trúc dữ liệu, tập các loại.

Je to např.

Ví dụ

TXT, ESL, DBF, MDB, TBW, SQL.

TXT, ESL, DBF, MDB, TBW, SQL.

CAT s nimi pracuje jako s databázovým souborem.

CAT làm việc với một tập tin cơ sở dữ liệu.

Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit.

Dữ liệu người dùng có thể không có bản dịch bộ nhớ Cat công cụ để chỉnh sửa, nếu dữ liệu này được thấy trong các công cụ khác, công cụ để kích hoạt nó để lưu tập tin sửa đổi.

4.2.

4.2.

Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode.

Translation Memory Exchange (TMX) là một tập tin văn bản với TMX, được mã hóa trong hoặc UTF-8 hoặc Unicode.

B.

B.

Podrobnější charakteristika

Thông số kỹ thuật chi tiết

1.

1.

Bitext

Bitext

Bitext je možno vytvořit

Bitext có thể tạo

a) konverzí dvou sloupců z listu XLS souboru nebo listu jiné tabulkového procesoru

a) chuyển đổi hai cột từ một tập tin xls bảng hoặc bảng bất kỳ bảng tính khác

b) přiřazením segmentů souborů ( přiřadit je anglicky "align" a přiřazení "alignment"

b) việc phân công phân đoạn tập tin (chỉ định nó sang tiếng Anh "align" và gán "alignment"

c) konverzí ta z tabulky nebo jiných typů souborů, kdy dojde ke ztrátě atributů a časového razítka

c) chuyển đổi từ một bảng hoặc các loại tập tin khác, mà mất đi các thuộc tính và thời gian tem

Příklad konverze: v MS Exelu je možno soubor "Uložit jako" vybrat vhodný formát; v MS Wordu se konverze provádí přes položku menu Tabulka a potom se pokračuje jako v MS Exelu

Chuyển đổi Ví dụ: MS Exel có thể nộp "Save As" để chọn định dạng thích hợp, trong MS Word chuyển đổi được thực hiện thông qua trình đơn Bảng và sau đó tiếp tục như trong MS Exel

2.

2.

Glosář

Thuật ngữ

Elektronické překladové slovníky umožňují přidávání a export terminologie.

Từ điển điện tử cho phép để thêm dịch thuật và các thuật ngữ xuất khẩu.

Do slovníku je možno přidávat jednotlivé významové dvojice a třídící poznámky.

Từ điển có thể được thêm một cặp ý nghĩa cá nhân và ghi chú phân loại.

Autoři slovníků šifrují obsah svojí databáze a neumožňují export dat.

Các tác giả của bộ từ điển để mã hóa các nội dung trong cơ sở dữ liệu của nó và không xuất dữ liệu.

Z komerčních slovníků je možno exportovat pouze uživatelem přidanou terminologii.

Các từ điển thương mại có thể được xuất chỉ bằng thuật ngữ được thêm vào.

Příklad: v PC Translatoru je možno přidávat do slovníku kromě významové dvojice pouze kód oboru.

Ví dụ: các Translator máy tính có thể được thêm vào từ điển ý nghĩa hơn một cặp chỉ của trường mã.

Je možno přidávat jednotlivé významové dvojice nebo celé soubory a potom shodné výrazy smazat.

Có thể thêm các cặp vợ chồng có nghĩa khác nhau hoặc toàn bộ tập tin và sau đó xóa các điều khoản tương tự.

Export vlastní terminologie je možno archivovat a importovat do novější verze softwaru.

Xuất khẩu thuật ngữ của riêng có thể được lưu trữ và nhập khẩu vào một phiên bản mới của phần mềm.

Shrnutí: glosáře z CAT nástrojů je možno po konverzi využít v jiných CAT nástrojích a také v překladačích.

Tóm tắt: Bảng thuật ngữ của các công cụ CAT có thể được sử dụng trong việc chuyển đổi khác CAT các công cụ và các trình biên dịch.

Do CAT nástrojů je možno připojovat i terminologii z překladačů nebo jiných veřejně dostupných zdrojů.

Bởi CAT công cụ có thể kết nối các thuật ngữ của trình biên dịch hoặc các nguồn công khai khác.

3.

3.

Segmentovaný dokument Trados

Phân đoạn tài liệu Trados

Dokument obsahuje neviditelná, viditelná a skrytá data.

Tài liệu chứa dữ liệu vô hình, hữu hình và ẩn.

Neviditelná data je možno zkontrolovat po uložení souboru jako HTM a HTM soubor prohlížet jako textový soubor (zdrojový HTM soubor).

Ẩn dữ liệu có thể được kiểm tra để lưu các tập tin dạng HTM và HTM để xem tập tin như là một tập tin văn bản (nguồn HTM file).

Viditelná data obsahují přeložený text.

Visible dữ liệu chứa các văn bản dịch.

Skrytá data obsahují zdrojový text, oddělovací značky a pomocné údaje, jako je procento shody s překladovou pamětí, která byla využita při překladu.

Dữ liệu ẩn chứa các văn bản nguồn, đánh dấu tách và dữ liệu phụ trợ như việc tuân thủ với một tỷ lệ phần trăm bộ nhớ dịch thuật, được sử dụng trong dịch thuật.

Tento formát je standardem a využívá jej kromě Tradosu například Wordfast Classic, AnyMem.

Đây là định dạng chuẩn và sử dụng nó, ngoại trừ như Trados Wordfast Classic, AnyMem.

Načítá jej a exportuje do něj MetaTexis.

Lần đọc nó và xuất khẩu nó để MetaTexis.

Exportuje do něj Wordfast Anywhere a další CAT nástroje a konverzní nástroje.

Xuất khẩu vào bất cứ nơi nào và Wordfast CAT các công cụ khác và các công cụ chuyển đổi.

Tzv. vyčištěním dokumentu (clean-up), je dokument vyčištěn od zdrojového textu a všech pomocných značek a o obsah dokumentu může být rozšířena aktuální překladová paměť jednotlivého CAT nástroje.

Cái gọi là. Tài liệu Cleanup (clean-up), tài liệu đó là làm sạch nguồn từ các văn bản và tất cả các nhãn phụ trợ và nội dung của tài liệu có thể được mở rộng tới các dịch bộ nhớ hiện tại đơn vị công cụ CAT.

Segmentovaný dokument Trados může být využit pro aktualizaci TM, kteří používají různé CAT nástroje.

Trados Segmented tài liệu có thể được dùng để cập nhật TM, sử dụng nhiều công cụ CAT.

4.

4.

Překladová paměť

 

Jednotlivé CAT nástroje umí importovat a exportovat TMX a tím je umožněna výměna dat mezi uživateli různých CAT nástrojů.

Mỗi công cụ CAT có thể nhập khẩu và xuất khẩu TMX và do đó cho phép trao đổi dữ liệu giữa người sử dụng các công cụ khác nhau CAT.

TMX je hlavním prostředkem pro výměnu TM a umí s ní pracovat i nástroje, které nepracují v MS Wordu a nepracují se segmentovaným dokumentem Tradosu.

TMX là chiếc xe chính cho việc trao đổi TM và có thể làm việc với nó cũng như các công cụ mà không làm việc trong MS Word và không làm việc với các tài liệu phân đoạn Trados.

Specifickým nástrojem mezi CAT nástroji je OmegaT.

Cụ thể là dụng cụ giữa các nhạc cụ OmegaT CAT.

Nástroj je napsán v Javě a má tři verze (pro jednotlivé operační systémy:

Công cụ này được viết bằng Java và có ba phiên bản (đối với các hệ điều hành khác nhau:

Windows, Linux a MacIntosh).

Windows, Linux và Macintosh).

Je to open free software.

Đây là phần mềm mở miễn phí.

Pracuje samostatně nebo s Open Officem (typ souboru ODT) a jako svoji překladovou paměť používá TMX v kódování UTF-8.

Công trình một mình hoặc với Open Office (ODT file type) và như là bộ nhớ bản dịch của họ trong TMX sử dụng UTF-8.

C.

C.

Využití překladových pamětí (Translation Memory = TM)

Sử dụng bộ nhớ dịch thuật (TM = Translation Memory)

1.

1.

CAT nástroj do TM ukládá při překládání jednu překladovou jednotku se všemi atributy za druhou

CAT TM công cụ để tiết kiệm khi dịch một đơn vị dịch với tất cả các thuộc tính của thứ hai

2.

2.

CAT nástroj porovnává (match) otevřený zdrojový segment překládaného dokumentu se všemi zdrojovými segmenty připojených překladových pamětí

CAT tool so sánh (trận) đoạn mã nguồn mở của các tài liệu dịch, tất cả các đoạn mã nguồn kết nối TMS

Pozn. anglické "match" - porovnání, vyhovění apod. vnímají Češi častou pouze konfrontačně jako střet - utkání (fotbalový match).

Lưu ý rằng kết hợp "tiếng Anh" - so sánh, tuân thủ, vv Séc thường cảm nhận như là một cuộc xung đột chỉ đối đầu - trận đấu (bóng đá trận).

Zde údaj match = 90, znamená, že segment se shoduje na 90% s nejvíce podobným segmentem v překladové paměti.

Đây thông tin phù hợp = 90, có nghĩa là các phân đoạn là giống nhau đến 90% với các phân đoạn tương tự như hầu hết trong bộ nhớ dịch thuật.

Pro porovnávání se nejčastěji používá Löwensteinův algoritmus.

Để so sánh, các Löwensteinův phổ biến nhất là sử dụng thuật toán.

CAT většinou zobrazí překladové jednotky s nejvyšší shodou, nebo automaticky umístí překlad do cílového segmentu a umí také zobrazit rozdíly mezi zdrojovými segmenty v dokumentu a v překladové paměti.

CAT thường xuất hiện đơn vị dịch với sự đồng thuận cao nhất, hoặc tự động đặt một bản dịch vào phân đoạn mục tiêu và cũng có thể thấy sự khác nhau giữa các phân đoạn trong các nguồn tài liệu và bộ nhớ dịch thuật.

3.

3.

Pokud segmenty (věty) neobsahují více než 10 slov jsou častou poskytovány 100% nabídky z TM.

Nếu các phân đoạn (câu) không quá 10 từ thường được cung cấp 100% nguồn cung của TM.

Dlouhé věty (třeba o 50 až 200 slovech) lze najít tehdy, když nový dokument obsahuje citace z předchozích dokumentů, zejména právnických, aktualizace příruček, návodů k obsluze apod.

Câu Long (có lẽ 50-200 từ) có thể được tìm thấy nếu tài liệu mới có báo giá từ các tài liệu trước đó, đặc biệt là pháp lý, cập nhật hướng dẫn sử dụng, hướng dẫn sử dụng, vv

4.

4.

Konkordační vyhledávání - ruční vyhledávání terminologie z vět uložených v jazykových párech

Konkordační tìm kiếm - hướng dẫn sử dụng tìm kiếm thuật ngữ của câu áp đặt trong cặp ngôn ngữ

5.

5.

Ruční doplňování terminologie do slovníků a glosářů nebo opravy uložené terminologie.

Hướng dẫn sử dụng bổ sung thuật ngữ trong từ điển và glossaries hoặc sửa chữa thuật ngữ được lưu giữ.

6.

6.

Dolování terminologie z vět uložených v jazykových párech.

Khai khoáng thuật ngữ của câu áp đặt trong cặp ngôn ngữ.

Speciální statistický software vyhodnocuje výskyt slov a frází v jazykovém páru a odhadne jak mají být slova nebo výrazy přeloženy.

Phần mềm thống kê đặc biệt đánh giá sự xuất hiện của từ và cụm từ trong cặp ngôn ngữ và ước tính như thế nào họ nên được từ hay cụm từ dịch.

Taková technologie je obsažena např. v bezplatné službě Google Translate, který data využívá k provádění strojového překladu (Machine Translation = MT).

Công nghệ này được bao gồm như là miễn phí của Google Translate, dữ liệu được sử dụng để thực hiện một bản dịch máy (MT = Máy dịch).

Existují i placené webové služby, které ze zákazníkových TM vydolují překlady, ke kterým neposkytuje překlad technologie porovnání celých segmentů.

Ngoài ra còn có các dịch vụ web trả tiền, mà của khách hàng TM vydolují dịch thuật, mà làm cho công nghệ so với bản dịch của toàn bộ các phân đoạn.

E.Odkazy a ukázky

E. Liên kết và lấy mẫu

Na www.condak.net poskytuji informace o CAT nástrojích a na www.condak.cz jsou informace o PC Translatoru nebo jiných desktopových překladačích.

Các www.condak.net cung cấp thông tin về CAT công cụ và thông tin trên máy tính để bàn www.condak.cz PC Translator hoặc trình biên dịch khác.

Na webové stránce http://www.condak.net/osu/cs/00.html bude prezentace z tohoto workshopu.

Trang web sẽ http://www.condak.net/osu/cs/00.html thảo từ hội thảo này.

V Ostravě 17.9.2009

Trong Ostrava 17 tháng chín năm 2009

Ing.

Ing.

Milan Čondák

Milan Condak

Využití překladových pamětí

Sử dụng TMS


Copyright Ing. Milan Čondák 17.09.2009