Využití překladových pamětí
 10  HU
Soubor ke stažení: cs_hu


Obsah

 

A.Úvod - charakteristika základních souborů

A. Bevezetés - az alapvető jellemzői fájlok

B.Podrobnější charakteristika

 

C.Využití překladových pamětí (Translation Memory = TM)

C. A fordítási memória (TM = Fordítási memória)

D.Odkazy a ukázky

 

A.

 

Úvod - charakteristika základních souborů

Bevezetés - az alapvető jellemzői készletek

1.Bitext a tabulka v DOC (RTF)

 

1.1.

 

Bitext obsahuje texty ve dvou jazycích.

Bitext szövegeket tartalmaz, két nyelven.

Soubor neobsahuje jazykové kódy a je kódován tak, aby byly oba jazyky lidmi čitelné.

Fájl nem tartalmaz nyelvi kódokat, és kódolni, hogy az emberek olvasni mindkét nyelven.

Jde nejčastěji o TXT soubor, který může mít národní kódování pro

Ez általában egy TXT fájl, amit a nemzeti kódoló

a)DOS, Unix (Linux), Mac

a) DOS, Unix (Linux), Mac

b)ANSI (Windows), národní stránky jednotlivých jazyků a jejich ekvivalenty pro HTM (čeština Win-1520)

 

Tabulky v DOC (RTF) obsahují v dokumentu jazykové kódy polí, která obsahují text (ve zdrojovém a cílovém jazyce).

A táblázatok DOC (RTF) tartalmazó dokumentum nyelv kódokat, a mezőket, szöveget tartalmazó (a forrás-és célnyelv).

c)UTF-8 je využíván nejčastěji, protože oba jazyky jsou lidmi čitelné, je využíván pro přiřazování souborů (UTF-7 se v překladatelském oboru nevyužívá) a soubory mají menší velikost než v UTF-16

c) az UTF-8 használják a leggyakrabban, mert mindkét nyelv ember által olvasható, hogy használni térképészeti fájl (UTF-7 nem használják a fordítási ipar) és a fájl kisebb, mint az UTF-16

d)Unicode (UTF-16) využívá MS Word a programy (CAT), které v něm fungují pro zobrazení textových souborů; může jít o lokální nebo webové databáze, konverzní programy atd.

d) Unicode (UTF-16) használ MS Word és programok (CAT), amelyet azon dolgozik, hogy megjelenítéséhez szöveges fájlokat, lehet, hogy egy helyi vagy internetes adatbázisa, konverziós programok, stb

e)Unicode Big Endian pro zobrazení východoevropského písma (CJK = čínština, japonština a korejština)

e) a Unicode big endian-Keleten a megtekintéséhez betűk (CJK = kínai, japán és koreai)

1.2.

1.2.

Tabulky v DOC (RTF) obsahují v dokumentech jazykové kódy a texty jsou uloženy v ANSI

 

2.Glosář a obdobné soubory

 

Slovník - obsahuje heslo + slovní druh + tvary slova + příklady použití + překlady.

Szótár - tartalmazza jelszó beszéd + + + + szót formák példa a fordításokat használt.

Bývá tříděn abecedně podle hesel.

Az ábécé szerint rendezve bejegyzéseket.

Překladový slovník - obsahuje výraz , který se skládá z jednoho až pěti slov a jeho překlad a bývá uložen v databázi

Translation szótár - tartalmaz egy kifejezés, amely tartalmaz egy, két vagy öt szót, és a fordítást, és egy adatbázisban tároljuk

Slovníček - obsahuje výraz z jednoho až pěti slov a jejich překlad a bývá uložen v textovém souboru nebo XLS (maximálně dvě pole)

Glossary - ezeket a szavakat tartalmazza egytől öt szavakat és a fordítást és tárolják egy szöveges fájlt, vagy XLS (legfeljebb két mezőt)

Glosář - slovníček + další pole na poznámky a eventuáleně data, jaká mohou být v atributech překladových pamětí

Glossary - egy szószedetet + további mezőket a megfigyelések és adatok eventuáleně lehet attribútumok fordítási memóriák

3.Segmentovaný dokument Trados (DOC nebo RTF), nevyčištěný dokument přeložený v MS Wordu

Trados 3.Segmentovaný dokumentum (DOC vagy RTF), tisztítatlan papírból hajtogatott MS Word

Běžně vzniká v průběhu překladu v CAT nástrojích, které využívají jako textový editor MS Word.

Gyakran merül fel a fordítás során CAT-eszközök, amelyek egy szövegszerkesztő, MS Word.

Někdy jej exportují i aplikace, které používají pro překládání jiný typ souboru.

Néha ez a kivitel iránti kérelmek használt lefordítani más fájltípus.

Dokument obsahuje překladové jednotky, tj. dvojice vět, kdy první věta je ve zdrojovém jazyce a druhá věta je v cílovém jazyce, oddělovací značky a číslice, která vyjadřuje procento shody.

A dokumentum tartalmaz egy fordítási egységet, azaz egy pár mondat, ha az első mondat a forrás nyelv és a második mondatban a célnyelven, elválasztás jelek és számok, amely kifejezi a százalékos megfelelés.

4.Překladová paměť

 

4.1.Jednotlivé CAT nástroje využívají svůj vlastní (nativní) typ souboru.

4.1.Jednotlivé CAT-eszközök használata a saját (natív) fájltípus.

Překladová paměť se anglicky jmenuje Translation Memory a má akronym TM.

Angol fordítási memória fordítási memória, és felszólította a rövidítés TM.

Přestože data obsažená v překladových pamětech jsou obdobná, liší se formát dat, struktura dat, typ souborů.

Bár az adatok a fordítási memória hasonló, különböző formában, az adatok szerkezete, fájltípusok.

Je to např.

Példaként

TXT, ESL.

TXT, ESL.

DBF, MDB, TBW, SQL.

DBF, MDB, TBW, SQL.

CAT s nimi pracuje jako s databázovým souborem.

CAT dolgozik, mint egy adatbázis fájlt.

Uživatel může data překladové paměti bez nativního CAT nástroje upravovat, pokud data uvidí v jiném nástroji a nástroj mu umožní změněný soubor uložit.

Felhasználói adatok nem tudja natív fordítási memória CAT-eszközök szerkeszteni, ha az adat látott egyéb szerszámok és eszközök, amelyek lehetővé teszik, hogy mentse el a módosított fájlt.

4.2.Translation Memory Exchange (TMX) je textový soubor s příponou TMX, který je kódován buď v UTF-8 nebo v Unicode.

4.2.Translation Memory Exchange (TMX) egy szöveges állomány, TMX, ami bele van kódolva vagy UTF-8 vagy Unicode.

B.

B.

Podrobnější charakteristika

Részletes előírások

1.Bitext

1.Bitext

Bitext je možno vytvořit

Bitext is létrehozhat

a)konverzí dvou sloupců z listu XLS souboru nebo listu jiné tabulkového procesoru

a) az átalakítás két oszlopot a munkalapon xls vagy bármely más lapot táblázatkezelő

b)přiřazením segmentů soborů ( přiřadit je anglicky "align" a přiřazení "alignment"

b) Adatkezelés szegmens feladat (rendelheti meg az angol "align" és a hozzá "összehangoló"

c)konverzí ta z tabulky nebo jiných typů souborů, kdy dojde ke ztrátě atributů a časového razítka

c) az átalakítás egy asztal vagy más fájltípus, amely elveszett attribútumok és időbélyegző

Příklad konverze: v MS Exelu je možno soubor "Uložit jako" vybrat vhodný formát; v MS Wordu se konverze provádí přes položku menu Tabulka a potom se pokračuje jako v MS Exelu

Átváltási Példa: MS Exel nyújthat be a "Mentés másként" opciót válasszuk ki a megfelelő formátumban, MS Word átalakítást végeztek keresztül a Táblázat menü, majd úgy folytatódik, az MS Exel

2.Glosář

 

Elektronické překladové slovníky umožňují přidávání a export terminologie.

Elektronikus fordítási szótárak lehetővé teszi hozzá és export terminológiát.

Do slovníku je možno přidávat jednotlivé významové dvojice a třídící poznámky.

A szótár lehet adni egy pár szó az egyéni és válogatás jegyzetek.

Autoři slovníků šifrují obsah svojí databáze a neumožňují export dat.

A szerzők a szótárak titkosítani tartalmának adatbázisában, és nem exportálja az adatokat.

Z komerčních slovníků je možno exportovat pouze uživatelem přidanou terminologii.

A kereskedelmi szótárak lehet exportálni csak a hozzáadott terminológiát.

Příklad: v PC Translatoru je možno přidávat do slovníku kromě významové dvojice pouze kód oboru.

Példa: a PC-Translator is bekerül a szótárba szó, mint csupán egy pár kód a területen.

Je možno přidávat jednotlivé významové dvojice nebo celé soubory a potom shodné výrazy smazat.

Lehetőség van hozzá más jelentése párok vagy egész fájlokat, majd törölje az azonos feltételek mellett.

Export vlastní terminologie je možno archivovat a importovat do novější verze softwaru.

Export saját terminológiai archiválhatók és behozott egy újabb verziója a szoftver.

Shrnutí: glosáře z CAT nástrojů je možno po konverzi využít v jiných CAT nástrojích a také v překladačích.

Összefoglaló: Glossary of CAT-eszközök használhatók a konverziós egyéb CAT-eszközök és a fordítók.

Do CAT nástrojů je možno připojovat i terminologii z překladačů nebo jiných veřejně dostupných zdrojů.

CAT-eszközök által lehet csatlakoztatni a terminológiát, a fordító, vagy más, nyilvánosan elérhető forrásokból.

3.Segmentovaný dokument Trados

3.Segmentovaný dokumentum Trados

Dokument obsahuje neviditelná, viditelná a skrytá data.

Dokumentum tartalmazza a láthatatlan, látható és rejtett adatokat.

Neviditelná data je možno zkontrolovat po uložení souboru jako HTM a HTM soubor prohlížet jako textový soubor (zdrojový HTM soubor).

Láthatatlan adatokat ellenőrizni lehet menteni a fájlt és HTM HTM megtekintéséhez a fájlt egy szöveges fájlt (forrás HTM file).

Viditelná data obsahují přeložený text.

Látható adatait tartalmazza a lefordított szöveget.

Skrytá data obsahují zdrojový text, oddělovací značky a pomocné údaje, jako je procento shody s překladovou pamětí, která byla využita při překladu.

Rejtett adatokat tartalmaz, a forrás szöveget, elválasztó jelek és a kiegészítő információkat, mint százalékban betartását fordítási memória, amelynek felhasználásával a fordításban.

Tento formát je standardem a využívá jej kromě Tradosu například Wordfast Classic, AnyMem.

Ez a formátum standard és azt használja, kivéve a Trados Wordfast Classic, AnyMem.

Načítá jej a exportuje do něj MetaTexis.

Olvassa, és exportálja azokat MetaTexis.

Exportuje do něj Wordfast Anywhere a další CAT nástroje a konverzní nástroje.

Export-ba Wordfast Bárhol és más CAT-eszközök és a konverziós eszközökkel.

Tzv. vyčištěním dokumentu (clean-up), je dokument vyčištěn od zdrojového textu a všech pomocných značek a o obsah dokumentu může být rozšířena aktuální překladová paměť jednotlivého CAT nástroje.

Ún. A dokumentum Cleanup (clean-up), az iratot megtisztítják a forrás szöveg és a kisegítő címkék és mit tartalmaz a dokumentum is ki lehet terjeszteni a jelenlegi fordítási memória egység CAT-eszközök.

Segmentovaný dokument Trados může být využit pro aktualizaci TM, kteří používají různé CAT nástroje.

Szegmentált dokumentum Trados lehet használni, hogy frissítse a TM segítségével számos CAT-eszközök.

4.Překladová paměť

4.Překladová Memory

Jednotlivé CAT nástroje umí importovat a exportovat TMX a tím je umožněna výměna dat mezi uživateli různých CAT nástrojů.

Minden CAT-eszközök is import és export a TMX, és így lehetővé teszik a különböző rendszerek közötti adatcsere a felhasználók a különböző CAT-eszközök.

TMX je hlavním prostředkem pro výměnu TM a umí s ní pracovat i nástroje, které nepracují v MS Wordu a nepracují se segmentovaným dokumentem Tradosu.

TMX a fő jármű cseréjére vonatkozó TM, és dolgozni vele, valamint az eszközök, amelyek nem működnek a MS Word és nem működnek a Trados szegmentált dokumentumban.

Specifickým nástrojem mezi CAT nástroji je OmegaT.

Konkrét eszköz közül eszközök OmegaT CAT.

Nástroj je napsán v Javě a má tři verze (pro jednotlivé operační systémy:

Az eszköz Java-ban íródott és három változata van (a különböző operációs rendszerek:

Windows, Linux a MacIntosh).

Windows, Linux és Macintosh).

Je to open free software.

Meg van nyitva az ingyenes szoftver.

Pracuje samostatně nebo s Open Officem (typ souboru ODT) a jako svoji překladovou paměť používá TMX v kódování UTF-8.

Egyedül dolgozik, vagy az Open Office (ODT fájl típus), valamint a fordítási memóriát használ TMX UTF-8.

C.

C.

Využití překladových pamětí (Translation Memory = TM)

Használatával fordítási memória (TM = Fordítási memória)

1.CAT nástroj do TM ukládá při překládání jednu překladovou jednotku se všemi atributy za druhou

1.CAT eszköze a TM menti fordítása esetén fordítási egységet minden adottsággal a második

2.CAT nástroj porovnává (match) otevřený zdrojový segment překládaného dokumentu se všemi zdrojovými segmenty připojených překladových pamětí

2.CAT eszköz összehasonlítja a (match) a nyílt forráskódú szegmens a lefordított dokumentum összes forrás szegmens kapcsolódó TMS

Pozn. anglické "match" - porovnání, vyhovění apod. vnímají Češi častou pouze konfrontačně jako střet - utkání (fotbalový match).

Vegye figyelembe, hogy angol "match" - összehasonlítás, megfeleltetés, stb csehek gyakran tekintették úgy, mint a konfliktus csak konfrontatív - match (football match).

Zde údaj mach = 90, znamená, že segment se shoduje na 90% s nejvíce podobným segmentem v překladové paměti.

Itt információt mach = 90 azt jelenti, hogy a szegmens azonos a 90%-a legtöbb hasonló szegmensben a fordítási memóriában.

Pro porovnávání se nejčastěji používá Löwensteinův algoritmus.

Mert összehasonlítás, a leggyakrabban használt Löwensteinův algoritmus.

CAT většinou zobrazí překladové jednotky s nejvyšší shodou, nebo automaticky umístí překlad do cílového segmentu a umí také zobrazit rozdíly mezi zdrojovými segmenty v dokumentu a v překladové paměti.

CAT általában oltás fordítási egység a legnagyobb az egyetértés, vagy automatikusan helyet fordítást a cél szegmens és láthatja a szegmensek közötti különbségek a forrás dokumentum és fordítási memória.

3.Pokud segmenty (věty) neobsahují více než 10 slov jsou častou poskytovány 100% nabídky z TM.

3.If szegmensek (mondatok) nem több, mint 10 szó gyakran nyújtott 100%-kínálat TM.

Dlouhé věty (třeba o 50 až 200 slovech) lze najít tehdy, když nový dokument obsahuje citace z předchozích dokumentů, zejména právnických, aktualizace příruček, návodů k obsluze apod.

A hosszú mondat (talán 50-200 szó) megtalálható, ha az új dokumentum tartalmaz egy idézet a korábbi dokumentumok, különösen a jogi, frissítése kézikönyvek, útmutatók, stb

4.Konkordační vyhledávání - ruční vyhledávání terminologie z vět uložených v jazykových párech

4.Konkordační keresés - kézi keresés terminológiája kiszabott a nyelvpárban

5.Ruční doplňování terminologie do slovníků a glosářů nebo opravy uložené terminologie.

5.Ruční feltöltés terminológiája szótárak, szószedetek és javítási tárolt terminológiát.

6.Dolování terminologie z vět uložených v jazykových párech.

6.Dolování terminológiája kiszabott a nyelvpárban.

Speciální statistický software vyhodnocuje výskyt slov a frází v jazykovém páru a odhadne jak mají být slova nebo výrazy přeloženy.

Speciális statisztikai szoftver értékeli előforduló szavakat és kifejezéseket a nyelvpárban és megbecsülik, hogyan kell szavakat és kifejezéseket lefordítani.

Taková technologie je obsažena např. v bezplatné službě Google Translate, který data využívá k provádění strojového překladu (Machine Translation = MT).

Ilyen például a felvételre az ingyenes Google Translate, az adatok, amelyek végrehajtása egy gépi fordítás (MT = Machine Translation).

Existují i placené webové služby, které ze zákazníkových TM vydolují překlady, ke kterým neposkytuje překlad technologie porovnání celých segmentů.

Vannak is fizetett webes szolgáltatások, amelyek az ügyfél TM vydolují fordítást, ami fordítási technológia összehasonlítása a teljes szegmensét.

E.Odkazy a ukázky

E. Kapcsolatok és minták

Na www.condak.net poskytuji informace o CAT nástrojích a na www.condak.cz jsou informace o PC Translatoru nebo jiných desktopových překladačích.

A www.condak.net tájékoztatás CAT-eszközök és információk www.condak.cz PC Translator asztali  vagy más fordítók.

Na webové stránce http://www.condak.net/osu/cs/00.html bude prezentace z tohoto workshopu.

A weboldal http://www.condak.net/osu/cs/00.html prezentációi ennek a műhelynek.

V Ostravě 17.9.2009

Ban Ostrava 17.9.2009

Ing.

Ing.

Milan Čondák

Condak Milan

Využití překladových pamětí

TM használja


Copyright Ing. Milan Čondák 17.09.2009