Tłumaczenie PDF to bardzo często pojawiające się zlecenie. Nie zawsze jest tak proste jak może się wydawać, z przyczyn, których wiele osób się nie domyśla.
Format PDF nie jest przeznaczony ani do edycji, ani tym bardziej do tłumaczenia. Profesjonalne tłumaczenie PDF wymaga wiedzy i doświadczenia. Postaramy się przybliżyć, dlaczego. Zapraszamy!
PDF to powszechnie używany format, ale tłumaczenie dokumentów PDF nie jest tak proste, jak mogłoby się wydawać. Warto przypomnieć, skąd format ten się wziął i do jakich celów go stworzono.
Format PDF opracowała firma Adobe Systems w celu umożliwienia przenoszenia treści zawierających tekst i elementy graficzne w niezmienionej postaci, tak aby u końcowego odbiorcy dokument wyglądał zawsze tak samo, niezależnie od tego, czy dany dokument PDF otwieramy do wyświetlenia na ekranie monitora, na smartfonie, czy kierujemy do wydrukowania na drukarce.
Wyślij do nas pliki PDF, aby otrzymać ofertę tłumaczenia!
Zamów bezpłatną wycenę!
Gdy zachodzi potrzeba przetłumaczenia pliku PDF, pojawia się pytanie, jak to zrobić, skoro mamy do czynienia z formatem, który z definicji zakłada niezmienność przechowywanych treści i ich wyglądu. A przecież tłumaczenie polega na zmianie tekstu oryginału w tekst tłumaczenia.
Zanim zlecimy tłumaczenie plików w formacie PDF, upewnijmy się, czy przypadkiem nie mamy dostępu do plików źródłowych, czyli dokumentów, z których PDF-y zostały utworzone. Tłumaczenie plików źródłowych to zawsze tańsza, pewniejsza i łatwiejsza opcja.
Dokumenty źródłowe to najczęściej pliki zapisane w takich programach jak aplikacje pakietu Microsoft Office (Word, Excel, Powerpoint), pliki stron internetowych (HTML, XML) czy programów DTP (Adobe Indesign, Framemaker). Biuro tłumaczeń szybciej, taniej i lepiej poradzi sobie z takimi plikami, niż z dokumentami PDF.
Mogłoby z tego wynikać, że tłumaczenie plików PDF nie powinno mieć miejsca. Jednak konieczność taka zachodzi bardzo często. Niżej przyjrzymy się, z jakimi rodzajami PDF-ów mamy do czynienia i jak profesjonalnie wykonać ich tłumaczenie. Zapraszamy!
Popularność PDF-a spowodowała, że wiele programów pozwala dziś zapisywać swoje dokumenty w tym formacie. Dodatkowo, dostępne są darmowe sterowniki, które po zainstalowaniu widnieją w systemie jako kolejna drukarka. Wystarczy uruchomić ulubiony program, może to być nawet Notatnik Windows, otworzyć w nim plik i wybrać polecenie Drukuj. Kolejny krok to wybór jako drukarki właśnie sterownika druku do PDF. Po "wydrukowaniu" otrzymamy plik PDF – kopię treści drukowanego dokumentu.
Przykładami takich programów: PDFCreator i CutePDF Writer. Poza tym nowsze wersje popularnych aplikacji jak MS Word czy programy DTP, pozwalają po prostu zapisać otwarty dokument jako PDF: opcja Plik | Zapisz jako i wybór rodzaju pliku: PDF.
CutePDF Writer pozwala w dowolnej aplikacji zapisać dokument jako PDF
W opisany sposób możemy tworzyć PDF-y w niemal każdej aplikacji, z dowolnego dokumentu źródłowego. Mogą to być dokumenty Worda, Excela, PowerPointa czy Indesigna. W każdym przypadku PDF zostanie "zbudowany" w inny sposób, a jego struktura będzie mniej lub bardziej złożona.
Na koniec to, co robi największą różnicę, jeśli chodzi o rozróżnianie PDF-ów w kontekście tłumaczenia. PDF-y tworzy się nie tylko z dokumentów tekstowych czy danych w arkuszach kalkulacyjnych. Jako PDF zapisuje się również skany i zdjęcia. Tak powstają PDF-y, które nie zawierają tekstu, ale składają się z obrazów.
Więcej na temat tworzenia, konwersji i zapisu dokumentów PDF piszemy na stronie Jak utworzyć PDF.
Pliki PDF tworzymy po to, aby zawarte w nich dane wyglądały tak samo na ekranie monitora, smartfona czy na wydruku. Format PDF z definicji nie jest więc przeznaczony do edycji.
Dokumenty PDF mogą zawierać tekst, grafikę, a nawet elementy multimedialne. Tworzymy je, aby ktoś otrzymał finalną wersję dokumentu lub mógł wydrukować ją w niezmienionej postaci.
Pliki eksportowane do PDF-a tworzy się za pomocą edytorów tekstu (np. Microsoft Word) czy w mniej popularnych aplikacjach, np. do składu tekstu (Framemaker, Indesign) czy projektowania typu AutoCAD. Zapisujemy je na koniec w postaci PDF-a, jako powszechnie akceptowalnym formacie.
Ponieważ dokumenty PDF mogą być tworzone za pomocą różnych programów i być efektem konwersji różnych dokumentów, ich budowa i struktura, której na pierwszy rzut oka nie widać, może być różna. Dwa pliki o podobnym wyglądzie, jednak utworzone z dwóch różnych dokumentów źródłowych, w różnych programach, mogą mieć bardzo różną strukturę.
W efekcie tłumaczenie obu PDF-ów, mimo że podobnych wizualnie, może być całkiem różne i przysparzać odmiennych problemów.
Ze względu na formę przechowywanych informacji, czyli to, co w procesie tłumaczenia jest najważniejsze, dokumenty PDF możemy podzielić na dwie grupy:
Z obu grup tylko pliki zawierające tekst mogą być edytowane – za pomocą Adobe Acrobata (program autorstwa twórców formatu PDF) lub podobnych narzędzi innych dostawców.
PDF-y zawierające edytowalny tekst można tłumaczyć na dwa sposoby, zależnie od złożoności układu stron danego dokumentu i sposobu rozmieszczenia w nim tekstu:
Tłumaczenie PDF-ów poprzez ich edycję należy traktować jako wyjątkową sytuację. Jest to opłacalne pod względem kosztów i nakładu pracy, gdy mamy do czynienia ze szczególnie złożonym układem strony, zawierającym wiele elementów graficznych, a tekstu do tłumaczenia jest bardzo niewiele.
Tłumaczenie wykonywane bezpośrednio w dokumencie PDF polega na otwarciu pliku w programie do edycji i zastępowaniu oryginalnego tekstu tłumaczeniem. Taki tryb tłumaczenia jest mało efektywny i narażony na wiele, często trudnych do rozwiązania, problemów, związanych m.in.:
Zwłaszcza druga kwestia bywa kłopotliwa w zależności od tego, w jaki sposób dany plik PDF został przygotowany i jak jest rozmieszczony zawarty w nim tekst. Zwykle tekst jest podzielony na mniejsze fragmenty, każdy przechowywany w osobnej ramce tekstowej. Jeśli tłumaczenie będzie wyraźnie dłuższe od oryginału, zmieszczenie tekstu tłumaczenia w danej ramce, tak aby był widoczny, może być problematyczne.
Dokument PDF najlepiej edytować w programie Adobe Acrobat
Jeśli tekstu jest więcej lub jego format jest bardziej złożony, na przykład występują w nim listy, formatowane nagłówki, osobne akapity z wcięciami względem marginesów, przechodzimy do drugiego rozwiązania: przeniesienia zawartości PDF-a do formatu dającego większe możliwości edycji i ogólnie większej kontroli nad wprowadzanym tekstem.
Do wyboru mamy dwie możliwości: ręczne skopiowanie tekstu w PDF-ie i wklejenie do nowego dokumentu w innym formacie lub użycie konwertera PDF-a do innego formatu, na przykład do DOCX obsługiwanego przez Microsoft Word.
Do konwersji PDF do Word służy wiele narzędzi. Mogą to być aplikacje lub rozwiązania w postaci usługi na stronie internetowej. Większość z nich jest płatna, choć są też darmowe.
Jeśli do edycji tekstu używamy Microsoft Word (w wersji od 2013 w górę), możemy spróbować jego możliwości w zakresie konwersji PDF do DOCX. W tym celu po prostu otwieramy w nim plik PDF:
PDF otwarty i skonwertowany do formatu DOCX w edytorze Microsoft Word
Microsoft Word świetnie poradzi sobie z konwersją wielu dokumentów PDF do formatu DOCX, choć nie każdego. Jeżeli po otwarciu PDF-a w Wordzie zauważymy istotne różnice między oryginałem a otwartym dokumentem, warto spróbować innych możliwości.
Możemy sprawdzić, co oferują dostępne na rynku konwertery PDF do DOCX lub, naszym zdaniem najlepszy pod tym względem, program Adobe Acrobat, w którym po prostu wybieramy polecenie eksportu otwartego PDF-a do formatu Worda:
Adobe Acrobat – konwersja PDF do formatu Worda (łatwa i skuteczna)
Po konwersji PDF do DOCX otrzymamy dokument, który możemy otwierać i poddawać zmianom, w tym tłumaczyć, za pomocą niemal dowolnego edytora tekstu. Tłumaczenie możemy wykonać ręcznie, ale także użyć dodatkowych metod ułatwiających tłumaczenie lub wspomóc się programem CAT, które umożliwi nam prawdziwie profesjonalne tłumaczenie dokumentu.
Na koniec przedstawiamy sytuacje, w której ani Microsoft Word, ani żaden dostępny konwerter PDF, w tym Adobe Acrobat, nie jest w stanie skutecznie skonwertować dokumentu PDF do DOCX lub podobnego formatu. Otrzymany układ strony jest nieprawidłowy lub też tekst jest pocięty i rozmieszczony w taki sposób w osobnych ramkach tekstowych, że jego tłumaczenie może być bardzo kłopotliwe.
W takim przypadku musimy ręcznie odtworzyć układ stron PDF-a w nowym dokumencie w bardziej edytowalnym formacie. Do tego celu wybieramy zaawansowany edytor tekstu jak Microsoft Word czy Writer pakietu LibreOffice lub program do składu tekstu np. Adobe Indesign czy Framemaker.
W nowym dokumencie wstawiamy elementy, które pozwolą nam odtworzyć layout PDF-a. Możemy użyć do tego ramek tekstowych czy tabeli. Kolejno dostawiamy elementy strony i kopiujemy do nich tekst z PDF-a. Gdy przeniesiemy całą treść do nowego dokumentu, a jego wygląd będzie przypominał oryginał w PDF-ie, możemy przystąpić do tłumaczenia.
W przypadku nieedytowalnych plików PDF utworzonych ze skanów lub zdjęć możemy albo spróbować wykonać ich OCR, albo ręcznie odtworzyć layout w nowym formacie i przepisać do nowego dokumentu widniejący w PDF-ie tekst.
OCR (ang. optical character recognition), czyli optyczne rozpoznawanie tekstu jest możliwe wtedy, gdy PDF utworzono ze skanów / zdjęć o odpowiednio wysokiej jakości, czyli rozdzielczości równej min. 300 dpi.
Jeśli mamy do tłumaczenia pliki PDF utworzone ze skanów lub zdjęć, musimy wykonać OCR, albo przygotować od nowa layout i do nowego dokumentu ręcznie przepisać widoczny w PDF-ie tekst.
OCR polega na rozpoznaniu na skanie lub zdjęciu elementów tekstowych i zamianie ich na edytowalny tekst. Po wykonaniu OCR-u otrzymujemy dokument z rozpoznanym edytowalnym tekstem, a do tego większość programów OCR skutecznie odtwarza layout odczytanego pliku źródłowego.
Dostępnych jest wiele programów do OCR-u. Jednym z nich jest ABBYY Finereader, który bardzo dobrze radzi sobie z rozpoznawaniem i zamianą tekstu na grafice w tekst edytowalny.
Sam OCR nie zajmuje wiele czasu. Dodatkowy czas należy jednak zarezerwować na kontrolę i dokonanie poprawek po jego wykonaniu, gdyż programy OCR niemal zawsze popełniają błędy, tzn. nieprawidłowo rozpoznają niektóre fragmenty tekstu.
Jeśli jakość skanów / zdjęć, z których powstał PDF, była wystarczająco dobra, możemy mieć pewność, że Adobe Acrobat świetnie poradzi sobie z prawidłowym rozpoznaniem i odczytaniem tekstu, oraz, co równie ważne, bardzo dobrze odtworzy układ strony.
Pozostałe programy OCR nie zawsze prawidłowo odtwarzają layout wczytanego PDF-a. Utworzony dokument z rozpoznanym w PDF-ie tekstem może więc odbiegać wyglądem od oryginału. Wtedy niezbędne będą poprawki, zdarza się, że dość czasochłonne. Dopiero po ich wykonaniu uzyskamy dokument gotowy do tłumaczenia.
Podstawą profesjonalnego tłumaczenia jest zapewnienie jak najlepszej kontroli i jakości tłumaczenia oraz zachowanie oryginalnego formatu tłumaczonego dokumentu. W przypadku plików PDF, które dają bardzo ograniczone możliwości edycji tekstu, oznacza to konieczność przeniesienia treści oryginału do innego formatu, oferującego większe możliwości edycji.
Zależnie od złożoności layoutu może to być DOCX i praca w edytorze Microsoft Word, a w przypadku bardziej skomplikowanych układów tekstu i grafiki program do składu tekstu typu Adobe Indesign.
Profesjonalne tłumaczenie PDF wymaga konwersji oryginalnego dokumentu lub skopiowaniu jego treści do nowego dokumentu w odpowiednim formacie. W nowym dokumencie musi zostać odtworzony layout oryginału, a zdania tekstu powinny pozostać w całości – niepocięte znakami akapitu czy, co gorsza, rozmieszczone w osobnych ramkach tekstowych.
Tylko wtedy możliwe będzie efektywne wykorzystanie narzędzi CAT i programów do zapewniania jakości tłumaczenia. Umożliwi to szybsze, dokładniejsze i pewniejsze tłumaczenie tekstu z zachowaniem spójności i możliwości kontroli jakości. Po wykonaniu tłumaczenia pozostanie pamięć tłumaczeniowa, którą będzie można wykorzystać podczas tłumaczenia podobnych dokumentów w przyszłości.
Program CAT umożliwia tłumaczenie zdanie po zdaniu, zapewniając maksymalną kontrolę jakości
Więcej o programach wspomagających tłumaczenie na stronie Narzędzia CAT.
Tłumaczenie plików PDF nie jest prostym zadaniem, ponieważ format ten z definicji opracowano do zachowania finalnej wersji dokumentów bez możliwości ich modyfikowania. Ponadto każdy dokument PDF jest inaczej zbudowany – zależnie od dokumentu źródłowego i aplikacji, w której się go zapisuje.
Co prawda, standard PDF jest powszechnie znany i stosowany, lecz dokumenty w tym formacie miewają różną, czasami bardzo złożoną strukturę. Często danego pliku PDF nie da się ani edytować, ani poddać takiej konwersji do innego formatu, aby zachowany został układ i format wszystkich elementów jak w oryginale.
Nawet niepozornie wyglądający dokument może sprawić kłopoty, wymagając zaskakująco dużo czasu na przygotowanie, a tym samym podnosząc koszty tłumaczenia. Jednak profesjonalne przygotowanie zawsze się opłaca, zwracając się w postaci wyższej jakości tłumaczenia i możliwościach jego ponownego wykorzystania.
Tym większe znaczenie ma zlecenie tłumaczenia fachowcom dysponującym odpowiednimi narzędziami i wiedzą w zakresie przetwarzania treści zapisanych w różnych formatach, w tym w opisywanym formacie PDF. Nasze biuro tłumaczeń zapewnia m.in.:
W rezultacie dostarczamy tłumaczenie w formacie dostępnym do edycji lub w formacie PDF o wyglądzie maksymalnie zbliżonym do oryginalnego układu strony tłumaczonego PDF-a. Dołączamy też pamięć tłumaczeniową z wykonanego tłumaczenia. Serdecznie zapraszamy do korzystania z naszych usług!
Tłumaczenia z biura tłumaczeń zgodne z ISO 17100:2015 Usługi tłumaczeniowe.
Tłumaczymy pliki
Wykorzystywane technologie
Zapewniamy profesjonalne tłumaczenia wraz z obsługą techniczną, składem tekstu DTP, wykonujemy OCR itd.
Profesjonalne rozwiązania, nowoczesne narzędzia i programy wspomagające CAT. Zapewniamy wysoką jakość i profesjonalną obsługę, także techniczną.