 |
Forum dyd@ktyczne INoI UP w Krakowie Platforma pracy grupowej INoI UP w Krakowie
|
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
W. M. Kolasa
Administrator
Dołączył: 02 Kwi 2006
Posty: 3234
Przeczytał: 0 tematów
Skąd: Kraków Płeć: Pan
|
Wysłany: 12 Styczeń 2009, 1:25 am Temat postu: OCR w DJVu (rozwiązanie alternatywne) |
|
|
OCR w DJVu
Do osadzenia warstwy OCR w djvu możesz wykorzystać albo komercyjny DE Firmy Cartlem (ongiś LizardTech). Tu więcej na ten temat: [link widoczny dla zalogowanych] ; albo użyć metody alternatywnej, którą opisuje niżej (daje ona przy okazji znacznie lepszą jakość OCR). Aby ją wykonać będą ci potrzebne:
A. Wiązka FineReadera 8.0
B. Rosyjski dekoder DjvuOCR 2.3
-- download: [link widoczny dla zalogowanych] [wersja 2.3]
-- lub link bezpośredni dla tych, co nie znają cyrylicy: [link widoczny dla zalogowanych]
-- rozpakuj gdzieś (i dodaj skrót na pulpit)
** (z FineReaderem 9.0 współpracuje tylko niestabilna 4 beta wer. 2.4: [link widoczny dla zalogowanych])
B. DjvuLibre wersja 3.5.20 lub wyższa:
-- download: [link widoczny dla zalogowanych] [wybierz wersję windows], potem zainstaluj
-- z pakietu będzie nam tylko potrzebna przeglądarka Djview 4.3 (lub 4.4) [doda się w Start/Programy/DjvuLibre/...]
1. Wczytaj do Djview swój plik djvu i wyeksportuj jego zawartość jako Tif wielostronicowy (tif document, nawet jeśli dokument był kolorowy, wybierz bitonal, G4). Kolor obrazków z punktu widzenia OCR nie odgrywa żadnej roli, a przyspieszy to proces 100-krotnie. Ustawienia ilustrują poniższe zrzuty.
W ten sposób uzyskasz zawartość swego pliku djvu w formacie wielostronicowego pliku TIF (w wysokiej kompresji G4)
2. Uruchom FineReadera i wczytaj plik. Wielostronicowy Tif wszyta się automatycznie. Potem wybierz Rozpoznaj wszystkie i czekaj cierpliwie aż program skończy.
3. Po zakończeniu rozpoznawania (sprawdź pobieżnie jak wyszło, ale nie rób korekty językowej). Zapisz tylko wyniki jako wiązka. Wiazka w FineReaderze to nie plik tylko folder (nie nie można go zapisywać wielokrotnie pod tą sama nazwą).
4. Teraz masz gotowy materiał:
- plik djvu (skąd eksportowałeś TIF) - w tym pliku jeszcze na ma OCR, ale zaraz będzie
- wiązkę FineReadera - gdzie jest sam OCR
5. Aby to połączyć użyj programu DjvuOCR 2.3.
6. Użyj Batch mode OCR maganer - ustawienia jak na zrzucie niżej. W szczególności należy:
- wczytać plik djvu (Ad djvu file)
- wiązkę (FineReader Project Directory) - po wczytaniu warto go przetestować (Test)
- można jeszcze dodać (ale nie jest to konieczne) dodatkowy wydruk kontrolny jako czyste text i html (ustawienia na zrzucie niżej)
- po ustawieniu wszystkich opcji wybierz: Process 0 czekaj aż zakończy
7. Masz już gotowy plik djvu z OCR w środku
8. Zainteresowani mogą poeksperymentować z innymi opcjami DjvuOCR 2.3 (warstwę można eksportować, usuwać, itd.)
Ostatnio zmieniony przez W. M. Kolasa dnia 12 Styczeń 2009, 3:02 am, w całości zmieniany 2 razy
|
|
Powrót do góry |
|
 |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
Katarzyna Wator
Dołączył: 17 Lis 2008
Posty: 47
Przeczytał: 0 tematów
|
Wysłany: 15 Styczeń 2009, 12:48 pm Temat postu: |
|
|
nie mogę wykonać tej pracy ponieważ podczas przekształcania z djvu na tiff w programie Djview wyskakuje błąd. Próbowałam na różnych komputerach i ciągle wyskakuje to samo.
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
P. Żurek
Dołączył: 22 Lis 2008
Posty: 30
Przeczytał: 0 tematów
Płeć: Pani
|
Wysłany: 15 Styczeń 2009, 12:49 pm Temat postu: |
|
|
Podobny problem pojawił się również u mnie.
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
Karina Materna
Dołączył: 30 Lis 2008
Posty: 30
Przeczytał: 0 tematów
|
Wysłany: 15 Styczeń 2009, 12:58 pm Temat postu: |
|
|
U mnie i Karoliny Kwapisz również wystąpił taki sam problem.
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
W. M. Kolasa
Administrator
Dołączył: 02 Kwi 2006
Posty: 3234
Przeczytał: 0 tematów
Skąd: Kraków Płeć: Pan
|
Wysłany: 16 Styczeń 2009, 1:37 am Temat postu: |
|
|
Jeśli podczas eksportu występuje ww. problem (zerwanie), należy OCR robić bezpośrednio z tifów (tych samych, z których tworzone było djvu).
Podobnie też wczytujemy te pliki:
1. Najpierw pierwszy
2. Potem dodajemy (ostatni +Shift drugi)
Reszta wg opisu.
Wyjaśnienie:
Z moich doświadczeń wynika, że przyczyna ww. problemu z tifami jest zazwyczaj jakaś niedozwolona operacja, którą wykonaliśmy na pliku/plikach. Np. kompresja do jpg i konwersja do do TIF (lub używanie nieodpowiednich programów do ich edycji). Po takich zabiegach djvu ma prawo ogłupieć i wtedy nie ma innej drogi tylko OCR wg sposobu który podałem wyżej (czyli bezpośrednio na TIFach).
Ostatnio zmieniony przez W. M. Kolasa dnia 16 Styczeń 2009, 1:37 am, w całości zmieniany 1 raz
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
Katarzyna Wator
Dołączył: 17 Lis 2008
Posty: 47
Przeczytał: 0 tematów
|
Wysłany: 20 Styczeń 2009, 15:35 pm Temat postu: |
|
|
rozpoznane pliki wysłane na [link widoczny dla zalogowanych]
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
P. Żurek
Dołączył: 22 Lis 2008
Posty: 30
Przeczytał: 0 tematów
Płeć: Pani
|
Wysłany: 20 Styczeń 2009, 16:59 pm Temat postu: |
|
|
rozpoznane pliki wysłane na [link widoczny dla zalogowanych]
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
D. Woźniak
Dołączył: 13 Paź 2008
Posty: 37
Przeczytał: 0 tematów
Płeć: Pan
|
Wysłany: 20 Styczeń 2009, 17:38 pm Temat postu: |
|
|
Już ok.
Ostatnio zmieniony przez D. Woźniak dnia 27 Styczeń 2009, 13:46 pm, w całości zmieniany 1 raz
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
Katarzyna Wator
Dołączył: 17 Lis 2008
Posty: 47
Przeczytał: 0 tematów
|
Wysłany: 26 Styczeń 2009, 14:38 pm Temat postu: |
|
|
Wator, Szczerba OCR wysłany na sendfile
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
Katarzyna Jordan
Dołączył: 01 Gru 2008
Posty: 22
Przeczytał: 0 tematów
|
Wysłany: 29 Styczeń 2009, 16:18 pm Temat postu: |
|
|
ocr wysłany
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
E. Pazdro
Dołączył: 13 Paź 2008
Posty: 29
Przeczytał: 0 tematów
Płeć: Pani
|
Wysłany: 29 Styczeń 2009, 16:41 pm Temat postu: |
|
|
ocr wysłany.
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
M. Stańczyk
Dołączył: 07 Lis 2008
Posty: 26
Przeczytał: 0 tematów
Płeć: Pani
|
Wysłany: 30 Styczeń 2009, 10:05 am Temat postu: |
|
|
OCR Magdalena Stańczyk i Maria Sygnarowicz został wysłany na [link widoczny dla zalogowanych]
Ostatnio zmieniony przez M. Stańczyk dnia 30 Styczeń 2009, 13:47 pm, w całości zmieniany 1 raz
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
M. Patronik
Dołączył: 30 Lis 2008
Posty: 30
Przeczytał: 0 tematów
Płeć: Pani
|
Wysłany: 30 Styczeń 2009, 11:47 am Temat postu: |
|
|
OCR Benita Pasowicz, Małgorzata Pociecha, Monika Patronik wysłany na [link widoczny dla zalogowanych]
|
|
Powrót do góry |
|
 |
Zobacz poprzedni temat :: Zobacz następny temat |
Autor |
Wiadomość |
B. Choczyńska
Dołączył: 13 Paź 2008
Posty: 26
Przeczytał: 0 tematów
Skąd: Kraków Płeć: Pani
|
Wysłany: 30 Styczeń 2009, 21:11 pm Temat postu: |
|
|
ocr wysłane
|
|
Powrót do góry |
|
 |
|
Nie możesz pisać nowych tematów Nie możesz odpowiadać w tematach Nie możesz zmieniać swoich postów Nie możesz usuwać swoich postów Nie możesz głosować w ankietach
|
fora.pl - załóż własne forum dyskusyjne za darmo
Powered by phpBB © 2001, 2005 phpBB Group
|