Forum Forum dyd@ktyczne INoI UP w Krakowie Strona Główna Forum dyd@ktyczne INoI UP w Krakowie
Platforma pracy grupowej INoI UP w Krakowie
 
 FAQFAQ   SzukajSzukaj   UżytkownicyUżytkownicy   GrupyGrupy   GalerieGalerie   RejestracjaRejestracja 
 ProfilProfil   Zaloguj się, by sprawdzić wiadomościZaloguj się, by sprawdzić wiadomości   ZalogujZaloguj 

OCR w DJVu (rozwiązanie alternatywne)
Idź do strony 1, 2  Następny
 
Napisz nowy temat   Odpowiedz do tematu    Forum Forum dyd@ktyczne INoI UP w Krakowie Strona Główna -> Technologia informacyjna (2008/2013)
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
W. M. Kolasa
Administrator



Dołączył: 02 Kwi 2006
Posty: 3234
Przeczytał: 0 tematów

Skąd: Kraków
Płeć: Pan

PostWysłany: 12 Styczeń 2009, 1:25 am    Temat postu: OCR w DJVu (rozwiązanie alternatywne)

OCR w DJVu

Do osadzenia warstwy OCR w djvu możesz wykorzystać albo komercyjny DE Firmy Cartlem (ongiś LizardTech). Tu więcej na ten temat: [link widoczny dla zalogowanych] ; albo użyć metody alternatywnej, którą opisuje niżej (daje ona przy okazji znacznie lepszą jakość OCR). Aby ją wykonać będą ci potrzebne:
A. Wiązka FineReadera 8.0
B. Rosyjski dekoder DjvuOCR 2.3
-- download: [link widoczny dla zalogowanych] [wersja 2.3]
-- lub link bezpośredni dla tych, co nie znają cyrylicy: [link widoczny dla zalogowanych]
-- rozpakuj gdzieś (i dodaj skrót na pulpit)
** (z FineReaderem 9.0 współpracuje tylko niestabilna 4 beta wer. 2.4: [link widoczny dla zalogowanych])
B. DjvuLibre wersja 3.5.20 lub wyższa:
-- download: [link widoczny dla zalogowanych] [wybierz wersję windows], potem zainstaluj
-- z pakietu będzie nam tylko potrzebna przeglądarka Djview 4.3 (lub 4.4) [doda się w Start/Programy/DjvuLibre/...]

1. Wczytaj do Djview swój plik djvu i wyeksportuj jego zawartość jako Tif wielostronicowy (tif document, nawet jeśli dokument był kolorowy, wybierz bitonal, G4). Kolor obrazków z punktu widzenia OCR nie odgrywa żadnej roli, a przyspieszy to proces 100-krotnie. Ustawienia ilustrują poniższe zrzuty.







W ten sposób uzyskasz zawartość swego pliku djvu w formacie wielostronicowego pliku TIF (w wysokiej kompresji G4)

2. Uruchom FineReadera i wczytaj plik. Wielostronicowy Tif wszyta się automatycznie. Potem wybierz Rozpoznaj wszystkie i czekaj cierpliwie aż program skończy.



3. Po zakończeniu rozpoznawania (sprawdź pobieżnie jak wyszło, ale nie rób korekty językowej). Zapisz tylko wyniki jako wiązka. Wiazka w FineReaderze to nie plik tylko folder (nie nie można go zapisywać wielokrotnie pod tą sama nazwą).



4. Teraz masz gotowy materiał:
- plik djvu (skąd eksportowałeś TIF) - w tym pliku jeszcze na ma OCR, ale zaraz będzie
- wiązkę FineReadera - gdzie jest sam OCR

5. Aby to połączyć użyj programu DjvuOCR 2.3.



6. Użyj Batch mode OCR maganer - ustawienia jak na zrzucie niżej. W szczególności należy:
- wczytać plik djvu (Ad djvu file)
- wiązkę (FineReader Project Directory) - po wczytaniu warto go przetestować (Test)
- można jeszcze dodać (ale nie jest to konieczne) dodatkowy wydruk kontrolny jako czyste text i html (ustawienia na zrzucie niżej)
- po ustawieniu wszystkich opcji wybierz: Process 0 czekaj aż zakończy



7. Masz już gotowy plik djvu z OCR w środku



8. Zainteresowani mogą poeksperymentować z innymi opcjami DjvuOCR 2.3 (warstwę można eksportować, usuwać, itd.)


Ostatnio zmieniony przez W. M. Kolasa dnia 12 Styczeń 2009, 3:02 am, w całości zmieniany 2 razy
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
Katarzyna Wator




Dołączył: 17 Lis 2008
Posty: 47
Przeczytał: 0 tematów


PostWysłany: 15 Styczeń 2009, 12:48 pm    Temat postu:

nie mogę wykonać tej pracy ponieważ podczas przekształcania z djvu na tiff w programie Djview wyskakuje błąd. Próbowałam na różnych komputerach i ciągle wyskakuje to samo.
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
P. Żurek




Dołączył: 22 Lis 2008
Posty: 30
Przeczytał: 0 tematów


Płeć: Pani

PostWysłany: 15 Styczeń 2009, 12:49 pm    Temat postu:

Podobny problem pojawił się również u mnie.
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
Karina Materna




Dołączył: 30 Lis 2008
Posty: 30
Przeczytał: 0 tematów


PostWysłany: 15 Styczeń 2009, 12:58 pm    Temat postu:

U mnie i Karoliny Kwapisz również wystąpił taki sam problem.
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
W. M. Kolasa
Administrator



Dołączył: 02 Kwi 2006
Posty: 3234
Przeczytał: 0 tematów

Skąd: Kraków
Płeć: Pan

PostWysłany: 16 Styczeń 2009, 1:37 am    Temat postu:

Jeśli podczas eksportu występuje ww. problem (zerwanie), należy OCR robić bezpośrednio z tifów (tych samych, z których tworzone było djvu).

Podobnie też wczytujemy te pliki:
1. Najpierw pierwszy
2. Potem dodajemy (ostatni +Shift drugi)

Reszta wg opisu.

Wyjaśnienie:

Z moich doświadczeń wynika, że przyczyna ww. problemu z tifami jest zazwyczaj jakaś niedozwolona operacja, którą wykonaliśmy na pliku/plikach. Np. kompresja do jpg i konwersja do do TIF (lub używanie nieodpowiednich programów do ich edycji). Po takich zabiegach djvu ma prawo ogłupieć i wtedy nie ma innej drogi tylko OCR wg sposobu który podałem wyżej (czyli bezpośrednio na TIFach).


Ostatnio zmieniony przez W. M. Kolasa dnia 16 Styczeń 2009, 1:37 am, w całości zmieniany 1 raz
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
Katarzyna Wator




Dołączył: 17 Lis 2008
Posty: 47
Przeczytał: 0 tematów


PostWysłany: 20 Styczeń 2009, 15:35 pm    Temat postu:

rozpoznane pliki wysłane na [link widoczny dla zalogowanych]
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
P. Żurek




Dołączył: 22 Lis 2008
Posty: 30
Przeczytał: 0 tematów


Płeć: Pani

PostWysłany: 20 Styczeń 2009, 16:59 pm    Temat postu:

rozpoznane pliki wysłane na [link widoczny dla zalogowanych]
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
D. Woźniak




Dołączył: 13 Paź 2008
Posty: 37
Przeczytał: 0 tematów


Płeć: Pan

PostWysłany: 20 Styczeń 2009, 17:38 pm    Temat postu:

Już ok.

Ostatnio zmieniony przez D. Woźniak dnia 27 Styczeń 2009, 13:46 pm, w całości zmieniany 1 raz
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
Katarzyna Wator




Dołączył: 17 Lis 2008
Posty: 47
Przeczytał: 0 tematów


PostWysłany: 26 Styczeń 2009, 14:38 pm    Temat postu:

Wator, Szczerba OCR wysłany na sendfile
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
Katarzyna Jordan




Dołączył: 01 Gru 2008
Posty: 22
Przeczytał: 0 tematów


PostWysłany: 29 Styczeń 2009, 16:18 pm    Temat postu:

ocr wysłany Smile
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
E. Pazdro




Dołączył: 13 Paź 2008
Posty: 29
Przeczytał: 0 tematów


Płeć: Pani

PostWysłany: 29 Styczeń 2009, 16:41 pm    Temat postu:

ocr wysłany.
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
M. Stańczyk




Dołączył: 07 Lis 2008
Posty: 26
Przeczytał: 0 tematów


Płeć: Pani

PostWysłany: 30 Styczeń 2009, 10:05 am    Temat postu:

OCR Magdalena Stańczyk i Maria Sygnarowicz został wysłany na [link widoczny dla zalogowanych]

Ostatnio zmieniony przez M. Stańczyk dnia 30 Styczeń 2009, 13:47 pm, w całości zmieniany 1 raz
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
M. Patronik




Dołączył: 30 Lis 2008
Posty: 30
Przeczytał: 0 tematów


Płeć: Pani

PostWysłany: 30 Styczeń 2009, 11:47 am    Temat postu:

OCR Benita Pasowicz, Małgorzata Pociecha, Monika Patronik wysłany na [link widoczny dla zalogowanych]
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
B. Choczyńska




Dołączył: 13 Paź 2008
Posty: 26
Przeczytał: 0 tematów

Skąd: Kraków
Płeć: Pani

PostWysłany: 30 Styczeń 2009, 21:11 pm    Temat postu:

ocr wysłane
Powrót do góry
Zobacz profil autora
Zobacz poprzedni temat :: Zobacz następny temat  
Autor Wiadomość
A.Knapik




Dołączył: 15 Lis 2008
Posty: 36
Przeczytał: 0 tematów


Płeć: Pani

PostWysłany: 4 Luty 2009, 20:26 pm    Temat postu:

OCR Ewelina Kamenczak, Alicja Knapik wyslany na [link widoczny dla zalogowanych]
Powrót do góry
Zobacz profil autora
Wyświetl posty z ostatnich:   
Napisz nowy temat   Odpowiedz do tematu    Forum Forum dyd@ktyczne INoI UP w Krakowie Strona Główna -> Technologia informacyjna (2008/2013) Wszystkie czasy w strefie CET (Europa)
Idź do strony 1, 2  Następny
Strona 1 z 2

 
Skocz do:  
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach

fora.pl - załóż własne forum dyskusyjne za darmo
Powered by phpBB © 2001, 2005 phpBB Group
Regulamin