2 efektywne sposoby wyodrębniania tekstu ze zdjęć i plików wydruków do dokumentu Word za pomocą OCR

Podziel się teraz:

W tym artykule są 2 sposoby na wyodrębnienie tekstu z obrazów i wydruków plików do dokumentu programu Word za pomocą OCR.

Program Word obsługuje optyczne rozpoznawanie znaków (OCR). Dzięki tej funkcji można wyodrębnić tekst z obrazu lub wydruku pliku do dokumentu programu Word. Tak świetne narzędzie pozwala nam na wprowadzanie kolejnych zmian w tych tekstach. Oto 2 szczegółowe podejścia do tego.Wyodrębnij tekst z obrazów i wydruków plików do dokumentu Word za pomocą OCR

Metoda 1: Użyj programu Microsoft Office Document Image Writer w programie Word 2003

  1. Najpierw otwórz program Word 2003. Kliknij kartę „Wstaw” na pasku menu i wybierz „Obraz”.
  2. Następnie wybierz „Z pliku”.  Kliknij „Wstaw” -> kliknij „Obraz” -> wybierz „Z pliku”
  3. Możesz powtórzyć powyższe 2 kroki, aby wstawić wiele obrazów do dokumentu.
  4. Następnie kliknij „Plik”, a następnie „Drukuj”, aby wywołać okno dialogowe „Drukuj”. Lub zamiast tego naciśnij „Ctrl + P”.
  5. W oknie dialogowym „Drukuj” wybierz drukarkę „Microsoft Office Document Image Writer”.
  6. Upewnij się, że wybrano „Wszystkie” dla „Zakres stron”.
  7. Następnie kliknij „OK”.Wybierz Drukarka->Wybierz „Wszystkie” dla zakresu stron->Kliknij „OK”
  8. W wyświetlonym oknie „Zapisz jako” wybierz miejsce przechowywania i kliknij „Zapisz”.
  9. Teraz w oknie „Microsoft Office Document Imaging” użyj myszy, aby narysować kwadratowe pole zawierające sekcję, w której znajduje się tekst do wyodrębnienia.Wybierz obszar -> kliknij prawym przyciskiem myszy -> wybierz „Kopiuj”
  10. Następnie kliknij prawym przyciskiem myszy i wybierz „Kopiuj”. Następną rzeczą, którą zobaczysz, jest zaznaczenie wszystkich tekstów w narysowanym polu.Teksty w tym obszarze są zaznaczone
  11. Na koniec otwórz dokument programu Word i wklej tam tekst, na przykład poniżej:Efekt korzystania z programu Microsoft Office Document Image Writer

Jak widać, nie jest w stanie poprawnie rozpoznać wszystkich słów. Ale nadal jest to znacznie szybsze niż wpisywanie ich ręcznie.

Metoda 2: Użyj funkcji OCR w programie OneNote w programie Word 2010

  1. Przede wszystkim wstaw obrazy do dokumentu programu Word.
  2. Następnie kliknij „Plik” tan, a następnie kliknij „Drukuj”.
  3. Następnie wybierz drukarkę „Wyślij do OneNote 2010”.
  4. I wybierz opcję drukowania wszystkich stron.
  5. Kliknij przycisk „Drukuj”.Kliknij „Plik” -> kliknij „Drukuj” -> wybierz „Wyślij do drukarki OneNote 2010” -> wybierz „Drukuj wszystkie strony” -> kliknij „Drukuj”
  6. Teraz uruchomiłeś program OneNote. W oknie „Wybierz lokalizację w programie OneNote” wybierz opcję „Strona bez tytułu” lub „Nowa sekcja 1”, aby zachować zawartość do wydrukowania.
  7. Następnie kliknij „OK”.Wybierz lokalizację -> kliknij „OK”
  8. Następnie kliknij wydruk i kliknij prawym przyciskiem myszy.
  9. Wybierz „Kopiuj tekst ze wszystkich stron wydruku”.Kliknij Wydruk->Kliknij prawym przyciskiem myszy->Wybierz „Kopiuj tekst ze wszystkich stron wydruku”
  10. Otwórz pusty dokument programu Word i wklej tam tekst.Efekt użycia OCR w OneNote

Chroń swój dokument Word

Łatwo zrozumieć, że Word nie jest odporny na korupcję. Właściwie żadne oprogramowanie tego nie robi. Dlatego potrzebne są pewne działania zapobiegawcze. Na przykład możesz regularnie tworzyć kopie zapasowe dokumentów. Poza tym dobrze jest mieć narzędzie do naprawy uszkodzony docx.

Wprowadzenie autora:

Vera Chen jest ekspertem w dziedzinie odzyskiwania danych w DataNumen, Inc., która jest światowym liderem w technologiach odzyskiwania danych, w tym Odzyskiwanie programu Excel i pdf oprogramowanie do naprawy. po więcej informacji odwiedź www.datanumen.com

Podziel się teraz:

Możliwość dodawania komentarzy nie jest dostępna.