Mnohokrát je možné, že jsme narazili na soubory, ve kterých se objevují obrázky, ale že nás ve skutečnosti zajímá pouze text, který obsahují, protože můžeme dokonce chtít změnit příponu.
Jednou ze současných technologií, které jsou velmi praktické a zajímavé pro jakýkoli typ uživatele, je technologie OCR (Optical Character Recognition), která nám dává možnost jednoduchým způsobem extrahovat text z obrázku a to nám umožňuje mít praktický nástroj na ruku v ruce, protože při mnoha příležitostech musíme mít upravitelný text obrázku, ať už je to pdf univerzity, bankovní výpis, obrázek s návodem k použití, zkrátka různé možnosti.
V zásadě nám OCR umožňuje převádět různé typy souborů do upravitelného formátu a mít v něm možnost vyhledávání.
Základní operace technologie OCR
- OCR nejprve analyzuje strukturu obrazu.
- Později rozdělí text na prvky, jako jsou obrázky, text atd.
- Rozdělte řádky na slova a poté na znaky
- Toto je uloženo v textovém formátu
Dnes budeme analyzovat, jak implementovat a používat technologii OCR v systému Windows 10, i když předdefinované programy pro prohlížení obrázků, jako jsou Fotografie nebo Malování, tuto schopnost nemají.
1. Znáte a stáhněte si skenování fotografií
Krok 1
Photo Scan je bezplatný nástroj, který nám dá možnost extrahujte text z obrázku nebo souboru jako PDF jednoduše a úplně. Skenování fotografií je nepochybně nástroj, který bude velkou pomocí pro veškerou práci, která vyžaduje získání informací o libovolném souboru obrázku, což nám poskytne přesný a spolehlivý obsah textu souboru.
Hlavní funkce Skenování fotografií
- Podporuje zařízení, jako je kamera
- Podporuje různé jazyky
- Extrakce textu je snadná
- Můžeme jej nakonfigurovat s různými motivy, abychom získali lepší vizualizaci
- Podporuje převod textu na řeč
- Bezúplatné
- Podporuje Windows 10 Anniversary Edition
- Obrázky můžeme vkládat přímo z internetu
Následující odkaz nás zavede přímo do obchodu Windows a odtud jej můžeme bezpečně stáhnout a nainstalovat.
skenování fotografií
Krok 2
Když nainstalujeme a spustíme skenování fotografií poprvé, budeme mít následující prostředí. Jak vidíme, máme tři (3) alternativy k získání obrázků, ze kterých extrahujeme text:
- Procházet fotografii: Pomocí této možnosti můžeme prohledávat obrázky v našem týmu
- Použít kameru: Pomocí této možnosti můžeme použít fotoaparát v systému Windows 10 k pořízení obrázku
- Vložit obrázek: S touto alternativou můžeme vkládat obrázky přímo z internetu
Krok 3
Abychom porozuměli velkému rozsahu skenování fotografií, definujeme způsob, jakým získáme obrázek, v tomto případě to bude Procházet fotografii¸ a můžeme vidět probíhající skenování fotografií:
Jak vidíme, aplikace zcela extrahuje text z obrázku, který jsme vybrali.
2. Nastavení obrázku
Jakmile máme obrázek s extrahovaným textem, můžeme použít alternativy, jako například:
Poslechněte si textToto je jedna z hlavních funkcí aplikace, protože stisknutím ikony hlasitosti v horní části uslyšíme veškerý text na obrázku.
DržetPo kliknutí na ikonu diskety pro uložení našeho textu musíme vybrat umístění a název souboru, kde bude výchozím formátem textový dokument, abychom umožnili následné úpravy.
Zalamování textuMůžeme kliknout na ikonu, můžeme definovat orientaci extrahovaného textu, ve výchozím nastavení je svislý, ale můžeme jej převést na vodorovný.
Další nastaveníMůžeme kliknout na tlačítko se třemi vodorovnými čarami umístěnými v levém horním rohu a uvidíme, že se zobrazí následující:
V dolní části klikneme na možnost Nastavení + O aplikaci pro přístup k dalším parametrům aplikace
Zde můžeme definovat hodnoty jako:
- Jazyk, ve kterém bude text extrahován
- Vyberte si vlastní motiv pro aplikaci
- Nastavte výchozí možnosti textu
Skenování fotografií bude cenným nástrojem pro chvíle, kdy je nutné mít po ruce text obrázku nebo souboru pro úpravy.
Extrahujte obrázek z PDF