Aplikace v tomto pracovním postupu

Jak to funguje

Vytvořte si automatický extraktor z pdf na text za minutu! Ideální řešení pro ty, kteří se zabývají velkým množstvím příchozích životopisů nebo jiných dokumentů! Extrahujte data z dokumentů pomocí vzdáleného pracovního postupu na adrese Latenode.com!


V tomto článku se dozvíte, jak vytvořit automatizovaný pracovní postup bez kódu, který bude získávat data ze souborů PDF na vašem Disku Google pomocí rozhraní API a Chat GPT a vyplní formulář Tabulky Google těmito daty.

Také můžete získat šablonu tohoto scénáře, kterou si můžete zdarma zkopírovat a použít pro sebe! 

Tuto šablonu můžete upgradovat nebo použít nejen pro extrakci textu v pdf.

Přehled scénářů

Podívejme se nejprve na celý scénář škrabky pdf a poté rozeberme jednotlivé kroky.

Ilustrace přehledu scénářů na Latenode

Jak tento scénář výpisu pdf funguje? Jednou za hodinu vezme všechny životopisy ve formátu pdf z Disku Google, převede je do souborů txt pomocí HTTP požadavku a poté asistent chatGPT extrahuje potřebná data a vyplní tabulku Google Spreadsheet.

Hlavní kroky scénáře:

  1. Spouštěč plánu. Aktivuje scénář v nastaveném časovém období.
  2. Disk Google. Zde máme 2 uzly: Najít soubor a Stáhnout soubor.
  3. Javascript. V celém scénáři budeme používat uzly Javascriptu s kopilotem AI pro formátování souborů. Nejprve jsem požádal AI o kód, který převede soubory z Disku Google do formátu base64.
  4. Požadavek HTTP. Použijte API k extrakci textu z pdf pomocí dokumentů API vyzkoušených služeb stran.
  5. ChatGPT. Asistent ChatGPT extrahuje data z textu.
  6. Tabulky Google. Vyplní list těmito informacemi,

Rozdělení scénářů

A zde je návod krok za krokem pro ty, kteří se chtějí tento postup naučit. Na konci článku nezapomeňte na šablony, které jsou zdarma a připravené k použití.

Přípravky

Pro tento scénář budete potřebovat možnost používat asistenty Open AI a jakýkoli převodník API.

Asistent OpenAI

To je jednoduché. Přihlaste se ke svému účtu OpenAI a přejděte na stránku asistentia klikněte na tlačítko "vytvořit" v pravém horním rohu. Zobrazí se panel nastavení asistenta.

Ilustrace správného nastavení asistenta umělé inteligence

Zde je třeba:

  1. Dejte svému asistentovi jméno
  2. Dejte mu pokyny, jak má odpovídat, a nějaký kontext. Doporučujeme, abyste ho požádali o použití přiložených souborů, protože jinak na to může zapomenout.
  3. Výběr modelu
  4. Vyberte dostupné nástroje a přidejte soubory, které může asistent použít. Nezapomeňte zapnout vyhledávání, aby bylo možné přidávat soubory.

Zkopírujte ID asistenta (uvidíte ho ve sloupci Název) a přejděte na stránku Klíče API, vytvořte jej a uložte.

Převodník PDF na TXT

Použijte libovolný, který se vám líbí. Já jsem si vzal ConvertAPI, protože má zkušební verzi zdarma a poskytuje spoustu informací.

Ilustrace aplikace ConvertAPI pro vytvoření automatického převodníku z pdf na text

Vytvořit scénář

Nyní přepneme na Latenode.com. Zde musíme vytvořit scénář převodu pdf na text: (Nemusíte jej vytvářet od začátku, stačí zkopírovat šablonu na konci článku).

Spouštěč plánu

Ilustrace spuštění plánu

Na kartě scénáře klikněte na tlačítko "Přidat uzel" a ze seznamu vyberte možnost "Plán". Kliknutím na uzel jej nastavte. Zadejte interval a časové pásmo, uložte změny. Jednou jsem také přidal spouštěč na Spustit, jen pro pohodlí.

Uzly Disku Google

Ilustrace uzlů Disku Google

Klikněte na tlačítko "Přidat uzel", na kartě akcí vyhledejte složku Google drive a vyberte uzel "Najít soubor".
Aby to fungovalo, musíte se přihlásit k účtu gmail a získat přístupový token, vybrat jednotku a název Search. V tomto případě chci získat data ze souborů, které mají v názvu CV.

Dále přidejte "Stáhnout soubor" ze stejné složky akce na disku Google.

Ilustrace, jak stáhnout soubor, který potřebujete k vytvoření AI pdf-textového konvertoru

Použijte id z výsledků předchozího uzlu a poté jednou klikněte na tlačítko spustit uzel, abyste uložili změny a zajistili tok dat scénářem. Ve výstupu se zobrazí soubor.

Javascript #1: Převod na base64

Ilustrace kódu JS, který potřebujete Pro extrakci textu

To je kód, který mi dala umělá inteligence. Můžete si ho vzít zde(#1). Nahraďte konst fileContentPath svým objektem z předchozího uzlu.

Požadavek HTTP

Vyhledejte požadavek HTTP v seznamu akcí. Chcete-li pochopit, jak ji vytvořit, navštivte dokumentaci k rozhraní ConvertAPI. Zde můžeme načerpat informace o nastavení požadavku.

Takto vypadá můj požadavek na převod z pdf do txt.

Ilustrace správného nastavení HTTP reques

K zadání názvu staženého souboru používám objekt z uzlu Najít soubor na Disku Google a obsah souboru v base64 z uzlu Javascript. A v záhlaví přidám dvojici Content-Type=application/json.

Ilustrace správného nastavení HTTP reques

Spusťte uzel jednou, abyste získali soubor z požadavku HTTP.

Javascript #2

Ilustrace kódu JS, který potřebujete Pro extrakci textu

Další kódový uzel, č. 2 zde.

Tentokrát jsem požádal AI o extrakci textu ze souboru txt.

Uzly ChatGPT

Budeme zde čelit 3 uzlům GPT:

  • Vytvořit vlákno
  • Vytvořit zprávu
  • Vytvořit běh

 Každý uzel provede akci pomocí nástroje OpenAI.

Nejprve vytvoříme vlákno nebo konverzaci s asistentem GPT.

Ilustrace vytvoření uzlů ChatGPT a použití klíče AP

Vložte svůj klíč Open AI API a je to! Jednou spusťte uzel a ve výstupu získáte id vytvořeného vlákna.

Vytvořit zprávu:

ilustrace, jak vytvořit správnou masáž pro AI Support Assistent

Zde opět potřebujete klíč API. Do pole ID vlákna vložte výsledek předchozího uzlu. Ten se zobrazí v pomocném okně po kliknutí na vstupní pole.

V části "Obsah zprávy" uveďte další pokyny, pokud chcete, a vložte obsah souboru z posledního uzlu Javascriptu. Automatizovaný extraktor pdf je o krok blíž!

Vytvořit běh

Ilustrace Jak vytvořit běh a sledovat výsledek

Tento uzel obdrží odpověď pdf scraperu.

Zadejte uzel stejně jako asistent OpenAI a použijte ID asistenta GPT.

Javascript #3

Ilustrace kódu JS, který potřebujete Pro extrakci textu

Zde naposledy použijeme uzel JS, abychom z odpovědi asistenta vytvořili 3 samostatné objekty json.

Zde je příklad, stačí vložit data do content const.

Tabulky Google

Umístěme tato data někam, tabulky Google jsou dobrou volbou pro tento scénář výpisu dat ve formátu pdf na adrese latenode.com.

ilustrace potřebných nastavení Tabulek Google

Ještě jednou se přihlaste k účtu gmail, abyste získali přístupový token, vyberte jednotku a list a vložte jsony do polí, uložte scénář a kliknutím na tlačítko spustit jednou spusťte nebo nasaďte scénář, abyste aktivovali spouštěč plánu.

Výsledky

Výsledky naší práce

Po úspěšném provedení scénáře tento pracovní postup extrahuje text ze souboru pdf na vašem Disku Google a vloží jej do tabulky Google Spreadsheet.

To je způsob, jak vytvořit extraktor pdf bez kódu na adrese latenode.

Jak jsem slíbil, zde je šablona tohoto pracovního postupu. Stačí ji zkopírovat a podle tohoto článku s návodem ji nastavit.

Je o tom video, neobtěžujte se čtením!

Pokud chcete, aby vám někdo pomohl, podívejte se na náš kanál na Discordu, máme tam několik vývojářů připravených pomoci!

Kategorie

AI
IT a vývoj
Reklama a marketing

ČASTO KLADENÉ DOTAZY

Mohu používat Latenode , pokud neumím programovat?

Ano, stránka Latenode je určena pro uživatele všech úrovní dovedností. Nabízí pokročilé funkce pro ty, kteří jsou zběhlí v JavaScriptu, a intuitivní vizuální nástroje a pomoc umělé inteligence pro začátečníky. Ať už jste zkušený vývojář, nebo začátečník, Latenode poskytuje uživatelsky přívětivé prostředí přizpůsobené vaší úrovni dovedností.‍‍

Lze web Latenode integrovat se službami a rozhraními API třetích stran?

Ano, Latenode podporuje integraci s celou řadou služeb a rozhraní API třetích stran. Můžete propojit Latenode s různými online platformami, databázemi a softwarovými systémy a automatizovat tak přenosy dat, spouštět akce a zefektivnit pracovní postupy. Latenode také poskytuje nástroje a zdroje, které proces integrace usnadňují.

Je k dispozici bezplatná verze Latenode ?

Ano, Latenode nabízí bezplatnou verzi, která vám umožní prozkoumat její možnosti. Tato verze obsahuje podmnožinu funkcí Latenode a umožňuje vám začít s automatizací a vyzkoušet si její výhody. Poté se můžete rozhodnout, zda přejdete na placený plán pro další funkce a zdroje.

Co je Latenode?

Latenode je viditelný a intuitivní automatizační nástroj, který má zákazníkům umožnit zefektivnit jejich pracovní postupy pomocí automatizace. Umožňuje zákazníkům vytvářet počítačové strategie prostřednictvím propojení různých internetových nabídek a gadgetů, což jim umožňuje úspěšně automatizovat povinnosti a zdobit produktivitu.

Jak Latenode pomáhá maximalizovat příležitosti?

Díky integraci všech marketingových nástrojů na jednom místě prostřednictvím integrace dat vám Latenode pomůže získat komplexní přehled o vašich operacích. Díky tomu můžete snadněji identifikovat potenciální příležitosti a přijímat informovaná rozhodnutí na základě přesných dat.