Importa data minn PDF għal Excel permezz tal-Power Query

Il-kompitu tat-trasferiment tad-dejta minn spreadsheet f'fajl PDF għal folja Microsoft Excel huwa dejjem "gost". Speċjalment jekk m'għandekx softwer ta' rikonoxximent għali bħal FineReader jew xi ħaġa bħal dik. L-ikkupjar dirett normalment ma jwassalx għal xi ħaġa tajba, għax. wara li twaħħal id-dejta kkupjata fuq il-folja, x'aktarx "jingħaqdu" f'kolonna waħda. Allura mbagħad ikollhom jiġu separati bir-reqqa bl-użu ta 'għodda Test bil-kolonni mit-tab Data (Data — Test għal Kolonni).

U ovvjament, l-ikkupjar huwa possibbli biss għal dawk il-fajls PDF fejn hemm saff ta 'test, jiġifieri b'dokument li jkun għadu kif ġie skannjat minn karta għal PDF, dan mhux se jaħdem fil-prinċipju.

Imma mhux daqshekk imdejjaq, tassew 🙂

Jekk għandek Office 2013 jew 2016, imbagħad fi ftit minuti, mingħajr programmi addizzjonali, huwa pjuttost possibbli li tittrasferixxi data minn PDF għal Microsoft Excel. U Word and Power Query se jgħinuna f'dan.

Pereżempju, ejja nieħdu dan ir-rapport PDF b'mazz ta' testi, formuli u tabelli mill-websajt tal-Kummissjoni Ekonomika għall-Ewropa:

Importa data minn PDF għal Excel permezz tal-Power Query

... u tipprova tiġbed minnha f'Excel, ngħidu l-ewwel tabella:

Importa data minn PDF għal Excel permezz tal-Power Query

Tlaqna!

Pass 1. Iftaħ PDF fil-Word

Għal xi raġuni, ftit nies jafu, iżda mill-2013 Microsoft Word tgħallmet tiftaħ u tagħraf fajls PDF (anke dawk skennjati, jiġifieri, mingħajr saff ta 'test!). Dan isir b'mod kompletament standard: tiftaħ Word, ikklikkja Fajl – Iftaħ (Fajl — Miftuħ) u speċifika l-format PDF fil-lista drop-down fir-rokna t'isfel tal-lemin tat-tieqa.

Imbagħad agħżel il-fajl PDF li għandna bżonn u kklikkja miftuħa (Miftuħ). Word tgħidilna li se tħaddem l-OCR fuq dan id-dokument għal test:

Importa data minn PDF għal Excel permezz tal-Power Query

Naqblu u fi ftit sekondi naraw il-PDF tagħna miftuħ għall-editjar diġà fil-Word:

Importa data minn PDF għal Excel permezz tal-Power Query

Naturalment, id-disinn, stili, fonts, headers u footers, eċċ se jtiru parzjalment mid-dokument, iżda dan mhux importanti għalina - għandna bżonn biss dejta mit-tabelli. Fil-prinċipju, f'dan l-istadju, huwa diġà jitħajjar li sempliċement tikkopja t-tabella mid-dokument rikonoxxut fil-Word u sempliċement tippejstjaha f'Excel. Xi drabi taħdem, iżda aktar spiss twassal għal kull xorta ta 'distorsjonijiet tad-dejta - pereżempju, in-numri jistgħu jinbidlu f'dati jew jibqgħu test, bħal fil-każ tagħna, għaliex. PDF juża mhux separaturi:

Importa data minn PDF għal Excel permezz tal-Power Query

Mela ejja ma naqtgħux kantunieri, imma nagħmlu kollox ftit aktar ikkumplikat, imma sewwa.

Pass 2: Issejvja d-Dokument bħala Web Page

Biex imbagħad tagħbija d-dejta riċevuta f'Excel (permezz tal-Power Query), id-dokument tagħna f'Word jeħtieġ li jiġi ffrankat fil-format tal-paġna tal-web - dan il-format huwa, f'dan il-każ, tip ta 'denominatur komuni bejn Word u Excel.

Biex tagħmel dan, mur fil-menu File – Save As (Fajl — Save As) jew agħfas iċ-ċavetta F12 fuq it-tastiera u fit-tieqa li tiftaħ, agħżel it-tip tal-fajl Web page f'fajl wieħed (Paġna web — Fajl wieħed):

Importa data minn PDF għal Excel permezz tal-Power Query

Wara li ssejvja, għandek tikseb fajl bl-estensjoni mhtml (jekk tara l-estensjonijiet tal-fajls fl-Explorer).

Stadju 3. Tlugħ tal-fajl fl-Excel permezz tal-Power Query

Tista 'tiftaħ il-fajl MHTML maħluq f'Excel direttament, iżda mbagħad se nġibu, l-ewwelnett, il-kontenut kollu tal-PDF f'daqqa, flimkien ma' test u mazz ta 'tabelli mhux meħtieġa, u, it-tieni, nerġgħu nitilfu d-dejta minħabba skorretti separaturi. Għalhekk, se nagħmlu l-importazzjoni f'Excel permezz tal-Power Query add-in. Din hija add-on kompletament b'xejn li biha tista 'ttella' dejta f'Excel minn kważi kull sors (fajls, folders, databases, sistemi ERP) u mbagħad tittrasforma d-dejta riċevuta b'kull mod possibbli, u tagħtiha l-forma mixtieqa.

Jekk għandek Excel 2010-2013, allura tista 'tniżżel Power Query mill-websajt uffiċjali ta' Microsoft - wara l-installazzjoni tara tab Mistoqsija dwar l-Enerġija. Jekk għandek Excel 2016 jew aktar ġdid, allura m'għandekx bżonn tniżżel xejn - il-funzjonalità kollha hija diġà mibnija f'Excel b'mod awtomatiku u tinsab fuq it-tab Data (Data) fil-grupp Niżżel u Aqleb (Ikseb & Ittrasforma).

Allura aħna mmorru jew għat-tab Data, jew fuq it-tab Mistoqsija dwar l-Enerġija u agħżel tim Biex tikseb data or Oħloq Mistoqsija - Mill-Fajl - Minn XML. Biex tagħmel viżibbli mhux biss fajls XML, ibdel il-filtri fil-lista drop-down fir-rokna t'isfel tal-lemin tat-tieqa għal Il-fajls kollha (Il-fajls kollha) u speċifika l-fajl MHTML tagħna:

Importa data minn PDF għal Excel permezz tal-Power Query

Jekk jogħġbok innota li l-importazzjoni mhux se titlesta b'suċċess, għaliex. Power Query jistenna XML minna, iżda fil-fatt għandna format HTML. Għalhekk, fit-tieqa li jmiss li tidher, ser ikollok bżonn tikklikkja bil-lemin fuq il-fajl inkomprensibbli għal Power Query u speċifika l-format tiegħu:

Importa data minn PDF għal Excel permezz tal-Power Query

Wara dan, il-fajl jiġi rikonoxxut b'mod korrett u se naraw lista tat-tabelli kollha li fih:

Importa data minn PDF għal Excel permezz tal-Power Query

Tista 'tara l-kontenut tat-tabelli billi tikklikkja l-buttuna tax-xellug tal-maws fl-isfond abjad (mhux fil-kelma Tabella!) taċ-ċelloli fil-kolonna tad-Data.

Meta t-tabella mixtieqa tkun definita, ikklikkja fuq il-kelma ħadra Tabella – u int “taqa’” fil-kontenut tiegħu:

Importa data minn PDF għal Excel permezz tal-Power Query

Fadal li tagħmel ftit passi sempliċi biex "jimxaħ" il-kontenut tagħha, jiġifieri:

  1. ħassar kolonni mhux meħtieġa (ikklikkja bil-lemin fuq l-intestatura tal-kolonna - Neħħi)
  2. ibdel it-tikek bil-virgoli (agħżel il-kolonni, ikklikkja bil-lemin - Sostituzzjoni tal-valuri)
  3. neħħi sinjali ugwali fl-intestatura (agħżel kolonni, ikklikkja bil-lemin - Sostituzzjoni tal-valuri)
  4. neħħi l-linja ta' fuq (home – Ħassar il-linji – Ħassar il-linji ta’ fuq)
  5. neħħi linji vojta (Dar – Ħassar linji – Ħassar linji vojta)
  6. għolli l-ewwel ringiela għall-intestatura tal-mejda (Home – Uża l-ewwel linja bħala intestaturi)
  7. iffiltra data mhux meħtieġa billi tuża filtru

Meta l-mejda tinġieb fil-forma normali tagħha, tista 'tinħatt fuq il-folja bil-kmand agħlaq u niżżel (Agħlaq u Tagħbija) on Il-prinċipali tab. U se nġibu sbuħija bħal din li biha diġà nistgħu naħdmu:

Importa data minn PDF għal Excel permezz tal-Power Query

  • It-trasformazzjoni ta' Kolonna għal Tabella b'Mistoqsija dwar l-Enerġija
  • Qsim ta 'test li jwaħħal f'kolonni

Ħalli Irrispondi