Selēnu var klasificēt kā automatizācijas rīku, kas atvieglo informācijas nokasīšanu no HTML tīmekļa lapām, lai veiktu tīmekļa nokasīšanu, izmantojot google hromu.
Šajā apmācībā jūs uzzināsiet:
Kas ir datu nokasīšana, izmantojot selēnu?
Kā sagatavot Excel Macro pirms datu nokasīšanas, izmantojot selēnu?
Kā atvērt Google Chrome, izmantojot VBA?
Kā atvērt vietni Google Chrome, izmantojot VBA?
Kā nokasīt informāciju no vietnes, izmantojot VBA?
Kā sagatavot Excel Macro pirms datu nokasīšanas, izmantojot selēnu?
Ir daži priekšnosacījumi, kas jāizpilda Excel makro failā, pirms tiek iesaistīts datu nokasīšanas procesā Excel.
2. solis) Atlasiet Visual Basic opciju zem Izstrādātāja lentes.
3. solis) Ievietojiet jaunu moduli.
4. solis. Inicializējiet jaunu apakšprogrammu un nosauciet to kā test2.
2. apakšpārbaude ()Beigu apakšnodaļa
Šādi būtu moduļa rezultāti: -
5. solis. Piekļūstiet atsauces opcijai cilnē rīks un norādiet Selenium tipa bibliotēku. Uz moduli ir jāatsaucas uz šīm bibliotēkām, jo tas palīdz atvērt google chrome un atvieglo makro skriptu izstrādi.
Tagad Excel fails ir gatavs mijiedarbībai ar Internet Explorer. Nākamās darbības būtu makro skripta iekļaušana, kas atvieglotu datu nokasīšanu HTML.
Kā atvērt Google Chrome, izmantojot VBA?
Šeit ir solis, lai atvērtu Google Chrome, izmantojot VBA
1. solis. Paziņojiet un inicializējiet mainīgos apakšprogrammā, kā parādīts zemāk
2. apakšpārbaude ()Blāvs draiveris kā jauns tīmekļa draiverisRimējiet rindas c, cc, kolonnu C kā veselu skaitli
2. solis. Lai atvērtu google chrome, izmantojot selēnu un VBA, ierakstiet driver.start “hroms” un nospiediet F5 .
Tālāk būtu kods.
2. apakšpārbaude ()Blāvs draiveris kā jauns tīmekļa draiverisRimējiet rindas c, cc, kolonnu C kā veselu skaitliDriver.start "Chrome"Lietojumprogramma. Pagaidiet tūlīt + Laiks ("00:00:20")Beigu apakšnodaļa
Moduļa rezultāts būtu šāds: -
Kā atvērt vietni Google Chrome, izmantojot VBA?
Kad varēsiet piekļūt google chrome, izmantojot VBA, nākamais solis būtu piekļuves vietnei iekļaušana, izmantojot VBA. To veicina get funkcija, kurā URL atribūtā jānorāda kā pēdiņas.
Veiciet šādas darbības, kā parādīts
Modulis izskatīsies šādi: -
Nospiediet F5, lai izpildītu makro.
Šī vietne tiks atvērta google hromā, kā parādīts
2. apakšpārbaude ()Blāvs draiveris kā jauns tīmekļa draiverisRimējiet rindas c, cc, kolonnu C kā veselu skaitliDriver.start "Chrome"Driver.get "http://demo.guru99.com/test/web-table-element.php"Lietojumprogramma. Pagaidiet tūlīt + Laiks ("00:00:20")Beigu apakšnodaļa
Tagad Excel makro ir gatavs attiecībā uz skrāpēšanas uzdevumu veikšanu. Nākamais solis parādīs, kā informāciju var iegūt, lietojot selēnu un VBA.
Kā nokasīt informāciju no vietnes, izmantojot VBA?
Pieņemsim, ka dienas tirgotājs vēlas piekļūt datiem no vietnes katru dienu. Katru dienu, kad tirgotājs nospiež pogu, tam automātiski jāiegūst tirgus dati Excel.
No iepriekš minētās vietnes būtu nepieciešams pārbaudīt kādu elementu un novērot datu struktūru. Piekļūstiet zemāk esošajam HTML avota kodam, nospiežot taustiņu kombināciju Control + Shift + I
Uzņēmums
grupa
Iepriekšēja aizvēršana (Rs)
Pašreizējā cena (Rs)
% izmaiņas
Pirmkods būtu šāds: -
Kā redzams, dati ir strukturēti kā viena HTML tabula. Tāpēc, lai no HTML tabulas izvilktu visus datus, būtu jāveido makro, kas izvelk HTML tabulas galvenes informāciju un attiecīgos ar tabulu saistītos datus. Veiciet šādus uzdevumus, kā parādīts: -
1. solis. Formulējiet cilpu for, kas darbojas kā HTML galvenes informācija kā kolekcija. Selēna draiverim jāatrod HTML tabulas galvenes informācija. Lai to izdarītu, mēs izmantojam metodi FindElementByClass () un FindElementByTag (), lai veiktu parādīto uzdevumu
VBA modulis izskatīsies šādi: -
2. apakšpārbaude ()Blāvs draiveris kā jauns WebDriverAptumšojiet rindu c, cc, kolonnu C kā veselu skaitlirowc = 2Application.ScreenUpdating = Nepatiesavadītājs. Sāciet "hroms"draiveris. Iegūstiet vietni "http://demo.guru99.com/test/web-table-element.php"Katram draiverim.FindElementByClass ("dataTable"). FindElementByTag ("thead"). FindElementsByTag ("tr")cc = 1Par katru t th.FindElementsByTag ("th")2. lapa. Šūnas (1, cc). Vērtība = t. Tekstscc = cc + 1Nākamais tNākamais th
2. solis. Tālāk selēna draiveris atrastu tabulas datus, izmantojot līdzīgu pieeju, kā minēts iepriekš. Jums ir jāuzraksta šāds kods: -
2. apakšpārbaude ()Blāvs draiveris kā jauns WebDriverAptumšojiet rindu c, cc, kolonnu C kā veselu skaitlirowc = 2Application.ScreenUpdating = Nepatiesavadītājs. Sāciet "hroms"draiveris. Iegūstiet vietni "http://demo.guru99.com/test/web-table-element.php"Katram draiverim.FindElementByClass ("dataTable"). FindElementByTag ("thead"). FindElementsByTag ("tr")cc = 1Par katru t th.FindElementsByTag ("th")2. lapa. Šūnas (1, cc). Vērtība = t. Tekstscc = cc + 1Nākamais tNākamais thKatram tr In driver.FindElementByClass ("dataTable"). FindElementByTag ("tbody"). FindElementsByTag ("tr")kolonna C = 1Katram td Tr.FindElementsByTag ("td")Sheet2. Šūnas (rowc, columnC). Vērtība = td. Tekstskolonna C = kolonna C + 1Nākamais tdrowc = rowc + 1Nākamais trApplication.Wait Now + TimeValue ("00:00:20")Beigu apakšnodaļa
VBA modulis izskatīsies šādi: -
Excel var inicializēt, izmantojot Excel lapas atribūtu Range vai izmantojot Excel lapas šūnu atribūtu. Lai samazinātu VBA skripta sarežģītību, kolekcijas dati tiek inicializēti darbgrāmatā esošajā 2. lapas Excel šūnu atribūtā. Turklāt teksta atribūts palīdz iegūt teksta informāciju zem HTML taga.
2. apakšpārbaude ()Blāvs draiveris kā jauns WebDriverAptumšojiet rindu c, cc, kolonnu C kā veselu skaitlirowc = 2Application.ScreenUpdating = Nepatiesavadītājs. Sāciet "hroms"draiveris. Iegūstiet vietni "http://demo.guru99.com/test/web-table-element.php"Katram draiverim.FindElementByClass ("dataTable"). FindElementByTag ("thead"). FindElementsByTag ("tr")cc = 1Par katru t th.FindElementsByTag ("th")2. lapa. Šūnas (1, cc). Vērtība = t. Tekstscc = cc + 1Nākamais tNākamais thKatram tr In driver.FindElementByClass ("dataTable"). FindElementByTag ("tbody"). FindElementsByTag ("tr")kolonna C = 1Katram td Tr.FindElementsByTag ("td")Sheet2. Šūnas (rowc, columnC). Vērtība = td. Tekstskolonna C = kolonna C + 1Nākamais tdrowc = rowc + 1Nākamais trApplication.Wait Now + TimeValue ("00:00:20")Beigu apakšnodaļa
VBA modulis izskatīsies šādi: -
3. solis. Kad makro skripts ir gatavs, nododiet apakšprogrammu Excel pogai Excel un izejiet no VBA moduļa. Atzīmējiet pogu kā atsvaidzināšanu vai jebkuru citu piemērotu nosaukumu, ko tajā varētu inicializēt. Šajā piemērā poga tiek inicializēta kā atsvaidzināšana.
4. solis) Nospiediet atsvaidzināšanas pogu, lai iegūtu zemāk minēto produkciju
5. solis. Salīdziniet Excel rezultātus ar google hroma rezultātiem
Kopsavilkums:
Selēnu var klasificēt kā automatizācijas rīku, kas atvieglo informācijas nokasīšanu no HTML tīmekļa lapām, lai veiktu tīmekļa nokasīšanu, izmantojot google hromu.
Skrāpēšana internetā jāveic uzmanīgi.
Informācijas nokasīšana parasti ir pretrunā ar vietnes noteikumiem.
Kad skrāpēšana tiek veikta caur selēnu, tā piedāvā vairāku pārlūkprogrammu atbalstu.
Citiem vārdiem sakot, skrāpis var veikt līdzīgus skrāpēšanas uzdevumus, izmantojot arī Firefox, Internet Explorer.