Kas ir urllib?
urllib ir Python modulis, ko var izmantot vietrāžu URL atvēršanai. Tas nosaka funkcijas un klases, kas palīdz URL darbībās.
Izmantojot Python, varat arī piekļūt datiem un izgūt tos no interneta, piemēram, XML, HTML, JSON utt. Jūs varat arī izmantot Python, lai tieši strādātu ar šiem datiem. Šajā apmācībā mēs redzēsim, kā mēs varam iegūt datus no tīmekļa. Piemēram, šeit mēs izmantojām guru99 video URL, un mēs piekļūsim šim video URL, izmantojot Python, kā arī izdrukāsim šī URL HTML failu.
Šajā apmācībā mēs iemācīsimies
- Kā atvērt URL, izmantojot Urllib
- Kā lasīt HTML failu jūsu vietrādim Python
Kā atvērt URL, izmantojot Urllib
Pirms palaižam kodu, lai izveidotu savienojumu ar interneta datiem, mums jāimportē URL bibliotēkas moduļa vai "urllib" priekšraksts.
- Importēt urllib
- Definējiet savu galveno funkciju
- Paziņojiet mainīgo webUrl
- Pēc tam URL lib bibliotēkā izsauciet funkciju urlopen
- Vietrādis URL ir guru99 apmācība youtube
- Tālāk mēs izdrukāsim rezultāta kodu
- Rezultāta kods tiek iegūts, izsaucot getcode funkciju mūsu izveidotajā mainīgajā webUrl
- Mēs to pārveidosim par virkni, lai to varētu sasaistīt ar mūsu virknes "rezultāta kodu"
- Tas būs parasts HTTP kods "200", norādot, ka http pieprasījums ir veiksmīgi apstrādāts
Kā iegūt HTML faila formas URL Python
Varat arī izlasīt HTML failu, izmantojot Python "lasīšanas funkciju", un, palaižot kodu, konsolē tiks parādīts HTML fails.
- Izsauciet lasīšanas funkciju mainīgajā webURL
- Lasīšanas mainīgais ļauj nolasīt datu failu saturu
- Izlasiet visu URL saturu mainīgajā, ko sauc par datiem
- Palaidiet kodu - tas datus izdrukās HTML formātā
Šeit ir pilns kods
Python 2 piemērs
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Python 3 piemērs
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)