Уроки Python 12 - Работаем с интернетом
компьютерная программа по информатике и икт

Кликодуев Владимир Валерьевич

Уроки Python 12 - Работаем с интернетом

 

Скачать:

ВложениеРазмер
Файл uroki_python_12.docx885.65 КБ

Предварительный просмотр:

Уроки Python 12 - Работаем с интернетом

Сегодня мы научимся получать информацию из сети интернет. Для начала нам нужно установить несколько модулей, которые предназначены для работы с веб-страницами. В командной строке Windows дадим команды:

pip install requests

pip install html2text 

Библиотека(модуль) requests - это наш главный инструмент для взаимодействия с сетью.

Модуль html2text служит для преобразования HTML кода веб-страниц в обычный текст, без наличия в нём HTML тегов.

Установив данные модули, попробуем получить какую-нибудь HTML страницу из интернета.

import requests

s=requests.get('https://m.news.yandex.ru')

print(s.text)

Программа напечатает нам много HTML кода из которого состоит страничка Яндекс новостей. http://python.divz.ru/pic/img20171029130804690.jpg

Но что, если мы хотим получить именно текст сайта, а не эту непонятную мешанину из тегов? Здесь нам поможет html2text. Давайте попробуем получить текст главной страницы сайта golos.io

import requests

import html2text

s=requests.get('http://golos.io')

d = html2text.HTML2Text().handle(s.text)

print(d)

Этот несложный код получит в переменную s с помощью GET запроса HTML код главной страницы сайта golos.io. Мы пока не будем копаться в тегах HTML в поисках нужных нам кусочков сайта, а просто преобразуем всю веб страницу в обычный текст с помощью d = html2text.HTML2Text().handle(s.text) и выведем на экран командой print(d). http://python.divz.ru/pic/img20171029130820402.jpg

API, JSON и GET запросы 

С помощью GET запросов можно обратиться к API любого сайта. API - это технология, позволяющая программам давать GET или POST запросы, и получать в ответ какую-то информацию, чаще всего отформатированную в формате JSON. Почитайте подробнее о том что такое API и JSON, если вы не в курсе. На каждом сайте где есть API, существует подробное описание какие именно запросы нужно слать, чтобы получить определенную информацию.

Простейший API запрос состоит из обычной HTTP ссылки сформированной так как нам нужно, и открываемой с помощью обычного GET запроса (справится библиотека requests О которой мы говорили выше.). Например давайте составим запрос к бирже bittrex чтобы получить актуальную информацию о торговой паре BTC-GBG

https://bittrex.com/api/v1.1/public/getmarketsummary?market=BTC-GBG

Пример JSON ответа можно посмотреть, открыв ссылку приведенную выше в обычном браузере.

{"success":true,"message":"","result":[{"MarketName":"BTC-GBG","High":0.00002270,"Low":0.00002036,"Volume":143801.71600916,"Last":0.00002111,"BaseVolume":3.08218412,"TimeStamp":"2017-09-07T04:23:01.57","Bid":0.00002104,"Ask":0.00002135,"OpenBuyOrders":114,"OpenSellOrders":2374,"PrevDay":0.00002123,"Created":"2017-02-12T00:38:21.023"}]} 

Давайте попробуем реализовать этот запрос из Python. С помощью модуля json выделим из всей этой каши что отдает нам запрос, какой-то определённый параметр, например курс биткоина к GBG.

import requests

import json

s=requests.get('https://bittrex.com/api/v1.1/public/getmarketsummary?market=BTC-GBG')

data = s.json()

k = data["result"][0]["Last"]

print("%.8f" % k)

Здесь мы сперва дали обычный GET запрос к API сайта bittrex и получили ответ в переменную s. Теперь нужно преобразовать эту JSON строчку в данные. Это мы сделали командой data = s.json().

Если мы посмотрим на структуру JSON ответа, то увидим тройную вложенность структур - словарь вложен в список, который в свою очередь вложен еще в один словарь. Это видно по фигурным и квадратным скобкам - эти скобки определяют словари и списки.

{"success":true,"message":"","result":[{"MarketName":"BTC-GBG","High":0.00002270,"Low":0.00002036,"Volume":143801.71600916,"Last":0.00002111,"BaseVolume":3.08218412,"TimeStamp":"2017-09-07T04:23:01.57","Bid":0.00002104,"Ask":0.00002135,"OpenBuyOrders":114,"OpenSellOrders":2374,"PrevDay":0.00002123,"Created":"2017-02-12T00:38:21.023"}]} 

Нам нужно получить элемент словаря с ключом 'Last', мы видим что этот словарь вложен в список, в котором всего 1 элемент имеющий индекс 0, а этот список является значением словаря с ключом 'result'. Поэтому чтобы добраться до значения 'Last' придётся построить трехэтажную конструкцию k = data["result"][0]["Last"].

Если вы сразу не поняли о чём я говорю, внимательно присмотритесь к вложенности скобок в JSON ответе. Фигурные скобки - это словарь, а квадратные - список. Мы изучали списки и словари в предыдущих уроках. И списки и словари могут быть вложены друг в друг (являться одними из элементов). В нашем случае мы получили тройную вложенность словарь-список-словарь, поэтому чтобы добраться до значений нужного нам внутреннего словаря, пришлось писать подряд три квадратные скобки k = data["result"][0]["Last"].

Полученное число будет выглядеть вот так 2.104e-05, поэтому в команде print("%.8f" % k) мы с помощью "%.8f" % k укажем что нам нужно вывести обычное число, с 8 знаками после запятой.

0.00002104 

Итак, сегодня мы научились работать с GET запросами, получать HTML код и текст любых страниц любого сайта. А также мы заглянули в волшебный мир API и JSON и немножко поломав мозг, вытащили из JSON ответа биржи bittrex текущий курс GBG. В следующем уроке мы разберём тему работы с интернетом более подробно.


По теме: методические разработки, презентации и конспекты

Уроки Python 1 - Переменные и их типы

Уроки Python 1 - Переменные и их типы...

Уроки Python 2 - Условный оператор if-else

Уроки Python 2 - Условный оператор if-else...

Уроки Python 3 - Сложные условия

Уроки Python 3 - Сложные условия...

Уроки Python 4 - Списки и циклы

Уроки Python 4 - Списки и циклы...

Уроки Python 5 - "Первая программа"

Уроки Python 5 - Первая программа...

Уроки Python 6 - Работа со строками

Уроки Python 6 - Работа со строками...