GAMEOVER 501 Опубликовано: 26 авг 2022 Функция IMPORTXML в Google Docs позволяет автоматически выгружать данные с сайта автоматически используя ссылку на страницу и определенный запрос. Видеоинструкция Синтаксис IMPORTXML в Google Таблице Для того, чтобы использовать данную функцию потребуется в таблице написать формулу: =IMPORTXML(Ссылка;Запрос) <img src="https://seopulses.ru/wp-content/uploads/2020/06/3-14-1024x263.png" itemprop="contentUrl" id="lTGx" width="1024" height="263"> Где: Ссылка — URL-адрес страницы; Запрос – в формате XPath. С примером можно ознакомиться в: https://docs.google.com/spreadsheets/d/1xmzdcBPap6lA5Gtwm1hjQfDHf3kCQdbxY3HM11IqDqY/edit#gid=0 Примеры использования IMPORTXML в Google Doc Парсинг названий Для работы с парсингом через данную функцию потребуется знание XPATH и составление пути в этом формате. Сделать это можно открыв консоль разработчика. Для примера будет использоваться сайт крупного интернет-магазина и в первую очередь необходимо в Google Chrome открыть окно разработчика кликнув правой кнопкой мыли и в выпавшем меню выбрать «Посмотреть код» (сочетание клавиш CTRL+Shift+I). <img src="https://seopulses.ru/wp-content/uploads/2020/06/2-16-1024x760.png" itemprop="contentUrl" id="L2Aa" width="1024" height="760"> После этого пытаемся получить название товара, которое содержится в H1, единственным на странице, поэтому запрос должен быть: //h1 И как следствие формула: =IMPORTXML(A2;»//h1″) <img src="https://seopulses.ru/wp-content/uploads/2020/06/4-16-1024x224.png" itemprop="contentUrl" id="4X2p" width="1024" height="224"> Важно! Запрос XPath пишется в кавычках «запрос». Парсинг различных элементов Если мы хотим получить баллы, то нам потребуется обратиться к элементу div с классом product-standart-bonus поэтому получаем: //div[@class=’product-standart-bonus’] <img src="https://seopulses.ru/wp-content/uploads/2020/06/5-13-1024x757.png" itemprop="contentUrl" id="7eT2" width="1024" height="757"> В этом случае первый тег div обозначает то, откуда берутся данные, когда в скобках [] уточняется его уникальность. Для уточнения потребуется указать тип в виде @class, который может быть и @id, а после пишется = и в одинарных кавычках ‘значение’ пишется запрос. Однако, нужное нам значение находиться глубже в теге span, поэтому добавляем /span и вводим: //div[@class=’product-standart-bonus’]/span В документе: <img src="https://seopulses.ru/wp-content/uploads/2020/06/6-11-1024x201.png" itemprop="contentUrl" id="3Dnw" width="1024" height="201"> Парсинг цен без знаний XPath Если нет знаний XPath и необходимо быстро получить информацию, то требуется выбрав нужный элемент в консоли разработчика кликнуть правой клавишей мыши и в меню выбрать «Copy»-«XPath». Например, при поиске запроса цены получаем: <img src="https://seopulses.ru/wp-content/uploads/2020/06/7-10-1024x711.png" itemprop="contentUrl" id="vqqn" width="1024" height="711"> //*[@id=»showcase»]/div/div[3]/div[2]/div[2]/div[1]/div[2]/div/div[1] Важно! Следует изменить » на одинарные кавычки ‘. Далее используем ее вместе с IMPORTXML. <img src="https://seopulses.ru/wp-content/uploads/2020/06/8-9-1024x266.png" itemprop="contentUrl" id="ayYn" width="1024" height="266"> Все готово цены получены. Простые формулы с IMPORTXML в Google Sheets Чтобы получить title страницы необходимо использовать запрос: =IMPORTXML(A3;»//title») <img src="https://seopulses.ru/wp-content/uploads/2020/06/9-9-1024x295.png" itemprop="contentUrl" id="JDe2" width="1024" height="295"> Для вывода description стоит использовать: =IMPORTXML(A3;»//description») <img src="https://seopulses.ru/wp-content/uploads/2020/06/10-9.png" itemprop="contentUrl" id="rSne" width="1025" height="379"> Первый заголовок (или любой другой): =IMPORTXML(A3;»//h1″) <img src="https://seopulses.ru/wp-content/uploads/2020/06/11-9-1024x185.png" itemprop="contentUrl" id="mVlr" width="1024" height="185"> 0 Поделиться сообщением Ссылка на сообщение