Как парсить данные с сайта через IMPORTXML?
=IMPORTXML("URL"; "//xpath_выражение"). Пример: =IMPORTXML(url; "//h1") — все заголовки H1. Используйте XPath для точного извлечения элементов.
IMPORTXML — самая гибкая функция парсинга в Google Sheets. Извлекает любые элементы с HTML/XML-страниц через XPath.
Синтаксис
=IMPORTXML(url; xpath_запрос)
Примеры XPath-запросов
=IMPORTXML(url; "//h1") → все заголовки H1
=IMPORTXML(url; "//title") → заголовок страницы
=IMPORTXML(url; "//meta[@name='description']/@content") → мета-описание
=IMPORTXML(url; "//a/@href") → все ссылки на странице
=IMPORTXML(url; "//table[2]//tr/td") → ячейки второй таблицы
Для SEO-аудита
=IMPORTXML(A2; "//h1") → H1 каждой страницы
=IMPORTXML(A2; "//title") → Title
=IMPORTXML(A2; "count(//img[not(@alt)])") → картинки без alt
Практический пример: цены конкурентов
=IMPORTXML("https://shop.example.com/product"; "//span[@class='price']")
Ограничения
- Максимум 50 вызовов IMPORTXML на таблицу
- Не работает с JavaScript-контентом (SPA, React)
- Медленнее IMPORTHTML — каждый вызов делает HTTP-запрос