contextractor.com

Обзор веб-сайта contextractor.com

Extract Clean Content from Any Webpage — Trafilatura 🧰

 Сгенерирован 05 Апреля 2026 22:40

Устаревшие данные? ОБНОВИТЬ !

Набрано баллов: 56/100

СЕО Контент

Заголовок страницы

Extract Clean Content from Any Webpage — Trafilatura 🧰

Длина : 54

Замечательно, Ваш заголовок страницы содержит от 10 до 70 символов.

Описание страницы

Extract clean, readable content from any website. Uses Trafilatura to strip navigation, ads, and boilerplate. Try it free — no login required. 🔧🛠

Длина : 145

Замечательно, Ваше описание страницы содержит от 70 до 160 символов.

Ключевые слова

content extraction,trafilatura,web scraping,text extraction,article extraction

Хорошо, Ваш веб-сайт содержит ключевые слова.

Og Meta Properties

Замечательно, Вы используете преимущества Og Properties.

Свойство Контент
title Extract Clean Content from Any Webpage — Trafilatura 🧰
description Extract clean, readable article text from any web page. Uses Trafilatura to remove navigation, ads, cookie banners, and boilerplate, leaving the main content as plain text or Markdown. Useful for feeding web content to LLMs or archiving articles. Free to try — no login required. 🔧🛠
url https://www.contextractor.com/
site_name Contextractor
locale en_US
image https://www.contextractor.com/_next/static/media/opengraph.361f26ff.png
image:width 1200
image:height 630
image:alt Extract Clean Content from Any Webpage — Trafilatura
type website

Заголовки

H1 H2 H3 H4 H5 H6
1 3 3 4 0 0
  • [H1] Web content extraction tool
  • [H2] Paste HTML content to extract
  • [H2] What is Contextractor?
  • [H2] What is Trafilatura?
  • [H3] Trafilatura Settings
  • [H3] Extract Output
  • [H3] Generate Commands
  • [H4] Extraction
  • [H4] Content
  • [H4] Metadata
  • [H4] Other

Картинки

Мы нашли 3 картинок на этом веб-сайте.

2 alt атрибута(-ов) не найдено. Добавив альтернативный текст, поисковые роботы будут лучше понимать содержание картинки.

Соотношение Контент/HTML

Соотношение : 0%

Соотношение текста в коде HTML у этой страницы меньше чем 15 процентов, это означает, что Вашем веб-сайту требуется больше контента.

Flash

Замечательно, мы не нашли Flash контента на странице.

Iframe

Замечательно, мы не зафиксировали Iframe'ов на Вашей странице.

ЧПУ ссылки

Отлично, все Ваши ссылки являются ЧПУ!

Нижнее подчеркивание в ссылках

Прекрасно! Мы не нашли "нижнее подчеркивание" в Ваших ссылках.

Внутренние ссылки

Мы нашли 17 ссылок(-и), включая 0 ссылок ссылок(-и) на файл(-ы).

Анкор Тип Вес ссылки
What is Contextractor? Внутренняя Передает вес
Trafilatura Внешняя Передает вес
CLI Внутренняя Передает вес
Docker Внутренняя Передает вес
Apify actor Внешняя Передает вес
Playground Внутренняя Передает вес
What is Trafilatura? Внутренняя Передает вес
Apify Внешняя Передает вес
free tier Внешняя Передает вес
Creator plan Внешняя Передает вес
Home Внутренняя Передает вес
About Внутренняя Передает вес
Press kit Внутренняя Передает вес
Library Внутренняя Передает вес
GitHub Внешняя Передает вес
Terms Внутренняя Передает вес
Privacy Внутренняя Передает вес

Ключевые слова

Облако ключевых слов

library github apify terms press help kit home runs months

Содержание ключевых слов

Ключевое слово Контент Заголовок страницы Ключевые слова Описание страницы Заголовки
apify 2
months 1
terms 1
github 1
help 1

Юзабилити

Домен

Домен : contextractor.com

Длина : 17

Favicon

Отлично, Ваш сайт имеет favicon.

Пригодность для печати

Плохо. Мы не нашли CSS файл, отвечающий за печать веб-сайта.

Язык

Хорошо, Ваш установленный язык веб-сайта: en.

Dublin Core

Ваш веб-сайт не использует преимущества Dublin Core.

Документ

Doctype

HTML 5

Кодировка

Замечательно. Кодировка веб-сайта: UTF-8.

W3C Validity

Ошибок : 0

Предупреждений : 0

Приватность эл. почты

Отлично, мы не нашли адрес эл. почты в контенте!

Устаревший HTML

Отлично. Мы не нашли устаревших тэгов в Вашем HTML.

Скорость загрузки

Отлично, Ваш веб-сайт не содержит вложенных таблиц.
Слишком плохо. Ваш веб-сайт использует встроенные CSS правила в HTML тэгах.
Замечательно. Ваш веб-сайт имеет мало CSS файлов.
Плохо. Ваш веб-сайт имеет слишком много JavaScript файлов (больше чем 6).
Замечательно, ваш сайт использует возможность gzip сжатия.

Мобильный телефон

Оптимизация под моб. телефон

Apple иконки
Meta Viewport Тэг
Flash контент

Оптимизация

XML карта сайта

Отлично, ваш сайт имеет XML карту сайта.

https://www.contextractor.com/sitemap.xml

Robots.txt

https://contextractor.com/robots.txt

Отлично, ваш веб-сайт содержит файл robots.txt.

Аналитика

Отлично, на вашем сайте присутствуют аналитические программы.

   Google Analytics

PageSpeed Insights


Устройство
Категории

Free SEO Testing Tool

Free SEO Testing Tool - это бесплатный СЕО инструмент, который поможет вам проанализировать Ваш веб-сайт.