contextractor.com

Analisi sito web contextractor.com

Extract Clean Content from Any Webpage — Trafilatura 🧰

 Generato il Aprile 05 2026 22:40 PM

Statistiche non aggiornate? AGGIORNA !

Il punteggio e 56/100

SEO Content

Title

Extract Clean Content from Any Webpage — Trafilatura 🧰

Lunghezza : 54

Perfetto, il tuo title contiene tra 10 e 70 caratteri.

Description

Extract clean, readable content from any website. Uses Trafilatura to strip navigation, ads, and boilerplate. Try it free — no login required. 🔧🛠

Lunghezza : 145

Grande, la tua meta description contiene tra 70 e 160 caratteri.

Keywords

content extraction,trafilatura,web scraping,text extraction,article extraction

Buono, la tua pagina contiene meta keywords.

Og Meta Properties

Buono, questa pagina sfrutta i vantaggi Og Properties.

Proprieta Contenuto
title Extract Clean Content from Any Webpage — Trafilatura 🧰
description Extract clean, readable article text from any web page. Uses Trafilatura to remove navigation, ads, cookie banners, and boilerplate, leaving the main content as plain text or Markdown. Useful for feeding web content to LLMs or archiving articles. Free to try — no login required. 🔧🛠
url https://www.contextractor.com/
site_name Contextractor
locale en_US
image https://www.contextractor.com/_next/static/media/opengraph.361f26ff.png
image:width 1200
image:height 630
image:alt Extract Clean Content from Any Webpage — Trafilatura
type website

Headings

H1 H2 H3 H4 H5 H6
1 3 3 4 0 0
  • [H1] Web content extraction tool
  • [H2] Paste HTML content to extract
  • [H2] What is Contextractor?
  • [H2] What is Trafilatura?
  • [H3] Trafilatura Settings
  • [H3] Extract Output
  • [H3] Generate Commands
  • [H4] Extraction
  • [H4] Content
  • [H4] Metadata
  • [H4] Other

Images

Abbiamo trovato 3 immagini in questa pagina web.

2 attributi alt sono vuoti o mancanti. Aggiungi testo alternativo in modo tale che i motori di ricerca possano comprendere meglio il contenuto delle tue immagini.

Text/HTML Ratio

Ratio : 0%

Il rapporto testo/codice HTML di questa pagina e inferiore a 15 percento, questo significa che il tuo sito web necessita probabilmente di molto piu contenuto.

Flash

Perfetto, non e stato rilevato contenuto Flash in questa pagina.

Iframe

Grande, non sono stati rilevati Iframes in questa pagina.

URL Rewrite

Buono. I tuoi links appaiono friendly!

Underscores in the URLs

Perfetto! Non sono stati rilevati underscores nei tuoi URLs.

In-page links

Abbiamo trovato un totale di 17 links inclusi 0 link(s) a files

Anchor Type Juice
What is Contextractor? Interno Passing Juice
Trafilatura Externo Passing Juice
CLI Interno Passing Juice
Docker Interno Passing Juice
Apify actor Externo Passing Juice
Playground Interno Passing Juice
What is Trafilatura? Interno Passing Juice
Apify Externo Passing Juice
free tier Externo Passing Juice
Creator plan Externo Passing Juice
Home Interno Passing Juice
About Interno Passing Juice
Press kit Interno Passing Juice
Library Interno Passing Juice
GitHub Externo Passing Juice
Terms Interno Passing Juice
Privacy Interno Passing Juice

SEO Keywords

Keywords Cloud

terms help github press runs home apify months library kit

Consistenza Keywords

Keyword Contenuto Title Keywords Description Headings
apify 2
months 1
terms 1
github 1
help 1

Usabilita

Url

Dominio : contextractor.com

Lunghezza : 17

Favicon

Grande, il tuo sito usa una favicon.

Stampabilita

Non abbiamo riscontrato codice CSS Print-Friendly.

Lingua

Buono. La tua lingua dichiarata en.

Dublin Core

Questa pagina non sfrutta i vantaggi di Dublin Core.

Documento

Doctype

HTML 5

Encoding

Perfetto. Hai dichiarato che il tuo charset e UTF-8.

Validita W3C

Errori : 0

Avvisi : 0

Email Privacy

Grande. Nessun indirizzo mail e stato trovato in plain text!

Deprecated HTML

Grande! Non abbiamo trovato tags HTML deprecati nel tuo codice.

Suggerimenti per velocizzare

Eccellente, il tuo sito web non utilizza nested tables.
Molto male, il tuo sito web utilizza stili CSS inline.
Grande, il tuo sito web ha pochi file CSS.
Molto male, il tuo sito web ha troppi file JS (piu di 6).
Perfetto, il vostro sito si avvale di gzip.

Mobile

Mobile Optimization

Apple Icon
Meta Viewport Tag
Flash content

Ottimizzazione

XML Sitemap

Grande, il vostro sito ha una sitemap XML.

https://www.contextractor.com/sitemap.xml

Robots.txt

https://contextractor.com/robots.txt

Grande, il vostro sito ha un file robots.txt.

Analytics

Grande, il vostro sito ha uno strumento di analisi dei dati.

   Google Analytics

PageSpeed Insights


Dispositivo
Categorie

Free SEO Testing Tool

Free SEO Testing Tool e uno strumento di ottimizzazione per i motori di ricerca (seo tool) che serve per analizzare le tue pagine web