contextractor.com

Evaluation du site contextractor.com

Extract Clean Content from Any Webpage — Trafilatura 🧰

 Généré le 05 Avril 2026 22:40

Vieilles statistiques? UPDATE !

Le score est de 56/100

Optimisation du contenu

Titre

Extract Clean Content from Any Webpage — Trafilatura 🧰

Longueur : 54

Parfait, votre titre contient entre 10 et 70 caractères.

Description

Extract clean, readable content from any website. Uses Trafilatura to strip navigation, ads, and boilerplate. Try it free — no login required. 🔧🛠

Longueur : 145

Génial, votre balise META description contient entre 70 et 160 caractères.

Mots-clefs

content extraction,trafilatura,web scraping,text extraction,article extraction

Bien, votre page contient une balise META keywords.

Propriétés Open Graph

Bien, cette page profite des balises META Open Graph.

Propriété Contenu
title Extract Clean Content from Any Webpage — Trafilatura 🧰
description Extract clean, readable article text from any web page. Uses Trafilatura to remove navigation, ads, cookie banners, and boilerplate, leaving the main content as plain text or Markdown. Useful for feeding web content to LLMs or archiving articles. Free to try — no login required. 🔧🛠
url https://www.contextractor.com/
site_name Contextractor
locale en_US
image https://www.contextractor.com/_next/static/media/opengraph.361f26ff.png
image:width 1200
image:height 630
image:alt Extract Clean Content from Any Webpage — Trafilatura
type website

Niveaux de titre

H1 H2 H3 H4 H5 H6
1 3 3 4 0 0
  • [H1] Web content extraction tool
  • [H2] Paste HTML content to extract
  • [H2] What is Contextractor?
  • [H2] What is Trafilatura?
  • [H3] Trafilatura Settings
  • [H3] Extract Output
  • [H3] Generate Commands
  • [H4] Extraction
  • [H4] Content
  • [H4] Metadata
  • [H4] Other

Images

Nous avons trouvé 3 image(s) sur cette page Web.

2 attribut(s) alt sont vides ou manquants. Ajouter un texte alternatif permet aux moteurs de recherche de mieux comprendre le contenu de vos images.

Ratio texte/HTML

Ratio : 0%

le ratio de cette page texte/HTML est au-dessous de 15 pour cent, ce qui signifie que votre site manque de contenu textuel.

Flash

Parfait, aucun contenu FLASH n'a été détecté sur cette page.

Iframe

Génial, il n'y a pas d'Iframes détectés sur cette page.

Réécriture d'URLs

Bien. Vos liens sont optimisés!

Tiret bas dans les URLs

Parfait! Aucuns soulignements détectés dans vos URLs.

Liens dans la page

Nous avons trouvé un total de 17 lien(s) dont 0 lien(s) vers des fichiers

Texte d'ancre Type Juice
What is Contextractor? Interne Passing Juice
Trafilatura Externe Passing Juice
CLI Interne Passing Juice
Docker Interne Passing Juice
Apify actor Externe Passing Juice
Playground Interne Passing Juice
What is Trafilatura? Interne Passing Juice
Apify Externe Passing Juice
free tier Externe Passing Juice
Creator plan Externe Passing Juice
Home Interne Passing Juice
About Interne Passing Juice
Press kit Interne Passing Juice
Library Interne Passing Juice
GitHub Externe Passing Juice
Terms Interne Passing Juice
Privacy Interne Passing Juice

Mots-clefs

Nuage de mots-clefs

kit press runs help terms apify github library home months

Cohérence des mots-clefs

Mot-clef Contenu Titre Mots-clefs Description Niveaux de titre
apify 2
months 1
terms 1
github 1
help 1

Ergonomie

Url

Domaine : contextractor.com

Longueur : 17

Favicon

Génial, votre site web dispose d'un favicon.

Imprimabilité

Aucun style CSS pour optimiser l'impression n'a pu être trouvé.

Langue

Bien. Votre langue est : en.

Dublin Core

Cette page ne profite pas des métadonnées Dublin Core.

Document

Doctype

HTML 5

Encodage

Parfait. Votre charset est UTF-8.

Validité W3C

Erreurs : 0

Avertissements : 0

E-mail confidentialité

Génial, aucune adresse e-mail n'a été trouvé sous forme de texte!

HTML obsolètes

Génial! Nous n'avons pas trouvé de balises HTML obsolètes dans votre code.

Astuces vitesse

Excellent, votre site n'utilise pas de tableaux imbriqués.
Mauvais, votre site web utilise des styles css inline.
Génial, votre site web contient peu de fichiers CSS.
Mauvais, votre site web contient trop de fichiers javascript (plus de 6).
Parfait : votre site tire parti de gzip.

Mobile

Optimisation mobile

Icône Apple
Méta tags viewport
Contenu FLASH

Optimisation

Sitemap XML

Votre site web dispose d’une sitemap XML, ce qui est optimal.

https://www.contextractor.com/sitemap.xml

Robots.txt

https://contextractor.com/robots.txt

Votre site dispose d’un fichier robots.txt, ce qui est optimal.

Mesures d'audience

Votre site web dispose d’une outil d'analytics, ce qui est optimal.

   Google Analytics

PageSpeed Insights


Dispositif
Les catégories

Free SEO Testing Tool

Free SEO Testing Tool est un outil gratuit de référencement qui vous aidera à analyser vos pages web