Gerado a 05 de Abril de 2026 22:40 PM
Estatísticas desatualizadas? ATUALIZE !
O resultado é de 56/100
Título
Extract Clean Content from Any Webpage — Trafilatura 🧰
Cumprimento : 54
Perfeito, o Título contém entre 10 e 70 caracteres.
Descrição
Extract clean, readable content from any website. Uses Trafilatura to strip navigation, ads, and boilerplate. Try it free — no login required. 🔧🛠
Cumprimento : 145
Perfeito, a Descrição META contém entre 70 e 160 caracteres.
Palavras-chave
content extraction,trafilatura,web scraping,text extraction,article extraction
Perfeito, a página contém palavras-chave META.
Propriedades Og Meta
Boa! Esta página tira vantagens das propriedades Og.
| Propriedade | Conteúdo |
|---|---|
| title | Extract Clean Content from Any Webpage — Trafilatura 🧰 |
| description | Extract clean, readable article text from any web page. Uses Trafilatura to remove navigation, ads, cookie banners, and boilerplate, leaving the main content as plain text or Markdown. Useful for feeding web content to LLMs or archiving articles. Free to try — no login required. 🔧🛠 |
| url | https://www.contextractor.com/ |
| site_name | Contextractor |
| locale | en_US |
| image | https://www.contextractor.com/_next/static/media/opengraph.361f26ff.png |
| image:width | 1200 |
| image:height | 630 |
| image:alt | Extract Clean Content from Any Webpage — Trafilatura |
| type | website |
Cabeçalhos
| H1 | H2 | H3 | H4 | H5 | H6 |
| 1 | 3 | 3 | 4 | 0 | 0 |
Imagens
Encontrámos 3 imagens nesta página.
2 atributos ALT estão vazios ou em falta. É recomendado adicionar texto alternativo de modo a que os motores de busca identifiquem melhor o conteúdo das suas imagens.
Rácio Texto/HTML
Rácio : 0%
O rácio de texto para código HTML desta página é menor que 15 porcento, o que significa que provavelmente é necessário de adicionar mais conteúdos em forma de texto.
Flash
Perfeito, não foi encontrado conteúdo Flash nesta página.
Iframe
Excelente, não foram detetadas Iframes nesta página.
Reescrita de URL
Perfeito. As ligações aparentam ser limpas!
Underscores (traços inferiores) nas URLs
Perfeito. Não foram encontrados 'underscores' (traços inferiores) nas suas URLs.
Ligações para a própria página
Encontrámos um total de 17 ligações incluindo 0 ligações a ficheiros
| Âncoras | Tipo | Sumo |
|---|---|---|
| What is Contextractor? | Internas | Passa sumo |
| Trafilatura | Externas | Passa sumo |
| CLI | Internas | Passa sumo |
| Docker | Internas | Passa sumo |
| Apify actor | Externas | Passa sumo |
| Playground | Internas | Passa sumo |
| What is Trafilatura? | Internas | Passa sumo |
| Apify | Externas | Passa sumo |
| free tier | Externas | Passa sumo |
| Creator plan | Externas | Passa sumo |
| Home | Internas | Passa sumo |
| About | Internas | Passa sumo |
| Press kit | Internas | Passa sumo |
| Library | Internas | Passa sumo |
| GitHub | Externas | Passa sumo |
| Terms | Internas | Passa sumo |
| Privacy | Internas | Passa sumo |
Núvem de palavras-chave
months terms github library apify home help kit press runs
Consistência das Palavras-chave
| Palavra-chave | Conteúdo | Título | Palavras-chave | Descrição | Cabeçalhos |
|---|---|---|---|---|---|
| apify | 2 | ![]() |
![]() |
![]() |
![]() |
| months | 1 | ![]() |
![]() |
![]() |
![]() |
| terms | 1 | ![]() |
![]() |
![]() |
![]() |
| github | 1 | ![]() |
![]() |
![]() |
![]() |
| help | 1 | ![]() |
![]() |
![]() |
![]() |
Url
Domínio : contextractor.com
Cumprimento : 17
Favicon
Ótimo, o site tem um favicon.
Facilidade de Impressão
Não encontrámos CSS apropriado para impressão.
Língua
Otimo! A língua declarada deste site é en.
Dublin Core
Esta página não tira vantagens do Dublin Core.
Tipo de Documento
HTML 5
Codificação
Perfeito. O conjunto de caracteres UTF-8 está declarado.
Validação W3C
Erros : 0
Avisos : 0
Privacidade do Email
Boa! Nenhum endereço de email está declarado sob a forma de texto!
HTML obsoleto
Fantástico! Não detetámos etiquetas HTML obsoletas.
Dicas de Velocidade
![]() |
Excelente, este site não usa tablelas dentro de tabelas. |
![]() |
Oh não, o site usa estilos CSS nas etiquetas HTML. |
![]() |
Boa, o site usa poucos ficheiros CSS. |
![]() |
Oh, não! O site utiliza demasiados ficheiros JavaScript (mais que 6). |
![]() |
Perfeito, o site tira vantagens da compressão gzip. |
Otimização para dispositivos móveis
![]() |
Icon Apple |
![]() |
Meta Viewport Tag |
![]() |
Conteúdo Flash |
XML Sitemap
Perfeito, o site tem um mapa XML do site (sitemap).
| https://www.contextractor.com/sitemap.xml |
Robots.txt
https://contextractor.com/robots.txt
Perfeito, o seu site tem um ficheiro robots.txt.
Analytics
Perfeito, o site tem uma ferramenta analítica para a análise de atividade.
Google Analytics |
Free SEO Testing Tool é uma ferramenta gratuita que o ajuda a avaliar o seu site