Voltar ao índice
Desenvolvimento web

Extrair Markdown limpo de páginas com Defuddle

Usa Defuddle CLI para remover navegação, anúncios e ruído de páginas web, retornando conteúdo legível em Markdown.

Ver código no GitHub Instala diretamente do repositório-fonte.

O que esta skill faz

A skill extrai o conteúdo principal de páginas web comuns com Defuddle CLI. A saída em Markdown reduz texto irrelevante e facilita a leitura, análise ou gravação local do material obtido.

Quando usar

  • Converter artigos online em Markdown
  • Limpar páginas de documentação para análise
  • Salvar o conteúdo principal em arquivo
  • Extrair título, descrição ou domínio de uma página

Como usar

  1. Instale com npm install -g defuddle se necessário
  2. Execute defuddle parse <url> --md
  3. Use -o content.md para salvar o resultado
  4. Use -p <nome> quando precisar apenas de um metadado

O que revisar antes de instalar

  • Não deve ser usado para URLs terminadas em .md
  • A extração depende da estrutura da página de origem
  • Não garante acesso a conteúdo protegido ou indisponível

SKILL.md

---
name: defuddle
description: Extract clean markdown content from web pages using Defuddle CLI, removing clutter and navigation to save tokens. Use instead of WebFetch when the user provides a URL to read or analyze, for online documentation, articles, blog posts, or any standard web page. Do NOT use for URLs ending in .md — those are already markdown, use WebFetch directly.
---

# Defuddle

Use Defuddle CLI to extract clean readable content from web pages. Prefer over WebFetch for standard web pages — it removes navigation, ads, and clutter, reducing token usage.

If not installed: `npm install -g defuddle`

## Usage

Always use `--md` for markdown output:

```bash
defuddle parse <url> --md
```

Save to file:

```bash
defuddle parse <url> --md -o content.md
```

Extract specific metadata:

```bash
defuddle parse <url> -p title
defuddle parse <url> -p description
defuddle parse <url> -p domain
```

## Output formats

| Flag | Format |
|------|--------|
| `--md` | Markdown (default choice) |
| `--json` | JSON with both HTML and markdown |
| (none) | HTML |
| `-p <name>` | Specific metadata property |