Desenvolvimento web
Extrair Markdown limpo de páginas com Defuddle
Usa Defuddle CLI para remover navegação, anúncios e ruído de páginas web, retornando conteúdo legível em Markdown.
Ver código no GitHub Instala diretamente do repositório-fonte.
O que esta skill faz
A skill extrai o conteúdo principal de páginas web comuns com Defuddle CLI. A saída em Markdown reduz texto irrelevante e facilita a leitura, análise ou gravação local do material obtido.
Quando usar
- Converter artigos online em Markdown
- Limpar páginas de documentação para análise
- Salvar o conteúdo principal em arquivo
- Extrair título, descrição ou domínio de uma página
Como usar
- Instale com npm install -g defuddle se necessário
- Execute defuddle parse <url> --md
- Use -o content.md para salvar o resultado
- Use -p <nome> quando precisar apenas de um metadado
O que revisar antes de instalar
- Não deve ser usado para URLs terminadas em .md
- A extração depende da estrutura da página de origem
- Não garante acesso a conteúdo protegido ou indisponível
SKILL.md
--- name: defuddle description: Extract clean markdown content from web pages using Defuddle CLI, removing clutter and navigation to save tokens. Use instead of WebFetch when the user provides a URL to read or analyze, for online documentation, articles, blog posts, or any standard web page. Do NOT use for URLs ending in .md — those are already markdown, use WebFetch directly. --- # Defuddle Use Defuddle CLI to extract clean readable content from web pages. Prefer over WebFetch for standard web pages — it removes navigation, ads, and clutter, reducing token usage. If not installed: `npm install -g defuddle` ## Usage Always use `--md` for markdown output: ```bash defuddle parse <url> --md ``` Save to file: ```bash defuddle parse <url> --md -o content.md ``` Extract specific metadata: ```bash defuddle parse <url> -p title defuddle parse <url> -p description defuddle parse <url> -p domain ``` ## Output formats | Flag | Format | |------|--------| | `--md` | Markdown (default choice) | | `--json` | JSON with both HTML and markdown | | (none) | HTML | | `-p <name>` | Specific metadata property |