Voltar ao índice
Desenvolvimento web Fonte oficial

Extraia empresas de diretórios com Firecrawl

Converta diretórios públicos ou autorizados em listas estruturadas de empresas para pesquisa, CRM, JSON ou CSV.

Ver código no GitHub Instala diretamente do repositório-fonte.

O que esta skill faz

A skill coleta empresas em diretórios com scraping, map ou navegação do Firecrawl. Ela lida com filtros, paginação, rolagem infinita e perfis, registrando somente campos efetivamente visíveis.

Quando usar

  • Exportar empresas de diretórios de startups
  • Coletar listagens de uma categoria no G2 ou Product Hunt
  • Montar uma tabela de pesquisa empresarial
  • Preparar uma lista estruturada para CRM

Como usar

  1. Defina o diretório, os filtros, a quantidade e o formato
  2. Configure FIRECRAWL_API_KEY e acesso autorizado quando necessário
  3. Use browser para filtros, paginação, rolagem ou abertura de perfis
  4. Extraia apenas campos visíveis e preserve as URLs das fontes
  5. Revise duplicatas, campos vazios e cobertura antes da exportação

O que revisar antes de instalar

  • Campos indisponíveis devem ficar vazios e não podem ser inferidos
  • Diretórios pagos ou autenticados exigem acesso legítimo
  • A estrutura e os limites de cada fonte podem restringir a coleta

SKILL.md

---
name: firecrawl-company-directories
description: Extract structured company lists from directories with Firecrawl. Use for scraping YC, Crunchbase, Product Hunt, G2, startup directories, category directories, or custom company databases into JSON, CSV, CRM-ready lists, or research tables.
license: ISC
metadata:
  author: firecrawl
  version: "0.1.0"
  homepage: https://www.firecrawl.dev
  source: https://github.com/firecrawl/firecrawl-workflows
inputs:
  - name: FIRECRAWL_API_KEY
    description: Firecrawl API key for hosted Firecrawl requests.
    required: true
---

# Firecrawl Company Directories

Use this to turn startup or company directories into structured lists.

## Onboarding Interview

Infer the directory, filters, result count, and output format from context. If the source is clear, proceed immediately.

Ask at most 1-3 concise questions only if blocked, such as the directory URL/name, required filters, or target result count.

## Firecrawl Collection Plan

Use Firecrawl browser when the directory needs filters, pagination, infinite scroll, or profile clicks. Use scrape/map when listings are public and static.

Suggested sources include YC companies, Crunchbase, Product Hunt, G2 categories, or any custom directory URL.

## Extraction Fields

Capture fields that are visible:

- name
- description
- industry/category
- stage/founded/location/team size/funding when visible
- tags
- directory profile URL
- company website URL

Leave unavailable fields blank. Do not infer.

## Final Deliverable

```markdown
# Company Directory Export: [Source]

## Summary
[Filters, count extracted, limitations]

## Companies
[Table or link to JSON/CSV]

## Sources
[Directory pages and profiles used]

## Rerun Inputs
workflow: firecrawl-company-directories
directory: [source]
filters: [criteria]
max_results: [number]
output: [json/csv/markdown]
```

## JSON Shape

Use `source`, `filters`, `extractedAt`, `totalResults`, and `companies[]` with `name`, `url`, `description`, `industry`, `stage`, `founded`, `location`, `teamSize`, `funding`, `tags`, `profileUrl`, and `websiteUrl`.

## Quality Bar

- Deduplicate companies.
- Track pagination progress.
- Note rate limits, login walls, or CAPTCHA blocks.