Goutte: Uma Biblioteca PHP para Web Scraper
Goutte é uma biblioteca de raspagem de tela e rastreamento web para PHP. Ela fornece uma API agradável para rastrear sites e extrair dados das respostas HTML/XML.
Visão Geral: Goutte é uma ferramenta útil para aqueles que precisam coletar informações de sites. Embora esteja depreciada a partir da versão 4, ainda pode ser usada como um proxy para a classe HttpBrowser do componente Symfony BrowserKit.
Recursos Principais: Permite criar instâncias de cliente, fazer solicitações, clicar em links, extrair dados e enviar formulários. Além disso, é possível configurar as configurações HTTP, como o tempo limite de solicitação.
Uso Básico: Para começar, adicione fabpot/goutte como dependência no seu composer.json. Em seguida, crie uma instância do cliente Goutte e faça solicitações usando o método request()
. Você também pode clicar em links, extrair dados e enviar formulários com facilidade.
Para mais informações, leia a documentação dos componentes Symfony BrowserKit, DomCrawler e HttpClient, que fornecem mais detalhes sobre o que é possível fazer com o Goutte.