You are currently viewing Guia para iniciantes sobre como evitar a raspagem de conteúdo de blogs no WordPress

Guia para iniciantes sobre como evitar a raspagem de conteúdo de blogs no WordPress

O senhor está procurando uma maneira de impedir que spammers e golpistas roubem as postagens do seu blog no WordPress usando raspadores de conteúdo?

É muito frustrante, como proprietário de um site, ver que alguém está roubando seu conteúdo de alta qualidade sem permissão, monetizando-o, superando-o no ranking do Google e roubando seu público.

Neste artigo, abordaremos o que é raspagem de conteúdo de blog, como o senhor pode reduzir e evitar a raspagem de conteúdo e até mesmo como tirar proveito dos raspadores de conteúdo para seu próprio benefício.

Guia para iniciantes sobre como evitar a raspagem de conteúdo de blogs no WordPressGuia para iniciantes sobre como evitar a raspagem de conteúdo de blogs no WordPress

O que é raspagem de conteúdo de blog no WordPress?

O scraping de conteúdo de blog é quando o conteúdo é retirado de várias fontes e republicado em outro site. Normalmente, isso é feito automaticamente por meio do RSS feed.

Infelizmente, é muito fácil e muito comum ter seu blog do WordPress conteúdo roubado dessa forma. Se isso já aconteceu com o senhor, então entende como pode ser estressante e frustrante.

Às vezes, seu conteúdo será simplesmente copiado e colado diretamente em outro site, inclusive sua formatação, imagens, vídeos e muito mais.

Outras vezes, seu conteúdo será republicado com atribuição e um link para seu website, mas sem sua permissão. Embora isso possa ajudar seu SEOo senhor pode querer manter o conteúdo original hospedado somente no seu site.

Por que os raspadores de conteúdo roubam conteúdo?

Alguns de nossos usuários nos perguntaram por que os scrapers estão roubando conteúdo. Normalmente, a principal motivação para o roubo de conteúdo é lucrar com seu trabalho árduo:

  • Comissão de afiliados: Os profissionais de marketing de afiliados desonestos podem usar seu conteúdo para trazer tráfego para o site deles por meio de mecanismos de pesquisa a fim de promover seus produtos de nicho.
  • Geração de leads: Advogados e corretores de imóveis podem pagar alguém para adicionar conteúdo e ganhar autoridade em sua comunidade e não perceber que o conteúdo está sendo extraído de outras fontes.
  • Receita de publicidade: Os proprietários de blogs podem extrair conteúdo para criar um centro de conhecimento em um determinado nicho “para o bem da comunidade” e depois encher o site de anúncios.

É possível impedir completamente a extração de conteúdo?

Neste artigo, mostraremos algumas medidas que o senhor pode tomar para reduzir e impedir a extração de conteúdo. Mas, infelizmente, não há como impedir completamente um ladrão determinado.

É por isso que terminamos este artigo com uma seção sobre como o senhor pode tirar proveito dos scrapers de conteúdo. Embora nem sempre seja possível impedir um ladrão, talvez você consiga obter algum tráfego e receita com o conteúdo que ele roubou de você.

O que o senhor deve fazer quando descobrir que alguém copiou seu conteúdo?

Como não é possível impedir completamente os scrapers, o senhor pode um dia descobrir que alguém está usando o conteúdo que roubou do seu blog. O senhor pode se perguntar o que fazer quando isso acontecer.

Aqui estão algumas abordagens que as pessoas adotam ao lidar com scrapers de conteúdo:

  • Não fazer nada: O senhor pode gastar muito tempo lutando contra os scrapers, por isso alguns blogueiros populares decidem não fazer nada. O Google já vê sites conhecidos como autoridades, mas isso não acontece com sites menores. Portanto, essa abordagem nem sempre é a melhor, em nossa opinião.
  • Take Down: O senhor pode entrar em contato com o scraper e pedir que ele retire o conteúdo do ar. Se ele se recusar, o senhor envia uma notificação de remoção. O senhor pode saber como fazer isso em nosso guia sobre Como encontrar e remover facilmente conteúdo roubado no WordPress.
  • Aproveite as vantagens: Embora trabalhemos ativamente para que o conteúdo extraído do WPBeginner seja retirado, também usamos algumas técnicas para obter tráfego e ganhar dinheiro com os extraidores. O senhor pode saber como na seção “Aproveite os raspadores de conteúdo” abaixo.

Dito isso, vamos dar uma olhada em como evitar o scraping de blogs no WordPress. Como este é um guia abrangente, incluímos um índice para facilitar a navegação:

As leis de marcas registradas e direitos autorais protegem seus direitos de propriedade intelectual, sua marca e seus negócios contra muitos desafios legais. Isso inclui plágio e uso ilegal de seu material protegido por direitos autorais ou do nome e logotipo de sua marca.

O senhor deve exibir claramente um aviso de direitos autorais em seu site. Embora o conteúdo de seu website seja automaticamente coberto pelas leis de direitos autorais, a exibição de um aviso informará que seu conteúdo é protegido por direitos autorais e que eles não podem usar suas propriedades protegidas para fins comerciais.

Exibir um aviso de direitos autorais em seu siteExibir um aviso de direitos autorais em seu site

Por exemplo, o senhor pode adicionar um aviso de direitos autorais com uma data dinâmica ao rodapé do WordPress. Isso manterá seu aviso de direitos autorais atualizado.

Isso pode desencorajar alguns usuários de roubá-lo. Também ajudará no caso de o senhor precisar enviar uma carta de cessação e desistência ou registrar uma reclamação de DCMA para retirar o conteúdo roubado.

O senhor também pode solicitar o registro de direitos autorais on-line. Esse processo pode ser complicado, mas, felizmente, há serviços jurídicos de baixo custo que podem ajudar pequenas empresas e indivíduos.

Saiba como em nosso guia sobre como registrar e proteger os direitos autorais do nome e do logotipo do seu blog.

Como a raspagem do conteúdo do blog geralmente é feita automaticamente por meio do RSS feed do seu blogVamos examinar algumas alterações úteis que o senhor pode fazer no seu feed.

Não inclua o conteúdo completo do post em seu feed RSS do WordPress

O senhor pode incluir apenas um resumo de cada publicação em seu feed RSS em vez do conteúdo completo. Isso inclui um trecho, bem como o post metadados como a data, o autor e a categoria.

Certamente há um debate na comunidade de blogueiros sobre a necessidade de ter feeds RSS completos ou feeds resumidos. Não entraremos nesse assunto agora, exceto para dizer que uma das vantagens de ter apenas um resumo é que ele ajuda a evitar a extração de conteúdo.

O senhor pode alterar as configurações acessando Configurações ” Leitura em seu painel de administração do WordPress. O senhor precisa selecionar a opção “Excerto” e, em seguida, clicar no botão “Salvar alterações”.

Os RSS Feeds podem conter o texto completo ou um trecho de cada postagemOs RSS Feeds podem conter o texto completo ou um trecho de cada postagem

Agora, o feed RSS mostrará apenas um trecho do seu artigo. Se alguém estiver roubando seu conteúdo por meio do feed RSS, receberá apenas o resumo, não a publicação completa.

Se o senhor quiser ajustar o resumo, consulte nosso guia sobre Como personalizar os trechos do WordPress.

Otimize seu RSS Feed para evitar scraping

Há outras maneiras de o senhor otimizar seu feed RSS do WordPress para proteger seu conteúdo, obter mais backlinks, aumentar o tráfego na Web e muito mais. Uma das melhores maneiras é atrasar a exibição das postagens no feed RSS.

A vantagem é que, ao adiar a exibição das publicações no feed RSS, o senhor dá aos mecanismos de busca tempo para rastrear e indexar seu conteúdo antes que ele apareça em outro lugar, como em sites de scrapers. Assim, os mecanismos de pesquisa verão seu site como autoridade.

A maneira mais segura e fácil de fazer isso é usar o WPCode porque ele tem uma receita que adiciona automaticamente o código personalizado correto ao WordPress.

Adicionar um snippet usando o WPCodeAdicionar um snippet usando WPCode

Para obter instruções detalhadas, consulte nosso guia sobre Como atrasar a exibição de postagens no feed RSS do WordPress.

3. Desativar Trackbacks, Pingbacks e API REST

Nos primórdios dos blogs, trackbacks e pingbacks foram introduzidos como uma forma de os blogs notificarem uns aos outros sobre links. Quando alguém faz um link para uma publicação em seu blog, o site dessa pessoa envia automaticamente um ping para o seu.

Esse pingback aparecerá então na página do seu blog. moderação de comentários com um link para o site deles. Se o senhor aprovar o comentário, ele receberá um backlink e uma menção do seu site.

Isso dá ao remetente de spam um incentivo para raspar seu site e enviar trackbacks. Felizmente, o senhor pode desativar trackbacks e pingbacks para dar aos scrapers um motivo a menos para roubar seu conteúdo.

Desativando Trackbacks e Pingbacks no WordPressDesativando Trackbacks e Pingbacks no WordPress

Para obter mais informações, consulte nosso guia sobre desativar trackbacks em todas as postagens futuras. O senhor também pode gostar de aprender Como desativar trackbacks e pings em posts existentes do WordPress.

Desativar a API REST do WordPress

Além de trackbacks e pingbacks, também recomendamos que o senhor desative a API REST do WordPress, pois ela pode facilitar a coleta de seu conteúdo por spammers.

Temos um guia detalhado sobre como o senhor pode desativar a API REST do WordPress.

Tudo o que o senhor precisa fazer é instalar e ativar o plug-in gratuito do WPCode e use o snippet pré-fabricado para desativar a API REST.

4. Bloqueie o acesso do Scraper ao seu site WordPress

Uma maneira de impedir que os scrapers roubem seu conteúdo é impedir o acesso deles ao seu site. O senhor pode fazer isso manualmente, bloqueando o endereço IP, mas a maioria dos usuários achará mais fácil usar um plug-in de segurança, como um firewall de aplicativo da Web.

Bloqueie o Scraper usando um plug-in de segurança (recomendado)

Bloquear scrapers manualmente é complicado e dá muito trabalho. Especialmente porque muitas tentativas e ataques de hackers são feitos usando uma grande variedade de endereços IP aleatórios de todo o mundo. É quase impossível acompanhar todos esses endereços IP aleatórios.

É por isso que o senhor precisa de um Firewall de aplicativos da Web (WAF), como Wordfence ou Securi. Eles funcionam como um escudo entre o seu site e todo o tráfego de entrada, monitorando o tráfego do site e bloqueando ameaças comuns à segurança antes que elas cheguem ao seu site WordPress.

Para o site do WPBeginner, usamos Sucuri. É um serviço de segurança de site que protege seu site contra esses ataques usando um firewall de aplicativo de site.

Basicamente, todo o tráfego do seu site passa pelos servidores do serviço de segurança, onde é examinado em busca de atividades suspeitas. Eles bloqueiam automaticamente o acesso de endereços IP suspeitos ao seu site. Veja como A Sucuri nos ajudou a bloquear 450.000 ataques ao WordPress em 3 meses.

Bloquear ou redirecionar manualmente o endereço IP do Scraper

Os usuários avançados também podem querer bloquear manualmente o endereço IP de um scraper. Isso dá mais trabalho, mas o senhor pode direcionar especificamente o endereço do scraper depois de conhecê-lo. O desenvolvedor da Web Jeff Star sugere essa abordagem quando escreve sobre como lida com scrapers de conteúdo.

Observação: Adicionar código aos arquivos do site pode ser perigoso. Mesmo um pequeno erro pode causar erros graves em seu site. É por isso que recomendamos esse método apenas para usuários avançados.

O senhor pode encontrar o endereço IP do scraper visitando “Raw Access Logs” no painel do cPanel do seu hospedagem na Web O senhor precisa procurar endereços IP com um número excepcionalmente alto de solicitações e manter um registro deles, por exemplo, copiando-os em um arquivo de texto separado. O senhor precisa procurar endereços IP com um número excepcionalmente alto de solicitações e manter um registro deles, por exemplo, copiando-os em um arquivo de texto separado.

Bloqueio do endereço IP do ScraperBloqueio do endereço IP do Scraper

Dica: O senhor precisa ter certeza de que não vai acabar bloqueando o seu acesso ao seu site, o de usuários legítimos ou o de mecanismos de pesquisa. Copie um endereço IP de aparência suspeita e use o ferramentas de pesquisa de IP para saber mais sobre isso.

Quando o senhor tiver certeza de que o endereço IP pertence a um scraper, poderá bloqueá-lo usando a ferramenta “IP Blocker” do cPanel ou adicionando um código como este em sua raiz .htaccess file:

Certifique-se de substituir o endereço IP no código por aquele que o senhor deseja bloquear. O senhor pode bloquear vários endereços IP inserindo-os na mesma linha, separados por espaços.

Para obter instruções detalhadas, consulte nosso guia sobre Como bloquear endereços IP no WordPress.

Em vez de simplesmente bloquear os scrapers, Jeff sugere que o senhor envie a eles feeds RSS fictícios. O senhor poderia criar feeds cheios de Lorem Ipsum e imagens irritantes ou até mesmo enviá-los de volta para o site deles, causando um loop infinito e derrubando o servidor.

Para redirecioná-los para um feed fictício, o senhor precisará adicionar um código como este ao seu arquivo .htaccess:

RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]

5. Evite o roubo de imagens no WordPress

Não é apenas o seu conteúdo escrito que o senhor precisa proteger. O senhor também deve evitar o roubo de imagens no WordPress.

Assim como o texto, não há como impedir completamente que as pessoas roubem suas imagens, mas há muitas maneiras de desencorajar o roubo de imagens em um site WordPress.

Por exemplo, o senhor pode desativar a função hotlinking de suas imagens do WordPress. Isso significa que, se alguém copiar seu conteúdo HTML, as imagens não serão carregadas no site.

Isso também reduzirá a carga do servidor e o uso da largura de banda, aumentando a velocidade e o desempenho do WordPress.

Como alternativa, o senhor pode adicionar uma marca d’água às suas imagens que lhe dê crédito. Isso deixará claro que o scraper roubou seu conteúdo.

O senhor pode aprender essas duas técnicas, bem como outras maneiras de proteger suas imagens, em nosso guia sobre maneiras de evitar o roubo de imagens no WordPress.

6. Desestimule a cópia manual de seu conteúdo

Embora a maioria dos scrapers use ferramentas automáticas, alguns ladrões de conteúdo podem tentar copiar manualmente todo ou parte do seu conteúdo.

Uma maneira de tornar isso mais difícil é impedir que eles copiem e colem seu texto. O senhor pode fazer isso dificultando a seleção do texto em seu site.

Para saber como impedir a cópia manual de seu conteúdo, consulte nosso guia passo a passo sobre Como impedir a seleção de texto e copiar/colar no WordPress.

No entanto, isso não será completamente proteger seu conteúdo. Lembre-se de que os usuários experientes em tecnologia ainda podem visualizar o código-fonte ou usar o ferramenta Inspect para copiar o que quiserem. Além disso, esse método não funcionará com todos os navegadores da Web.

Além disso, lembre-se de que nem todas as pessoas que copiarem seu texto serão ladrões de conteúdo. Por exemplo, algumas pessoas podem querer copiar o título para compartilhe sua publicação nas mídias sociais.

Por isso, recomendamos que o senhor só use esse método se achar que ele é realmente necessário para o seu site.

7. Aproveite as vantagens dos raspadores de conteúdo

À medida que seu blog fica maior, é quase impossível impedir ou controlar todos os scrapers de conteúdo. Ainda enviamos reclamações DMCA. No entanto, sabemos que há muitos outros sites que estão roubando nosso conteúdo e que simplesmente não conseguimos acompanhar.

Em vez disso, nossa abordagem é tentar tirar proveito dos scapers de conteúdo. Não é tão ruim quando se vê que o senhor está ganhando dinheiro com seu conteúdo roubado ou recebendo muito tráfego do site de um scraper.

Faça dos links internos um hábito para ganhar tráfego e backlinks de scrapers

Em nosso guia definitivo sobre SEOrecomendamos que o senhor faça dos links internos um hábito. Ao colocar links para seu outro conteúdo nas postagens do blog, o senhor pode aumentar as visualizações de página e reduzir a taxa de rejeição em seu próprio site.

Mas há um segundo benefício quando se trata de raspagem. Os links internos lhe darão acesso a valiosos backlinks das pessoas que estão roubando seu conteúdo. Mecanismos de pesquisa como o Google usam backlinks como um sinal de classificação, portanto, os backlinks adicionais são bons para seu SEO.

Por fim, esses links internos permitem que o senhor roube o público do scraper. Blogueiros talentosos colocam links em palavras-chave interessantes, tornando-as tentadoras para os usuários clicarem. Os visitantes do site do scraper também clicarão nos links, o que os levará diretamente de volta ao seu próprio site.

Auto link de palavras-chave com links de afiliados para ganhar dinheiro com scrapers

Se o senhor ganha dinheiro em seu site com marketing de afiliadosrecomendamos que o senhor ative o link automático em seus feeds RSS. Isso o ajudará a maximizar os ganhos dos leitores que só leem seu site por meio de leitores de RSS.

Melhor ainda, isso o ajudará a ganhar dinheiro com os sites que estão roubando seu conteúdo.

Basta usar um plug-in do WordPress como o ThirstyAffiliates que substituirá automaticamente as palavras-chave atribuídas por links de afiliados. Mostramos ao senhor como fazer isso em nosso guia sobre Como vincular automaticamente palavras-chave a links de afiliados no WordPress.

Promova seu site no rodapé de seu RSS

O senhor pode usar o SEO tudo em um para adicionar itens personalizados ao rodapé do RSS.

Por exemplo, o senhor pode adicionar um banner que promova seus próprios produtos, serviços ou conteúdo.

Salvar o rodapé do feed RSS da AIOSEOSalvar o rodapé do feed RSS da AIOSEO

A melhor parte é que esses banners também aparecerão no site do scraper.

Em nosso caso, sempre adicionamos um pequeno aviso de isenção de responsabilidade na parte inferior das publicações em nossos feeds RSS. Ao fazer isso, obtemos um backlink para o artigo original do site do scraper.

Isso permite que o Google e outros mecanismos de pesquisa saibam que somos a autoridade. Também permite que seus usuários saibam que o site está roubando nosso conteúdo.

Para obter mais dicas, consulte nosso guia sobre como controlar o rodapé do feed RSS no WordPress.

Esperamos que este tutorial tenha ajudado o senhor a aprender como evitar a extração de conteúdo de blogs no WordPress. Talvez o senhor também queira ver nosso guia definitivo de segurança do WordPress ou nossa escolha especializada de as melhores soluções de análise para WordPress.

Se o senhor gostou deste artigo, por favor, assine o nosso Canal do YouTube para tutoriais em vídeo sobre o WordPress. O senhor também pode nos encontrar em Twitter e Facebook.