22.9 C
New York
Thursday, June 1, 2023

Extraindo artigos de texto completo usando tags de contêiner – CyberSEO Professional


Extrator de artigo de texto completo do CyberSEO Pro

O CyberSEO Professional O plug-in inclui um recurso poderoso que permite extrair artigos de texto completo de páginas HTML usando a tag container. Essa funcionalidade pode ajudá-lo a exibir artigos completos em seu web site, em vez de apenas trechos ou resumos, garantindo que o conteúdo de seu web site seja exclusivo e informativo.

Nas versões anteriores do CyberSEO Professional, você pode usar o script RSS de texto completo common para extrair artigos de texto completo de páginas da net arbitrárias. Embora o script RSS de texto completo seja muito poderoso e possa extrair quase qualquer artigo, ele não é onipotente e às vezes falha ou não consegue extrair corretamente certas partes do código HTML, como vídeos incorporados, and so forth. Esse método ainda está disponível como antes, mas há um novo que permite extrair um artigo de texto completo de qualquer página da Net com um structure HTML fixo, mesmo que o script RSS de texto completo tenha problemas com ele. Apenas observe que esse novo método deve ser adaptado para cada web site em explicit, de acordo com seu structure HTML interno. Como resultado, ele não funcionará com fontes como os feeds RSS do Google Notícias, que estão vinculados a diferentes websites com seus próprios layouts HTML exclusivos.

Neste artigo, você será guiado pelo processo de uso do método de tag de contêiner com a ajuda de ferramentas do Inspetor de navegador, como Firefox ou Chrome. Compreendendo que nem todos estão familiarizados com HTML ou desenvolvimento da Net, este guia foi desenvolvido para ser o mais simples e fácil de seguir possível.

Etapa 1: encontrar a tag do contêiner

  1. Abra a página da Net que contém o artigo que deseja extrair no Firefox ou no Chrome.
  2. Clique com o botão direito do mouse na área de conteúdo principal do artigo e selecione “Inspecionar” (Firefox) ou “Inspecionar elemento” (Chrome) no menu de contexto. Isso abrirá a ferramenta Inspetor do navegador, exibindo a estrutura HTML da página.
  3. Na ferramenta Inspetor, você verá destacado o elemento HTML que envolve o conteúdo principal do artigo. Esta é a tag do contêiner. pode ser um <div>, <part>, <article>ou outro elemento HTML semelhante.

Passo 2: Identifique os atributos

  1. Look at a marca de contêiner destacada na ferramenta Inspetor para encontrar seus atributos. Atributos são propriedades de um elemento HTML que fornecem informações adicionais sobre ele. Os atributos comuns incluem class, id, modeland so forth
  2. Anote o(s) atributo(s) e seus valores correspondentes. Por exemplo, se a tag do contêiner for <div id="essential" class="article-content">os atributos são class com o valor "article-content" e id com o valor "essential".

Inspetor do Chrome

Etapa 3: configurar o plug-in CyberSEO Professional

  1. Nas configurações do feed, navegue até a guia “Avançado”.
  2. Selecione “Usar configurações personalizadas” no Extrair artigos de texto completo menu suspenso.
  3. No campo “Tag do contêiner”, digite o nome da tag que você encontrou na Etapa 1 (por exemplo, div, article, part). Para o exemplo acima é div.
  4. No campo “Atributos (formato JSON)”, insira os atributos e seus valores no formato JSON, conforme encontrado na Etapa 2. Para nosso exemplo, você inseriria {"class": "article-content", "id": "essential"}.
  5. Escolha se deseja incluir a tag container e seus atributos no conteúdo extraído marcando ou desmarcando a opção “Inclusive”.
  6. Salve suas alterações e puxe o feed para testar a extração.

CyberSEO Pro extrai artigo de texto completo

Seguindo estas etapas, você pode configurar facilmente o plug-in CyberSEO Professional para extrair artigos de texto completo de páginas HTML usando o recurso de tag de contêiner. Com um pouco de prática, você conseguirá identificar tags de container e seus atributos com facilidade, garantindo que seu web site tenha o conteúdo mais abrangente e exclusivo possível.

Embora essa abordagem possa não funcionar para feeds agregadores como Google Information ou Bing Information, é uma solução eficaz para extrair artigos de texto completo de websites individuais com layouts HTML consistentes. Seguindo as etapas descritas neste guia, você pode garantir a importação de conteúdo de texto completo de alta qualidade para o seu web site WordPress usando o plug-in CyberSEO Professional.

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles