menu
Webを活用してお客様のビジネス課題を解決します。札幌・東京を拠点にWebコンサルティングをコアにした、Web制作・システム開発・サーバ構築会社です。
Google検索品質評価ガイドラインPart 1「ページ品質評価のガイドライン」

7.5.4 コピーされたMC

最新原文:2021年10月19日 | 公開日:2023年03月29日

少ない時間、労力、専門知識などで豊富なコンテンツを作成するもう一つの方法は別のソースからコンテンツをコピーすることです。このコピーとは、コンテンツを”スクレイピング”すること。つまり、(閲覧する)ユーザーに対してオリジナルのコンテンツや価値を追加することなく、他の非関連なウェブサイトからコンテンツをコピーすることを指します。(コピーコンテンツやスクレイピングコンテンツについてはこちらを参照してください)

コピーコンテンツによるページは、時間、労力、専門知識が全くないか非常に少なく、また編集や手作業によるキュレーションもほとんど行われていない状態です。他のサイトのコンテンツをコピーしただけで作られたページにはほとんど価値が存在しません。自動生成コンテンツと同様に多くのページ、あるいはウェブサイト全体を作成するために使用できる手法です。このため、コピーされたコンテンツを見分けるにはサイト内の多くのページを調査するのが最も簡単な場合が多いです。

最低評価はそのページのMCのすべて、あるいはほとんどすべてが時間、労力、専門知識、手作業によるキュレーション、ユーザーへの付加価値などをほとんど使わずにコピーされた場合には適切です。そのようなページはたとえそのコンテンツが他のソースにクレジットされていたとしても、最低評価のレーティングを受けるべきです。

以下はすべてコピーコンテンツとみなされています:

● コンテンツがどこからなのか識別可能なソースから正確にコピーされたもの。ページ全体がコピーされることもあれば、ページの一部分だけがコピーされることもあります。複数のページがコピーされて1つのページに貼り合わされることもあります。このように正確にコピーされたテキストは普通、コピーされたコンテンツの中で最も識別しやすいタイプです。
● コピーでありながらもオリジナルからわずかに変更がなされたコンテンツ。このようなコピーでは完全に一致する元のソースを見つけることは困難です。数個の単語が変更されることもあれば文章全体が変更されることもあり、また、文章中のある特定単語を別の単語に置き換える「検索と置換」による変更が行われることもあります。このようなタイプの変更はコンテンツの元のソースを見つけるのが難しくなるように意図的に行われます。私たちはこのようなコンテンツを “最小限の変更でコピーされたもの(copied with minimal alteration)”と呼んでいます。
● 検索結果ページやニュースフィードなど常に変化するソースからコピーされたコンテンツ。この様な動的コンテンツ(頻繁に変更されるコンテンツ)のコピーである場合、元のソースと完全に一致するものを見つけることは困難でしょう。しかし、この場合もコピーされたコンテンツとみなします。

重要:ライセンス供与されたコンテンツや シンジケーションされたコンテンツは、”コピー”と見なしてはいけません。(ウェブシンジケーションについては、こちらをご覧ください)米国におけるシンジケートされたコンテンツの例としては、APやロイターのニュース記事などがあります。

原文

7.5.4 Copied MC

Another way to create an abundance of content with little time, effort, expertise, etc. is to copy content from another source. The word “copied” refers to the practice of “scraping” content, or copying content from other non-affiliated websites without adding any original content or value to users (see here for more information on copied or scraped content).

Pages with copied content are created with no or very little time, effort, or expertise, and also have little to no editing or manual curation. There is little value when pages are created simply by copying content from other sites. As with auto-generated content, it is a technique that can be used to create many pages or even a whole website. For this reason, it is often easiest to recognize copied content by exploring many pages on the site.

The Lowest rating is appropriate if all or almost all of the MC on the page is copied with little or no time, effort, expertise, manual curation, or added value for users. Such pages should be rated Lowest, even if the page assigns credit for the content to another source.

All of the following are considered copied content:

● Content copied exactly from an identifiable source. Sometimes an entire page is copied, and sometimes just parts of the page are copied. Sometimes multiple pages are copied and then pasted together into a single page. Text that has been copied exactly is usually the easiest type of copied content to identify.
● Content that is copied, but changed slightly from the original. This type of copying makes it difficult to find the exact matching original source. Sometimes just a few words are changed, or whole sentences are changed, or a “find and replace” modification is made, where one word is replaced with another throughout the text. These types of changes are deliberately done to make it difficult to find the original source of the content. We call this kind of content “copied with minimal alteration.”
● Content copied from a changing source, such as a search results page or news feed. You often will not be able to find an exact matching original source if it is a copy of “dynamic” content (content that changes frequently). However, we will still consider this to be copied content.

Important: Licensed or syndicated content should not be considered as “copied” (see here for more on web syndication). Examples of syndicated content in the U.S. include news articles by AP or Reuters.