Google Webmaster Central Blog - Official news on crawling and indexing sites for the Google index

Site content and use of web catalogues

Friday, March 16, 2007 at 2:28 PM

Sites with more content can have more opportunities to rank well in Google. It makes sense that having more pages of good content represent more chances to rank in search engine result pages (SERPs). Some SEOs however, do not focus on the user’s needs, but instead create pages solely for search engines. This approach is based on the false assumption that increasing the volume of web pages with random, irrelevant content is a good long-term strategy for a site. These techniques are usually accomplished by abusing qlweb style catalogues or by scraping content from sources known for good, valid content, like Wikipedia or the Open Directory Project.

These methods violate Google's webmaster guidelines. Purely scraped content, even from high quality sources, does not provide any added value to your users. It's worthwhile to take the time to create original content that sets your site apart. This will keep your visitors coming back and will provide useful search results.

In order to provide best results possible to our Polish and non-Polish users, Google continues to improve its algorithms for validating web content.

Google is willing to take action against domains that try to rank more highly by just showing scraped or other autogenerated pages that don't add any value to users. Companies, webmasters, and domain owners who consider SEO consultation should take care not to spend time on methods which will not have worthwhile long-term results. Choosing the right SEO consultant requires in-depth background research, and their reputation and past work should be important factors in your decision.

PS: Head on over to our Polish discussion forum, where we're monitoring the posts and chiming in when we can!

Treść oraz katalogi na serwisach internetowy

Serwisy o dużej ilości stron mają szanse na wyższe pozycje w indeksie Google. Oznacza to, że oferując wiele stron z niepowtarzalną treścią można polepszyć notowania w wynikach wyszukiwarek (SERP). Fakt ten jest znany i wykorzystywany przez przedsiębiorstwa oferujące usługi pozycjonowania witryn internetowych. Często jednak nie jest brane pod uwagę, że treść strony powinna być tworzona dla użytkowników, a nie dla wyszukiwarek (w tym Google). Takie podejście prowadzi do błędnego założenia, że wystarczy zwiększyć ilość stron konkretnej domeny, dodając na przykład katalogi z dowolną, niejednokrotnie zupełnie nieistotną treścią, aby na dłuższy okres czasu wypozycjonować domenę. Przejawia się to między innymi nadużywaniem katalogów typu qlweb lub kopiowaniem znanych z jakościowo dobrej treści serwisów, jak Wikipedia lub Open Directory Project.

Takie metody są bez wątpliwości rozbieżne z wytycznymi Google dla webmasterów. Dowolnie skopiowane treści, nawet jeżeli dobrej jakości, nie stanowią większej wartości informacyjnej dla użytkowników. Aby wyróżnić serwis internetowy, warto poświęcić czas na tworzenie nowej treści, dzięki czemu można zwiększyć lojalność użytkowników i dostarczyć przydatnych wyników w wyszukiwarce.

W trosce o naszych polskich użytkowników (i nie tylko) Google konsekwentnie ulepsza algorytmy weryfikujące merytoryczną wartość serwisów internetowych.

Google jest skłonny podejmować działania przeciwko domenom, których webmasterzy usiłują osiągnąć lepsze pozycje w wynikach poprzez dodawanie skopiowanej lub automatycznie wygenerowanej treści, która nie stanowi żadnej wartości dla użytkowników. Przedsiębiorstwa, webmasterzy oraz właściciele domen biorący pod uwagę konsultacje specjalistów SEO, powinni zadbać o to, żeby ich czas nie był wykorzystywany na stosowanie metod nieprzynoszących długoterminowych rezultatów. Przy wyborze doradców oraz firm oferujących pozycjonowanie, ich reputacja jest kluczowym czynnikiem i powinna zostać dokładnie zweryfikowana przed podjęciem ostatecznej decyzji.

PS: Zapraszamy na naszą polską grupe dyskusyjną, na której z zainteresowaniem czytamy Wasze wpisy i staramy się na nie reagować.

Posted by Kaspar Szymanski, Search Quality
The comments you read here belong only to the person who posted them. We do, however, reserve the right to remove off-topic comments.

17 comments:

JLH said...

I guess I'll need to spend some time learning Polish so that we can communicate with Google.

Andy Beard said...

The original was in Polish, but the English translation is actually very accurate, and probably some of the best Polish > English translation I have ever read.

If you wrote both Kasper you are to be congratulated as your translation is better than most professional translators in Poland that I have come across, and that is quite a few.

Teo said...

You know, these pages are indeed annoying. I've seen links to my site on (autogenerated) pages with porn, for example.. And this really bothers me a lot. Can we report these sites so that they won't be indexed anymore?

Aji Issac said...

are you talking about duplicate contents too?

How will you calculate the value to users, is there an automated way apart from checking the dups content?

Michael Martinez said...

Wikipedia is known for good content? Sorry, that dog won't hunt.

deni2s said...

Does that means, that placing copy of ODP on my website (www.hc.lv) will affect my Google PR rankings negatively? I thought, that Google should encourage ODP copying (btw, isn't Google Directory copy of ODP?)

Sebastian said...

Denis, there is one ODP and one legit clone ;) All the others should be disallowed in robots.txt to avoid hassles.

emotika said...

To andy beard - don't be silly, it is translated alright but far from being perfect. If this is the best most translators in Poland can do I just found a new job.

Goran Aleksic said...

I think this is not fair.

You just removed 250.000 www.inter.co.yu pages from google, now I have only 7, beacose *part* of my site relies on ODP data and improved algorithms threats whole my site, subdomains and client's sites as a spam.

I think I *am* adding value. I know and I agree it's worthwhile to take the time to create original content - all I am doing all the time is trying to make *relevant* content.

Dan said...

I want to achieve a higher ranking
and want advice on how I can go about it?info@www.timeshareeverywhere.net
I also want to trade links on my site with other associate sites.

Dan said...

I need some goog link exchange for my site. we the webmaster's must stick together! If you have any associate links please e-mail me...info@timeshareeverywhere.net

thanks dan

Mark said...

talking about content from other sources will rss feed from trusted site and displaying it on our site is included in this?
I think not.

lewis said...

If this is the case, then can someone tell me why www.google.com has a good rank, considering that it is a website purely generated using scraped data?

S.G. said...

totally agree with all. content is the king. i'm not sure that the standards are apply by all search engines.

google, slurp understand Disallow: /*xls$ , while msnbot and teoma ignores it. ( check http://www.ghita.ro/article/23/web_robots_and_dynamic_content_issues.html the last paragraphs )

retouching said...

I have new web-site http://digital-photo-retouching.com/, but my site at all has no PR, not even 0. What can I do with it?!

bazyliszek said...

Very Interesting Post
About Polish Webmasters

Thanks Google for Yours joke.
Look how You spamming results by Yours Copy of Dmoz.

http://www.google.pl/search?hl=pl&q=inurl%3A%2Ftop%2Fworld%2F+google&btnG=Szukaj+w+Google&lr=

In Polands we say "Co wolno wojewodzie to nie tobie smrodzie"

Please use translators

Many Thanks

Google Webmaster Central said...

Hi everyone,

Since over a year has passed since we published this post, we're closing the comments to help us focus on the work ahead. If you still have a question or comment you'd like to discuss, free to visit and/or post your topic in our Webmaster Help Group.

Thanks and take care,
The Webmaster Central Team