SEO, SEM, eMarketing

Blog Radka Kubery

Gdzie mnie można znaleźć

Google+: Radek Kubera
Facebook: Radek Kubera
Forum PiO: Radek
Twitter: Radek Kubera

Desynonimizator - SPAM Stop po raz drugi

2013-06-19 10:53:39 Witam serdecznie.
Przywołany w wątku PIO znów do działania:
Google Update: Frazy Mocno Spamowane

postanowiłem udostępnić publicznie program, którego zadaniem jest ukazanie w praktyce desynonimizowania tekstów.

Program działa zgodnie z zasadą opisaną w tym wpisie:
No i stało się – Google zaczyna karać za spam

Program, który desynonimizuje i porównuje teksty posiada 230 linii kodu i został napisany w kilka godzin - zatem nie wymagajmy od niego cudów.
Ale zapraszam do testów.

Poniżej znajduje się formularz, do którego wklejamy dwa rożne teksty (np. dwa warianty tej samej, zsynonimizowanej treści)
Po zatwierdzeniu pokaże nam wyniki podobieństwa tekstu1 do tekstu2 oraz tekstu2 do tekstu1.

Czemu dwa wyniki?
Jeżeli w jednym okienku wprowadzimy cały tekst a w drugim tylko jego fragment, wtedy tekst2 będzie np. w 90% podobny do tekstu1, zaś tekst1 będzie podobny do tekstu2 w 10%.

Jak działa desynonimizer?
Działa w ten sposób, że na początku sprowadza program do postaci prostej, zdesynonimizowanej. Potem bada (metodą strasznie kaleką) podobieństwo ułożenia wsłów w obu tekstach. Ten drugi punkt ma zapobiec sytuacji, gdyby okazało się, że są dwa artykuły, które zawierają dokładnie ten sam zestaw wyrazów a jednak piszą o czymś innym. Z drugiej strony wyłapuje to tekst przestawny

Jak wyglądają wyniki naszych testów?
Dwa różne teksty (nie synonimy) mają podobieństwo na poziomie 10-20%
Teksty branżowe (np. napisane o dokładnie tym samym) mają podobieństwo na poziomie 20-30%.
Jeżeli podobieństwo tekstów wynosi 50% to mamy już przynajmniej 80% szans, że to synonimy.
Przy 65% nie ma już podejrzenia a jest w zasadzie pewność.

Po co to udostępniam?
Chcę, aby branża SEO zrozumiała, że synonimizacja (przynajmniej na aktualnym poziomie) już jest historią. Mój program ma 230 linii kodu - Google ma więcej czasu i ludzi na napisanie "porządnego" programu i dużą próbkę do testów. Oczywiście przejdą wielopoziomowe teksty bardzo mocno posynonimizowane - jednak taki automat wyłapie moim zdaniem już dziś przynajmniej 30% spamu z automatu. Dodatkowo głęboka synonimizacja znów podniesie koszty SEO - a przecież o to chodzi.

Co wyłapie to narzędzie?
Bez problemu wyłapie większość aktualnych wpisów w preclach, katalogach (szczególnie z publicznych baz).

A oto i desynonimizator.

Desynonimizator (teksty w języku polskim lub angielskim)

Język tekstów:


text1:
text2: