'페이지랭크'에 해당되는 글 1

  1. 2011/03/01 구글, 랭킹 알고리즘 변경…“낚시 페이지를 걸러라”
사용자 삽입 이미지

구글이 검색결과의 순위를 정하는(랭킹) 알고리즘을 개선했습니다.

구글의 펠로우 연구원인 아밋 싱할(Amit Singhal)과 수석 엔지니어인 맷 커츠가 구글 공식 블로그에 올린 글에 따르면, 앞으로 구글은 콘텐츠의 품질을 평가해 가치가 높은 페이지를 먼저 보여주게 됩니다.

두 연구원은 “가치가 낮은 콘텐츠, 다른 웹 사이트를 카피한 콘텐츠, 별로 유용하지 않은 콘텐츠의 우선순위를 낮춘 대신 (복사본이 아닌) 원본 콘텐츠, 깊이 있는 보고서, 심도 있는 분석 등은 우선순위를 높였다”고 밝혔습니다.

구글의 이 같은 알고리즘 개선은 콘텐츠 팜(falm) 때문입니다. 콘텐츠 팜은 남의 콘텐츠를 복사해 놓거나 별 가치도 없는 콘텐츠만 가득하면서 검색 최적화를 통해 검색결과 상단에 노출되는 사이트들입니다.

구글은 이번 개편을 통해 콘텐츠 팜 사이트들이 검색 결과 상단에서 사라지기를 기대하고 있습니다.

하지만 ‘품질이 높은 콘텐츠를 검색결과의 상단에 배치하겠다’는 아이디어가 새로운 것은 아닙니다.

구글의 랭킹 알고리즘으로 유명한 페이지 랭크는 기본적으로 이 같은 발상에서 시작된 것입니다. 많이 인용되는 논문이 우수한 것처럼, 많이 참조된 웹페이지에 우선순위를 주겠다는 것이 페이지 랭크의 기본 사상이었습니다.

문제는 ‘콘텐츠의 품질을 어떻게 판단하느냐’가 중요한 관건이 될 것입니다. 콘텐츠의 품질은 사람이 평가해도 판단이 제각각일텐데, 컴퓨터가 이를 판단하기란 쉽지 않을 것입니다.

하지만 구글은 아직 이에 대한 알고리즘은 밝히지 않고 있습니다. 외신에 따르면, 구글 대변인은 “악의적인 사용자들에게 우리의 알고리즘을 알리고 싶지 않다”고 밝혔다고 합니다.

다만 두 연구원은 ‘개인 차단목록 크롬확장(Personal Blocklist Chrome extension)’을 이용하지는 않았다고 설명했습니다. ‘개인 차단목록 크롬확장’은 어떤 웹사이트가 사용자에게 차단돼 있는지를 추적하고, 그 결과를 구글에 보고하는 구글 크롬의 새로운 확장 기능입니다.

하지만 이 확장 기능을 이용하지 않았음에도 새로운 알고리즘에 의해 품질이 낮다고 평가된 사이트와 크롬확장을 통해 수집한 개인 차단목록에 중복된 사이트가 많았다고 두 연구원은 밝혔습니다.

특히 많은 사용자에 의해 차단돼 있는 수천 개의 도메인 중 84 %는 이번에 개선된 알고리즘에서 순위가 내려갔다고 합니다.

한편 구글은 새로운 알고리즘을 미국 서비스에만 적용했지만, 앞으로 다른 나라 서비스에도 점자 적용할 계획이라고 밝혔습니다.
2011/03/01 17:27 2011/03/01 17:27