1. 구글 펭귄 알고리즘이란?

구글 검색엔진에 키워드로 검색했을 때, 저품질 콘텐츠가 상위에 뜨면 사용자의 검색 만족도는 낮아질 수밖에 없습니다. 이를 해결하고자 구글은 2011년 판다 알고리즘을 출시하며 사용자 경험 개선을 위해 꾸준하게 구글 업데이트를 진행했습니다.
지난 시간에는 판다 알고리즘(내부 판다 알고리즘 포스팅 링크 연결해 주세요.)에 대해 깊게 분석하며 알아보는 시간을 가졌습니다. 판다 알고리즘에 대한 이해를 바탕으로 오늘은 펭귄 알고리즘에 대해 알아보려고 합니다. 펭귄 알고리즘이 어떤 특징을 갖고 있는지, 우리가 이 알고리즘에 맞춰 어떻게 SEO를 관리하면 좋을지, 디지털 마케팅 방법은 무엇인지 소개해 드리겠습니다.
1.1 펭귄 알고리즘의 출시 배경
구글에서는 크롤링을 하거나 색인을 생성, 분석할 때 어떻게 사이트 점수를 매기고 순위를 매겼을까요? 여러 기준 중에서 링크 볼륨이 가장 큰 역할을 했습니다.
예전에는 페이지에 링크가 많이 포함되어 있을수록 구글 검색 페이지에서 높은 순위를 차지하는데 유리했습니다. 그래서 구글 상위에 노출되고자 많은 회사들이 페이지에 무분별하게 링크를 생성하기 시작했습니다. 링크의 품질보다 양이 더 중요했고, 최대한 많은 웹사이트를 통해서 백링크를 확보했습니다. 여기서 백링크란, 다른 사이트로부터 우리 사이트로 들어오는 링크를 의미합니다.
이 과정에서 백링크를 쉽게 얻을 수 있는 디렉터리, 포럼, 북마크 페이지 등 저품질 사이트가 많아졌습니다. 검색한 키워드와 관련이 없는 링크들이 과도하게 삽입되면서, 방문자들의 사용 경험은 점차 악화되었습니다. 일부 저품질 사이트와 콘텐츠가 원래 있어야 하는 순위보다 더 높은 순위를 차지하는 상황이 벌어진 것입니다.
저품질 콘텐츠를 줄이기 위해 구글에서 판다 알고리즘을 출시했던 것처럼, 이번에도 사용자의 부정적인 경험을 막고자 구글에서는 새로운 알고리즘인 펭귄 알고리즘을 출시했습니다.
1.2 펭귄 알고리즘이란?
구글은 2012년 4월 24일, 펭귄 알고리즘을 출시했습니다. 펭귄 알고리즘은 판다 알고리즘처럼 대표적인 스팸 방지 알고리즘에 해당합니다. 저품질 콘텐츠 및 링크를 통해 구글을 속이고 높은 순위를 받으려는 사이트를 판별하기 위한 알고리즘입니다.
펭귄 알고리즘의 이름은 어떤 뜻일까요? 처음에 알고리즘 출시 당시에서는 웹스팸 알고리즘으로 출시했다고 합니다. 구글 웹스팸 팀 책임자였던 Matt Cutts의 트윗을 통해 펭귄 알고리즘이라는 명칭이 공식적으로 알려지게 되었습니다. 구글은 이 웹스팸 알고리즘을 펭귄 알고리즘이라고 알렸지만, 구체적으로 밝혀진 이름의 유래는 없다고 합니다.
구글은 사람들이 검색한 키워드에 대해 가장 관련성이 높은 답변을 가능한 한 빠르게 제공하는 것이 목표입니다. 펭귄 알고리즘도 구글의 이 목표를 달성하기 위해 개발한 스팸 방지 알고리즘이라고 이해하시면 될 것 같습니다.
2. 펭귄 알고리즘 영향력 및 작동 방식
2.1 펭귄 알고리즘 영향력

펭귄 알고리즘이 2012년 4월, 처음 출시되었을 때, 구글의 자체 추정치에 따르자면 검색 결과의 3.1% 영향을 미쳤다고 합니다. 판다 알고리즘이 영어권 전체 검색 결과의 11.8%에 영향을 미친 것과 비교하면 영향력은 낮지만, 그래도 약 3%의 수치는 일반 사용자가 인지할 수 있을 정도의 효과라고 합니다.
참고로 펭귄 알고리즘은 중국어, 독일어, 아랍어와 같은 언어 쿼리에 약 3% 영향을 미쳤지만, 스팸이 많은 언어권에서는 영향이 더 높다고 합니다. 예를 들어, 폴란드어 쿼리에서는 5% 영향을 미쳤다고 합니다.
펭귄 알고리즘은 4.0 버전까지 업데이트를 진행했으며, 그 과정에서 쿼리에 크고 작은 영향력을 행사했습니다. 그리고 2016년 9월 23일, 펭귄 알고리즘이 구글의 핵심 알고리즘의 일부가 되었습니다. 핵심 알고리즘이 되었다는 의미는 사이트의 순위가 실시간으로 평가되며, 알고리즘의 영향을 받는다는 뜻입니다.
2.2 펭귄 알고리즘 작동 방식 – 링크 전략
펭귄 알고리즘에 자세히 파악하기 위해서는 알고리즘의 기준을 파악해야 합니다. 구글은 과도한 검색엔진 최적화를 막기 위해 2가지를 기준으로 삼아 알고리즘을 설계했습니다. 첫 번째는 링크 전략(Link scheme), 두 번째는 키워드 스터핑(Keyword stuffing)입니다.
앞서 출시 배경에서 말씀드렸던 것처럼 펭귄 알고리즘이 출시되기 전, 구글 검색 순위를 올리기 위해 백링크를 대량으로 생성했습니다. 왜냐하면 백링크는 구글의 랭크 알고리즘의 요소 중 하나에 해당하기 때문입니다. 링크를 통해 구글 검색엔진에 사이트 정보를 주고, 구글 검색 랭킹에 영향을 미칩니다.
펭귄 알고리즘은 사이트 간 인위적으로 링크를 거는 행위를 막습니다. 하지만, 모든 백링크가 나쁜 것은 아닙니다. 내 웹사이트에 고품질 백링크가 걸려 있는 경우 구글은 이 사이트를 신뢰할 만한 사이트라고 판단하고 점점 상위에 노출시킬 확률이 높아지게 됩니다.
백링크에 대해 조금 더 자세히 안내해 드리겠습니다. 백링크는 URL 주소를 그대로 표기하거나, 텍스트에 하이퍼 링크를 걸어서 표기할 수 있습니다. 이를 앵커 텍스트라고 부릅니다. HTML에서 앵커 텍스트는 아래와 같은 구조로 사용합니다.
<a href="/ko/”/" https:> 헤들리 디지털</a>
위와 같이 HTML이 쓰였을 때, ‘헤들리 디지털’라는 키워드가 앵커 텍스트가 되는 것입니다. 이러한 앵커 텍스트는 사이트와 링크의 관련성을 보여주기 때문에 중요한 역할을 수행합니다.
그렇다면 펭귄 알고리즘이 지양하는 백링크 방식은 어떤 것일까요?
- 품질이 낮은 사이트의 백링크
- 동일하거나, 유사한 앵커 텍스트가 있는 백링크
- 돈을 주고 구매한 백링크
- 봇을 통해 인위적으로 구축한 백링크
- 블랙햇 기술을 사용한 사이트의 백링크
- 짧은 시간에 구축된 대량의 백링크
이러한 기준을 바탕으로 펭귄 알고리즘은 작동하며, 알고리즘 최적의 콘텐츠를 만들기 위해서는 위의 백링크를 지양해야 합니다. 백링크에 더 궁금하신 내용이 있다면 ‘여기’를 참고해 주세요.
2.3 펭귄 알고리즘 작동 방식 – 키워드 스터핑

키워드 스터핑
키워드 스터핑이란 단어를 반복적으로 사용하는 행위를 일컫습니다. 예를 들어, ‘구글 펭귄 알고리즘’을 소개하는 글에 ‘펭귄 알고리즘’ 키워드를 처음부터 끝까지 과도하게 넣으면 어떨까요? 키워드를 검색해서 사이트에 들어온 사용자에게 부정적인 경험을 줄 수 있을 것입니다.
키워드를 의미 없이 반복해서 사용할 경우, 구글로부터 페널티를 받을 수 있습니다. 키워드를 무분별하게 사용하지 않더라도 콘텐츠가 충분히 유용하다면 구글 검색 결과에 노출될 가능성이 높습니다. 메인 키워드만 반복해서 사용하는 것보다 연관된 키워드를 자연스럽게 언급하는 것을 추천합니다.
펭귄 알고리즘은 키워드 스터핑을 지양하며, 이 기준을 토대로 스팸성 사이트 및 콘텐츠를 거르기 위해 작동합니다.
2.4 펭귄 알고리즘 적용 범위
펭귄 알고리즘이 도입된 이후, 조작적으로 링크를 구축하거나 저품질 링크를 무작위로 넣은 사이트의 순위는 대폭 하락했습니다.
펭귄 알고리즘을 인한 다운그레이드는 사이트 전체에 적용된 것은 아니라고 합니다. 일부 펭귄의 다운그레이드는 경우에 따라서 스팸이 많이 전송되고 지나치게 최적화된 특정 키워드 그룹에만 영향을 미치는 경우도 있었습니다.
참고로 펭귄 알고리즘은 도메인 간에도 영향을 미칠 수 있어 도메인을 변경하거나 이전 도메인을 새 도메인으로 리디렉션하는 경우에는 부정적인 영향을 받을 수 있습니다.
구글은 실험을 통해301, 302 리디렉션을 해도 펭귄 알고리즘의 영향을 벗어날 수 없다는 것을 보여줬습니다. 구글 웹마스터 포럼에서는 한 도메인에서 새로운 도메인으로 메타 리프레시를 사용하는 것도 문제를 일으킬 수 있다고 전했습니다.
2.5 펭귄 알고리즘과 판다 알고리즘 비교

구글은 저품질 콘텐츠를 다루기 위해 판다 알고리즘을 설계했지만, 여전히 스팸성 콘텐츠가 많다는 것을 깨닫고는 펭귄 알고리즘을 설계했다고 합니다.
판다와 펭귄, 어떤 공통점이 있을까요? 농담처럼 판다와 펭귄 모두 몸의 색이 하얀색과 검은색으로 이루어져 있다는 점이 같다고 합니다. 두 알고리즘은 모두 각 스팸 방지 알고리즘으로 도입되었지만 구글의 핵심 알고리즘에 통합되었다는 공통점이 있습니다.
구글 판다 알고리즘은 저품질 콘텐츠를 막으며 고품질의 콘텐츠 생산을 유도하는 방향이지만, 펭귄 알고리즘은 과도하게 적용된 SEO를 방지하는 역할을 수행한다는 점에서 차이점이 있다고 볼 수 있습니다.
3. 펭귄 알고리즘에 맞추기 위한 전략
펭귄 알고리즘이 도입되고, 타격을 입은 곳들이 예상보다 많았습니다. 이들의 공통적인 문제점은 잘못된 링크 구축, 키워드 스터핑, 낮은 품질의 콘텐츠였습니다. 펭귄 알고리즘으로 순위가 대폭 하락하자, 이를 회복할 수 있는 방법을 찾기 시작했습니다. 헤들리 디지털에서 펭귄 알고리즘에 맞추기 위한 방법을 소개하겠습니다.
3.1 소설 미디어를 활용한 링크 확산

첫 번째 방법은 소셜 미디어를 적극적으로 활용하여 링크를 구축하는 방법입니다. 페이스북, 인스타그램, 유튜브, 트위터 등 소셜 미디어로 자연스럽게 사이트와 콘텐츠를 외부에 알리는 것이 중요합니다.
소셜 미디어 채널을 통해 사람들 사이에 콘텐츠가 공유되고, 노출된다면 자연스럽게 링크는 확산될 것입니다. 링크가 확산된다면 구글은 해당 콘텐츠가 사용자에게 유용한 콘텐츠라고 판단합니다. 백링크를 통해 링크를 확산하는 것 대신 다양한 소셜 미디어 채널을 활용하는 것을 추천합니다.
3.2 콘텐츠 품질 향상을 통한 링크 확산
둘째, 콘텐츠 품질을 높이기 위해 노력하는 것이 중요합니다. 키워드 스터핑처럼 의미 없는 키워드, 문장을 반복하는 방식을 사용하는 것을 지양해야 합니다. 키워드와 연관성이 있는 콘텐츠로 방문자에게 도움이 되는 콘텐츠를 제작해야 링크 확산을 도움이 될 것입니다.
물론 콘텐츠 최적화가 중요합니다. 하지만 이 과정이 지나쳐서는 안되며, 주제와 키워드의 관계가 명확하고 이해될 수 있도록 콘텐츠 품질을 높여야 합니다.
양질의 콘텐츠라면 사이트 방문자는 스스로 주위에 콘텐츠를 추천하거나 소개하게 됩니다. 경쟁사보다 더 뛰어난 콘텐츠를 제공하기 위해 타사 사이트와 콘텐츠를 참고하는 자세가 필요합니다. 결국 콘텐츠 품질을 높이면 소셜 미디어를 통해 링크가 확산될 가능성도 높아집니다.
3.3 고품질의 백링크를 통한 링크 구축
예전에는 백링크의 양이 많으면 구글 상위 노출도 가능했지만, 펭귄 알고리즘으로 인해 이제 백링크 양이 기준이 되는 시대는 지났습니다. 그러므로 의미 없이 인위적인 방법으로 백링크 수를 높이기 모든 행동은 그만두어야 합니다.
특정 도메인에서 인위적인 백링크가 대량 생산되면 구글 펭귄 알고리즘에 의해 다운그레이드 영향을 받을 것입니다. 그리고 이런 행위를 하는 사이트는 저품질 판정을 받게 되며, 대량 생성한 백링크를 받은 사이트도 역시 영향을 미칠 것입니다.
하지만, 백링크의 질은 여전히 중요한 요소입니다. 예를 들어, 권위가 높은 사이트, 안전한 사이트에서 링크를 걸어준다면 구글은 높은 품질의 콘텐츠라고 인식합니다. 그러므로 고품질의 백링크를 통해 링크를 구축하는 작업이 아직도 유효한 작업이라고 말씀드릴 수 있습니다. 고품질의 SEO 백링크를 확보하고 싶다면 헤들리의 간편 SEO 백링크 패키지를 확인해 보세요.
4. 구글 알고리즘이 중요한 이유
우리가 SEO를 잘 하기 위해서는 펭귄 알고리즘을 비롯하여 구글의 여러 알고리즘들에 대해 이해하고 있어야 합니다. 알고리즘을 잘 이해하고 있어야 SEO에 적극적으로 대응할 수 있기 때문입니다.
결국 펭귄 알고리즘을 잘 이해한다는 것은 위의 목표에 더 쉽게 다가갈 수 있는 방법입니다. 구글의 알고리즘은 양질의 콘텐츠를 만드는 사람들에게는 유리합니다. 편법을 부리지 않고 콘텐츠와 연관이 있는 링크, 키워드를 사용하면 결국 자연스럽게 순위가 올라가게 되기 때문입니다.
구글 순위가 올라간다는 것은 무엇을 의미할까요? 키워드 검색 시, 더 많이 검색결과에 노출되며 더 많은 사용자의 유입을 이끌어낼 수 있다는 것입니다. 이는 검색하는 사용자 입장에서도 긍정적인 방향입니다. 정보를 찾는 과정에서 스팸성 콘텐츠, 사이트를 피하고 양질의 콘텐츠를 빠르게 만날 수 있기 때문이죠. 알고리즘 외에도 SEO(검색 엔진 최적화)에 대해 좀 더 알고 싶다면, 구글 SEO 상위 노출 완벽 가이드북을 참고해 주세요.
5. 펭귄 알고리즘 이슈 및 해결
펭귄 알고리즘의 영향을 받아 여러분이 운영하고 있는 사이트, 콘텐츠의 순위가 하락했다면 어떻게 해야 할까요? 먼저 사이트를 꼼꼼히 살펴보면서 부자연스러운 링크는 모두 제거하세요. 수동으로 생성된 링크거나 스팸 가능성이 있는 링크는 모두 제거해야 합니다. 그리고 백링크를 수집하고, 스팸 가능성이 있는 백링크를 제거하는 작업이 필요합니다.
5.1 백링크 수집하기
스팸성 높은 사이트와 여러분의 사이트와 연결되어 있다면, 어떻게 해야 할까요? 백링크를 수집해서 확인하는 절차가 필요합니다. 먼저 구글 서치 콘솔을 활용하세요. 가장 신뢰할 수 있는 데이터 소스로 백링크를 수집하고 확인할 수 있는 도구입니다.
참고로 백링크를 다운로드할 수 있는 도구로는 SEO SpyGlass, Semrush, Ahrefs 등 여러 도구가 있습니다. 이 도구들을 활용하여 백링크를 수집하는 것을 추천합니다.
5.2 거부 파일(disavow file) 만들기
백링크를 수집하고 나서는 내 사이트로 연결되는 링크를 거부하기 위한 작업을 진행해야 합니다. 품질 가이드라인에 위배되는 등 다른 사이트에서 여러분의 사이트로 연결되는 링크를 삭제해야 합니다. 하지만 링크를 직접 제거하거나, 각 제거 요청을 하기에는 쉽지 않습니다. 그럴 때는 사이트로 연결되는 페이지, 도메인 URL을 거부하는 작업이 필요합니다.
거부 파일은 사이트에 영향을 미치지 않도록 파일에 있는 링크를 무시하도록 구글에 제출하는 파일입니다. 만약 거부 파일에 고품질 링크를 포함할 경우, 해당 링크가 더 이상 순위에 도움을 주지 않으니 잘 확인해야 합니다. 개별 링크를 거부하는 것 대신 도메인 수준에서 링크를 거부하는 것을 추천합니다.
해당 작업은 고급 기능으로서 신중히 사용해야 합니다. 자세한 가이드는 구글 서치 콘솔 가이드에서 확인하실 수 있습니다.
6. 펭귄 알고리즘 업데이트 히스토리
펭귄 알고리즘은 2012년 출시 후, 7번의 업데이트를 진행했습니다. 펭귄 알고리즘의 주요 업데이트 히스토리에 대해 말씀드립니다.
펭귄 업데이트 1.0
2012년 4월 24일, 펭귄 알고리즘이 첫 출시되었으며, 쿼리의 3.1% 영향을 미쳤습니다.
펭귄 업데이트 1.1
2012년 3월 26일, 펭귄 알고리즘 출시 후 첫 업데이트가 진행되었습니다.
펭귄 업데이트 1.2
2012년 10월 5일, 데이터 새로 고침으로 인해 매우 제한된 쿼리만 영향을 받았습니다. 영어 이외의 언어로 된 소수 쿼리에게도 영향을 미쳤습니다. 영어 쿼리의 0.3%에 영향을 미쳤고, 다른 언어의 쿼리에도 비슷한 수치를 보였다고 합니다.
펭귄 업데이트 2.0
2013년 5월 22일, 차세대 펭귄 알고리즘 업데이트가 진행되었습니다. 영어 쿼리의 2.3% 영향을 미쳤고, 스팸이 많은 언어권에도 영향을 받았다고 합니다. 사이트의 홈페이지 외에도 특정 랜딩 페이지를 검사하기 시작했습니다.
펭귄 업데이트 2.1
2013년 10월 4일, 심층 웹 페이지를 크롤링하고 스팸 링크가 포함되어 있는 분석하는 업데이트를 진행했습니다.
펭귄 업데이트 3.0
2014년 10월 17일, 3,0 버전이 출시되었으며 2.1 버전 업데이트 이후 약 1년이 걸렸습니다. 업데이트로 구글에서의 순위 변동이 발생했습니다. 영어권 쿼리에서 1% 미만 영향을 받았습니다.
펭귄 업데이트 4.0 (Core Algorithm Incorporation)
2016년 9월 23일, 펭귄 알고리즘이 구글 핵심 알고리즘에 통합되었습니다. 이는 구글은 더 이상 개별적인 펭귄 업데이트를 발표하지 않는다는 의미입니다.
7. 마치며
펭귄 알고리즘에 대해 전반적적으로 알아보는 시간이었습니다. 구글 상위 노출을 하기 위해 양질의 콘텐츠를 제작하고, 질 좋은 백링크를 구축 및 확산하는 것이 필요합니다. 오늘 소개해 드린 방식을 잘 이해하고, 적용한다면 구글 SEO 최적화를 이룰 수 있을 것입니다.