Stackoverflow는 LLM이 망하게 만들었나?

  • 카카오톡 공유하기
  • 네이버 블로그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 트위터 공유하기
  • 링크 복사하기

최근 커뮤니티 글 중에서 stackoverflow에 쇠퇴에 대해서 다룬 글을 보았습니다. 사실 언젠가 부터 코드에 대한 문제 해결을 위해 검색엔진을 이용하지 않는 것들이 거의 습관처럼 되어버렸기 때문에 그 의견에는 동의하는 생각을 가지고 있었습니다.

이것은 2008년 부터 2024년까지 Stackoverflow의 월별 질문수를 정리한 데이터가 공개되었습니다.

<출처: https://gist.github.com/hopeseekr/f522e380e35745bd5bdc3269a9f0b132>

아마도 코드를 접하는 사람이라면, stackoverflow의 도움을 한번도 받지 않은 사람은 없을 것 입니다. 디버그를 위해서 구글링을 하게 되면 가장 많은 데이터를 제공해주는 사이트였기 때문에 마침 내가 찾는 에러에 대한 답변을 해준 포스트를 찾는 것은 어렵지 않았죠.

이를 정리한 자료를 보니 실제로 2023년 부터 급격하게 이용이 줄었다는 것을 알수 있었습니다. 하지만, 공교롭게도 코로나 팬데믹 이후부터 하락세로 전환 되었다는 것을 알수 있었습니다. 그에 대해서는 이미 stackoverflow에 대한 변화와 그것을 따라가지 못한 현실에 이미 약속된 미래였을 수도 있습니다.

그 과정을 좀더 깊숙하게 들여다보면, 운영방식에 대한 불만들이 오래전부터 제기되었던 것이 있습니다. 그간의 데이터를 통해서 제기된 질문들이 많은 데이터가 쌓이면서 낮은 수준의 질문들이 이미 선점되었고, 새로운 질문에 대해서 유사게시물로 인정되면서 질문 등록이 어려워진 상황을 이야기 합니다.

결국 질문을 등록하기 위해 쓸데 없는 질문을 해야 하는 상황도 전개된다는 것이죠. 또한 답변 에 따른 평판 지수에 따라 주어지는 특권으로 불만제기가 많았던 것도 한몫 하고 있다는 것입니다.

stackoverflow의 그간의 데이터는 LLM 학습의 좋은 소재가 되어버렸고, 또한 친절함이 가미되어 지금의 다양한 LLM 서비스를 통해서 자연스럽게 옮겨온 것이라고 생각됩니다. 지금의 혜택은 stackoverflow의 희생양이지만, 이후에 좀더 다양하고 높은 수준의 질문에 대해서 얼마나 대응할 수 있을지 모르겠습니다.

관련하여 stackoverflow의 트래픽 대부분은 검색엔진을 통해서 유입되는데, LLM으로 인해 검색엔진의 활용도 줄어가고 있습니다. 물론 Perplexity.ai 검색을 활용하는 AI도 있겠지만, 순수하게 검색엔진을 통한 정보 검색의 방향도 바뀌어 가고 있습니다. (간혹 검색엔진 창에 LLM에 질의하는 식의 검색을 하는 제 자신을 보면서도 무언가 이상함을 뒤늦게 느끼곤 합니다.)

stackoverflow의 질문수의 감소와 이에 상응하는 답변수의 감소는 콘텐츠의 최신성과 관련성이 떨어질수 밖에 없기 때문에 트래픽 감소, 서비스 쇠퇴를 피하기 어려울 것으로 보입니다.

서비스를 유지함에 있어, 생태계의 변화에 민감하게 반응하고 그에 맞는 혁신이 동반되어야 오랫동안 지속될 수 있을 것이라 다시 한번 생각해봅니다.


게시됨

카테고리

,

작성자

댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다