Featured Post

이 블로그 유입경로에 챗GPT가 보인다. 무단 수집일까?

 블로그스팟의 유입경로를 보다 눈에 띄는 이름을 발견했습니다. chatgpt.com입니다. 익히 알려져 있듯이 챗GPT는 AI 서비스의 선두주자입니다. 검색하면 구글을 떠올리듯 AI 서비스하면 챗GPT를 먼저 생각합니다. 챗GPT에서 방문을 했다는 건 무슨 의미일까요?
 

내가 블로그에 작성한 글과 자료를 수집한다는 뜻이 됩니다. 인공지능 서비스를 하기 위해서는 데이터가 중요하니까요. 그렇지만 저는 이 블로그에서 챗GPT를 허용하지 않았습니다. 맞춤 로봇 설정을 다음과 같이 했습니다.

 

User-agent: GPTBot
Disallow: /
 

위처럼 써놓으면 챗GPT 봇에게 이 블로그를 수집하지 마라고 선언합니다. 왜 챗GPT에게 수집하지 말라고 할까요? AI 서비스는 블로그 소유자 입장에서는 전혀 도움이 되지 않기 때문입니다. 이용자가 챗GPT 에게 질문을 합니다. 챗GPT 는 인공지능으로 글과 자료를 요약해서 보여줍니다. 답을 찾았다면 이용자는 떠나게 됩니다.
 

 

막았는데도 방문한 chatgpt
chatgpt가 보이네.

 


 

검색엔진은 그렇지 않습니다. 무언가를 검색해서 사이트나 블로그에 방문을 하도록 유도를 합니다. 방문자에게 광고를 보여주거나 다른 상품을 구매하도록 유도함으로써 이득을 얻을 수 있습니다. 인공지능 서비스들은 블로그 방문을 배제시켜 버립니다. 출처를 보여주기는 하지만, 어디 출처까지 들어가서 확인을 하는 사람이 얼마나 되겠습니까? 답을 얻었다면 떠날 뿐입니다.

 

다시 말해서 챗GPT가 내가 작성한 글과 이미지를 보여주는 건 나에게 전혀 도움이 되지 않고 이용만 당합니다. 그래서 막았습니다. '내 글 가져가지 말라고' 질문에 대한 답에 내 글이 포함되지 않겠지만 뭐 어떻습니까? 나에게 도움도 어떠한 이득도 없는데. 가져가지 않아도 상관없습니다.
 

챗GPT 수집봇이 정말 글을 가져가지 않았을지는 모르겠습니다. 오픈 AI의 최근 방침은 논란이 있더라도 영상, 사진, 글 자료를 일단 수집하겠다는 의도를 보이고 있는 듯합니다. 결국 승자가 모든 걸 가져가는 게임에서 이기려면 규칙을 있더라고 무시를 할 수 있습니다. 뉴욕타임스나 거대 사이트라면 규칙을 지킬지 모르지만 일개 개인이 운영하는 블로그라면 무단으로 자료를 수집하고 인공지능 데이터 학습에 이용할지도 모릅니다.
 

인공지능 서비스가 문제인점, 내 자료를 가져갔는지 활용을 했는지 알 수 없습니다. 챗GPT 봇이 방문을 했더라도 수집을 했는지 아닌지 알 수가 없죠. 그런 서비스도 의무화시켰으면 좋겠습니다. 사이트나 페이지를 검색해서 수집을 해갔는지 학습에 이용했는지 확인할 수 있는 서비스요. 법적인 강제가 아니라면 제공하지는 않겠지만. 


계속해서 느끼는 바인데, 인공지능 서비스가 개선되고 강화될 수록 검색엔진을 이용할 이유가 없어집니다. 다른 면에서 보자면, 자료를 작성하는 사람도 동기부여가 약해집니다. 열심히 자료를 수집하고 글을 작성하고 편집을 해서 포스팅을 하더라도, 검색엔진에서 색인을 해주지 않고 많은 사람들에게 보이지 않습니다. 꾸준한 활동을 하더라도 성과가 없고 금전적으로 이득을 볼 수 있는 기회는 더 줄어들어 갑니다. 그렇다면 블로그, 사이트를 계속 운영해야 될까?
 


취미 이상이 되려면 노력, 시간, 자금이 들어가는데. 기회를 붙잡을 수 있는 시간이 줄어들어 가는 것처럼 보인단 말이죠. 저 역시도 블로그에 올리는 글에 너무 많은 노력을 들이려고 하지는 않습니다. 간다하게 일기처럼 쓸 뿐입니다. 블로그의 원래 목적이기도 하지만.

댓글