더피알 매거진

“라이선스 맺었는데…” 챗GPT의 배신, 기사 링크 오류 심각

니먼저널리즘연구소, 오픈AI 파트너 10개 언론사 주요 기사 실험
최초 보도·퓰리처상 수상 상관없이 잘못된 링크나 없는 링크 제시
한국신문협회 “빨리 개선 안되면 언론사 이미지·신뢰에 타격 우려”

  • 기사입력 2024.07.15 15:50
  • 기자명 김경탁 기자

더피알=김경탁 기자 | 생성형 인공지능의 시대를 열어낸 것으로 평가되는 챗GPT가 정보소스로 잘못된 URL을 제공하는 문제가 보고됐다. 운영사와 라이선스 계약을 체결한 언론사 기사에 대해서 발생한 문제여서 이용시 더 많은 주의가 요구된다.

니먼저널리즘연구소(Nieman Journalism Lab)는 챗GPT가 퓰리처상 수상 기사와 같은 언론사의 가장 주목할 만한 기사의 URL조차 안정적으로 연결하지 못하는 것으로 나타났다고 홈페이지 기사를 통해 밝혔다.

최근 주요 뉴스 언론사들은 잇달아 오픈AI와 콘텐츠 라이선스 파트너십을 체결했고, 계약의 일환으로 챗GPT는 각 언론사 보도의 요약본을 생성하고 해당 언론사의 웹사이트로 연결되는 링크를 제공하고 있다.

니먼연구소는 미국 하버드 대학교의 언론인 전문 연수 기관인 니먼 언론재단(Nieman Foundation for Journalism) 산하 기관으로, 이 발표는 오픈AI와 라이선스 계약을 체결한 10개 언론사를 대상으로 파트너 언론사 링크 기능을 테스트한 결과였다.

니먼랩의 AI 전문 필자(스탭 라이터)인 앤드류 덱(Andrew Deck)은 앞서 라이센스 계약에도 불구하고 챗GPT가 제휴 언론사 중 하나인 비즈니스 인사이더(Business Insider)의 잘못된 링크를 생성·연결하고 있다고 6월 13일 보고한 바 있다.

앤드류 덱은 “특히 특정 기사를 처음 보도한 매체의 링크를 공유해 달라고 요청하거나, 정확하게 생성한 답변에 대한 보도 링크를 공유해 달라고 요청할 때 역시 잘못된 URL을 제시할 가능성이 높았다”며 “챗GPT가 주어진 기사에 대한 올바른 URL이 아닌, 가장 가능성이 높은 URL을 예측해 제시하기 때문으로 보인다”고 밝혔다.

앤드류 덱은 비즈니스 인사이드 관계자의 유출된 편지를 통해 챗GPT가 거짓 URL을 생성해 일부 사용자를 실제 기사 페이지가 아닌 ‘존재하지 않는 페이지(404 오류)’로 안내하고 있다는 것을 확인했다고 한다.

그는 이후 오픈AI와 라이선스 계약을 체결한 AP통신(The Associated Press), 월스트리트 저널(The Wall Street Journal), 파이낸셜 타임스(The Financial Times), 더 타임스(The Times, 영국), 르 몽드(Le Monde), 엘 파이스(El País), 디 애틀랜틱(The Atlantic), 더 버지(The Verge), 복스(Vox), 폴리티코(Politico) 등 10개 언론사를 대상으로 챗GPT의 파트너 언론사 링크 기능을 테스트했다.

실험 결과
실험 결과

대부분의 파트너 언론사들은 챗GPT가 자사 웹사이트로 연결된다고 밝혔는데, 5월에 발표된 챗GPT와 디 애틀랜틱의 라이선스 계약에 따르면, 챗GPT에서 더 애틀랜틱에 대한 질문은 저작자 표시와 함께 전체 기사를 읽을 수 있는 웹사이트 링크가 포함될 것이라고 명시돼 있다.

하지만 실험 결과, 현재 챗GPT는 퓰리처상 수상 기사와 같은 언론사의 가장 주목할 만한 기사의 URL조차 안정적으로 연결하지 못하는 것으로 나타났다.

구체적인 사례로, 2019년에 파이낸셜 타임스는 와이어카드(독일의 대형 핀테크 기업, Wirecard)의 대규모 회계 사기 사건 보도로 전 독일 총리가 설립한 루트비히 에르하르트 경제저널리즘상(Ludwig Erhard Prize)을 받았고, 국제 규제 기관의 조치 촉발에 기여했다.

그런데 앤드류 덱이 챗GPT에게 해당 뉴스 기사를 웹에서 검색해 달라고 요청하자, 챗GPT는 파이낸셜 타임스가 아닌 다른 웹사이트 링크를 인용하거나 존재하지 않는 페이지(404 오류)의 링크를 제시했다고 한다.

또 챗GPT에게 특정 기사를 처음 보도한 매체의 링크를 공유해 달라고 요청하거나, 정확하게 생성한 답변에 대한 보도 링크를 공유해 달라고 요청할 때 역시 잘못된 URL을 제시할 가능성이 높았다고 앤드류 덱은 전했다.

앤드류 덱은 Book3(무단 복제 도서 데이터베이스)에서 저작권 있는 인기 소설의 사용을 폭로한 첫 번째 뉴스 기사를 웹에서 검색하도록 요청했는데, 챗GPT는 디 애틀랜틱에서 해당 보도를 폭로했다고 바르게 답했지만, 답변과 함께 제공된 URL은 디 애틀랜틱의 다른 기사였다.

실험 결과
실험 결과

앤드류 덱은 이런 오류가 발생하는 이유에 대해 “챗GPT가 주어진 기사에 대한 올바른 URL이 아닌, 가장 가능성이 높은 URL을 예측해 제시한다는 것을 의미한다”고 해석했다.

앤드류 덱은 “이러한 URL 환각이 대규모로 발생하고 있다면 오픈AI에게 해결할 책임이 있다”며 “라이선스 계약을 맺은 언론사를 정확하게 인용하는 것과 신뢰할 수 있는 추천 트래픽 소스가 되겠다는 약속을 해야 한다”고 강조했다.

이런 실험결과가 발표되기 전부터 오픈AI와 파트너십을 맺은 언론사의 많은 기자들은 검색 도구로서 챗GPT의 잠재력에 대해 공개적으로 회의감을 표명해왔다.

디 애틀랜틱의 노동조합 편집 교섭위원회 일원인 데이비드 그라함( David A. Graham)은 “챗GPT의 URL 환각은 매우 우려스럽다”며 “저널리즘의 무결성과 디 애틀랜틱의 콘텐츠에 대한 보호를 요구해야 한다”고 말한 바 있다.

한편 한국신문협회는 주간 미디어동향에서 이 소식을 전하면서 “언론사의 대표 기사는 시간과 비용이 많이 소요되고 언론사의 브랜드 평판과 독자 구축에 핵심이 되는데 기사 링크가 제대로 표시되지 않을 경우, 언론사 이미지 및 신뢰에 타격을 받을 것으로 우려된다”고 지적했다.

이 기사를 공유합니다
관련기사
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전