< 목록으로

OpenAI의 GPT-4, 저작권 콘텐츠 '암기' 논란 일으키며 AI 개발 윤리에 대한 논쟁 촉발

M
관리자
2025.04.05
추천 0
조회수 482
댓글 0


최근 OpenAI의 GPT-4와 같은 인공지능 모델들이 저작권이 있는 자료를 '암기'했다는 주장이 제기되면서 기술계에서 큰 파문을 일으키고 있다. 이 주장은 워싱턴 대학교, 코펜하겐 대학교, 스탠퍼드 대학교 등 여러 대학의 연구팀이 발표한 새로운 연구 결과에 기반을 두고 있으며, OpenAI가 자사의 AI 모델을 훈련시키기 위해 사용한 데이터의 출처와 윤리에 대한 중대한 의문을 제기하고 있다.

AI 모델은 방대한 양의 데이터로 훈련되어 패턴과 관계를 학습하여 사람처럼 텍스트를 생성하는 예측 엔진 역할을 한다. 그러나 최근 연구에 따르면, 이러한 모델이 훈련 과정 중 일부 저작권이 있는 콘텐츠를 그대로 재생산하는 현상이 나타났다는 것이다. 연구자들은 특정 단어들이 통계적으로 드물게 사용되는 '하이 서프리잘'(high-surprisal) 단어를 통해 AI 모델의 암기를 감지할 수 있는 방법을 개발했다. 예를 들어, "Jack and I sat perfectly still with the [MASK] humming."이라는 문장에서 모델이 "radar"를 맞춘다면, 이는 해당 문장이 훈련 중에 암기되었음을 나타낸다는 것이다.

연구 결과, GPT-4는 저작권이 있는 여러 인기 소설의 일부를 암기한 것으로 보이며, 특히 'BookMIA'라는 데이터셋에서 나온 전자책의 내용을 포함하고 있었다. 또한 뉴욕타임즈 기사의 일부 구문도 녹아들어 있었지만, 소설에 비해서는 낮은 빈도로 나타났다. 이러한 발견은 OpenAI가 저작권이 있는 콘텐츠를 무단으로 사용한 것인지에 대한 심각한 의문을 제기하고 있다.

이러한 상황 속에서 Abhilasha Ravichander, 워싱턴 대학교의 박사 과정 학생이자 연구 공동 저자는, 언론과의 인터뷰에서 AI 모델의 신뢰성을 확보하기 위해 훈련 데이터에 대한 투명한 감사와 분석이 필요하다고 강조했다. 현재 OpenAI는 저작권자들로부터 불리한 소송을 받고 있으며, 이들은 OpenAI가 저작권이 있는 자료를 불법적으로 사용했다고 주장하고 있다. OpenAI는 '공정 사용'의 원칙을 주장하고 있지만, 원고들은 AI 훈련을 위한 방대한 데이터의 섭취가 공정 사용의 범위를 넘어선다고 반박하고 있다.

이 법적 논쟁은 AI 개발에서의 지적 재산권의 경계를 재정의할 가능성이 크며, AI 훈련 데이터에 대한 규제의 중요성을 더 강조하고 있다. 또한 OpenAI는 저작권 사용에 대한 보다 유연한 규제 마련을 적극적으로 로비하고 있으며, 이는 창작자의 권리를 존중하면서도 혁신을 지속할 수 있는 방법을 모색하는 주제로 이어질 가능성이 높다.

결국 이 연구는 AI 개발의 투명성과 윤리적 고려의 필요성을 부각시키고 있으며, 향후 AI와 컨텐츠 창작 간의 관계를 심화시킬 핵심 요소가 될 것이다. AI 산업은 앞으로도 훈련 데이터에 대한 명확한 이해와 책임을 기반으로 한 개발을 통해 신뢰성을 높여 나가야 할 것이다.


crossorigin="anonymous">

댓글

뉴스

SUI의 최근 70% 상승에도 불구하고, Ruvi AI(RUVI) 투자자들은 여름 동안 1,000% 이상의 가격 상승을 만끽하고 있다
M
관리자
조회수 339
추천 0
2025.04.28
SUI의 최근 70% 상승에도 불구하고, Ruvi AI(RUVI) 투자자들은 여름 동안 1,000% 이상의 가격 상승을 만끽하고 있다
미중 무역 불확실성에 따른 아시아 통화 약세, 미국 달러 강세로 이어져
M
관리자
조회수 323
추천 0
2025.04.28
미중 무역 불확실성에 따른 아시아 통화 약세, 미국 달러 강세로 이어져
주식 시장 동향: 보잉, 도미노 피자, 엘리 릴리, 프로그레시브 등 주요 기업 주식 변동
M
관리자
조회수 351
추천 0
2025.04.28
주식 시장 동향: 보잉, 도미노 피자, 엘리 릴리, 프로그레시브 등 주요 기업 주식 변동
프로셰어스, XRP 숏 및 울트라숏 ETF 출시: 시장 심리에 미치는 영향
M
관리자
조회수 358
추천 0
2025.04.28
프로셰어스, XRP 숏 및 울트라숏 ETF 출시: 시장 심리에 미치는 영향
미 재무장관, 중국의 통상 긴장 완화 책임 강조
M
관리자
조회수 334
추천 0
2025.04.28
미 재무장관, 중국의 통상 긴장 완화 책임 강조
트럼프 가족과 연관된 암호화폐 정책, SEC의 독립성에 대한 우려가 커지고 있다
M
관리자
조회수 329
추천 0
2025.04.28
트럼프 가족과 연관된 암호화폐 정책, SEC의 독립성에 대한 우려가 커지고 있다
LayerZero, 인터넷 규모의 검증 가능한 애플리케이션 vApps 출시
M
관리자
조회수 347
추천 0
2025.04.28
LayerZero, 인터넷 규모의 검증 가능한 애플리케이션 vApps 출시
미국 농업, 전면적인 위기 상황에 직면…농민들 “무역 전쟁 위기가 이미 시작됐다”
M
관리자
조회수 343
추천 0
2025.04.28
미국 농업, 전면적인 위기 상황에 직면…농민들 “무역 전쟁 위기가 이미 시작됐다”
WOO X의 차세대 추천 프로그램: 맞춤형 코드, 이중 보상, 투명성
M
관리자
조회수 356
추천 0
2025.04.28
WOO X의 차세대 추천 프로그램: 맞춤형 코드, 이중 보상, 투명성
미국 농업, 무역 전쟁으로 심각한 타격…농부들 "이미 위기 상황이다"
M
관리자
조회수 346
추천 0
2025.04.28
미국 농업, 무역 전쟁으로 심각한 타격…농부들 "이미 위기 상황이다"
2025년 크립토 백만장자가 되는 법: 솔라나(SOL) 같은 전통 토큰 대신 이 트렌디한 알트코인에 주목하라
M
관리자
조회수 356
추천 0
2025.04.28
2025년 크립토 백만장자가 되는 법: 솔라나(SOL) 같은 전통 토큰 대신 이 트렌디한 알트코인에 주목하라
유럽 부동산 투자, 첫 분기 증가세…하지만 거시 경제 불확실성이 전망에 그늘 드리워
M
관리자
조회수 360
추천 0
2025.04.28
유럽 부동산 투자, 첫 분기 증가세…하지만 거시 경제 불확실성이 전망에 그늘 드리워
비트코인의 초창기를 놓쳤다면? 비트코인 솔라리스가 솔라나의 초고속 네트워크에서 암호화폐 부의 두 번째 기회를 제공합니다.
M
관리자
조회수 334
추천 0
2025.04.28
비트코인의 초창기를 놓쳤다면? 비트코인 솔라리스가 솔라나의 초고속 네트워크에서 암호화폐 부의 두 번째 기회를 제공합니다.
경제 이벤트: 암호화폐 시장에 미치는 중요한 데이터
M
관리자
조회수 347
추천 0
2025.04.28
경제 이벤트: 암호화폐 시장에 미치는 중요한 데이터
1inch 팀, WBTC 매각 후 109만 달러 규모의 대규모 1INCH 토큰 구매
M
관리자
조회수 360
추천 0
2025.04.28
1inch 팀, WBTC 매각 후 109만 달러 규모의 대규모 1INCH 토큰 구매
작성
220 221 222 223 224