< 목록으로

AI 챗봇의 신뢰성 저하 — 최근 연구 결과

M
관리자
2024.10.05
추천 0
조회수 133
댓글 0


최근 '더 크고 더 조정 가능한 언어 모델은 신뢰성이 낮아진다'는 제목의 연구가 Nature Scientific Journal에 발표되었다. 이 연구는 인공지능(AI) 챗봇들이 최신 모델이 출시될수록 점점 더 많은 오류를 발생시키고 있다는 내용을 담고 있다. 연구의 저자 중 한 명인 레신 저우는 AI 모델이 항상 그럴듯한 답변을 제공하도록 최적화되어 있기 때문에, 표면적으로는 올바르게 보이는 응답들이 우선적으로 사용자가 접하게 된다고 설명했다.

이러한 AI 환각 현상은 스스로를 강화하고 시간이 흐름에 따라 복합적으로 증가하는 경향이 있으며, 이는 더 오래된 대형 언어 모델로 새로운 모델을 훈련시키는 과정에서 발생하는 '모델 붕괴'라는 현상으로 더욱 악화된다. 이러한 문제에 대해 편집자이자 작가인 마티유 로이는 사용자가 이러한 도구에 지나치게 의존하지 말고, AI가 생성한 검색 결과의 일관성을 항상 점검해야 한다고 경고했다. 그는 "AI는 여러 작업에 유용할 수 있지만, 사용자는 AI 모델이 제공하는 정보를 반드시 검증해야 한다. 사실 확인은 AI 도구를 사용할 때 모든 사람의 과정에서 중요한 단계가 되어야 한다"면서 고객 서비스 챗봇이 관련될 때 더 복잡해질 수 있다고 덧붙였다.

불행히도, "정보를 확인할 방법이 거의 없다는 점이 문제"라고 로이는 주장했다. 그는 대개의 경우 정보 확인이 결국 자신이 질문한 챗봇에 의존하게 되는 상황을 지적하였다. 이러한 문제들은 현재의 AI 및 대형 언어 모델에서 너무나 흔하게 발생하고 있으며, 이는 Google의 AI 플랫폼이 역사적으로 부정확한 이미지를 생성했던 사건에서도 명백히 드러났다. 예를 들어, AI가 사람들을 나치 군인으로 묘사하거나 유명한 역사적 인물의 잘못된 이미지를 생성한 일이 있었다.

AI 환각 문제를 완화하기 위한 방안으로 NVIDIA CEO인 젠슨 황은 AI 모델에게 사용자에게 제공하는 모든 답변에 대한 연구를 수행하고 출처를 제시하도록 강제할 것을 제안했다. 그러나 이러한 조치들은 이미 가장 인기 있는 AI 및 대형 언어 모델에서 특징으로 채택되고 있는 방법임에도 불구하고 AI 환각 문제는 여전히 해결되지 않고 있다.

최근 9월에 하이퍼라이트 AI의 CEO인 맷 슈머는 자사의 새로운 70B 모델이 '반영 조정(Reflection-Tuning)'이라는 방식을 사용하여 AI가 자신의 오류를 분석하고 시간이 지남에 따라 응답을 조정할 수 있는 방법을 구현했다고 발표했다. 이는 AI가 자가 학습할 수 있는 기회를 제공하는 혁신적 접근법으로 여겨진다.

이러한 연구 결과와 제안들은 AI 기술의 발전과 활용에 있어 신뢰성과 정확성을 높이기 위한 필수적인 논의로 자리 잡고 있으며, 사용자들에게도 AI 도구에 대한 접근 방식을 재고할 기회를 제공하고 있다. AI 모델의 성능이 떨어진다는 사실을 인지하고, 이러한 도구들이 생성한 정보에 대한 비판적 사고를 유지하는 것이 중요하다.


crossorigin="anonymous">

댓글

뉴스

Intuit, 예상 하회하는 분기 실적 전망에 따라 주가 급락
M
관리자
조회수 8
추천 0
2024.11.22
Intuit, 예상 하회하는 분기 실적 전망에 따라 주가 급락
Bluesky CEO 제이 그레이버, "블루스카이 플랫폼은 억만장자에 의해 좌우되지 않는다"
M
관리자
조회수 7
추천 0
2024.11.22
Bluesky CEO 제이 그레이버, "블루스카이 플랫폼은 억만장자에 의해 좌우되지 않는다"
알파벳, 정부의 구글 크롬 분리 요청 소식에 주가 6% 하락
M
관리자
조회수 7
추천 0
2024.11.22
알파벳, 정부의 구글 크롬 분리 요청 소식에 주가 6% 하락
마조리 테일러 그리네 의원, 엘론 머스크와 비베크 라마스와미와 함께 새로운 DOGE 소위원회 의장으로 임명됨
M
관리자
조회수 7
추천 0
2024.11.22
마조리 테일러 그리네 의원, 엘론 머스크와 비베크 라마스와미와 함께 새로운 DOGE 소위원회 의장으로 임명됨
Jim Cramer가 제안하는 목요일 주식 시장 주목할 만한 10가지 사항
M
관리자
조회수 7
추천 0
2024.11.21
Jim Cramer가 제안하는 목요일 주식 시장 주목할 만한 10가지 사항
디지털 결제 서비스에 대한 CFPB의 감독 확대
M
관리자
조회수 7
추천 0
2024.11.21
디지털 결제 서비스에 대한 CFPB의 감독 확대
달러스토어의 주가 급락, 그 배경은?
M
관리자
조회수 7
추천 0
2024.11.21
달러스토어의 주가 급락, 그 배경은?
트럼프와 파월 의장이 금리에 대해 충돌할 가능성
M
관리자
조회수 7
추천 0
2024.11.21
트럼프와 파월 의장이 금리에 대해 충돌할 가능성
Nvidia 주가, 분기 수익 성장 둔화로 프리마켓에서 3% 급락
M
관리자
조회수 7
추천 0
2024.11.21
Nvidia 주가, 분기 수익 성장 둔화로 프리마켓에서 3% 급락
10년물 국채 수익률 하락, 경제 데이터 및 연준 연설 대기
M
관리자
조회수 7
추천 0
2024.11.21
10년물 국채 수익률 하락, 경제 데이터 및 연준 연설 대기
Baidu, 3분기 매출 3% 감소에도 시장 기대를 웃도는 실적 발표
M
관리자
조회수 7
추천 0
2024.11.21
Baidu, 3분기 매출 3% 감소에도 시장 기대를 웃도는 실적 발표
아다니 vs.힌덴부르크: 인도의 거대 제국이 혼란에 빠진 경과
M
관리자
조회수 7
추천 0
2024.11.21
아다니 vs.힌덴부르크: 인도의 거대 제국이 혼란에 빠진 경과
아다니 그룹, 뉴욕의 허위 사기 및 뇌물 혐의 반박
M
관리자
조회수 7
추천 0
2024.11.21
아다니 그룹, 뉴욕의 허위 사기 및 뇌물 혐의 반박
영국 규제당국, 다가오는 클라우드 산업 경쟁 구제책 발표 예고
M
관리자
조회수 7
추천 0
2024.11.21
영국 규제당국, 다가오는 클라우드 산업 경쟁 구제책 발표 예고
미국의 '미니 예산' 위기, 영국의 사례에서 교훈을 얻어야 할 때
M
관리자
조회수 7
추천 0
2024.11.21
미국의 '미니 예산' 위기, 영국의 사례에서 교훈을 얻어야 할 때
작성
1 2 3 4 5