뉴스홈 > 뉴스센터 > IT

스마일게이트 AI센터, 인공지능 윤리성 연구를 위한 혐오 발언 데이터 구축 및 공개

2022년01월20일 10시26분
게임포커스 박종민 기자 (jjong@gamefocus.co.kr)

 

스마일게이트 AI센터(센터장 한우진)가 악플 및 혐오 발언 데이터셋을 공개했다.

 

스마일게이트 AI 센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 혐오 표현을 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

 

악플 및 혐오 발언 데이터는 지난 2019년 1월 1일부터 2021년 7월 1일까지 기간 동안 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글을 대상으로 수집했다. 수집 과정에서 혐오 관련 데이터의 시의성과 편향성을 띄고 있는 특성을 감안했으며, 약 55만 여 개의 데이터를 기반으로 1만 개의 데이터셋을 구축했다.

 

특히 데이터셋 구축 과정에서 ‘여성/가족’ ‘성소수자’ ‘남성’ ‘인종/국적’ ‘연령’ ‘지역’ ‘종교’ ‘기타혐오’ 등 8개의 대상으로 범주화 했다. 또 혐오 발언 분류를 위한 기준 모델을 공개했으며, 이를 통해 혐오 발언 추출이 가능하다.

 

스마일게이트 AI 센터의 악플 및 혐오 발언 데이터셋은 향후 다양한 영역에서 활용될 수 있을 것으로 기대된다.게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 여러 분야에서 대상을 둘러싼 혐오 발언 여부를 파악할 수 있다. 향후 지속적인 R&D를 실시하면서 확보 된 기술력을 바탕으로 혐오 표현을 보다 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화 할 계획이다.한편 이번에 수집된 데이터는 스마일게이트 AI 센터 깃허브 페이지를 통해 1월 중 공개될 예정이다.

 

스마일게이트 AI 센터 한우진 센터장은 “AI 센터는 자연어 처리 및 분류 관련 연구 목적 외에도 윤리성이 결여된 인공지능이 사회에 미치는 문제에 대해서 연구하고 있는 기관으로서 책임과 문제의식을 갖고 있다. 특히 이번에 공개된 데이터가 혐오 표현이나 인공지능의 윤리성이 사전에 분류 및 예방되어 좀 더 안전하게 인공지능을 활용하는 데 밑거름이 되기를 바란다”며 “향후 스마일게이트 AI 센터는 그 동안 진행해온 연구 결과와 노력들이 기술적인 관점에서 뿐만 아니라 사회에 긍정적인 기여를 할 수 있도록 다양한 노력을 시도할 것"이라고 말했다.

 

'MSI' 5년 연속 진출 T1 "올해는 꼭 우승으...
MSI 진출 실패, 젠지 유상욱 감독 "잘 쉬고...
T1 '2026 LCK MSI 대표 선발전' 젠지 상대...
'블루 아카이브' 선생님 4500명 함께 달렸...
5년 연속 진출 VS 3년 연속 우승, T1과 젠...
kakao LINE

관련뉴스

- 관련뉴스가 없습니다.
목록으로 목록으로 스크랩하기
로그인 한 사용자만 댓글 작성이 가능합니다
숨기기
댓글 0 예비 베플
댓글이 없습니다.
댓글이 없습니다.
1

많이 본 뉴스

[특징주]펄어비스, 신작 '붉은사막' 출시 12일만에 글로벌 400만...
비피엠지, 웰컴페이먼츠·브이디크럭스와 제휴 체결... 스테이블...
링네트, 1분기 영업이익 전년동기대비 3배 증가... 데이터센터 ...
코나아이, 국민연금 지분율 5% 이상 확보 부각 및 메탈카드 사업...
메타보라게임즈, 글로벌 게이머 참여형 플랫폼 ‘보라 딥스(BORA...
위메이드 '비댁스'와 스테이블코인 결제 표준 모델 구축위한 MOU...
한국콜마, 자회사 연우 이란 전쟁 여파로 종이포장재 수혜 부각 ...