뉴스홈 > 뉴스센터 > IT

스마일게이트 AI센터, 인공지능 윤리성 연구를 위한 혐오 발언 데이터 구축 및 공개

2022년01월20일 10시26분
게임포커스 박종민 기자 (jjong@gamefocus.co.kr)

 

스마일게이트 AI센터(센터장 한우진)가 악플 및 혐오 발언 데이터셋을 공개했다.

 

스마일게이트 AI 센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 혐오 표현을 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

 

악플 및 혐오 발언 데이터는 지난 2019년 1월 1일부터 2021년 7월 1일까지 기간 동안 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글을 대상으로 수집했다. 수집 과정에서 혐오 관련 데이터의 시의성과 편향성을 띄고 있는 특성을 감안했으며, 약 55만 여 개의 데이터를 기반으로 1만 개의 데이터셋을 구축했다.

 

특히 데이터셋 구축 과정에서 ‘여성/가족’ ‘성소수자’ ‘남성’ ‘인종/국적’ ‘연령’ ‘지역’ ‘종교’ ‘기타혐오’ 등 8개의 대상으로 범주화 했다. 또 혐오 발언 분류를 위한 기준 모델을 공개했으며, 이를 통해 혐오 발언 추출이 가능하다.

 

스마일게이트 AI 센터의 악플 및 혐오 발언 데이터셋은 향후 다양한 영역에서 활용될 수 있을 것으로 기대된다.게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 여러 분야에서 대상을 둘러싼 혐오 발언 여부를 파악할 수 있다. 향후 지속적인 R&D를 실시하면서 확보 된 기술력을 바탕으로 혐오 표현을 보다 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화 할 계획이다.한편 이번에 수집된 데이터는 스마일게이트 AI 센터 깃허브 페이지를 통해 1월 중 공개될 예정이다.

 

스마일게이트 AI 센터 한우진 센터장은 “AI 센터는 자연어 처리 및 분류 관련 연구 목적 외에도 윤리성이 결여된 인공지능이 사회에 미치는 문제에 대해서 연구하고 있는 기관으로서 책임과 문제의식을 갖고 있다. 특히 이번에 공개된 데이터가 혐오 표현이나 인공지능의 윤리성이 사전에 분류 및 예방되어 좀 더 안전하게 인공지능을 활용하는 데 밑거름이 되기를 바란다”며 “향후 스마일게이트 AI 센터는 그 동안 진행해온 연구 결과와 노력들이 기술적인 관점에서 뿐만 아니라 사회에 긍정적인 기여를 할 수 있도록 다양한 노력을 시도할 것"이라고 말했다.

 

HAOPLAY '리버스: 1999', 2주년 기념 업데...
글로벌 시장 공략 속도 내는 카카오게임즈,...
하이브로 '타이니팜: 리마스터', 서비스 반...
넷마블 신작 '뱀피르' 공식 OST 영상 공개...
마상소프트 '킹스레이드', 도쿄게임쇼 통해...
kakao LINE

관련뉴스

- 관련뉴스가 없습니다.
목록으로 목록으로 스크랩하기
로그인 한 사용자만 댓글 작성이 가능합니다
숨기기
댓글 0 예비 베플
댓글이 없습니다.
댓글이 없습니다.
1

많이 본 뉴스

오버테이크(Overtake) 'TAKE' 토큰 글로벌 동시 상장으로 유통 ...
풀무원, '금값' 김값 가격 폭등에 정부 김 비축 제도 추진... 김...
도우인시스, 삼성 폴더7 미국서 예약신기록... UTG 단독 공급 부...
루미르, 일론머스크 스페이스X와 위성 3,4,5기 추가 발사 계약 '...
SK이터닉스, 美 ESS 시장 직접 진출… 대중국 고관세 수혜 기대...
워트, 삼성전자 약 23조 테슬라 파운드리 수주... 삼성 美 텍사...
메타보라게임즈, 보라 생태계와 카이아 CL 프로토콜 연동 완료...