느프트, 자연어처리 연구 결과물 ‘알맹이 말뭉치’ 공개
느프트(대표 유정욱)는 신조어와 합성어 처리에 강점을 가진 AI 자연어 처리 데이터베이스 ‘알맹이 말뭉치’를 공개한다고 밝혔다.
새롭게 공개된 ‘알맹이 말뭉치’는 CHAT GPT를 대표로 하는 AI 언어 처리 기술에 중요하게 활용 가능한, 새로운 신조어와 합성어에 강점을 가진 한국어 데이터베이스이다.
특히 다양한 뉴 미디어와 SNS를 통해 쏟아지고 있는 합성어∙신조어에 가장 초점을 두고 생성한 데이터베이스로 매일 업데이트 되는 RSS뉴스피드 및 WIKI 내용을 학습해 얻은 데이터와 기존의 말뭉치를 필터링하여 새롭게 구성한 결과물이다.
‘알맹이 말뭉치’는 기존 형태소 분석기에서 분석 오류가 많이 나타나는 합성어, 새롭게 탄생하는 신조어들을 지속적인 문자데이터 수집과 비지도 학습(Unsupervised learning)과 같은 최신 AI 기술의 적용을 통해 학습한 보다 정확한 형태의 데이터베이스이기 때문에 키워드 형태 분석에서 장점을 가지고 있다.
느프트는 내달 초 뉴스 키워드 공유 플랫폼 ‘알맹이’를 공개할 예정으로 사용자에게 현재 가장 이슈가 되고 있는 주제가 무엇인지, 그 주제의 키워드가 무엇인지를 제공하는 것이 알맹이 플랫폼이 추구하고 있는 방향이며, 궁극적인 목표는 자연어처리 학습을 위한 양질의 데이터를 수집해 제공하는데 있다고 설명했다.
유정욱 느프트 대표는 “자연어처리의 시장규모는 빠르게 성장할 것이며, 한국형 CHAT GPT의 개발과 더불어 한국어 자연어 처리 시장에 '알맹이 말뭉치'가 크게 기여할 것을 확신” 한다고 말했다.
한편 ‘알맹이 말뭉치’에 관한 자세한 정보는 공식 홈페이지에서 확인할 수 있다. /정의준 기자 firstay@sedaily.com
정의준 기자 디지털본부
구독 신청 버튼을 눌러주세요.
주요뉴스
주간 TOP뉴스
- 1 삼성전자, 나이스웨더와 협업해 ‘해브 어 굿 라이프’ 한정판 굿즈 공개
- 2 국내 식음료 첫 100살 기업 하이트진로…“R&D·세계화 집중”
- 3 롯데칠성음료, 새로 ‘살구맛’ 출시
- 4 MG새마을금고보험, 신상품 레저상해공제 판매 개시
- 5 LS머트리얼즈, 국내 최초로 개발한 UC 활용 ‘대전력 부하 제어시스템’ 개발
- 6 넷마블, ‘나 혼자만 레벨업:어라이즈’ 내달 8일 출시…“사전등록 1,200만 돌파”
- 7 삼천리자전거, ‘캐치 티니핑’ 어린이 자전거 3종 출시…“다양한 안전장치 적용”
- 8 삼성전자, 파리 올림픽 앞두고 스케이트보드·서핑 등 다큐 3부작 공개
- 9 GS25 “편의점 공사 현장에 AI 뜬다”
- 10 무보, 중소기업 수출규모별 맞춤 지원 프로그램 ‘수출성장 플래닛' 도입