2018 DMZ 해커톤에서 남한말 vs 북한말 끝말잇기 게임 을 개발하기 위해 만들어진 DB입니다. 2018.11.13에 국립국어원 표준국어대사전을(http://stdweb2.korean.go.kr) 발췌하여 DB를 구축하였으며 오픈소스의 발전과 우리말 연구를 위한 다양한 분들에게 도움이 되었으면 하는 마음으로 이를 공유합니다.
본래 저작권법 제24조의2에 의하면 국가에 의해 작성되어 공표된 저작물은 허락 없이 이용할 수 있어야 하지만, 표준국어대사전의 경우에는 국립국어원이 저작재산권 전부를 보유하고 있지 않으므로 저작권 등록물에 해당됩니다. 그러나 단순히 낱말과 품사를 수집한 것은 한국어 자체로써 저작권 보호를 받을 수 없는 자료이므로 자유로운 2차 가공 및 배포가 가능합니다. 마찬가지로 해당 DB에도 저작권이 없습니다.
https://github.com/korean-word-game/crawling 에서 크롤링에 쓰인 소스를 공개합니다.
kr_korean.csv (9.72MB)
첫번째 열 | 두번째 열 |
---|---|
낱말 | 품사 |
kr_korean.db (13.5MB)
# SQLite format 3
kr (TABLE)
┣━━━ id (INTEGER)
┣━━━ word (TEXT)
┗━━━ part (TEXT)
korean_kr.sql (17.8MB)
# 5.7.24 - MySQL Community Server (GPL)
-- --------------------------------------------------------
-- SQL 내보내기 설정
-- 데이터베이스: 생성
-- 테이블: 생성
-- 데이터: 삽입 무시 (기존 데이터를 갱신하지 않음)
-- 최대 INSERT 크기: 1024 KB
-- --------------------------------------------------------
korean (DB)
┗━━ kr (TABLE)
┣━━ id (INT)
┣━━ word (TEXT)
┗━━ part (TEXT)
kp_korean.csv (1.32MB)
첫번째 열 | 두번째 열 |
---|---|
낱말 | 품사 |
kp_korean.db (1.80MB)
# SQLite format 3
kp (TABLE)
┣━━━ id (INTEGER)
┣━━━ word (TEXT)
┗━━━ part (TEXT)
korean_kp.sql (2.31MB)
# 5.7.24 - MySQL Community Server (GPL)
-- --------------------------------------------------------
-- SQL 내보내기 설정
-- 데이터베이스: 생성
-- 테이블: 생성
-- 데이터: 삽입 무시 (기존 데이터를 갱신하지 않음)
-- 최대 INSERT 크기: 1024 KB
-- --------------------------------------------------------
korean (DB)
┗━━ kp (TABLE)
┣━━ id (INT)
┣━━ word (TEXT)
┗━━ part (TEXT)
kr_kp_korean.db (15.3MB)
# SQLite format 3
kr (TABLE)
┣━━━ id (INTEGER)
┣━━━ word (TEXT)
┗━━━ part (TEXT)
kp (TABLE)
┣━━━ id (INTEGER)
┣━━━ word (TEXT)
┗━━━ part (TEXT)
korean_kr_kp.sql (20.1MB)
# 5.7.24 - MySQL Community Server (GPL)
-- --------------------------------------------------------
-- SQL 내보내기 설정
-- 데이터베이스: 생성
-- 테이블: 생성
-- 데이터: 삽입 무시 (기존 데이터를 갱신하지 않음)
-- 최대 INSERT 크기: 1024 KB
-- --------------------------------------------------------
korean (DB)
┣━━ kr (TABLE)
┃ ┣━━ id (INT)
┃ ┣━━ word (TEXT)
┃ ┗━━ part (TEXT)
┃
┗━━ kp (TABLE)
┣━━ id (INT)
┣━━ word (TEXT)
┗━━ part (TEXT)