KTUGFaq

KTUG FAQ

로그인:
비밀번호:
가입
Might as well be frank, monsieur. It would take a miracle to get you out of Casablanca.
FrontPage › SpellX

목차

1 SpellX
2 라이센스
3 다운로드와 설치
3.1 다운로드
3.2 설치 및 설정
4 사용법
5 참고문헌
6 감사의 말씀
7 ToDo

1 SpellX

SpellX는 국민대학교 강승식 교수님의 한국어 형태소 분석 모듈 [http]HAM에 포함된 맞춤법 검사기 HAM/SPELL을 MadToad 님이 수정한 한글 맞춤법 검사기(Windows 실행 파일)이다.

2 라이센스

SpellX[http]HAM의 사용조건은 다음과 같다.

한국어 분석기 실행파일 및 라이브러리의 사용조건

아래 각 항목에서 "소프트웨어"라 함은 압축파일에 포함되어 있는 파일의 전부 혹은 일부를 모두 포함하며 압축파일에 포함되어 있는 LICENSE.TXT의 모든 내용에 동의하는 경우에만 사용할 수 있습니다. LICENSE.TXT를 요약하면 아래와 같습니다.

1. "소프트웨어"는 연구 또는 실험의 목적으로만 사용하며, 상품화 등 영리적인
목적으로 사용하지 않는다.

1. "소프트웨어"를 사용한 결과로 작성된 논문이나 각종 문서에는 반드시
"소프트웨어"의 이름, 저작권자, 출처 등을 명확히 명시하여야 한다.

1. "소프트웨어"의 전부 또는 일부를 불특정 다수에게 판매, 배포, 제공하지 않는다.

1. "소프트웨어"의 전부 또는 일부, "소프트웨어"를 이용하여 개발된 소프트웨어를
인터넷 홈페이지 등 불특정 다수가 접근할 수 있는 형태로 사용하지 않는다.

1. "소프트웨어"를 유효기간 동안 혹은 유효기간 이후에 사용함으로 인하여
발생하는 어떠한 손해에 대해서도 "소프트웨어" 저작권자는 책임을 지지 않는다.

1. "소프트웨어"를 사용함에 있어 저작권자에게 손해를 끼치거나 저작권자에게 유해한
영향을 끼칠 가능성이 있다고 판단되는 목적으로 사용하지 않는다.

1. "소프트웨어"는 2004년12월까지만 사용할 수 있으며, 그 이후에는 사용하지 않는다.
"소프트웨어"의 사용이 끝난 이후에는 제3자가 해독할 수 없는 상태로 폐기한다.

1. "소프트웨어"를 사용함으로 인하여 발생하는 제반 문제에 대해 "소프트웨어"의
사용자는 모든 책임을 진다.

위 내용은 LICENSE.TXT를 요약한 것이며, 압축파일에 포함되어 있는 LICENSE.TXT의 모든 내용에 동의하는 경우에만 "소프트웨어"를 사용할 수 있습니다.

2003년 1월 24일 국민대학교 컴퓨터학부 강승식

Email: sskang@kookmin.ac.kr Phone:+82-2-910-4800 Fax:+82-2-910-4868

3 다운로드와 설치

3.1 다운로드

  1. HAM/SPELL 다운로드 [http]http://nlp.kookmin.ac.kr/down/HAM/ver500a/ham-v500a-spell-Windows.zip
    • 위의 다운로드가 되지 않습니다. 확인해 주세요.
      DeleteMe 강승식 선생님 연구실 호스트가 죽은 모양입니다. 4월 12일 월요일까지 계속 그러면 제가 연락드려 보겠습니다. - MadToad
      DeleteMe 다운로드 이제 됩니다. 호스트가 살아났군요. - MadToad
  2. SpellX 실행 파일 다운로드

3.2 설치 및 설정

  1. HAM/SPELL을 적당한 디렉토리에 압축을 푼다.
  2. 압축을 푼 디렉토리에 있는 spell.dll을 PATH가 걸린 디렉토리로 옮기거나 이 디렉토리를 PATH에 추가한다.
  3. spellx.exe를 위의 디렉토리, 혹은 PATH가 걸린 다른 디렉토리로 옮겨 놓는다.
  4. HAM/SPELL의 압축을 풀었을 때 생성되는 하위 디렉토리 hdic에 들어 있는 초기화 파일(ham2000.ini)과 사전 파일들(*.dic)도 다른 곳으로 옮길 수 있다.
  5. 환경변수 SPELLX_INIT_DIRham2000.ini 파일이 있는 디렉토리를 가리키도록 설정한다.
  6. 주석을 참조하면서 사전의 위치 등 ham2000.ini의 옵션을 설정한다.
    1. 특히 KC2007등에서 설치시 기본 디렉토리(c:\bin\tex)와 다른 디렉토리에 KC2007을 설치한 경우 반드시 ham2000.ini에서 DicDirPath부분을 고쳐야 한다. 예: DicDirPath=c:/bin/TeX/KTUG_bin/HAMSpell/

4 사용법

  1. 명령행 창에서 맞춤법 검사기(spellx.exe)를 실행하면 다음과 같이 간단한 사용법 안내가 표시된다.(명령행 선택 사항들은 현재 동작하지 않는다.)
      C:\bin\ham>spellx
      usage: spellx [-options] [input.txt] [output.txt]
    
          no options & I/O files --> default options applied
              -c: get all spell-corrected candidates
              -i: maximum candidates are specified: 'i' is one of 0-9
              -v: split verb + '아/어' + xverb + Eomi
              -n: compound noun --> noun + noun + ... + noun
              -a: all ascii-included words are regarded as correct
              -x: don't blank-insertion check bet'n 2 words
              -w: echo-back input word itself
    
          Options may be combined like -c2, -wcv, or -nxvc3
          WITH OPTION & NO I/O FILES SPECIFIED --> INTERACTIVE TESTING
      ------------------------------------------------------------------
      (c) 1993-2001 Kookmin Univ. Kang Seung-Shik, Tel.(+82-2)910-4800
          Email: sskang@kookmin.ac.kr, http://nlp.kookmin.ac.kr/
      ------------------------------------------------------------------
    
     


  2. 입력 텍스트 파일을 spellx.exe의 인자로 지정하면 맞춤법 검사 결과가 다음과 같이 화면에 표시된다.(출력 파일을 지정하면 결과가 파일로 저장된다.)

      워드프로세서는
          No candidates found!
      워드프로세서의
          No candidates found!
      워드프로세서의
          No candidates found!
      워드프로세서
          No candidates found!
      ...
      국쑤
          [1] 국수 (13)
          [2] 국부 (45)
          [3] 국무 (56)
      지베
          [1] 집에 (4)
          [2] 지배 (6)
          [3] 지게 (34)
      ...
      만코
          [1] 만조 (23)
          [2] 만보 (27)
          [3] 만도 (29)
      ...
      맞춤범
          [1] 맞춤법 (18)
      ...
    
     


    SpellX는 입력 파일에 포함된 어절들 가운데 맞춤법에 맞지 않는 것들을 골라내어 교정 후보를 제시해 준다. 여러 개의 교정 후보가 있을 때에는 우선 순위가 높은 것부터 제시한다. 위의 예에서 어절 워드프로세서는, 워드프로세서의 등은 워드프로세서라는 낱말이 사전에 등록되어 있지 않아 맞춤법에 맞지 않는 것으로 표시되었다. 많고가 잘못 표기된 만코에 대해서는 옳은 교정 후보를 제시하지 못하였으나 다른 어절들에 대해서는 교정 후보 제시가 제대로 되었다.

5 참고문헌

다음의 책은 맞춤법 검사기의 핵심은 형태소 분석기의 원리에 대해 자세히 소개하고 있으며, [http]HAM 라이브러리 사용법이 부록에 실려 있다.
강승식. 2002. 한국어 형태소 분석과 정보 검색. 홍릉과학출판사.

6 감사의 말씀

[http]HAM을 공개해 주시고 SpellX의 배포를 허락해 주신 국민대학교 강승식 교수님께 감사드립니다.

7 ToDo

  • 사용법 설명 보강: 사용자 사전 편집 방법 등
  • SpellX 기능 개선: ispell에서와 같은 대화형 인터페이스 개발







^
Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2007-09-19 12:29:00
Processing time 0.1006 sec