|
|
오픈소스 정보검색관리시스템 KRISTAL-IRMS
Knowledge Retrieval In Science & Technology Affiliated Literatures
- Information Retrieval Management System
KRISTAL 연구실 (K-Lab)
K-Lab -- KRISTAL Laboratory -- 페이지에서는
GIIS에서 현재 수행하고 있는 기반 연구실적들에 대한 시연을 보실 수 있습니다.
대부분의 경우 사용자가 직접 입력하여 데모 시스템을 테스트할 수 있습니다.
의문사항이나 조언이 있으면 게시판에 글을 남겨주시면 감사하겠습니다.
- KRISTAL 색인기 시험 페이지
KRISTAL의 다양한 색인기능을 직접 체험해볼 수 있는 데모 페이지.
형태소분석기반 한글색인, 토큰기반색인, 한자복합색인 등
사용자의 다양한 요구사항을 반영한 색인기능구현.
- KRISTAL 형태소분석기 시험 페이지
KRISTAL 색인기의 핵심엔진인 한국어 형태소분석기 데모 페이지.
현재 한글오토마타기반 분석알고리즘과 다양한 한글사전을 기반으로 높은 형태소분석 성공률을 나타내고 있음
- KRISTAL English Lemmatizer
영어 형태소분석 및 품사태깅의 기반 엔진으로 활용될 수 있는 영어어절원형복원기(English Lemmatizer) 데모 페이지.
현재 버전 0.1을 출시하였으며, 지속적으로 성능향상 중에 있음
- KRISTAL LIKE 검색 시험 페이지
Like 검색 기능 테스트 사이트. DBMS가 제공하는 문자열탐색 모델.
메모리 DB에 대하여 BMH 문자열 탐색 알고리즘을 이용하여 LIKE와 같은
검색결과를 제공. 좌절단/중간절단이 필요한 경우에 유용할 수 있음.
- KRISTAL 사용자 지정 가중치 섹션 검색 시험 페이지
사용자가 지정한 섹션에 대해서 더 많은 가중치를 부여하여 상위 문서로 올려주는 개념을 테스트한 페이지입니다.
- KRISTAL 유사문서 검색 기능
유사문서 검색 기능 설명 및 데모사이트을 위한 페이지입니다.
- KRISTAL 그룹바이 검색 기능
그룹바이 검색 기능 설명 및 데모사이트을 위한 페이지입니다.
- KCrawler
KRISTAL Crawler 설명 및 데모사이트 페이지입니다.
- KRISTAL 질의분석기 시험 페이지
KRISTAL의 질의분석기(Query Parser) 결과를 각종 색인타입 및 옵션에
따라 테스트할 수 있음.
- 하이라이팅(Highlighting) 및 요약 테스트
검색에 사용된 질의어를 문서에 표시해주거나, 문서의 간략 정보만을 제공하는 기능
- 검색어 자동완성기능 시험 페이지
입력한 검색어와 유사한 검색어를 화면에 출력해주는 기능
- KRISTAL HyperTextizer 데모
C++ 클라이언트 라이브러리에 내장된 자동링크구성기. 특히 본문에 대한
상세보기에서 키워드나 사용자가 중요하다고 생각되는 단어나 어절에 대해서
자동으로 링크를 구성할 수 있는 편리한 도구.
- KRISTAL 주요어 추출기 시험 페이지
주어진 문서로부터 주요 키워드 또는 어절을 통계적 기법을 이용하여 추출.
현재 연구단계임.
- KRISTAL IRMS 기반의 게시판 소개
KRISTAL IRMS로 만든 계층형 웹 게시판. PHP 인터페이스와 KRISTAL C++
클라이언트의 이중구조로 구성되어 있음. 모든 소스는 다운로드하여
설치할 수 있음.
2006년 8월 현재, kristalinfo.com 외 과학기술학회마을 게시판,
대한방사선치료학회 등 111개 학회 395개 게시판에서 서비스 중.
- KRISTAL 웹 인터페이스 자동구축기 (단일DB)
단일DB에 대해 JSP용 KRISTAL 검색 및 관리인터페이스를 자동으로 생성해주는 도구.
KRISTAL 데몬이 실행된 상태에서 웹인터페이스 자동구축기를 실행하면
수분 내에 간단한 검색 및 갱신(삽입/삭제/수정) 인터페이스를 생성.
- KRISTAL 웹 인터페이스 자동구축기 (분산DB)
분산DB에 대해 JSP용 KRISTAL 검색인터페이스를 자동으로 생성해주는 도구.
KRISTAL 분산데몬이 실행된 상태에서 웹 인터페이스 자동구축기를 실행하면
수분 내에 간단한 검색 인터페이스를 생성.
- KRISTAL 문서분류기 테스트
자동문서분류(automated document classification) 또는
자동문서범주화(automated text categorization) 알고리즘 중
예제기반 범주기인 kNN 범주기와 KRISTAL의 만남.
준비중 (문서분류 한글 테스트 컬렉션 정리가 완료되는 대로 데모 시스템 구축 예정)
- 아직 정제되지 않은 테스트 컬렉션 (KRTC.2003.tar.gz, 24.4MB)
- 단백질 서열 검색 및 분류 (ProSeS)
단백질 아미노산 서열을 N-gram 방식으로 색인하여 검색 및 분류에
적용한 서비스입니다. 약 350만 개의 단백질 서열을 서열기반으로
유사도기반 또는 완전일치 기반으로 검색할 수 있으며
해당 단백질 서열의 세포내 위치, PIRSF 수퍼패밀리(Superfamily) 등의
정보를 문서범주화를 통해 분석할 수 있습니다.
- 유니코드(Unicode) 처리
유니코드 3.0에 대한 소개 자료 및 C언어 기반 각종 도구 제공
- K-Manager : KRISTAL 데이터베이스 GUI 관리도구
KRISTAL 리스너 기반의 KRISTAL 데이터베이스의 생성에서부터 운영 및 데이터 관리에 이르는 전주기적 관리를 지원하는 도구
- 간단하지만 유용한 도구들
|
include('../__tail.php');
?>
|