비정형 데이터의 의미정보 추출 시스템 ‘디사(DISA)’

 

개요

다양한 형태의 비정형 데이터에서 의미 개체, 관계 정보, 감성 정보 등의 의미 정보를 추출하여 정형화된 데이터로의 정제

디사 관련 이미지

빠르고 정확한 언어 분석 및 정보 추출

  • 한국어, 영어, 중국어, 일본어 등 다국어 지원 형태소 분석기 사용
  • Rule기반의 언어분석 지원으로 정확하고 빠른 성능을 보장하며, 튜닝을 통한 정확도 향상 가능

웹 기반의 손쉬운 관리도구

  • 의미 정보 추출 프로세스 전체에 대한 통합 관리 도구 제공
  • 추출 정확도 향상을 위한 지식 사전과 추출 패턴의 관리 기능 제공
  • 추출 성능 검증과 튜닝을 위한 검증 기능 제공
  • 다양한 도메인 적용을 위한 지식사전 적용

다양한 매쉬업 서비스와의 연계

  • 데이타베이스, 파일 등 다양한 형태의 출력 지원으로 타 시스템과의 원활한 연계 시스템
  • 라이브러리 형태의 검색엔진 및 추론엔진에 plug-in 적용기능 제공
  • 독립시스템 형태의 서버 구축 가능

검증된 안정성 및 성능

  • 순수 자체 기술로 개발한 언어처리/분석 탑재
  • 다수의 정보 추출 프로젝트 진행으로 검증된 성능과 안정성
  • 통합 검색 시스템, 온톨로지 시맨틱 검색 시스템과의 원활한 연계