• 제목/요약/키워드: user query

검색결과 700건 처리시간 0.032초

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

방사선종양학과 On-line 통계처리프로그램의 개발 (The Development of On-Line Statistics Program for Radiation Oncology)

  • 김윤종;이동훈;지영훈;이동한;조철구;김미숙;류성렬;홍승홍
    • Radiation Oncology Journal
    • /
    • 제19권4호
    • /
    • pp.369-380
    • /
    • 2001
  • 목적 : 인터넷을 이용한 국내 방사선종양학과내의 관련정보를 공유할 수 있는 통계처리프로그램을 개발함으로써 방사선 종양학의 발전을 위한 정책적 판단의 기초자료를 제공하고자 한다. 대상 및 방법 : 전국 52개 병원을 대상으로 방사선 종양학과내의 관련정보를 지면을 이용한 설문조사를 통해 통계 처리하던 기존 방식에서, 인터넷을 이용하여 입력한 후 필요한 정보에 대한 전국 통계를 실시간으로 얻을 수 있도록 구성하였다. 통계조사를 위한 서버 환경으로 O/S는 Windows NT 4.0을 기반으로 하였으며 웹서버로는 Internet Information Server 4.0 (IIS4.0)을 이용하였다. 자료를 수집하고 검색하기 위한 데이터베이스로는 $Microsoft^{\circledR}$사의 Access MDB를 사용하였고 데이터베이스를 사용자가 접근하고, 활용하기 위한 실제 프로그램은 Structured Query Language (SQL), Visual Basic, VBScript, JAVAScript 등을 이용하여 구현하였다. 입력된 자료는 사용자의 요구에 따라 연도별, 병원별로 통계처리 되어 표시되도록 하였다. 결과 : 프로그램은 크게 나누어 인력현황, 연구현황, 특수증기 및 특수기술 등을 요하는 치료현황, 외부조사기기에 따른 치료현황, 근접치료현황, 임상통계현황, 방사선 안전관리현황, 시설현황, 장비현황, 방사선 정도관리현황 및 방사성 핵종 보유현황으로 구성되어 있다. 세부항목은 총 38개의 입력창으로 구성되어 있으며, 통계 처리한 결과는 6개의 출력창을 통하여 보여주고 있다. 또한 사용자의 요구에 따라 통계처리결과는 유연하게 확장이 가능하게 되어 있다. 결론 : 전국 방사선 종양학과내에서 이루어지고 있는 모든 자료에 대할 통계 자동화 프로그램을 개발하여 기초자료로 활용할 수 있도록 하였다. 이를 통하여 관련 사용자들이 쉽고 빠르게 자료를 입력할 수 있고, 또 전국적인 통계자료 정보를 필요에 따라 수시로 얻을 수 있게 되었다.

  • PDF

ACE-BIS: 최적의 버스 노선을 선택하기 위한 비용 효율적인 알고리즘의 개발 (ACE-BIS: A Cost-Effective Bus Information System)

  • 이종찬;박상현;서민구;김상욱
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.655-667
    • /
    • 2006
  • 최근, 모바일 기술 및 GPS 기술의 발전으로 인하여 다양한 위치 기반 서비스가 크게 각광을 받고 있다. 이에 따라 본 논문에서는 모바일 기기를 사용하여 목적지에 도착할 수 있는 다양한 버스 노선 정보를 손쉽게 제공할 수 있는 모바일 대중교통 정보 시스템 ACE-BIS(A Cost-Effective Bus Information System)를 제안한다. 높은 통신비용과 서버의 과부하를 초래하는 기존의 교통 정보 시스템과는 달리, ACE-BIS는 모바일 기기 내에 저장된 버스 정류장 및 노선 데이타를 이용해 휴리스틱 알고리즘을 수행함으로써 목적지까지의 노선 정보 및 예상 소요 시간을 사용자에게 제공한다. 또한 별도의 통신비용을 부담하려는 사용자에게는 서버와의 통신을 통해 버스의 현재 위치 및 도로 체증 상황 등의 실시간 교통 정보를 반영한 좀 더 정확한 경로 정보를 제공한다. 아울러, 서버 내에서 관리되는 실시간 교통 정보를 이용하여 미래 시점의 경로 정보에 대한 서비스도 제공한다. 현실 세계의 특성을 반영한 가상 데이타를 대상으로 다양한 실험을 수행함으로써 제안된 시스템의 정확성과 효율성을 검증한다.

위키피디아 기반의 효과적인 개체 링킹을 위한 NIL 개체 인식과 개체 연결 중의성 해소 방법 (A Method to Solve the Entity Linking Ambiguity and NIL Entity Recognition for efficient Entity Linking based on Wikipedia)

  • 이호경;안재현;윤정민;배경만;고영중
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.813-821
    • /
    • 2017
  • 개체 링킹은 입력된 질의에 존재하는 개체를 표현한 개체 표현(entity mention)을 지식베이스에 존재하는 개체와 연결하여 의미를 파악하는 연구이다. 개체 링킹에 관한 연구는 지식 베이스 구축 문제, 다중 표현 문제, 개체 연결 중의성 문제, NIL 개체 인식 문제가 존재한다. 본 연구에서는 지식 베이스 구축 문제와 다중 표현 문제를 해결하기 위해 위키피디아를 기반으로 개체 이름 사전을 구축한다, 또한, 문맥 유사도, 의미적 관련성, 단서 단어 점수, 개체 표현의 개체명 타입 유사도, 개체 이름 매칭 점수, 개체인기도 점수 자질들을 기반으로 SVM(support vector machine)을 학습하여, NIL 개체를 인식하는 문제와 개체 연결 중의성을 해소하는 방법을 제안한다. 구축한 지식 베이스를 기반으로 제안한 두 방법을 순차적으로 적용하였을 때 좋은 개체 링킹 성능을 얻었다. 개체 링킹 시스템의 성능은 NIL 개체 인식 성능이 83.66%, 중의성 해소 성능이 90.81%의 F1 점수를 보였다.

시각화된 환경에서 다차원 관점을 지원하는 객체기반 패싯 시소러스 관리 시스템 모델의 정형화 및 구현 (A Data Model for an Object-based Faceted Thesaurus System Supporting Multiple Dimensions of View in a Visualized Environment)

  • 김원중;양재동
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.828-847
    • /
    • 2007
  • 본 논문에서는 패싯 분류에 기반하여 다차원 사용자 관점의 도메인 시소러스를 체계적으로 구축하고, 각 관점에 따라 시각화된 환경에서 시소러스를 브라우징, 항해 그리고 검색할 수 있는 다차원 관점객체기반 패싯 시소러스 시스템을 제안한다. 기존의 패싯 시소러스 시스템들과 달리, 본 시스템은 개념들간의 다각적인 상관 관계를 객체 지향 패러다임에 따라 자동으로 설정 구축할 수 있고, 브라우징과 항해를 통해 다차원 시소러스의 복잡한 개념 구조를 적절히 시각화할 수 있기 때문에, 시소러스의 유지 보수 관리가 용이하다. 다차원 브라우징 및 항해는 계층화된 패싯 용어들간의 조합으로 이루어진 패싯화된 시소러스를 필요시 동적으로 생성함으로써 이루어진다. 패싯화된 시소러스는 일종의 다차원 가상 시소러스 계층들로 볼 수 있다. 제안하는 방식에 의한 시소러스 자동 구축은 패싯들의 조합으로 새로운 차원의 시소러스를 용이하게 추가할 수 있기 때문에, 융통성 있는 시소러스 확장이 가능하고 대량의 시소러스 인스턴스들을 관점에 따라 적절한 해석을 부여하는 방식으로 구조화하기 때문에 개별적 사용자 관점에 부합되는 인스턴스들을 참조 질의에 의해 효율적으로 검색할 수 있다. 본 논문에서는 먼저 제안 시스템을 체계화하기 위한 모델을 정형화하고 이를 바탕으로 모델의 실용성을 입증하기 위해 그 프로토타입을 구현하였다.

대학연습림의 효율적 관리를 위한 지리정보시스템의 활용방안 (Application of Geographic Information Systems for Effective Management of University Forests)

  • 권태호;김태균
    • 한국지리정보학회지
    • /
    • 제2권3호
    • /
    • pp.81-90
    • /
    • 1999
  • 대학연습림의 기능이 점차 확대되면서 산림 및 자연환경에 대한 다양한 정보가 필요하게 되고, 연습림의 관리전략에도 복잡한 기술이 요구되고 있다. 따라서 GIS 기법을 응용한 소위 산림정보시스템과 같은 체계적 수단을 통해 산림 및 입지환경에 대한 여러 가지 정보들을 보다 손쉽게 수집, 편집, 관리, 분석, 갱신하고 나아가 의사결정을 지원할 수 있다면 연습림의 관리에도 많은 효과를 얻을 수 있게 된다. 본 연구는 대구대학교 성주연습림을 대상으로 이러한 목적을 시범적으로 모색해보고자 한 것으로, 일차 단계로서 각종 공간자료를 수치지도화 하여 지형을 비롯한 임상, 토양형 등 여러 수치주제도를 구축함으로써 도면정보의 유지 및 통합과정의 어려움을 해소하면서 위치적 통일성과 정보의 통합성을 어느 정도 확보하였다. 또한 영림계획상의 속성자료와 연결하여 사용자 중심의 시스템을 개발함으로써 보다 신속한 검색, 분석은 물론 각종 산림계획의 수립, 평가, 실행과정의 의사결정 수단으로 활용할 수 있었다. 그러나 시스템의 기능에 대한 다양한 요구에 부응하고 효용성을 높이기 위해서는 최신 자료로의 갱신이나 새로운 기술의 도입 등 문제점에 대한 지속적인 보완이 필요할 것으로 생각된다.

  • PDF

워드넷 기반 협동적 평가와 하이퍼링크를 이용한 검색엔진의 성능 향상 (Improving Performance of Search Engine By Using WordNet-based Collaborative Evaluation and Hyperlink)

  • 김형일;김준태
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.369-380
    • /
    • 2004
  • 본 논문에서는 정색엔진의 성능 향상을 위하여 질의어의 모호성 해결과 새로운 가중치 부여 방식을 제안한다. 일반적인 검색엔진은 질의어의 형태와 같은 것들이 포함되어 있는 웹 페이지를 결과로 보여주는 내용기만 방식을 사용하고 있다. 검색 결과로 나타난 웹 페이지들의 순위를 결정하는데 있어서도 주어진 질의어와 웹 페이지 사이의 키워드 매칭에 의한 내용기반 방식을 사용한다. 이와 같이 질의어의 형태만으로 웹페이지들과 유사도를 비교한다는 것은 정확한 검색에 많은 장애를 준다. 또한 질의어의 의미에 모호성이 존재할 경우에는 사용자의 의도와 관련 없는 것들이 결과로 나타나기도 한다. 이러한 원인의 발생은 일반적인 검색엔진들이 내용기반 방법을 기반으로 웹 검색에 이용되기 때문이다. 본 논문에서는 질의어에 모호성이 있는 경우 워드넷을 이용하여 모호성을 해결하도록 하는 사용자 인터페이스를 구현했다. 그리고 사용자의 클릭 수를 각 웹 페이지의 가중치에 누적함으로써 다수 사용자의 협동적 평가에 따른 웹 페이지의 중요도가 검색 순위에 반영되도록 하였다. 클릭수의 누적에 있어서 질의어의 의미 카테고리별로 가중치를 구분하여 저장함으로써 보다 세분화된 웹 페이지 가중치 부여 방식을 사용하였다 그리고 점 페이지의 하이퍼링크를 웹 페이지의 가중치에 적용하였다. 웹 페이지의 가중치에 하이퍼링크를 적용함으로써 웹 페이지의 대표성을 가중치에 부여하여 가중치에 신뢰도를 증가시켰다. 실험용 정색엔진이 일반 검색엔진에 비해 높은 검색 정확도를 나타내는 것을 실험을 통해 확인하였다.

자연환경조사에서 실시간 GIS구현을 위한 가상사무실 기반의 필드멥핑 (Field Mapping based on Virtual Office for Real time GIS in Field Survey for Natural Environment)

  • 엄정섭;김희두
    • Spatial Information Research
    • /
    • 제9권1호
    • /
    • pp.51-72
    • /
    • 2001
  • 전통적인 자연환경조사에서 조사대상물 위치의 부정확, 조사결과와 GIS-DB 구축간에 이원화된 작업으로 인한 경제적 비효용 등이 문제점으로 지적되어왔다. 본 연구에서는 이러한 문제에 대한 대안을 제시하기 위해 자연환경조사 결과를 조사원이 조사현장에서 실시간으로 입·출력하는 기법의 구현과정을 보고한다. 제안된 기법은 GPS, 네트워크 컴퓨터, 이동 컴퓨팅, 착용 가능 컴퓨터 등의 최근 정보 통신 환경의 변화 동향을 바탕으로 GPS를 기반으로 하여 조사현장에서 지도를 수정·갱신할 수 있는 가상사무실 조사를 상징하였다. 본 시스템을 이용함으로써 조사원이 현지조사시 GPS를 이용하여 보다 정확한 위치정보를 확보할 수 있게 되었다. 또한 이동 컴퓨팅에 의거한 가상사무실을 이용하여 조사결과를 조사현장에서 실시간으로 GIS 데이터베이스로 구축할 수 있게 되었다. 아울러 현지조사과정에서 반영한 조사가 가능하게 되었다. 이러한 시스템이 국가차원에서 정착될 경우 조사결과의 신뢰성이 증진되어 각급 기관에서 조사한 결과의 통합·활용 가능성이 휠씬 높아질 것으로 사료된다. 본 연구가 전통적인 자연환경조사의 한계를 극복할 수 있는 계기가 되어 향후 국가전체차원의 자연환경 GIS구축이나 각급지방자치단체에서 보다 대축적의 자연환경 GIS구축을 위한 현지조사기법으로서 중요한 참고자료가 될 수 있을 것으로 사료된다.

  • PDF

Node.js를 활용한 웹GIS 서버의 설계와 구현 (Design and Implementation of Web GIS Server Using Node.js)

  • 전상환;도경태
    • Spatial Information Research
    • /
    • 제21권3호
    • /
    • pp.45-53
    • /
    • 2013
  • 웹GIS는 수년 동안 사용자들에게 효율적이고 정확한 공간정보를 제공하기 위해 최신 웹기술을 기반으로 발전해왔다. 또한 웹GIS 서버는 클라이언트의 요청을 빠르게 연산 처리하고 공간정보 서비스를 제공하기 위해 성능개선을 지속해왔다. 본 연구에서는 서버 개발에 자바스크립트(JavaScript)를 사용하는 이벤트 기반의 비동기식 I/O 처리가 가능한 프레임웍 기술인 Node.js를 활용하여 NodeMap이라고 이름붙인 웹GIS 서버를 설계하고 구현하였다. NodeMap은 기본적으로 OGC 표준 인터페이스를 지원하는 웹GIS 서버이다. 이를 위해 공간 인덱스 및 표준 공간쿼리 함수를 지원하는 DBMS를 활용하여 GIS 데이터를 처리하도록 하였다. 그리고 공간 정보를 타일 맵 위에 렌더링 하기 위해 HTML5 Canvas를 지원하는 Node-Canvas 모듈을 활용하였다. 마지막으로 Node.js의 가장 많이 쓰이는 커넥트 모듈 기반의 프레임웍인 Express 모듈을 활용하였다. 구현된 NodeMap은 성능테스트를 통해 향 후 웹GIS 서버개발기술로서 Node.js의 활용 가능성을 확인하였다. 본 연구를 통해 기존 서버 개발 기술과 차별화된 기술인 Node.js를 웹GIS 서버 구현에 우선적용 함으로서 향 후 인터넷 GIS 서비스에서의 활용 가능성을 제시하였다.

Gramene database: A resource for comparative plant genomics, pathways and phylogenomics analyses

  • Tello-Ruiz, Marcela K.;Stein, Joshua;Wei, Sharon;Preece, Justin;Naithani, Sushma;Olson, Andrew;Jiao, Yinping;Gupta, Parul;Kumari, Sunita;Chougule, Kapeel;Elser, Justin;Wang, Bo;Thomason, James;Zhang, Lifang;D'Eustachio, Peter;Petryszak, Robert;Kersey, Paul;Lee, PanYoung Koung;Jaiswal, kaj;Ware, Doreen
    • 한국작물학회:학술대회논문집
    • /
    • 한국작물학회 2017년도 9th Asian Crop Science Association conference
    • /
    • pp.135-135
    • /
    • 2017
  • The Gramene database (http://www.gramene.org) is a powerful online resource for agricultural researchers, plant breeders and educators that provides easy access to reference data, visualizations and analytical tools for conducting cross-species comparisons. Learn the benefits of using Gramene to enrich your lectures, accelerate your research goals, and respond to your organismal community needs. Gramene's genomes portal hosts browsers for 44 complete reference genomes, including crops and model organisms, each displaying functional annotations, gene-trees with orthologous and paralogous gene classification, and whole-genome alignments. SNP and structural diversity data, available for 11 species, are displayed in the context of gene annotation, protein domains and functional consequences on transcript structure (e.g., missense variant). Browsers from multiple species can be viewed simultaneously with links to community-driven organismal databases. Thus, while hosting the underlying data for comparative studies, the portal also provides unified access to diverse plant community resources, and the ability for communities to upload and display private data sets in multiple standard formats. Our BioMart data mining interface enable complex queries and bulk download of sequence, annotation, homology and variation data. Gramene's pathway portal, the Plant Reactome, hosts over 240 pathways curated in rice and inferred in 66 additional plant species by orthology projection. Users may compare pathways across species, query and visualize curated expression data from EMBL-EBI's Expression Atlas in the context of pathways, analyze genome-scale expression data, and conduct pathway enrichment analysis. Our integrated search database and modern user interface leverage these diverse annotations to facilitate finding genes through selecting auto-suggested filters with interactive views of the results.

  • PDF